機器學習技術新知 – 李彼德之家

用類比法帶您快速了解Attention機制的關鍵概念—Query, Key, Value

人工智慧 | 機器學習技術新知 | 知識分享

用類比法帶您快速了解Attention機制的關鍵概念—Query, Key, Value

ByPeter_Li 29 2 月, 202429 2 月, 2024

介紹先前文章有提到Transformer模型裡面有三個Multi-Head Attention的機制，在Attentio…

白話文範例帶您了解Transformer核心原理: 從三個Multi-Head Attention角度出發

人工智慧 | 機器學習技術新知 | 知識分享

白話文範例帶您了解Transformer核心原理: 從三個Multi-Head Attention角度出發

ByPeter_Li 2 2 月, 20242 2 月, 2024

Why Transformer? 傳統RNN的架構是採用時序性的類神經網路進行自然語言的處理，這樣的方式就是透過時序方式一…

Transformer介紹:為何它是現今NLP技術發展的基石?

人工智慧 | 機器學習技術新知 | 知識分享

Transformer介紹:為何它是現今NLP技術發展的基石?

ByPeter_Li 16 12 月, 202316 12 月, 2023

機器翻譯架構 Transformer可應用在許多任務當中，本篇文章以機器翻譯為舉例說明。先介紹一般機器翻譯的作法，假設我們…

揭密大型語言模型(large language model, LLM) 變成萬事通的關鍵技術: 提示工程(prompt)

人工智慧 | 機器學習技術新知 | 知識分享

揭密大型語言模型(large language model, LLM) 變成萬事通的關鍵技術: 提示工程(prompt)

ByPeter_Li 11 9 月, 202311 9 月, 2023

為什麼會有提示工程(prompt)? 先前有提到大型語言模型是學習處理通用的自然語言任務，如果要處理特定任務，上次有提到過…

揭密大型語言模型(large language model, LLM) 變成專家的關鍵技術: 微調技巧(fine-tuning)

人工智慧 | 機器學習技術新知 | 知識分享

揭密大型語言模型(large language model, LLM) 變成專家的關鍵技術: 微調技巧(fine-tuning)

ByPeter_Li 3 8 月, 20233 8 月, 2023

為什麼要介紹大型語言模型(large language model, LLM)以及微調的技巧(fine-tuning)? …