從自編碼器(autoencoder)到ChatGPT架構:探索大型語言模型(LLM)的原理與基本概念

內容目錄

自編碼器(autoencoder)是什麼?為何我們需要知道這樣的知識?

自編碼器(autoencoder)是基於類神經網路的一種技術，在應用上有特別的用途，像是異常檢測方面的應用等等。

由於在大型語言模型的原理當中，有著編碼與解碼的技術，因此，此處會先介紹自編碼器，主要是讓大家對編碼與解碼有一定的概念，才能更進一步了解大型語言模型的原理。

自編碼器(autoencoder)架構

自編碼器(autoencoder)架構如下所示

自編碼器(autoencoder)是由許多層的網路節點所組成，而此網路結構的特點是一個左右對稱的形式。

我們舉個例子，一般的自編碼器(autoencoder)的在各個層的節點數目，一開始左邊輸入進來的是原圖，也就是原始資料，接下來節點數目會不斷遞減，節點數目就會變成500，然後到中間的節點數目降為10，為最少的節點數目，接下來繼續往右，節點數目又再增加到500，最終又再輸出原圖，也就是在節點數目1000的部分。

我們用一個架構圖簡化自編碼器在做的事情，自編碼器(autoencoder)其實就是輸入原圖後，經由自編碼的運算，再輸出原圖。

大家可能會有疑問，就是為何要這樣做?輸入原圖，輸出也是原圖，這樣做有意義嗎?事實上，這樣的作法可以讓我們做後續的應用，像是一開始提到異常檢測的應用，不過此處我們先暫且不多談，我們持續來了解自編碼器的架構。

從剛剛的自編碼器(autoencoder)網路架構，我們進一步了解到以中間節點數目10為基準，左右兩側是一個對稱的樣式，左邊在做的其實就是編碼器(encoder)，右邊在做的就是解碼器(decoder)。而自編碼器的動作就是先編碼再解碼就可以得到原圖。

編碼器(encoder)

我們進一步來看編碼器(encoder)的結構，編碼器(encoder)的意義為何?為什麼節點數目會不斷遞減?

事實上編碼器(encoder)做的事情就是在壓縮維度，當原圖輸入進來之後就不斷的把原圖進行壓縮，壓縮的意思就是把資料不斷簡化(也就是節點數目不斷降低)，壓縮到最小的資料量也就是10個節點數目的部分，在10個節點數的地方就稱為瓶頸點(botttleneck)，這10個節點上面的數值，就可組成是10維度的向量，這10維度的向量代表的是特徵的表示法。

這代表的從原圖輸入的部分有1000個節點，後續不斷的壓縮資訊，最終只用10個節點就可以擷取到1000個節點原圖的關鍵特徵。

編碼器致力於在做的就是將原圖萃取出關鍵特徵，我們就可以不用那麼大的維度去描述同一張圖，例如原本要用1000個節點去描述，現在只要用10個節點就可以描述了。