|

機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法

機器學習在訓練方法分三大類,有監督式學習,非監督式學習,強化學習,而本篇文章則是要講解監督式學習的訓練方法。

何謂監督式學習呢?

監督式學習的意思是給定數據讓機器學習過程中,需要告訴機器標準解答,告訴它什麼是對的,才有辦法進行學習。因此,在數據當中,除了要給定資料特徵作為輸入以外,還要給定資料標籤作為輸出,而資料標籤指的就是標準解答。

到底我們要如何訓練監督式學習的模型呢?

以下為訓練監督式學習的六步驟。

步驟1:一開始須要取得數據,而數據當中須具備資料特徵與資料標籤。

資料特徵代表AI模型的輸入,資料標籤代表AI模型的輸出。

因為我們要從輸入預測輸出,所以通常輸出是讓模型預測的結果,而在訓練過程是代表標準答案,等於是先告訴AI這樣的輸入是對應這樣的輸出,在不斷透過學習,AI模型就可以抓到如何從輸入預測輸出的關鍵特徵。

步驟2:將整體數據切分為訓練數據與驗證數據以及測試數據。

訓練數據與驗證數據是在AI模型學習過程中會用到。

而測試數據則是讓AI模型訓練完成後,才會用到。

步驟3:輸入訓練與驗證數據讓AI模型學習。

訓練數據是讓AI模型學習,AI模型的權重就是依照這個訓練數據去進行尋找。

驗證數據是當AI模型學習到權重之後,用以驗證模型的一個步驟。

步驟4:觀察AI模型學習是否合理?

用訓練數據的資料特徵會讓AI模型預測得到一個輸出結果,而我們會將這個輸出結果與標準解答比較,這兩者之間的差距可以計算得到訓練的損失,其意義為代表機器在看過標準解答後有沒有學習好?訓練損失要低,才會代表機器在看過解答後有學起來。

此時還會用驗證數據的資料特徵讓AI模型預測得到一個輸出結果,我們會將輸出結果與標準解答做比較,這兩者之間的差距可以計算得到驗證的損失,其意義為因為AI模型並沒有看過驗證數據的解答去學習,此時就好像在對AI模型考試,如果表現不好,驗證損失高,則會代表機器並沒有學起來,它只是死記答案,並沒有真正融會貫通。因此,驗證損失預期也要低,才代表機器有真正學起來。

步驟5:用測試數據測試模型。

待AI模型訓練完成後,我們會輸入測試數據到AI模型中進行預測,進一步確認訓練完成的AI模型的表現如何?

步驟6:評估測試結果是否可行?

最後可將預測結果與標準答案比較,計算兩者之間的誤差,誤差小於一個範圍,才認為此AI模型是有訓練成功,針對不同數據具有預測能力。

[參考資料]:

1.快速反應機制─類神經網路

2.機器學習與人工神經網路(二):深度學習(Deep Learning)

3.機器學習的衰頹興盛:從類神經網路到淺層學習

[相關文章]:

1.類神經網路(Deep neural network, DNN)介紹

2.類神經網路—揭開網路架構調整秘辛

3.類神經網路—啟動函數介紹

4.類神經網路—前向傳播法

5.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法

6.類神經網路—反向傳播法(二): 淺談梯度

7.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法

8.類神經網路—反向傳播法(四): 揭開反向傳播法神秘面紗

9.機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法

10.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感

[延伸閱讀]:

1.卷積類神經網路(Convolution neural network,CNN)介紹

2.遞迴類神經網路(Recurrent neural network,RNN)介紹

3.淺談最近非常火紅的ChatGPT背後可能原理機制為何?

Similar Posts