機器學習在訓練方法分三大類,有監督式學習,非監督式學習,強化學習,而本篇文章則是要講解監督式學習的訓練方法。
何謂監督式學習呢?
監督式學習的意思是給定數據讓機器學習過程中,需要告訴機器標準解答,告訴它什麼是對的,才有辦法進行學習。因此,在數據當中,除了要給定資料特徵作為輸入以外,還要給定資料標籤作為輸出,而資料標籤指的就是標準解答。
到底我們要如何訓練監督式學習的模型呢?
以下為訓練監督式學習的六步驟。
步驟1:一開始須要取得數據,而數據當中須具備資料特徵與資料標籤。
資料特徵代表AI模型的輸入,資料標籤代表AI模型的輸出。
因為我們要從輸入預測輸出,所以通常輸出是讓模型預測的結果,而在訓練過程是代表標準答案,等於是先告訴AI這樣的輸入是對應這樣的輸出,在不斷透過學習,AI模型就可以抓到如何從輸入預測輸出的關鍵特徵。
步驟2:將整體數據切分為訓練數據與驗證數據以及測試數據。
訓練數據與驗證數據是在AI模型學習過程中會用到。
而測試數據則是讓AI模型訓練完成後,才會用到。
步驟3:輸入訓練與驗證數據讓AI模型學習。
訓練數據是讓AI模型學習,AI模型的權重就是依照這個訓練數據去進行尋找。
驗證數據是當AI模型學習到權重之後,用以驗證模型的一個步驟。
步驟4:觀察AI模型學習是否合理?
用訓練數據的資料特徵會讓AI模型預測得到一個輸出結果,而我們會將這個輸出結果與標準解答比較,這兩者之間的差距可以計算得到訓練的損失,其意義為代表機器在看過標準解答後有沒有學習好?訓練損失要低,才會代表機器在看過解答後有學起來。
此時還會用驗證數據的資料特徵讓AI模型預測得到一個輸出結果,我們會將輸出結果與標準解答做比較,這兩者之間的差距可以計算得到驗證的損失,其意義為因為AI模型並沒有看過驗證數據的解答去學習,此時就好像在對AI模型考試,如果表現不好,驗證損失高,則會代表機器並沒有學起來,它只是死記答案,並沒有真正融會貫通。因此,驗證損失預期也要低,才代表機器有真正學起來。
步驟5:用測試數據測試模型。
待AI模型訓練完成後,我們會輸入測試數據到AI模型中進行預測,進一步確認訓練完成的AI模型的表現如何?
步驟6:評估測試結果是否可行?
最後可將預測結果與標準答案比較,計算兩者之間的誤差,誤差小於一個範圍,才認為此AI模型是有訓練成功,針對不同數據具有預測能力。
[參考資料]:
2.機器學習與人工神經網路(二):深度學習(Deep Learning)
[相關文章]:
1.類神經網路(Deep neural network, DNN)介紹
5.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法
7.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法
9.機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法
10.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感
[延伸閱讀]:
1.卷積類神經網路(Convolution neural network,CNN)介紹
自動引用通知: 類神經網路-反向傳播法(四): 揭開反向傳播法神秘面紗 - 李彼德之家
自動引用通知: 類神經網路-反向傳播法(三): 五步驟帶您了解梯度下降法 - 李彼德之家
自動引用通知: 類神經網路—反向傳播法(二): 淺談梯度 - 李彼德之家
自動引用通知: 類神經網路-反向傳播法(一): 白話文帶您了解反向傳播法 - 李彼德之家
自動引用通知: 類神經網路-啟動函數介紹 - 李彼德之家
自動引用通知: 類神經網路-前向傳播法 - 李彼德之家
自動引用通知: 類神經網路-揭開網路架構調整秘辛 - 李彼德之家
自動引用通知: Rule-based v.s. AI方法比較 - 李彼德之家
自動引用通知: 類神經網路(Deep neural network, DNN)介紹 - 李彼德之家
自動引用通知: 淺談最近非常火紅的ChatGPT背後可能原理機制為何? - 李彼德之家
自動引用通知: 遞迴類神經網路(Recurrent neural network,RNN)介紹 - 李彼德之家
自動引用通知: 卷積類神經網路(Convolution neural network,CNN)介紹 - 李彼德之家