機器學習訓練原理大揭秘：六步驟帶您快速了解監督式學習的訓練方法

機器學習在訓練方法分三大類，有監督式學習，非監督式學習，強化學習，而本篇文章則是要講解監督式學習的訓練方法。

內容目錄

何謂監督式學習呢？

監督式學習的意思是給定數據讓機器學習過程中，需要告訴機器標準解答，告訴它什麼是對的，才有辦法進行學習。因此，在數據當中，除了要給定資料特徵作為輸入以外，還要給定資料標籤作為輸出，而資料標籤指的就是標準解答。

到底我們要如何訓練監督式學習的模型呢？

以下為訓練監督式學習的六步驟。

步驟1:一開始須要取得數據，而數據當中須具備資料特徵與資料標籤。

資料特徵代表AI模型的輸入，資料標籤代表AI模型的輸出。

因為我們要從輸入預測輸出，所以通常輸出是讓模型預測的結果，而在訓練過程是代表標準答案，等於是先告訴AI這樣的輸入是對應這樣的輸出，在不斷透過學習，AI模型就可以抓到如何從輸入預測輸出的關鍵特徵。

步驟2:將整體數據切分為訓練數據與驗證數據以及測試數據。

訓練數據與驗證數據是在AI模型學習過程中會用到。

而測試數據則是讓AI模型訓練完成後，才會用到。

步驟3:輸入訓練與驗證數據讓AI模型學習。

訓練數據是讓AI模型學習，AI模型的權重就是依照這個訓練數據去進行尋找。

驗證數據是當AI模型學習到權重之後，用以驗證模型的一個步驟。

步驟4:觀察AI模型學習是否合理?

用訓練數據的資料特徵會讓AI模型預測得到一個輸出結果，而我們會將這個輸出結果與標準解答比較，這兩者之間的差距可以計算得到訓練的損失，其意義為代表機器在看過標準解答後有沒有學習好?訓練損失要低，才會代表機器在看過解答後有學起來。

此時還會用驗證數據的資料特徵讓AI模型預測得到一個輸出結果，我們會將輸出結果與標準解答做比較，這兩者之間的差距可以計算得到驗證的損失，其意義為因為AI模型並沒有看過驗證數據的解答去學習，此時就好像在對AI模型考試，如果表現不好，驗證損失高，則會代表機器並沒有學起來，它只是死記答案，並沒有真正融會貫通。因此，驗證損失預期也要低，才代表機器有真正學起來。