機器學習訓練: 批次訓練(mini-batch)是什麼?為何它可解決龐大數據面臨的痛點?

內容目錄

批次訓練(mini-batch)

一般機器學習的訓練方式，是一次輸入所有訓練數據到機器當中進行訓練。但是這樣會產生一個問題，當資料量太過龐大的時候，在有限的運算資源下，是難以用這樣的方式讓電腦去做運算訓練。

為了要解決這樣的問題，批次訓練(mini-batch)方法就產生了，批次訓練的方法它一樣是要讓機器看過所有訓練數據進行訓練，差別只是在於它不是同時全部輸入，而是將訓練數據分批(batch)輸入機器當中進行訓練，透過這樣的方式，就可有效減輕電腦的運算量，同時也可處理龐大的數據量，並且達成讓機器學習好的效果!

批次訓練(mini-batch)對梯度下降之影響

以一般訓練的方式，對應到的就是梯度下降法，也就是在損失空間裡面，會沿著每個位置的負梯度行走，才會到達山谷也就是損失最低點，此點對應的權重，就是最佳權重。而這樣的訓練方式，是最有效率的，因為每一個位置都是沿著最陡峭的地方下去。而在批次訓練的部分，因為已經無法一次看過所有訓練資料，所以要分成不同的訓練資料去做訓練，此時，每個位置看到的並非是最陡峭的方向，而是看到一個相對陡峭的方向就下去，看起來軌跡會更為隨機變化。雖然損失了一點下山的效率，但是可以解決運算資源的問題，而且最終依然可以正確到達山谷。

總結

我們以一個比喻法來作總結，一般的梯度下降法，是在下山的過程當中，環視周遭找一個最陡峭的方向下山，這樣就可最有效率到底谷底。但是在批次梯度下降法中，因為並沒有一次看過所有資料，所以是無法環視周遭去找一個最陡峭的方向。這樣的感覺就很像是山裡面起霧，起霧的時候，能見度很低，所以我們只能找一個看起來相對陡峭的方向就去下山。雖然會損失掉一點效率的部分，但最終仍然能到達山谷。