人工智慧 | 知識分享

機器學習訓練完成的陷阱：何謂局部最小值?如何避免陷入局部最小值？

ByPeter_Li 9 5 月, 20239 5 月, 2023

何謂局部最小值?

機器學習在訓練AI模型的時候，其實是透過梯度下降法，進行最佳權重的查找。而最佳權重其實是在損失函數空間當中，找一個最低點，最低點代表損失最小值，代表在此點上的權重，是最佳權重。

但是在實際運作情形下，損失空間是相當複雜的，會有出現一個常見的問題，就是在損失空間裡，會出現一個局部最小值，而在梯度下降法進行的過程中，一旦進入到局部最小值，這時候就會因為梯度不明顯，而導致難以跳脫出局部最小值，這時候我們可能就會以為這時候的解是最佳解，但事實上是錯誤的。

如何跳脫局部最小值?

實際上該如何避免陷入局部最小值呢?

避免陷入局部最小值的方法有許多種方法，這邊提一個我們在上一篇提到的批次訓練法，使用批次訓練法是可以避免陷入局部最小值的，因為批次訓練的梯度下降法，是每一次都隨機抽樣一定的樣本數，進行梯度的計算，而這種隨機性就有可能當我們在訓練過程中落入局部最小值時，往不同的方向走就有機會跳脫出局部最小值並且往全域最小值行走，進而得到最佳解。

[參考資料]:

1.快速反應機制─類神經網路

2.機器學習與人工神經網路(二)：深度學習(Deep Learning)

3.機器學習的衰頹興盛：從類神經網路到淺層學習

[類神經網路基礎系列專文]:

1.類神經網路(Deep neural network, DNN)介紹

2.類神經網路—揭開網路架構調整秘辛

3.類神經網路—啟動函數介紹(一): 深入解析Relu與Sigmoid函數：如何影響類神經網路的學習效果？

4.類神經網路—啟動函數介紹(二): 回歸 vs. 分類: 線性函數與Tanh函數之原理探索

5.類神經網路—啟動函數介紹(三): 掌握多元分類的核心技術：不可不知的softmax函數原理

6.類神經網路—啟動函數介紹(四): 如何選擇最適當的啟動函數？用一統整表格讓您輕鬆掌握

7.類神經網路—前向傳播法

8.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法

9.類神經網路—反向傳播法(二): 淺談梯度

10.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法

11.類神經網路—反向傳播法(四): 揭開反向傳播法神秘面紗

12.機器學習訓練原理大揭秘：六步驟帶您快速了解監督式學習的訓練方法

13.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感

[機器學習基礎系列專文]:

1.機器學習訓練原理大揭秘：六步驟帶您快速了解監督式學習的訓練方法

2.機器學習面臨的問題種類介紹:回歸與分類

[類神經網路延伸介紹]:

1.卷積類神經網路(Convolution neural network,CNN)介紹

2.遞迴類神經網路(Recurrent neural network,RNN)介紹

[ChatGPT系列專文]:

1.淺談最近非常火紅的ChatGPT背後可能原理機制為何?

2.從ChatGPT探索GPT的原理概念:少量數據的解方—遷移學習技巧

瀏覽人次 694

機器學習訓練: 批次訓練(mini-batch)是什麼?為何它可解決龐大數據面臨的痛點?

人工智慧 | 知識分享

機器學習訓練: 批次訓練(mini-batch)是什麼?為何它可解決龐大數據面臨的痛點?

ByPeter_Li 1 5 月, 20231 5 月, 2023

批次訓練(mini-batch) 一般機器學習的訓練方式，是一次輸入所有訓練數據到機器當中進行訓練。但是這樣會產生一個問題…

遞迴類神經網路(Recurrent neural network,RNN)介紹

人工智慧 | 知識分享

遞迴類神經網路(Recurrent neural network,RNN)介紹

ByPeter 30 10 月, 202224 4 月, 2024

為什麼要有遞迴類神經網路(RNN)? 舉個例子，假設我們要去看一則電影影評到底是正面的還是負面的，如果那一則電影影評是“我…

Transformer介紹:為何它是現今NLP技術發展的基石?

人工智慧 | 機器學習技術新知 | 知識分享

Transformer介紹:為何它是現今NLP技術發展的基石?

ByPeter_Li 16 12 月, 202316 12 月, 2023

機器翻譯架構 Transformer可應用在許多任務當中，本篇文章以機器翻譯為舉例說明。先介紹一般機器翻譯的作法，假設我們…

類神經網路—前向傳播法

人工智慧 | 知識分享

類神經網路—前向傳播法

ByPeter 26 11 月, 202222 4 月, 2023

前向傳播法是什麼？前向傳播法是用在當類神經網路已經訓練完畢的時候，給定新的輸入到類神經網路中，計算推論得到新輸出的一個過…

淺談最近非常火紅的ChatGPT背後可能原理機制為何?

人工智慧 | 知識分享

淺談最近非常火紅的ChatGPT背後可能原理機制為何?

ByPeter 5 2 月, 20232 5 月, 2023

本篇文章聽完李弘毅老師的講解之後有感而發，再透過自己的想法寫下來，因為ChatGPT尚未公開詳細作法，所以事實上李弘毅老師…

類神經網路—啟動函數介紹(三): 掌握多元分類的核心技術：不可不知的softmax函數原理

人工智慧 | 知識分享

類神經網路—啟動函數介紹(三): 掌握多元分類的核心技術：不可不知的softmax函數原理

ByPeter_Li 23 3 月, 20231 4 月, 2023

今天來跟大家介紹的是softmax啟動函數，此函數是用在多元分類的問題。而sigmoid函數只能用在二元分類的問題。多元…

One Comment

自動引用通知: 類神經網路(Deep neural network, DNN)介紹 - 李彼德之家

Comments are closed.