人工智慧 | 機器學習基礎 | 知識分享

判斷模型對於回歸問題的好壞—精確度(均方根誤差,MSE)與穩健度(全距,Range)的考量

ByPeter_Li 29 9 月, 202329 9 月, 2023

內容目錄

為什麼要要有度量標準?

當模型訓練完成後，我們不確定到底模型有沒有訓練好?有可能模型會有過擬合的現象，只有在特定資料才會預測準確，也有可能欠擬合，模型預測精準度非常差。因此，我們需要有方法來測試模型的好壞，一般的作法會輸入測試資料，讓模型預測，此時，我們可同時比對預測結果與真實解答的差距，再透過度量標準的計算，以了解模型的好壞。

回歸模型度量標準—衡量精確度與穩健度

在回歸問題上，模型預測是連續的數值，採用的度量標準是衡量模型的精確度與穩健度，這是因為我們希望模型預測的結果，可以既準確又穩定。

準確的意思代表的是模型預測的結果大致上貼近標準解答。

穩定的意思是當模型預測產生誤差時，這個誤差變化可控制在一定範圍內，不會產生突然一個資料進來，模型就大幅失準。

衡量精確度標準—均方根誤差

衡量精確度一般會採用均方根誤差，均分根誤差就是將計算真實解答與預測結果差距取平方後再累加起來，當均方根誤差小，則代表模型預測的誤差大致上是落在一定範圍內，但是無法確定其中有一些誤差可能會偏大或偏小。

而在誤差偏大的部分，有可能在某些領域上將產生嚴重危害，舉例來說，在自動駕駛部分，如果均分根誤差小於一定程度，代表大致上的駕駛都還算精準，但是如果剛好有其中一個誤差偏大，車輛很有可能就會撞上障礙物，造成極大危害。所以在這樣的應用當中，不但精確度要小，穩健度也要高。

穩健度—全距(or極差)

計算穩健度的方式就是採用全距來判斷，全距是將最大誤差與最小誤差相減，藉此，了解整體誤差變化的範圍。

全距越小，代表整體誤差變化越小，這樣我們就能確保模型在運作的時候，就算有偏差，偏差也不會太大，才能確保模型應用在某些領域上，可以更安全。

結論

本篇文章介紹了衡量模型好壞的標準，也就是要考量精確度與穩健度，才能確保模型應用在場域的時候，可以完美的表現。

[參考資料]:

1.快速反應機制─類神經網路

2.機器學習與人工神經網路(二)：深度學習(Deep Learning)

3.機器學習的衰頹興盛：從類神經網路到淺層學習

[類神經網路基礎系列專文]:

1.類神經網路(Deep neural network, DNN)介紹

2.類神經網路—揭開網路架構調整秘辛

3.類神經網路—啟動函數介紹(一): 深入解析Relu與Sigmoid函數：如何影響類神經網路的學習效果？

4.類神經網路—啟動函數介紹(二): 回歸 vs. 分類: 線性函數與Tanh函數之原理探索

5.類神經網路—啟動函數介紹(三): 掌握多元分類的核心技術：不可不知的softmax函數原理

6.類神經網路—啟動函數介紹(四): 如何選擇最適當的啟動函數？用一統整表格讓您輕鬆掌握

7.類神經網路—前向傳播法

8.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法

9.類神經網路—反向傳播法(二): 淺談梯度

10.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法

11.類神經網路—反向傳播法(四): 揭開反向傳播法神秘面紗

12.機器學習訓練原理大揭秘：六步驟帶您快速了解監督式學習的訓練方法

13.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感

[機器學習基礎系列專文]:

1.機器學習訓練原理大揭秘：六步驟帶您快速了解監督式學習的訓練方法

2.機器學習面臨的問題種類介紹:回歸與分類

[類神經網路延伸介紹]:

1.卷積類神經網路(Convolution neural network,CNN)介紹

2.遞迴類神經網路(Recurrent neural network,RNN)介紹

[ChatGPT系列專文]:

1.淺談最近非常火紅的ChatGPT背後可能原理機制為何?

2.從ChatGPT探索GPT的原理概念:少量數據的解方—遷移學習技巧

瀏覽人次 809

機器學習訓練完成的陷阱：何謂局部最小值?如何避免陷入局部最小值？

人工智慧 | 知識分享

機器學習訓練完成的陷阱：何謂局部最小值?如何避免陷入局部最小值？

ByPeter_Li 9 5 月, 20239 5 月, 2023

何謂局部最小值? 機器學習在訓練AI模型的時候，其實是透過梯度下降法，進行最佳權重的查找。而最佳權重其實是在損失函數空間當…

淺談關於機器學習訓練—不可不知的事情

人工智慧 | 知識分享

淺談關於機器學習訓練—不可不知的事情

ByPeter_Li 19 5 月, 202319 5 月, 2023

我們在進行機器學習開發的時候，要從無到有把機器學習模型訓練出來，最重要需要注意的就是數據，因為機器學習本身就是基於數據打造…

機器學習面臨的問題種類介紹:回歸與分類

人工智慧 | 知識分享

機器學習面臨的問題種類介紹:回歸與分類

ByPeter 28 2 月, 202323 3 月, 2023

今天跟大家分享機器學習遇到的問題，大致可分為兩個種類，也就是回歸和分類，我們需要先對所要面臨的問題去解析，看這個問題是對應…

分群演算法(cluster analysis)

人工智慧 | 機器學習基礎 | 知識分享

分群演算法(cluster analysis)

ByPeter_Li 19 8 月, 202319 8 月, 2023

為什麼要介紹分群演算法(cluster analysis)? 分群演算法是一種非監督式學習(unsupervised le…

白話文範例帶您了解Transformer核心原理: 從三個Multi-Head Attention角度出發

人工智慧 | 機器學習技術新知 | 知識分享

白話文範例帶您了解Transformer核心原理: 從三個Multi-Head Attention角度出發

ByPeter_Li 2 2 月, 20242 2 月, 2024

Why Transformer? 傳統RNN的架構是採用時序性的類神經網路進行自然語言的處理，這樣的方式就是透過時序方式一…

揭密大型語言模型(large language model, LLM) 變成專家的關鍵技術: 微調技巧(fine-tuning)

人工智慧 | 機器學習技術新知 | 知識分享

揭密大型語言模型(large language model, LLM) 變成專家的關鍵技術: 微調技巧(fine-tuning)

ByPeter_Li 3 8 月, 20233 8 月, 2023

為什麼要介紹大型語言模型(large language model, LLM)以及微調的技巧(fine-tuning)? …