機器學習面臨的問題種類介紹:回歸與分類

今天跟大家分享機器學習遇到的問題,大致可分為兩個種類,也就是回歸和分類,我們需要先對所要面臨的問題去解析,看這個問題是對應到什麼樣的類別,然後才可以對症下藥,找到正確的方法去解決問題,以下是對回歸與分類問題的介紹。

第一個要講解的是回歸問題,什麼是回歸問題呢?回歸問題意思是我們想從現有的數據當中,去找尋數據變化的趨勢,並且根據這個趨勢建立數學模型,有了數學模型後,才能預測得到各種情況下的結果。

舉例來說,回歸問題就是應用在股價預測上,股價會隨著時間不斷波動變化,我們當然希望透過過去累積的數據,去抓住整體股價變化趨勢,建立模型,讓我們可以去預測出未來股價變化。

以類神經網路的結構就是如同以下所示,最右邊輸出層則為一個節點。回歸預測主要要得到的結果是數值,因此最終是一個節點。

分類問題有分成兩種,一種是二元分類,另一種是多元分類。

這邊先來講解二元分類問題,二元分類問題代表的是只有兩個類別的分類,舉例來說,就是輸入一張圖片,讓機器去辨別這張圖片到底是筆電還是不是筆電,只會有兩種選擇。

這樣的問題對應的類神經網路結構為在最右邊輸出是一個節點。機器在分類問題當中,其實在輸出的部分,就並非是如同上面回歸問題一樣,是輸出一個數值。取而代之的是,預測結果是一個機率,這個機率代表的是屬於某個類別的可能性。舉例來說,機率1代表是100%這張圖片就是筆電,而當機率越低,這張圖片就會越來越不是筆電。最極端就是機率為0,就代表一定不是筆電。當機率在0~1之間時,則是要在看機率是往哪裡靠,才決定是哪個類別。舉例來說,預測出結果的機率為0.8,這時候0.8會比較靠近1,離0會比較遠,此時就會判定這樣分類的結果為這張圖片就是筆電。

多元分類是代表要分的類別超過兩個以上,舉例來說,要分類類別有三個,一個是筆電,桌電,手機

這時候在分類結果上,一樣是得到機率,會去計算屬於每個類別的機率為何,舉例來說,預測得到結果為筆電機率為0.8,桌電機率為0.1,手機機率為0.1,則這張圖片就會視為是筆電。

結論

透過上述之方式,我們就可針對各個問題的種類,去用特定的方式去做處理,才能得到最佳的結果。

[參考資料]:

1.快速反應機制─類神經網路

2.機器學習與人工神經網路(二):深度學習(Deep Learning)

3.機器學習的衰頹興盛:從類神經網路到淺層學習

[相關文章]:

1.類神經網路(Deep neural network, DNN)介紹

2.類神經網路—揭開網路架構調整秘辛

3.類神經網路—啟動函數介紹

4.類神經網路—前向傳播法

5.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法

6.類神經網路—反向傳播法(二): 淺談梯度

7.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法

8.類神經網路—反向傳播法(四): 揭開反向傳播法神秘面紗

9.機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法

10.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感

[延伸閱讀]:

1.卷積類神經網路(Convolution neural network,CNN)介紹

2.遞迴類神經網路(Recurrent neural network,RNN)介紹

3.淺談最近非常火紅的ChatGPT背後可能原理機制為何?