鳶尾花分類介紹
鳶尾花細分會有不同種類,在機器學習常用的數據集裡面,就有鳶尾花數據集,裡面有不同鳶尾花的特徵以及相對應的類別。本篇文章舉的範例為假設我們今天有一些鳶尾花的樣本,我們想要用程式辨識到底這些樣本所屬的鳶尾花類別為何,我們將採用三種不同的方法也就是深度學習、機器學習、規則為主方法,來說明實現的方式。
方法介紹
首先深度學習的方法,是輸入圖片之後,像是卷積類神經網路,就會利用卷積、池化進行影像辨識,因此,模型就可以自動從圖片當中辨別特徵,然後透過大量數據進行學習。在這個方法裡,不用人為給定特徵,也不用人為去教模型學習,而是從數據當中,即可自動化進行學習。待模型建立完畢後,輸入圖片到模型中,就可辨別鳶尾花種類。
機器學習的做法,無法直接輸入圖片讓機器辨別特徵,必須要採用人為方式,樣本當中擷取特徵,進行特徵工程,舉例來說要把每一個鳶尾花的樣本,把這些花朵的花瓣長度與寬度等等特徵資訊取得之後,再讓機器從數據當中學習。
在預測的時候,每當我們預測新樣本,就需要針對新樣本在進行特徵工程,擷取特徵後,才能輸入這些特徵到模型當中進行預測,才能得到分類結果。
規則為主的方法,在建立方法的時候,需要先從鳶尾花樣本當中,擷取特徵像是取得花瓣長度、寬度等等訊息,待特徵取得完畢後,再觀察特徵與類別的關係,最終再用人為方式訂定判別規則。
在預測的時候,就是針對新樣本,取得特徵後,像是如果取得的特徵為花瓣長度為4,寬度為1,就將特徵輸入到我們方法當中做分類,依照我們規則分出來的方法,就是種類1。
綜合比較
1.針對深度學習而言,可自動辨別特徵,從數據當中去學習,一般而言所需的運算資源會最多。隨著數據量提升,精準度會提升最多,因此,又稱為大數據的方法。方法建立的前提,是需要有一定的數據量才能建立模型。
2.針對機器學習而言,需要從人為方式進行特徵工程,有特徵後,模型才能從數據當中學習。一般而言,耗費運算資源次之。隨著數據量提升,精準度提升的效果也是次之。方法建立的前提,是需要有一定的數據量才能學習。
3.針對規則為主方法,需要人為查找特徵也要訂出分類規則。一般而言耗費運算資源最低。隨著數據量增多,在方法規則不變的情況,不會改變精準度。方法建立的前提是少量數據也可以建立,因為主要是有規則有方法都可行。
[相似文章]:
2.規則為主的方法(rule-based method)是什麼? 與機器學習(machine learning)的差異為何?它們的應用場景是在哪裡?
[類神經網路基礎系列專文]:
1.類神經網路(Deep neural network, DNN)介紹
3.類神經網路—啟動函數介紹(一): 深入解析Relu與Sigmoid函數:如何影響類神經網路的學習效果?
4.類神經網路—啟動函數介紹(二): 回歸 vs. 分類: 線性函數與Tanh函數之原理探索
5.類神經網路—啟動函數介紹(三): 掌握多元分類的核心技術:不可不知的softmax函數原理
6.類神經網路—啟動函數介紹(四): 如何選擇最適當的啟動函數?用一統整表格讓您輕鬆掌握
8.類神經網路—反向傳播法(一): 白話文帶您了解反向傳播法
10.類神經網路—反向傳播法(三): 五步驟帶您了解梯度下降法
11.類神經網路—反向傳播法(四): 揭開反向傳播法神秘面紗
12.機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法
13.類神經網路—反向傳播法(五): 用等高線圖讓您對學習率更有感
[機器學習基礎系列專文]:
1.機器學習訓練原理大揭秘:六步驟帶您快速了解監督式學習的訓練方法
[類神經網路延伸介紹]:
1.卷積類神經網路(Convolution neural network,CNN)介紹
2.遞迴類神經網路(Recurrent neural network,RNN)介紹
[ChatGPT系列專文]: