当前位置:网站首页>通俗易懂理解樸素貝葉斯分類的拉普拉斯平滑

通俗易懂理解樸素貝葉斯分類的拉普拉斯平滑

2022-06-27 09:41:00 小白學視覺

點擊上方“小白學視覺”,選擇加"星標"或“置頂

重磅幹貨,第一時間送達

這個男生的四個特征是長相不帥,性格不好,身高矮,不上進,我們最終得出的結論是女生不嫁!很多人說這是一道送分題,哈哈哈哈。我們用數學算法也說明了不靠譜是取不到老婆滴!

那麼我們再來一個例子,假如此時另外一對情侶,這對情侶中,男生的四個特征是,長相帥,性格爆好,身高高,上進,那麼他的女朋友嫁還是不嫁呢?可能又會有小夥伴說這是一道送分題,是不是,我們下面用事實說話!

下面通過例子來引出拉普拉斯平滑過程!

從例子開始

還是下面的訓練數據:

9132621c22e0daeeb8075b115c06eaab.png

四個特征集合分別長相{帥,不帥}、性格{爆好,好,不好}、身高{高,中,矮}、上進與否{上進,不上進}

我們此時要求出該男生在四個特征分別是長相帥,性格爆好,身高高,上進的情况下,他對應的嫁與不嫁的概率誰大誰小,從而得出結論!

也就是要比較p(嫁|長相帥,性格爆好,身高高,上進)與p(不嫁|長相帥,性格爆好,身高高,上進)的概率大小。

按照樸素貝葉斯算法公式,我們可以得到如下公式:

921dd6f98133b381b7b3144a5e765fb1.png

cbf7965d454b671e2ee5a1566b70ee00.png

由於兩者的分母都是p(長相帥)、p(性格爆好)、p(身高高)、p(上進),那麼我們可以不算分母,比較的時候只比較倆個公式分子大小即可。

好的,下面我們開始計算,先計算在四個特征的條件下,嫁的概率。

我們需要分別計算p(性格爆好|嫁)、p(長相帥|嫁)、p(身高高|嫁)、p(上進|嫁)

首先我們來算p(性格爆好|嫁)=?我們觀察訓練數據,發現如下:

d1b57345be6061307ab78d903ef0bd85.png

居然沒有一個數據有爆好這個特點的,那麼p(性格爆好|嫁) = 0,那麼我們可以看出問題了,根據公式:

f1e6a7e614bd4ae2e22c08b016635f47.png

我們最後的p(嫁|長相帥、性格爆好、身高高、上進)由於一項p(性格爆好|嫁)為0,而造成整個概率為0,這顯然是錯誤的。

而這個錯誤的造成是由於訓練量不足,會令分類器質量大大降低。為了解决這個問題,我們引入Laplace校准(這就引出了我們的拉普拉斯平滑),它的思想非常簡單,就是對每個類別下所有劃分的計數加1,這樣如果訓練樣本集數量充分大時,並不會對結果產生影響,並且解决了上述頻率為0的尷尬局面。

引入拉普拉斯平滑的公式如下:

4017719c78661603d3fd3cc2aed6caf8.png

3305fae4b45d944b54b3054b436494f6.png

其中ajl,代錶第j個特征的第l個選擇,Sj代錶第j個特征的個數,K代錶種類的個數。

λ為1,這也很好理解,加入拉普拉斯平滑之後,避免了出現概率為0的情况,又保證了每個值都在0到1的範圍內,又保證了最終和為1的概率性質!

我們可以通過下面例子更加深刻的理解這個公式:(現在我們是加入拉普拉斯平滑)

加入拉普拉斯平滑

我們先需要分別計算p(性格爆好|嫁)、p(長相帥|嫁)、p(身高高|嫁)、p(上進|嫁),p(嫁)

p(性格爆好|嫁)=?統計滿足要求的如下面紅色部分

e25506b99fba83748edf1324e13c6ab0.png

沒有一個滿足是性格爆好的條件,但是此時概率不為0,按照加入拉普拉斯平滑後的公式,性格特征的個數為爆好,好,不好,三種情况,那麼Sj為3,則最終概率為1/9 (嫁的個數為6+特征個數為3)

p(長相帥|嫁)=?統計滿足條件的如下面紅色部分:

7c18348cfbf0f2476d5454b110f0af09.png

由上圖可知滿足要求的為3個,按照加入拉普拉斯平滑後的公式,長相特征的個數為帥,不帥,兩種情况,那麼Sj為2,則最終概率p(長相帥|嫁)為4/8 (嫁的個數為6+特征個數為2)

p(身高高|嫁) = ?統計滿足條件的如下面紅色部分:

d98a0bedf361da159c20bf3f95bbd916.png

由上圖可知滿足要求的為3個,按照加入拉普拉斯平滑後的公式,身高特征的個數為高,中,矮情况,那麼Sj為3,則最終概率p(身高高|嫁)為4/9 (嫁的個數為6+特征個數為3)

p(上進|嫁)=?統計滿足要求的如下面紅色部分:

edbf4e129183143f1200dfbdb7f0effe.png

由上圖可知滿足要求的為5個,按照加入拉普拉斯平滑後的公式,上進特征的個數為上進,不上進情况,那麼Sj為2,則最終概率p(上進|嫁)為6/8 (嫁的個數為6+特征個數為2)

p(嫁) = ?滿足要求的如下紅色標注:

68d9b09ac60efa1f8bbf3da0e58a6266.png

由上圖可知滿足要求的為6個,按照加入拉普拉斯平滑後的公式,種類的個數為嫁,不嫁情况,那麼K為2,則最終概率p(嫁)為7/14 = 1/2 (嫁的個數為6+種類個數為2)

到這裏為止,我們已經算出了在該男生條件下,嫁的概率為:

p(嫁|長相帥、性格爆好、身高高、上進) = 1/9*4/8*4/9*6/8*1/2

下面我們需要算出p(不嫁|長相帥、性格爆好、身高高、上進)的概率,然後與上面的數值進行比較即可,算法與上面完全一模一樣!這裏也走一遍。

我們需要估計出p(長相帥|不嫁)、p(性格爆好|不嫁)、p(身高高|不嫁)、p(上進|不嫁),p(不嫁)的概率分別為多少。

p(長相帥|不嫁)=?滿足要求如下面紅色標注:

73fb6019de35c3e8b4d702f6acb81021.png

由上圖可知滿足要求的為5個,按照加入拉普拉斯平滑後的公式,長相帥特征的個數為不帥,帥情况,那麼Sj為2,則最終概率p(長相不帥|不嫁)為6/8 (不嫁的個數為6+特征個數為2)

p(性格爆好|不嫁)=?滿足要求如下面紅色標注:

d1c906b03d54e60a907233fab9975679.png

沒有一個滿足是性格爆好的條件,但是此時概率不為0,按照加入拉普拉斯平滑後的公式,性格特征的個數為爆好,好,不好,三種情况,那麼Sj為3,則最終概率p(性格爆好|不嫁)為1/9 (不嫁的個數為6+特征個數為3)

p(身高高|不嫁)=?滿足要求如下面紅色標注:

17b21487c7f67340d0d9abbeec6594a2.png

沒有一個滿足是身高高的條件,但是此時概率不為0,按照加入拉普拉斯平滑後的公式,身高特征的個數為高,中,矮,三種情况,那麼Sj為3,則最終概率p(身高高|不嫁)為1/9 (不嫁的個數為6+特征個數為3)

p(上進|不嫁)=?滿足要求如下面紅色標注:

f3e9b1e879fdd8064bdb4703215a450c.png

由上圖可知滿足要求的為3個,按照加入拉普拉斯平滑後的公式,上進特征的個數為上進,不上進情况,那麼Sj為2,則最終概率p(上進|不嫁)為4/8 (不嫁的個數為6+特征個數為2)

p(不嫁)=?滿足要求的如紅色標注:

19897474413276cf3c303933f1a334b4.png

由上圖可知滿足要求的為6個,按照加入拉普拉斯平滑後的公式,種類的個數為嫁,不嫁情况,那麼K為2,則最終概率p(不嫁)為7/14 = 1/2 (不嫁的個數為6+種類個數為2)

到這裏為止,我們已經算出了在該男生條件下,不嫁的概率為:

p(不嫁|長相帥、性格爆好、身高高、上進) = 5/8*1/9*1/9*3/8*1/2

結論

於是我們可以得到

p(嫁|長相帥、性格爆好、身高高、上進) = 1/9*4/8*4/9*6/8*1/2 > p(不嫁|長相帥、性格爆好、身高高、上進) = 6/8*1/9*1/9*4/8*1/2

於是我們可以大膽的告訴女生,這樣的好男人,貝葉斯告訴你了,該嫁!!!

這就是我們使用拉普拉斯平滑後計算的整個算法過程!

希望對大家的理解有幫助~歡迎大家指錯交流!

好消息!

小白學視覺知識星球

開始面向外開放啦

569720a85465096c37d792a57c5b5cd8.png

下載1:OpenCV-Contrib擴展模塊中文版教程

在「小白學視覺」公眾號後臺回複:擴展模塊中文教程,即可下載全網第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟踪、生物視覺、超分辨率處理等二十多章內容。


下載2:Python視覺實戰項目52講
在「小白學視覺」公眾號後臺回複:Python視覺實戰項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數、添加眼線、車牌識別、字符識別、情緒檢測、文本內容提取、面部識別等31個視覺實戰項目,助力快速學校計算機視覺。


下載3:OpenCV實戰項目20講
在「小白學視覺」公眾號後臺回複:OpenCV實戰項目20講,即可下載含有20個基於OpenCV實現20個實戰項目,實現OpenCV學習進階。


交流群

歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫學影像、GAN、算法競賽等微信群(以後會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功後會根據研究方向邀請進入相關微信群。請勿在群內發送廣告,否則會請出群,謝謝理解~
原网站

版权声明
本文为[小白學視覺]所创,转载请带上原文链接,感谢
https://yzsam.com/2022/178/202206270937212999.html

随机推荐