本章給大家介紹一種用于預(yù)測(cè)的算法——邏輯回歸(logistic regression)
給定一個(gè)輸入特征向量x(例如你想要識(shí)別的圖像——是否有貓),你需要一個(gè)算法進(jìn)行計(jì)算之后進(jìn)行結(jié)果輸出(在這里我們用的是邏輯回歸算法)。這個(gè)被輸出的預(yù)測(cè)結(jié)果我們稱為y^y^,假設(shè)y是1,如果預(yù)測(cè)得很準(zhǔn)的話y^y^可能會(huì)是0.99)。
上圖第一個(gè)公式中的x是個(gè)(n,1)維的矩陣,表示一個(gè)訓(xùn)練樣本,里面的n表示一個(gè)訓(xùn)練樣本中的特征數(shù)量,例如一張圖片就是一個(gè)訓(xùn)練樣本,圖片中每個(gè)顏色強(qiáng)度值就是一個(gè)特征;w也是一個(gè)(n,1)維的矩陣,它表示權(quán)重(weight),它一一對(duì)應(yīng)于每個(gè)輸入的特征,也可以說它指示了某個(gè)特征的重要程度;b是一個(gè)實(shí)數(shù),在這里可以將其看作為一個(gè)閥值。
如何理解w和b呢?
我舉個(gè)例子來幫助大家理解??梢园焉厦娴乃惴ㄟ^程看作是一種通過權(quán)衡輸入然后再做出決定的一個(gè)過程。假設(shè)周末即將到來,你聽說在你的城市將會(huì)有一個(gè)音樂節(jié)。你要決定是否去參加這個(gè)節(jié)日。你需要通過權(quán)衡3個(gè)因素(3個(gè)特征)來做出決定:1、天氣好嗎 2、你的女友是否愿意陪你去 3、舉辦地點(diǎn)離地鐵近嗎 這3個(gè)因素就對(duì)應(yīng)著上圖中的x1、x2,x3(它們是x這個(gè)訓(xùn)練樣本中的3個(gè)特征)。
我們可以給它們賦個(gè)值,如果天氣好,那么x1為1,否則為0,x2和x3雷同;假設(shè)你很討厭壞天氣,如果天氣不好,你就不會(huì)去參加這個(gè)節(jié)日,對(duì)其它兩個(gè)因素要求不高(這里假設(shè)你是個(gè)老司機(jī),女人多得是,不怕冷落了女友)。那么我們分別給3個(gè)權(quán)重賦值為7,2,2。w1的值大很多,這表明天氣對(duì)你來說很重要,比你的女友是否愿意去,以及交通的便利性更重要。而b我們可以看作一個(gè)閥值,假設(shè)我們給b賦值為-5,那么也就是說,只要天氣好,即使女友不陪你去、交通也不方便,你也會(huì)去參加這個(gè)節(jié)日——x1 * w1 + x2 * w2 + x3 * w3 = 1 * 7 + 0 * 2 + 0 * 2 = 7(這里的*代表乘法)(我們這里先不考慮σ函數(shù)),而7 +(-5)> 0,結(jié)果是你會(huì)去那個(gè)音樂節(jié)。如果我們選擇不同的w和b值,那么對(duì)于同一個(gè)輸入x,會(huì)有不同的結(jié)果輸出。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)的目的就是通過訓(xùn)練過程來得到這些w和b值(后面會(huì)教大家如何來訓(xùn)練得到它們)。這些w和b值可以讓神經(jīng)網(wǎng)絡(luò)得到一項(xiàng)判斷能力,一項(xiàng)預(yù)測(cè)能力——輸入一張圖片,神經(jīng)網(wǎng)絡(luò)根據(jù)訓(xùn)練好的w和b,通過上面的公式根據(jù)每個(gè)像素的值以及與其對(duì)應(yīng)的權(quán)重值以及閾值來判定這張圖里是否有貓。神經(jīng)網(wǎng)絡(luò)就是這樣來進(jìn)行預(yù)測(cè)的。它和我們?nèi)祟惖乃伎挤绞绞且粯拥?。雖然我們?nèi)丝梢宰龀龇浅?fù)雜的判斷,但是基本原理是很簡(jiǎn)單的。
人為什么能輕松分辨出一個(gè)圖片中是否有貓?因?yàn)槲覀內(nèi)司褪且粋€(gè)巨型的神經(jīng)網(wǎng)絡(luò),這個(gè)神經(jīng)網(wǎng)絡(luò)里面包含了數(shù)億甚至更多的神經(jīng)元(上圖藍(lán)色的圓圈就表示一個(gè)神經(jīng)元),每個(gè)神經(jīng)元都可以接受多個(gè)輸入,在日常生活中,小孩子通過大人的教導(dǎo),不斷的看見貓,我們的神經(jīng)元對(duì)于這個(gè)輸入就形成了很多特定的w(權(quán)重),所以當(dāng)再次看見一個(gè)貓時(shí),這個(gè)輸入(這個(gè)貓)與相應(yīng)的w聯(lián)合起來進(jìn)行運(yùn)算后,其結(jié)果就指示了這個(gè)輸入是一個(gè)貓。
下面再來說一下σ,它代表了sigmoid函數(shù),上面是它的定義公式以及圖形。我們?yōu)槭裁葱枰吭谏厦嫖覀兣e的去參加節(jié)日的例子中,我們得出的結(jié)果為2,其實(shí)對(duì)于不同的x和w值,結(jié)果可能會(huì)更大。所以這并不適用于二元分類問題,因?yàn)樵诙诸悊栴}中你想要得到的y^y^應(yīng)該表示一個(gè)概率,一個(gè)輸入是否等于它真實(shí)標(biāo)簽的概率(例如輸入的圖像里面是否有貓)。所以y^y^的值應(yīng)該在0和1之間。sigmoid函數(shù)的作用就是把計(jì)算結(jié)果轉(zhuǎn)換為0和1之間的值。通過看它的圖形就可以明白,往sigmoid函數(shù)里輸入的值z(mì)越大,那么y^y^就越靠近1,也就是里面有貓的概率就越大。
以上就是神經(jīng)網(wǎng)絡(luò)為什么能夠給出預(yù)測(cè)結(jié)果的大致原理。其實(shí)就像jack床長(zhǎng)所說,“每個(gè)人都是一個(gè)巨型的神經(jīng)網(wǎng)絡(luò)”,只要我們善于反思、善于總結(jié)、善于學(xué)習(xí),每個(gè)人都會(huì)變得越來越強(qiáng)大,都能成就更好的自己。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4785瀏覽量
101266 -
算法
+關(guān)注
關(guān)注
23文章
4632瀏覽量
93451
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)是如何給出預(yù)測(cè)結(jié)果的?
文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論