在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么損失函數(shù)可以是這個(gè)形式?機(jī)器學(xué)習(xí)的終極目標(biāo)是什么?

wpl4_DeepLearni ? 來(lái)源:lp ? 2019-04-08 17:23 ? 次閱讀

我們知道邏輯回歸的損失函數(shù)cost=-ylogo-(1-y)log(1-o),其中o為模型輸出,y為樣本真實(shí)分布,為什么損失函數(shù)可以是這個(gè)形式?機(jī)器學(xué)習(xí)的終極目標(biāo)是什么?機(jī)器學(xué)習(xí)中測(cè)試集起的作用是什么?

首先我們需要知道一個(gè)概念——信息量,它指的是一個(gè)事件發(fā)生所帶來(lái)的信息。日常生活中,信息的載體是消息,比如“一個(gè)星期有7天”這條消息,它所帶來(lái)的信息量我們可以認(rèn)為是0,為什么呢?用大白話解釋就是說了等于沒說,因?yàn)椤耙粋€(gè)星期有7天”這個(gè)事件它是確定事件。又比如說“老板希望這個(gè)月32號(hào)發(fā)工資”,從科學(xué)的角度來(lái)講,這個(gè)消息的信息量為無(wú)窮大,因?yàn)檫@是不可能事件。而另外一條消息“埃航一架飛機(jī)墜毀了”,這個(gè)消息帶來(lái)的信息量就非常大,因?yàn)轱w機(jī)發(fā)生事故的概率很小,而墜毀的概率就更小了,因此這個(gè)事件的不確定性非常大,所以這條消息帶來(lái)的信息量很大。

題圖:保羅·高更《我們從何處來(lái)?我們是誰(shuí)?我們向何處去?》

總結(jié)一下,信息量反映一個(gè)事件不確定性的程度,它在數(shù)學(xué)上有一個(gè)定義,就是I=-log(p),-log是遞減函數(shù),p越大,那么I就越小。也就是說,一個(gè)事件的確定性程度越高,它發(fā)生所帶來(lái)的信息量就越小。

不過,當(dāng)事件還沒有發(fā)生的時(shí)候,就不是直接去求信息量了,而應(yīng)該是求信息量的期望值,所以這個(gè)時(shí)候,我們要求的是信息熵,需要在信息量前面乘以該事件發(fā)生的概率,也就是信息熵H(P)=-Plog(P),所以,信息熵反映的是一個(gè)事件還沒有發(fā)生之前,它發(fā)生時(shí)候帶來(lái)信息量的期望值。在以2為底求對(duì)數(shù)的時(shí)候,信息熵的單位可以記為bit。

也可以理解為,根據(jù)真實(shí)分布,我們能夠找到一個(gè)最優(yōu)策略,該策略可以以最小的代價(jià)消除系統(tǒng)的不確定性,而這個(gè)代價(jià)的大小就是信息熵。

介紹為信息熵H(P)之后,我們?cè)賮?lái)看交叉熵,交叉熵出現(xiàn)的背景是我們想知道分布Q是否可以代表分布P,放到機(jī)器學(xué)習(xí)中,假設(shè)測(cè)試集的分布可以認(rèn)為是P,這個(gè)是確定的,因?yàn)檎?fù)樣本都是我們提前標(biāo)定好的,標(biāo)定好那一刻之后,它的分布就被唯一確定了,而分布Q則是我們訓(xùn)練好的網(wǎng)絡(luò)。現(xiàn)在,我們想知道對(duì)于測(cè)試樣本的概率分布為P的情況下,訓(xùn)練好的網(wǎng)絡(luò)的分布Q帶給我們的不確定性期望值為多少?用公式描述就是用概率分布P去乘以訓(xùn)練好的網(wǎng)絡(luò)的信息量:

H(P,Q)=-Plog(Q)

如果H(P,Q)為0,說明我們訓(xùn)練好的網(wǎng)絡(luò)帶來(lái)的不確定性為0,也就是說我們標(biāo)定的數(shù)據(jù)為正,網(wǎng)絡(luò)輸出也為正,標(biāo)定的數(shù)據(jù)為負(fù),網(wǎng)絡(luò)輸出也為負(fù),沒有任何懸念可言,因此,使得交叉熵H(P,Q)=0不就是我們訓(xùn)練網(wǎng)絡(luò)的終極目標(biāo)嗎?

最后,我們還要看相對(duì)熵(又稱KL散度)的概念,在用分布Q去擬合分布P的時(shí)候,我們一定會(huì)多產(chǎn)生一些無(wú)關(guān)緊要的信息熵,那么這個(gè)多余的信息熵就是用交叉熵減去真實(shí)分布熵,用公式表示就是:

D(P||Q)=H(P,Q)-H(P)

一般情況下,在標(biāo)記員標(biāo)記好數(shù)據(jù)的那一刻,P的分布就已經(jīng)確定了,H(P)可以認(rèn)為是一個(gè)常數(shù),所以優(yōu)化H(P,Q)實(shí)際上就等于優(yōu)化D(P||Q),也就是說優(yōu)化交叉熵等同于優(yōu)化相對(duì)熵或優(yōu)化KL散度,因此我們經(jīng)常看到交叉熵、相對(duì)熵或KL散度混淆使用,原因就在這里。

那么回到邏輯回歸中,樣本要么為正,要么為負(fù),假設(shè)測(cè)試集真實(shí)標(biāo)簽為y,模型輸出為o,于是交叉熵為-ylog(o)-(1-y)log(1-o),就得到了我們開頭說的損失函數(shù)的形式。損失函數(shù)值越小,那么用模型的輸出去逼近測(cè)試集真實(shí)的分布所消耗的額外信息熵就越小。需要注意的是,我們這里用測(cè)試集的分布來(lái)代表真實(shí)分布,因此測(cè)試集的選取是十分重要的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 信息
    +關(guān)注

    關(guān)注

    0

    文章

    407

    瀏覽量

    35820
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4367

    瀏覽量

    64040
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8487

    瀏覽量

    133975

原文標(biāo)題:從信息論的角度來(lái)理解損失函數(shù)

文章出處:【微信號(hào):DeepLearningDigest,微信公眾號(hào):深度學(xué)習(xí)每日摘要】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    [1.1.1]--VR的終極目標(biāo)及當(dāng)前的實(shí)現(xiàn)形式

    vrVR/AR
    學(xué)習(xí)電子知識(shí)
    發(fā)布于 :2022年12月04日 22:17:48

    [1.1.1]--VR的終極目標(biāo)及當(dāng)前的實(shí)現(xiàn)形式

    vrVR/AR
    jf_75936199
    發(fā)布于 :2023年02月23日 02:31:09

    【DIY掃地機(jī)器人】第二篇----勘察現(xiàn)場(chǎng),制定計(jì)劃

    `《瓦力》里的MO應(yīng)該是保潔實(shí)現(xiàn)人工智能化的終極目標(biāo),看到一個(gè)如此有潔癖的機(jī)器人,有時(shí)候都慚愧,科幻畢竟是科幻,我們可以朝著那個(gè)方向邁上一小步,相信我們的后人會(huì)實(shí)現(xiàn)這種既幽默又愛干凈的高科技,就像
    發(fā)表于 03-13 18:29

    【小e物聯(lián)網(wǎng)試用體驗(yàn)】之makefile

    幾個(gè)基本概念1,終極目標(biāo)即make最終要?jiǎng)?chuàng)建的目標(biāo),所有其他目標(biāo)的創(chuàng)建都依賴于此目標(biāo),make的執(zhí)行也是從這里開始默認(rèn)的終極目標(biāo)一般是all
    發(fā)表于 07-06 20:17

    求一種stm32單片機(jī)按鍵消抖解決方案

    如果有更好的解決方案或是發(fā)現(xiàn)天神的方案有問題,歡迎大家熱烈討論!明確按鍵的使用環(huán)境和終極目標(biāo)使用環(huán)境首先我們的按鍵使用在有操作系統(tǒng)的環(huán)境中,不能使用占用CPU的延時(shí)函數(shù),使用操作系統(tǒng)的延時(shí)每20ms
    發(fā)表于 11-26 08:15

    工作中的C++基本原理及技巧

    目錄 基本原理 拋棄托管擴(kuò)展 未來(lái)的樂趣 編程的演變 終極目標(biāo) 結(jié)束語(yǔ),盡管不是再見 這個(gè)月,我要改變常規(guī)的問答形式來(lái)告訴您關(guān)于
    發(fā)表于 11-03 11:59 ?23次下載

    博通對(duì)終極目標(biāo)高通公司的收購(gòu)無(wú)果而終,今后的博通何去何從?

    行業(yè)的并購(gòu)終結(jié)者,博通(Broadcom Ltd., AVGO)對(duì)終極目標(biāo)高通公司(Qualcomm Inc., QCOM)的收購(gòu)無(wú)果而終,今后的博通何去何從? 半導(dǎo)體行業(yè)經(jīng)過數(shù)年的整合后,博通首席執(zhí)行長(zhǎng)陳福陽(yáng)(Hock Tan)面臨這樣一種局面:很少有目標(biāo)公司的影響力能
    的頭像 發(fā)表于 03-18 09:41 ?4357次閱讀

    機(jī)器學(xué)習(xí)經(jīng)典損失函數(shù)比較

    所有的機(jī)器學(xué)習(xí)算法都或多或少的依賴于對(duì)目標(biāo)函數(shù)最大化或者最小化的過程。我們常常將最小化的函數(shù)稱為損失
    的頭像 發(fā)表于 06-13 17:53 ?8824次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>經(jīng)典<b class='flag-5'>損失</b><b class='flag-5'>函數(shù)</b>比較

    機(jī)器學(xué)習(xí)實(shí)用指南:訓(xùn)練和損失函數(shù)

    這個(gè)損失函數(shù)是合理的,因?yàn)楫?dāng) $t$ 接近 0 時(shí),$-log(t)$ 變得非常大,所以如果模型估計(jì)一個(gè)正例概率接近于 0,那么損失函數(shù)將會(huì)
    的頭像 發(fā)表于 06-29 15:02 ?8781次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>實(shí)用指南:訓(xùn)練和<b class='flag-5'>損失</b><b class='flag-5'>函數(shù)</b>

    人工智能的終極目標(biāo):類腦智能

    這中間發(fā)生了什么?你可能回憶了兩人第一次見面的情景,這個(gè)信息從短時(shí)記憶中廣播出來(lái),并傳到大腦的各個(gè)長(zhǎng)時(shí)記憶處理器上。其中一個(gè)處理器表示,她是做機(jī)器學(xué)習(xí)的。這個(gè)信息被傳到意識(shí)中,再?gòu)V播到
    發(fā)表于 07-30 16:25 ?3362次閱讀

    英飛凌舉行各項(xiàng)質(zhì)量項(xiàng)目,向?qū)崿F(xiàn)“零缺陷”的質(zhì)量終極目標(biāo)不斷前進(jìn)。

    ? 自創(chuàng)立以來(lái),零缺陷一直是英飛凌質(zhì)量文化的重要理念,也是其卓越運(yùn)營(yíng)的關(guān)鍵要求。為此,英飛凌舉行了各項(xiàng)質(zhì)量項(xiàng)目,向?qū)崿F(xiàn)零缺陷的質(zhì)量終極目標(biāo)不斷前進(jìn)。 3-2-1卓越績(jī)效管理模式 通過結(jié)合德國(guó)管理精髓與本地實(shí)踐經(jīng)驗(yàn),英飛凌無(wú)錫獨(dú)創(chuàng)了企業(yè)的長(zhǎng)盛之道
    的頭像 發(fā)表于 09-16 16:51 ?2634次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中分類與回歸常用的幾種損失函數(shù)

    本文將介紹機(jī)器學(xué)習(xí)、深度學(xué)習(xí)中分類與回歸常用的幾種損失函數(shù),包括均方差損失 Mean Squar
    的頭像 發(fā)表于 10-09 16:36 ?6473次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中分類與回歸常用的幾種<b class='flag-5'>損失</b><b class='flag-5'>函數(shù)</b>

    Gambetta:我們的終極目標(biāo)是建造一個(gè)大規(guī)模的量子計(jì)算機(jī)

    阿波羅任務(wù)與下一代大藍(lán)量子計(jì)算機(jī)進(jìn)行了對(duì)比。 在IBM Research上發(fā)表的一篇文章中,Gambetta說:就像登月一樣,我們有一個(gè)終極目標(biāo),那就是進(jìn)入一個(gè)超越經(jīng)典計(jì)算機(jī)的領(lǐng)域:我們想要建造一個(gè)大規(guī)模的量子計(jì)算機(jī)。 遠(yuǎn)大的抱負(fù)可以幫助人類實(shí)現(xiàn)登上月球的
    的頭像 發(fā)表于 10-29 10:18 ?2353次閱讀

    stm32單片機(jī)按鍵消抖、長(zhǎng)按、多擊終極解決方案

    如果有更好的解決方案或是發(fā)現(xiàn)天神的方案有問題,歡迎大家熱烈討論!明確按鍵的使用環(huán)境和終極目標(biāo)使用環(huán)境首先我們的按鍵使用在有操作系統(tǒng)的環(huán)境中,不能使用占用CPU的延時(shí)函數(shù),使用操作系統(tǒng)的延時(shí)每20ms
    發(fā)表于 11-19 10:21 ?59次下載
    stm32單片機(jī)按鍵消抖、長(zhǎng)按、多擊<b class='flag-5'>終極</b>解決方案

    【Makefile】簡(jiǎn)單介紹

    其中第一條規(guī)則中的”目標(biāo)“,將會(huì)成為終極目標(biāo)。我們最終目的,就是為了生成這個(gè)目標(biāo)的。
    的頭像 發(fā)表于 11-18 10:22 ?616次閱讀
    主站蜘蛛池模板: 久草色在线 | 日本片巨大的乳456线观看 | 一区二区三区高清 | 午夜影院观看 | 中文字幕一区二区三区四区五区 | 亚洲视频欧美视频 | 在线观看亚洲一区 | 日韩欧美高清一区 | 爽死你个放荡粗暴小淫视频 | 人人弄| 中韩日欧美电影免费看 | www.国产一区二区三区 | 69日本xxxxxxxxx18| 日韩精品视频免费在线观看 | 天天草狠狠干 | 一级特黄毛片 | 最新色视频 | 欧美色频 | 国产一级在线观看 | 欧美军同video69视频 | 好硬好大好爽女房东在线观看 | 三级黄色a | 色老头久久久久 | 亚洲福利视频一区二区 | 狠狠色噜噜狠狠狠狠2018 | 精品视频一区二区三区 | 狠狠色噜噜噜噜狠狠狠狠狠狠奇米 | 亚洲一级毛片免费看 | 一国产大片在线观看 | 一级国产特黄aa大片 | 四虎影院精品 | 成人免费视频一区 | 四虎最新网| 亚洲黄色小说网站 | 色播基地| 天天干干干干 | 日本黄网站高清色大全 | 一级毛片aa| 在线免费影视 | 四虎4hu影库永久地址 | 天天躁夜夜 |