在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

提供一種logit的調(diào)整方法來應(yīng)對長尾分布的問題

工程師鄧生 ? 來源:GiantPandaCV ? 作者:Garfield ? 2022-09-05 14:31 ? 次閱讀

1. 論文信息

2. 介紹

在傳統(tǒng)的分類和識別任務(wù)中,訓(xùn)練數(shù)據(jù)的分布往往都受到了人工的均衡,即不同類別的樣本數(shù)量無明顯差異,如最有影響力的ImageNet,每種類別的樣本數(shù)量就保持在1300張左右。

aece2de2-2cd9-11ed-ba43-dac502259ad0.jpg

在實(shí)際的視覺相關(guān)任務(wù)中,數(shù)據(jù)都存在如上圖所示的長尾分布,少量類別占據(jù)了絕大多少樣本,如圖中Head部分,大量的類別僅有少量的樣本,如圖中Tail部分。解決長尾問題的方案一般分為4種:

重采樣 (Re-sampling):采樣過程中采樣不同的策略,如對tail中的類別樣本進(jìn)行過采樣,或者對head類別樣本進(jìn)行欠采樣。

重加權(quán) (Re-weighting):在訓(xùn)練過程中給與每種樣本不同的權(quán)重,對tail類別loss設(shè)置更大的權(quán)重,這樣有限樣本數(shù)量。

新的學(xué)習(xí)策略 (Learning strategy):有專門為解決少樣本問題涉及的學(xué)習(xí)方法可以借鑒,如:meta-learning、transfer learning。另外,還可以調(diào)整訓(xùn)練策略,將訓(xùn)練過程分為兩步:第一步不區(qū)分head樣本和tail樣本,對模型正常訓(xùn)練;第二步,設(shè)置小的學(xué)習(xí)率,對第一步的模型使用各種樣本平衡的策略進(jìn)行finetune。

其實(shí)就筆者喜歡的風(fēng)格而言,我對重加權(quán)這一方向的工作更為喜歡,因?yàn)橥ㄟ^各種統(tǒng)計(jì)學(xué)上的結(jié)論,來設(shè)計(jì)很好的loss改進(jìn)來解決長尾/不均衡分布問題,我喜歡這類研究的原因是,他們(大部分)實(shí)現(xiàn)簡單,往往只需幾行代碼修改下loss,就可以取得非常有競爭力的結(jié)果,因?yàn)楹唵嗡院苋菀走\(yùn)用到一些復(fù)雜的任務(wù)中。

而從“奧卡姆剃刀”來看,我覺得各種遷移模型的理念雖然非常好,從頭部常見類中學(xué)習(xí)通用知識,然后遷移到尾部少樣本類別中,但是往往會需要設(shè)計(jì)復(fù)雜的模塊,有增加參數(shù)實(shí)現(xiàn)過擬合的嫌疑,我認(rèn)為這其實(shí)是把簡單問題復(fù)雜化。我覺得從統(tǒng)計(jì)方面來設(shè)計(jì)更加優(yōu)美,因此本文來介紹一篇我非常喜歡的從統(tǒng)計(jì)角度出發(fā)的工作。這篇論文來自Google Research,他們提供了一種logit的調(diào)整方法來應(yīng)對長尾分布的問題。由于研究風(fēng)格更偏向 machine learning, 所以論文風(fēng)格更偏向統(tǒng)計(jì)類。

本文首先總結(jié)了對于logit的調(diào)整方法:

聚焦于測試階段:對學(xué)習(xí)完的logit輸出進(jìn)行處理(post-hoc normalization),根據(jù)一些先驗(yàn)假設(shè)進(jìn)行調(diào)整。

聚焦于訓(xùn)練階段:在學(xué)習(xí)中調(diào)整loss函數(shù),相對平衡數(shù)據(jù)集來說,調(diào)整優(yōu)化的方向。

aeddeafc-2cd9-11ed-ba43-dac502259ad0.png

如上圖,這兩種方法都有許多較為優(yōu)秀的工作,但是文中描述了這兩種方法的幾種限制:

weight normalization非常依賴于weight的模長會因?yàn)閏lass的data數(shù)量稀少而變小,然而這種假設(shè)非常依賴于優(yōu)化器的選擇

直接修改loss進(jìn)行重加權(quán),也會影響模型的表征學(xué)習(xí),從而導(dǎo)致優(yōu)化過程不穩(wěn)定,同時(shí)模型可能對尾部類過擬合,傷害了模型表征學(xué)習(xí)能力。

論文的motivation就是克服這些缺點(diǎn),讓不同類(head and tail classed)之間的logit能有一個(gè)相對較大的margin,設(shè)以一個(gè)consistent的loss,來讓模型的性能更好。

3. 問題設(shè)定和過往方法回顧

3.1 Problem Settings

論文先從統(tǒng)計(jì)學(xué)的角度定義了一下這個(gè)problem settings,其實(shí)就是訓(xùn)練一個(gè)映射,讓這個(gè)scorer的誤分類損失最小:

但是類別不平衡的學(xué)習(xí)的setting導(dǎo)致P(y)分布是存在高度地skewed,使得許多尾部類別標(biāo)簽出現(xiàn)的概率很低。在這里,錯誤分類的比例就不是一個(gè)合適的metric: 因?yàn)槟P退坪醢阉械奈膊款悇e都分類成頭部類別也更夠取得比較好的效果。所為了解決這個(gè)問題,一個(gè)自然的選擇是平衡誤差,平均每個(gè)類的錯誤率,從而讓測試計(jì)算出的metric不是有偏的。

論文總結(jié)出了一個(gè)比較general的loss形式:

這里 是類別 yy 的權(quán)重;是另一個(gè)超參, 用來控制 margin 的大小。

3.2 Post-hoc weight normalization

由于頭部類別多,容易過擬合,自然會對頭部類別overconfidence,所以我們需要通過一定的映射來調(diào)整logit。具體到調(diào)整的策略,自然是讓大類置信度低一點(diǎn),小類置信度高一點(diǎn)。

for , where and . Intuitively, either choice of upweights the contribution of rare labels through weight normalisation. The choice is motivated by the observations that tends to correlate with . Further to the above, one may enforce during training.

這里引用了一些其他做long-tail learning的論文,可以參考以便更好地對這一塊進(jìn)行理解。

3.3 Loss modification

至于對于loss的修改,就是很直接了在前面加一個(gè)權(quán)重,對于的取值,自然就是各個(gè)工作重點(diǎn)關(guān)注和改進(jìn)的地方。

af02f478-2cd9-11ed-ba43-dac502259ad0.png

論文給予原有的各種方法各種比較全面的總結(jié)。

4. 方法

首先進(jìn)行Post-hoc logit adjustment:

其實(shí)等號左邊就是一個(gè)根據(jù)類別的樣本數(shù)進(jìn)行re-weighting。但是為了在exp的線性變換加上temperature時(shí)候不影響排序問題,所以把等號右邊變成上式,通過這種方式放縮不會導(dǎo)致原本的排序出現(xiàn)問題。從而使得重加權(quán)仍能夠給尾部類更高的權(quán)重。

af2dc766-2cd9-11ed-ba43-dac502259ad0.png


把loss改寫成易于理解的方式就如下:

下面這個(gè)更為直接的loss被成為為pairwise margin loss,它可以把 y 與 y' 之間的margin拉大。

然后就是實(shí)現(xiàn)結(jié)合:

af47e862-2cd9-11ed-ba43-dac502259ad0.png

通過一些特殊的取值和另外的trick,可以實(shí)現(xiàn)兩者的結(jié)合。

5. 實(shí)驗(yàn)結(jié)果

af5f3152-2cd9-11ed-ba43-dac502259ad0.png

這張圖非常有意思,可以看出兩個(gè)設(shè)計(jì)理念非常有效果。

af842f0c-2cd9-11ed-ba43-dac502259ad0.pngafa47d2a-2cd9-11ed-ba43-dac502259ad0.png

可以發(fā)現(xiàn)該方法在頭部類和尾部類的性能都有所提升。

6. 結(jié)論

摘要:這篇寫得很好的論文重新審視了logit調(diào)整的想法,以解決長尾問題。本文首先建立了一個(gè)統(tǒng)計(jì)框架,并以此為基礎(chǔ)提出了兩種有效實(shí)現(xiàn)對數(shù)平差的方法。他們通過在合成和自然長尾數(shù)據(jù)集上使用幾個(gè)相關(guān)基線對其進(jìn)行測試,進(jìn)一步證明了這種方法的潛力。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 映射
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    15867
  • 雙線性變換
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    5574

原文標(biāo)題:Google提出面向長尾分布的logit的調(diào)整新方法

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎?

    您好!我現(xiàn)在用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎。 我現(xiàn)在用普通的信號發(fā)生器產(chǎn)生了個(gè)正弦波,1KHz的頻率,用采集卡采集了16*1024個(gè)數(shù)
    發(fā)表于 02-10 07:49

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種方法,通過使用點(diǎn)到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點(diǎn)云與數(shù)字孿生體進(jìn)行對齊,從而實(shí)現(xiàn)精確且全球致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系
    的頭像 發(fā)表于 12-13 11:18 ?268次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統(tǒng)漂移的新<b class='flag-5'>方法</b>

    一種創(chuàng)新的動態(tài)軌跡預(yù)測方法

    本文提出了一種動態(tài)軌跡預(yù)測方法,通過結(jié)合歷史幀和歷史預(yù)測結(jié)果提高預(yù)測的穩(wěn)定性和準(zhǔn)確性。它引入了歷史預(yù)測注意力模塊,以編碼連續(xù)預(yù)測之間的動態(tài)關(guān)系,并通過三重因子注意力模塊實(shí)現(xiàn)了最先進(jìn)的性能。本
    的頭像 發(fā)表于 10-28 14:34 ?528次閱讀
    <b class='flag-5'>一種</b>創(chuàng)新的動態(tài)軌跡預(yù)測<b class='flag-5'>方法</b>

    一種基于光強(qiáng)度相關(guān)反饋的波前整形方法

    。在這里,課題組提出了一種基于光強(qiáng)度相關(guān)反饋的波前整形方法,該方法使用遺傳算法在比傳統(tǒng)方法更短的時(shí)間和更少的迭代次數(shù)內(nèi)實(shí)現(xiàn)所需的波前整形。在該方法
    的頭像 發(fā)表于 10-27 16:28 ?308次閱讀
    <b class='flag-5'>一種</b>基于光強(qiáng)度相關(guān)反饋的波前整形<b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設(shè)備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發(fā)表于 10-24 14:57 ?848次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

    一種完全分布式的點(diǎn)線協(xié)同視覺慣性導(dǎo)航系統(tǒng)

    在本文中,我們提出了一種完全分布式的點(diǎn)線協(xié)同視覺慣性導(dǎo)航系統(tǒng)。我們通過蒙特卡羅模擬和真實(shí)環(huán)境數(shù)據(jù)集,在稠密特征或稀疏特征環(huán)境下將所提出的算法與其他四算法進(jìn)行了比較。所有結(jié)果表明,我們的PL-CVIO優(yōu)于獨(dú)立的MSCKF和CVI
    的頭像 發(fā)表于 09-30 14:45 ?531次閱讀
    <b class='flag-5'>一種</b>完全<b class='flag-5'>分布</b>式的點(diǎn)線協(xié)同視覺慣性導(dǎo)航系統(tǒng)

    一種利用wireshark對遠(yuǎn)程服務(wù)器/路由器網(wǎng)絡(luò)抓包方法

    一種利用wireshark對遠(yuǎn)程服務(wù)器/路由器網(wǎng)絡(luò)抓包方法
    的頭像 發(fā)表于 09-21 08:03 ?3658次閱讀
    <b class='flag-5'>一種</b>利用wireshark對遠(yuǎn)程服務(wù)器/路由器網(wǎng)絡(luò)抓包<b class='flag-5'>方法</b>

    THS4551是否可以通過在Vocm引腳處接入電阻調(diào)整分壓比例的方法來配置輸出共模電壓?

    引腳處接入電阻調(diào)整分壓比例的方法來配置輸出共模電壓。 打個(gè)比方,比如 Vs+ = 5V,Vs- = 0V (PD常On)時(shí),是否可以如下圖所示,通過在Vocm和Vs-間接入300k電阻將輸出信號共模電壓調(diào)整值1.66V左右。
    發(fā)表于 08-06 07:14

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結(jié)構(gòu)進(jìn)行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實(shí)現(xiàn)近乎完美的高分辨率顯微鏡。 層析成像是一種強(qiáng)大的無
    的頭像 發(fā)表于 07-19 06:20 ?456次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>

    rup是一種什么模型

    部分)開發(fā)的,它基于統(tǒng)建模語言(UML)和面向?qū)ο蟮能浖_發(fā)方法。RUP提供一種結(jié)構(gòu)化的方法來開發(fā)軟件,它包括
    的頭像 發(fā)表于 07-09 10:13 ?1424次閱讀

    AD8338有沒有可行的方法來測量大增益?

    AD8338是款VGA芯片,可變增益范圍為-10dB至70dB。然而,理論上的70dB增益過大,導(dǎo)致來自源的輸入信號非常小,容易受到干擾,導(dǎo)致70dB增益未得到驗(yàn)證。有沒有可行的方法來測量大增益?
    發(fā)表于 05-21 07:06

    如果是使用六步方波的方法來控制電機(jī),要如何實(shí)現(xiàn)過電流保護(hù)?

    請問下如果是使用六步方波的方法來控制電機(jī),要如何實(shí)現(xiàn)過電流保護(hù)? 以免電流過大造成板子損壞
    發(fā)表于 04-22 08:10

    熔接機(jī)sm熔接參數(shù)調(diào)整方法

    熔接機(jī)是一種用于將兩個(gè)或更多的工件通過加熱使其熔化,并在冷卻后將其粘接在起的設(shè)備。在使用熔接機(jī)進(jìn)行熔接之前,需要對熔接參數(shù)進(jìn)行調(diào)整,以確保最佳的熔接效果。本文將詳細(xì)介紹熔接機(jī)SM熔接參數(shù)的調(diào)
    的頭像 發(fā)表于 04-09 18:07 ?3222次閱讀

    下通過采用HPC方法來解決汽車行業(yè)工程挑戰(zhàn)的兩個(gè)具體實(shí)例

    大家可能都知道,將Ansys解決方案與高性能計(jì)算(HPC)相結(jié)合,可帶來巨大的投資回報(bào)(ROI)。接下來,讓我們來看下通過采用HPC方法來解決汽車行業(yè)工程挑戰(zhàn)的兩個(gè)具體實(shí)例。
    的頭像 發(fā)表于 03-12 14:29 ?667次閱讀

    led驅(qū)動電源如何調(diào)整電流大小的方法

    LED(Light Emitting Diode)是一種半導(dǎo)體器件,經(jīng)常被用作照明、顯示和指示燈。為了驅(qū)動LED,需要使用LED驅(qū)動電源提供穩(wěn)定的電流。調(diào)整LED的電流大小對于控制L
    的頭像 發(fā)表于 02-27 17:50 ?7467次閱讀
    主站蜘蛛池模板: 手机看片免费福利 | 国产香蕉在线视频 | 天天干天天拍天天射天天添天天爱 | 日本三级网址 | 欧美激情伊人 | 黄色欧美视频 | 日本大黄视频 | 在线观看一区二区三区视频 | 四虎成人精品在永久在线观看 | 天堂中文字幕在线观看 | 经典三级一区二区三区视频 | 国产一级特黄aa大片爽爽 | 国产午夜精品久久理论片小说 | 天天干天天干天天色 | 国产精品久久久久久久久免费hd | 99亚洲精品卡2卡三卡4卡2卡 | 久久aa毛片免费播放嗯啊 | 色综合视频在线观看 | 久久国产香蕉视频 | 成人免费黄色 | 亚洲人成人| 成人久久久久久 | 亚洲欧洲第一页 | 唯美久草 | 老司机午夜永久在线观看 | 色播基地 | 日日干天天干 | 日本午夜视频 | 午夜激情福利网 | cijilu刺激 国产 | 天天插天天射天天操 | 49pao强力在线高清基地 | 国产精品久久久亚洲第一牛牛 | 三级黄色在线观看 | 日日爱视频 | 欧美激情xxxx性bbbb | 国产hs免费高清在线观看 | 狠狠操狠狠摸 | 久久久久国产一级毛片高清版 | 亚洲人成77777在线观看网 | 中文字幕一区二区三区在线不卡 |