在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于有效樣本的類別不平衡損失

自然語言處理愛好者 ? 來源:AI公園 ? 作者:Sik-Ho Tsang ? 2021-08-16 11:14 ? 次閱讀

導讀

使用每個類的有效樣本數量來重新為每個類的Loss分配權重,效果優于RetinaNet中的Focal Loss。

本文綜述了康奈爾大學、康奈爾科技、谷歌Brain和Alphabet公司的基于有效樣本數的類平衡損失(CB損失)。在本文中,設計了一種重新加權的方案,利用每個類的有效樣本數來重新平衡損失,稱為類別平衡損失。

1. 類別平衡問題

假設有像上面那樣的不平衡的類。head:對于索引小的類,這些類有較多的樣本。Tail:對于大索引的類,這些類的樣本數量較少。黑色實線:直接在這些樣本上訓練的模型偏向于優勢類。紅色虛線:通過反向類頻率來重新加權損失可能會在具有高類不平衡的真實數據上產生較差的性能。藍虛線:設計了一個類平衡項,通過反向有效樣本數來重新加權損失。

2. 有效樣本數量

2.1. 定義

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

數據間信息重疊,左:特征空間S,中:1個樣本數據的單位體積,右:數據間信息重疊

直覺上,數據越多越好。但是,由于數據之間存在信息重疊,隨著樣本數量的增加,模型從數據中提取的邊際效益會減少

左:給定一個類,將該類的特征空間中所有可能數據的集合表示為S。假設S的體積為N且N≥1。中:S子集中的每個樣本的單位體積為1,可能與其他樣本重疊。Right:從S中隨機抽取每個子集,覆蓋整個S集合。采樣的數據越多,S的覆蓋率就越好。期望的采樣數據總量隨著樣本數量的增加而增加,以N為界。

因此,將有效樣本數定義為樣本的期望體積。

這個想法是通過使用一個類的更多數據點來捕捉邊際效益的遞減。由于現實世界數據之間的內在相似性,隨著樣本數量的增加,新添加的樣本極有可能是現有樣本的近重復。另外,cnn是用大量的數據增廣來訓練的,所有的增廣實例也被認為與原始實例相同。對于一個類,N可以看作是唯一原型的數量。

2.2. 數學公式

En表示樣本的有效數量(期望體積)。為了簡化問題,不考慮部分重疊的情況。也就是說,一個新采樣的數據點只能以兩種方式與之前的采樣數據交互:完全在之前的采樣數據集中,概率為p,或完全在原來的數據集之外,的概率為1- p。

有效數字:En = (1?β^n)/(1?β),其中,β = (N? 1)/N,這個命題可以用數學歸納法證明。當E1 = 1時,不存在重疊,E1 =(1?β^1)/(1?β) = 1成立。假設已經有n?1個樣本,并且即將對第n個樣本進行采樣,現在先前采樣數據的期望體積為En ?1,而新采樣的數據點與先前采樣點重疊的概率為 p = E(n?1)/N。因此,第n個實例采樣后的期望體積為:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此時:

我們有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命題表明有效樣本數是n的指數函數。超參數β∈[0,1)控制En隨著n的增長有多快。

3. 類別平衡 Loss (CB Loss)

類別平衡(CB)loss可以寫成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是類別y的ground-truth的數量。β = 0對應沒有重新加權, β → 1對應于用反向頻率進行加權。

提出的有效樣本數的新概念使我們能夠使用一個超參數β來平滑地調整無重權和反向類頻率重權之間的類平衡項。

所提出的類平衡項是模型不可知的和損失不可知的,因為它獨立于損失函數L和預測類概率p的選擇。

3.1. 類別平衡的 Softmax 交叉熵損失

給定一個標號為y的樣本,該樣本的softmax交叉熵(CE)損失記為:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假設類y有ny個訓練樣本,類平衡(CB)softmax交叉熵損失為:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 類別平衡的 Sigmoid 交叉熵損失

當對多類問題使用sigmoid函數時,網絡的每個輸出都執行一個one-vs-all分類,以預測目標類在其他類中的概率。在這種情況下,Sigmoid不假定類之間的互斥性。由于每個類都被認為是獨立的,并且有自己的預測器,所以sigmoid將單標簽分類和多標簽預測統一起來。這是一個很好的屬性,因為現實世界的數據通常有多個語義標簽。sigmoid交叉熵(CE)損失可以寫成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

類平衡(CB) sigmoid交叉熵損失為:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 類別平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以減少分類很好的樣本的損失,聚焦于困難的樣本。

類別平衡的 (CB) Focal Loss為:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 實驗結果

4.1. 數據集

試驗了CIFAR-10和CIFAR-100的5個不平衡系數分別為10、20、50、100和200的長尾版本。iNaturalist 和ILSVRC是天然的類別不平衡數據集。

上面顯示了每個類具有不同不平衡因素的圖像數量。

4.2. CIFAR 數據集

loss類型的超參數搜索空間為{softmax, sigmoid, focal}, [focal loss]的超參數搜索空間為β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致為0.9999。但在CIFAR-100上,不同不平衡因子的數據集往往有不同且較小的最優β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和沒有類平衡項時的分類錯誤率

在CIFAR-10上,根據β = 0.9999重新加權后,有效樣本數與樣本數接近。這意味著CIFAR-10的最佳重權策略與逆類頻率重權類似。在CIFAR-100上,使用較大的β的性能較差,這表明用逆類頻率重新加權不是一個明智的選擇,需要一個更小的β,具有更平滑的跨類權重。例如,一個特定鳥類物種的獨特原型數量應該小于一個一般鳥類類的獨特原型數量。由于CIFAR-100中的類比CIFAR-10更細粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大規模數據集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有數據集驗證集上,使用不同損失函數訓練的大規模數據集上的Top-1和Top-5分類錯誤率

使用了類平衡的Focal Loss,因為它具有更大的靈活性,并且發現β = 0.999和γ = 0.5在所有數據集上都獲得了合理的良好的性能。值得注意的是,使用了類別平衡的Focal Loss來代替Softmax交叉熵,ResNet-50能夠達到和ResNet-152相應的性能。

以上數字顯示類平衡的Focal Loss損失經過60個epochs的訓練后,開始顯示其優勢。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

編譯:ronghuaiyang(AI公園)

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6225

    瀏覽量

    107621
  • 數據集
    +關注

    關注

    4

    文章

    1223

    瀏覽量

    25297
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22653

原文標題:CB Loss:基于有效樣本的類別不平衡損失

文章出處:【微信號:NLP_lover,微信公眾號:自然語言處理愛好者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    輪轂電機不平衡電磁力對車輪定位參數的影響

    [摘要] 輪轂電機驅動電動汽車將電機、減速機構和制動器等高度集成于車輪內。不同路面激勵下的輪胎跳動、載荷不均和軸承磨損等造成電機氣隙沿圓周分布不均,其所產生的不平衡電磁力將會通過減速機構或直接傳遞
    發表于 06-10 13:17

    B0430J50100AHF超小型不平衡平衡變壓器

    B0430J50100AHF超小型不平衡平衡變壓器B0430J50100AHF是Anaren推出的一款超小型、低成本且低輪廓的不平衡平衡變壓器,專為滿足新一代A/D和D/A轉換器I
    發表于 02-08 09:26

    平衡電阻器可以改為不平衡

    在電子電路中,平衡電阻器與不平衡電阻器各自扮演著重要的角色。平衡電阻器主要用于實現電路的平衡和穩定性,減少噪音和干擾,提高信號質量。而不平衡
    的頭像 發表于 01-30 14:31 ?1061次閱讀

    單元不平衡永久故障閾值的單元類型特定設置

    電子發燒友網站提供《單元不平衡永久故障閾值的單元類型特定設置.pdf》資料免費下載
    發表于 10-18 11:21 ?0次下載
    單元<b class='flag-5'>不平衡</b>永久故障閾值的單元類型特定設置

    電容器不平衡保護動作原因分析

    電容器不平衡保護動作的原因多種多樣,主要包括以下幾個方面: 1. 電容器組內部故障 電容量不平衡 :電容器組中的電容器由于老化、損壞或制造差異,可能導致三相電容量不平衡。當三相之間電容值差異較大
    的頭像 發表于 09-20 15:43 ?2386次閱讀

    電橋電路不平衡時是什么電路

    電橋電路是一種測量電阻的電路,它利用了惠斯通電橋的原理。當電橋電路不平衡時,它是一種具有特定特性的電路,這種特性可以用于測量電阻、電容、電感等元件的參數。 電橋電路的基本原理 電橋電路是一種由四個
    的頭像 發表于 08-27 14:31 ?1630次閱讀

    LCR測試儀如何測量不平衡度?

    在電路設計和維修中,了解電路元件的特性是非常重要的。LCR測試儀就是一種常用的檢測儀器,它可以測量電感(L)、電容(C)和電阻(R)的參數。其中,測量不平衡度是LCR測試儀的一項重要功能。那么
    的頭像 發表于 08-26 16:49 ?921次閱讀
    LCR測試儀如何測量<b class='flag-5'>不平衡</b>度?

    電容電壓分配不平衡的影響

    電容電壓分配不平衡(也稱為電容器電壓不均衡)在電力系統中可能會產生多種負面影響,具體包括以下幾點: 1、過壓導致的電容器損壞 電壓不平衡會導致某些電容器承受過高的電壓,超過其額定值。這種過壓可能會
    的頭像 發表于 08-09 14:15 ?1505次閱讀
    電容電壓分配<b class='flag-5'>不平衡</b>的影響

    不平衡電橋設計時要注意哪些問題

    不平衡電橋設計時,需要注意以下幾個方面的問題: 一、工作點調平 確保電橋調平 :在工作點處,需要將電橋調平,即確保電橋在測量開始前處于平衡狀態,以減少測量誤差。 二、靈敏度提升 提高
    的頭像 發表于 08-05 09:53 ?1299次閱讀

    三相電流不平衡對電壓影響大嗎

    在現代電力系統中,三相交流電是最常見的供電方式。三相電流平衡是保證電力系統穩定運行的關鍵因素之一。然而,由于多種原因,三相電流可能會出現不平衡現象,這對電力系統的電壓穩定性和設備的正常運行
    的頭像 發表于 07-25 16:28 ?2462次閱讀

    三相負載不平衡會引起零序電流嗎

    會。三相負載不平衡是指在三相電力系統中,三個相的負載電流不相等。這種情況在實際應用中是比較常見的,比如在工業生產、民用建筑等場合。三相負載不平衡會引起一系列的問題,其中之一就是零序電流的產生。 一
    的頭像 發表于 07-25 16:26 ?2300次閱讀

    不平衡電流和零序電流的區別是什么

    在電力系統中,電流的平衡不平衡是影響電力系統穩定性和安全性的重要因素。不平衡電流和零序電流是兩種常見的電流類型,它們在電力系統中扮演著不同的角色。 一、定義 不平衡電流 是指三相電力
    的頭像 發表于 07-25 16:24 ?3555次閱讀

    三相電流不平衡會產生零序電流嗎

    會產生。在電力系統中,三相電流不平衡是一個常見的問題,它會導致許多不良后果,如設備過熱、效率降低、電能損耗增加等。而零序電流則是電力系統中一種特殊的電流形式,它與三相電流不平衡有著密切的關系。 一
    的頭像 發表于 07-25 16:22 ?2493次閱讀

    軟啟動三相不平衡的解決辦法有哪些

    軟啟動三相不平衡是指在軟啟動過程中,三相電動機的電流不平衡,導致電動機的運行效率降低,甚至可能引發電動機的損壞。針對這個問題,我們可以從多個方面進行解決。 一、軟啟動三相不平衡的原因分析 電源電壓
    的頭像 發表于 07-02 09:40 ?4939次閱讀

    軟啟動報三相電流不平衡怎么處理

    軟啟動器是一種用于電動機啟動的電氣設備,它可以有效地降低電動機啟動時的電流沖擊,減少對電網和電動機的影響。然而,在實際應用中,軟啟動器有時會出現三相電流不平衡的問題,這會對電動機的正常運行和軟啟動
    的頭像 發表于 06-18 11:44 ?6801次閱讀
    主站蜘蛛池模板: 正在播放国产巨作 | 一级黄a | 男女交性视频免费视频 | 秋霞一级特黄真人毛片 | 韩国理伦片在线观看2828 | 久久精品国产免费 | 日本欧美一区二区 | 国产一区二区三区不卡观 | 日本卡一卡2卡3卡4精品卡无人区 | 色五月激情五月 | 起碰成人免费公开网视频 | 欧美一欧美一区二三区性 | 亚洲黄色色图 | 久久亚洲精品国产精品婷婷 | ww欧洲ww在线视频看 | 直接看黄的网站 | 日韩一区二区视频 | 米奇色影院 | 狠狠色噜噜狠狠狠狠奇米777 | 女生扒开尿口让男生舔 | 欧美一级日韩一级亚洲一级 | 国产精品嫩草影院一二三区 | 9久久9久久精品 | 老子影院午夜精品欧美视频 | 色综合天天综合网看在线影院 | 天天宗合网 | 亚洲不卡免费视频 | 99精品久久久久久久婷婷 | 天天干天天爱天天操 | 五月激情六月丁香 | 亚洲综合精品成人啪啪 | 不卡视频一区 | 欧美一级别 | 一区二区在线看 | 天天看天天做 | 在线看你懂得 | 羞羞漫画喷水漫画yy漫画 | 热re66久久精品国产99热 | 男人和女人做a免费视频 | 97国产精品人人爽人人做 | 最新亚洲一区二区三区四区 |