在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

模型在Close set和在Open set的表現是否存在一定的相關性呢

工程師鄧生 ? 來源:GiantPandaCV ? 作者:Garfield ? 2022-09-09 09:26 ? 次閱讀

2. 介紹

參考一篇綜述,首先介紹兩個概念:

Close Set Recognition,閉集識別:指 訓練集中的類別和測試集中的類別是一致的,例如最常用最經典的ImageNet-1k。所有在測試集中的圖像的類別都在訓練集中出現過,沒有未知種類的圖像。從AlexNet到VGG,再到ResNet,以及最近大火的Visual Transformer,都能夠比較好的處理這一類別的任務。

Open Set Recognition,開集識別:指對一個在訓練集上訓練好的模型,當利用一個測試集(該測試集的中包含訓練集中沒有的類別)進行測試時,如果輸入已知類別數據,輸出具體的類別,如果輸入的是未知類別的數據,則進行合適的處理(識別為unknown或者out-of-distribution)。例如在利用一個數據集訓練好了一個模型可以對狗和人進行分類,而輸入一張狗的圖像,由于softmax這種方式的設定,模型可能會告訴你80%的概率為人,但顯然這是不合理的,限制了模型泛化性能提升。而我們想要的結果,是當輸入不為貓和人的圖像(比如狗)時,模型輸出為未知類別,輸入人或貓圖像,模型輸出對應具體的類別。

3ab9d0de-2fde-11ed-ba43-dac502259ad0.png

由于現實場景中更多的是開放和非靜態的環境,所以在模型部署中,經常會出現一些沒有見過的情況,所以這種考慮開集檢測的因素,對模型的部署十分有必要。那么模型在Close set和在Open set的表現是否存在一定的相關性呢?下面我們來了解一份ICLR 2021的工作來嘗試理解和探索兩者之間的關系。

在本文中,作者重新評估一些open set識別的方法,通過探索是否訓練良好的閉集的分類器通過分析baseline的數據集,可以像最近的算法一樣執行。要做到這一點,我們首先研究了分類器的閉集和開集性能之間的關系。

雖然人們可能期望更強的close set分類器過度擬合到train set出現的類別,因此在OSR中表現較差。其實最簡單的方法也非常直觀,就是‘maximum softmax probability (MSP) baseline,即經過softmax輸出的最大的概率值。而該論文展示了在close set和open set上開放集的表現是高度相關的,這一點是非常關鍵的。而且展這種趨勢在不同的數據集、目標以及模型架構中都是成立的。并在ImageNet-1k這個量級上的數據集進行評估,更能說明該方法的有效性。

但僅僅觀察到這種現象,這種contribution雖然有意義,但可能也不足以支撐一篇頂會oral,所以自然要基于這一現象展開一些方法上的設計,來提升開集檢測的表現。根據這一觀察,論文提出一種通過改善close set性能的方式來進一步提升open set上的表現。

具體來說,我們引入了更多的增強、更好的學習率調度和標簽平滑等策略,這些策略顯著提高了MSP基線的close set和open set性能。我們還建議使用maximum logit score(MLS),而不是MSP來作為開放集指標。通過這些調整,可以在不改變模型結構的情況下,非常有效的提升模型open set狀態下的識別性能。

3. 方法

3c2742e4-2fde-11ed-ba43-dac502259ad0.png

首先就是一張非常直觀的圖,在不用的數據集上,對OSR和CSR兩個任務的表現進行比較。論文首先利用標準基準數據集上,選取三種有代表性的開放集識別方法,包括MSP,ARPL以及ARPL+CS。然后利用一個類似于VGG形態的的輕量級模型,在不同的分類數據集上進行檢測。可以看到OSR和CSR兩個任務的表現是呈現出高度的正相關的。

對于理論上的證明,論文選取了模型校準的角度來解讀。直觀地說,模型校準的目的是量化模型是否具有感知對象類別的能力,即是否可以把低置信度的預測與高錯誤率相關聯。也就是說如果給了很低的置信度,而錯誤率又是很高的,那么就可以定義為模型沒有被很好地校準。反之,則說明模型被很好地校準了。

3c5c5092-2fde-11ed-ba43-dac502259ad0.png3c811c10-2fde-11ed-ba43-dac502259ad0.png

到目前為止,論文已經證明了在單一、輕量級架構和小規模數據集上封閉集和開放集性能之間的相關性——盡管我們強調它們是OSR文獻中現有的標準基準。如上圖,論文又在在大規模數據集(ImageNet-1k)上試驗了一系列架構。和在CIFAR-10等小數據集一致,該數據集也存在上述的現象。

至于,獲得更好的open set recognition上的表現,也就非常直接了。就是通過各種優化方式、訓練策略的設計,讓模型可以能夠在close set上具有更好的性能。完整的細節和用于提高封閉集性能的方法的表格明細可以在論文,以及附錄中更好地了解。

論文還提出一種新的評估close set性能的方式。以前的工作指出,開放集的例子往往比封閉集的例子具有更低的norm。因此,我們建議在開放集評分規則中使用最大對數,而不是softmax概率。Logits是深度分類器中最后一個線性層的原始輸出,而softmax操作涉及到一個歸一化,從而使輸出可以被解釋為一個概率向量的和為1。由于softmax操作將logits中存在的大部分特征幅度信息歸一化,作者發現logits能帶來更好的開放集檢測結果。

3cae29b2-2fde-11ed-ba43-dac502259ad0.png

這種新的方式,改善了在所有數據集上的性能,并大大縮小了與最先進方法的差距,各數據集的AUROC平均絕對值增加了13.9%。如果以報告的baseline和當前最先進的方法之間的差異比例來計算,這意味著平均差異減少了87.2%。MLS方法還在TinyImageNet上取得了新的領先優勢,比OpenHybrid高出3.3%。

另外,作者指出,目前的標準OSRbaseline評價方式有兩個缺點:

它們都只涉及小規模的數據集;

它們缺乏對構成 "語義類 "的明確定義。

后者對于將開放集領域與其他研究問題,如out-of-distribution以及outlier的檢測,進行區分非常重要。OSR旨在識別測試圖像是否與訓練類有語義上的不同,而不是諸如模型對其預測不確定或是否出現了低層次的distribution shift。所以作者基于這兩個缺點,提出來了新的baseline用于評估open set的性能。具體關于數據集的細節,可以參考原文

4. 結論

在這篇文章中,作者給出了模型的閉集準確率與開集識別能力正相關的觀點,同時通過實驗驗證了加強模型的閉集性能能夠幫助我們獲得更強的開集能力。對于 Open-Set Recognition 具有啟發意義。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • msp
    msp
    +關注

    關注

    0

    文章

    162

    瀏覽量

    35586
  • 分類器
    +關注

    關注

    0

    文章

    152

    瀏覽量

    13372
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    為何工程塑料不適合打印圓弧形模型

    的打印方式,那每層之間必然會存在一定的銜接痕跡。 正因如此,XY軸方向上遇到弧面或小角度平面時,其層紋會變得異常明顯。從 JLC3D 小編實際打印的圓弧形
    發表于 04-07 15:31

    DLP3478Internal pattern模式下,不同的pattern set切換需要消耗多長時間

    “如果只使用了個pattern set,那么pattern可以最快的速度下顯示。如果使用了多個pattern set,那么切換不同的
    發表于 03-03 06:14

    DLP3010EVM-LC每個set之間的時間間隔多大,是如何計算的

    1.如圖所示,每個set之間的時間間隔多大,是如何計算的? 2.8bit圖次是不是最多只能燒錄36張?
    發表于 02-24 07:08

    DLP4710EVM-LC pattern set載入過程是什么樣的?

    ,有大概的計算公式嗎?或者有沒有個大概范圍,比如30us-1000us。 那么是不是可以認為,每次load,是一次性載入個pattern set里的所有內容,而不是像dlp4500
    發表于 02-21 13:58

    ADS1293ADC轉換時是否一定幾率采集到錯誤的AD轉換值?

    請問下正常是的ADS1293 ADC轉換時是否一定幾率采集到錯誤的AD轉換值,如果有大概多次AD轉換會發生次,發生錯誤后ALARMB引腳會什么變化,
    發表于 01-23 08:27

    【「大模型啟示錄」閱讀體驗】如何在客服領域應用大模型

    內為企業帶來效益。選擇模型時,需要評估其性能表現。這包括模型的準確、響應速度、對話流暢、情
    發表于 12-17 16:53

    飛凌嵌入式ElfBoard ELF 1板卡-通用文件I/O模型open

    前面介紹了linux系統切皆文件的概念,系統使用套系統調用函數open()、read()、write()、close()等可以對所有文件執行I/O操作。應用程序發起的I/O請求,內
    發表于 10-10 09:09

    XTR111如果負載RLoad短路會不會造成SET引腳過流損壞芯片?

    XTR111的手冊中,電流輸出模式提供了過流保護電路。 但是圖Figure 48的電壓模式,閉合SW1 如果負載RLoad短路會不會造成SET引腳過流損壞芯片? 內部是否有電流
    發表于 08-20 06:15

    Mesh組網完成后,esp_wifi_set_config函數寫入的配置信息會丟失,為什么?

    NVS句柄 nvs_close(nvs_handle); //僅驗證下寫入的內容是否正確 //nvs_mesh_info_t rm_i; //esp_nvs_read_mesh_info
    發表于 07-19 06:57

    如何使用espconn_set_keepalive?

    我想建立個 TCP 連接,該連接在第次數據發送后不會關閉,我閱讀了有關 espconn_set_保持活著 函數的信息,該函數將心跳發送到服務器,因此它不會斷開連接(如果我理解正確的話)。但是我
    發表于 07-12 15:10

    接觸與非接觸式測量相關性的方法

    接觸式測量和非接觸式測量是兩種常見的測量方法,它們工業生產、科學研究和日常生活中都有廣泛的應用。本文將詳細介紹這兩種測量方法的基本原理、特點、應用領域以及它們之間的相關性、接觸式測量
    的頭像 發表于 06-14 09:24 ?2669次閱讀

    STM32串口接收數據是否需要檢測并復位ORE?還是讀DR的時候自動會復位

    串口接收數據是否需要檢測并復位ORE?還是讀DR的時候自動會復位? 如何串口接收更可靠? if(USART_GetFlagStat
    發表于 05-17 07:01

    【大語言模型:原理與工程實踐】大語言模型的應用

    問題時,即使輸入不同的提示詞,大語言模型也可能產生截然不同的結果,這體現了其高度的靈活性和創造。然而,這種靈活性也帶來了一定的挑戰。由于自然語言的模棱兩可和提示工程的新生性質,當嘗試將大語言
    發表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的評測

    安全的評測則關注模型強化學習階段的表現。行業模型的評測則針對特定行業的能力,如金融和法律等領域。整體能力的評測從宏觀角度評估
    發表于 05-07 17:12

    STM8 SET后發現中斷實現不了,為什么?

    我就用了EXTI個外設。發現在中斷函數里寫了條中斷確認語句 ==SET后發現中斷實現不了。刪除==SET。或者改成!=RESET就可以了。這是為什么啊?十分困惑。求解答
    發表于 05-07 06:18
    主站蜘蛛池模板: 操美女免费网站 | 欧美性野久久久久久久久 | 特黄特黄视频 | 欧美日韩国产一区二区三区不卡 | 成人国产精品一级毛片了 | 夜夜橹橹网站夜夜橹橹 | 成人网在线看 | 国产激爽大片在线播放 | 日本高清视频色wwwwww色 | 网友偷自拍原创区 | 国产操比视频 | 免费人成动漫在线播放r18 | 狠狠色丁香久久婷婷综合丁香 | 狠狠色成色综合网 | 77788色淫视频免费观看 | 天天插综合 | 好紧好爽的午夜寂寞视频 | 永久免费的啪啪免费的网址 | 久久综合久 | 嫩草网 | 毛片毛| 福利视频自拍偷拍 | 天天摸天天干 | 天堂中文在线资源库用 | 色爱区综合 | 最新合集丨新片速递 | 天堂成人在线观看 | 久久99热精品免费观看无卡顿 | 国产一级做a爰片久久毛片男 | 色免费在线 | 簧片视频在线观看 | 午夜精品久久久久久91 | 国产人成高清视频观看 | 视频在线观看网站免费 | 福利视频免费观看 | 天堂资源最新版在线www | 欧美18同性gay视频 | 亚洲一区二区三区四区五区六区 | 一级视频免费观看 | 亚洲国产精品久久婷婷 | 在线视频一区二区三区 |