在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新方法:用知識蒸餾給數據集瘦身

OpenCV學堂 ? 來源:量子位 ? 作者:量子位 ? 2022-07-10 09:52 ? 次閱讀

	

這兩天,推特上一個任務懸賞火得一塌糊涂。

一家AI公司提供25萬美金(折合人民幣約167萬元),懸賞什么任務能讓模型越大、性能反而越差。

b24de934-fecc-11ec-ba43-dac502259ad0.png

評論區里已經討論得熱火朝天了。

b267ad60-fecc-11ec-ba43-dac502259ad0.png

不過這事兒倒也不是單純整活,而是為了進一步探索大模型。

畢竟,這兩年大家越發意識到,AI模型不能單純比“大”。

一方面,隨著模型的規模越來越大,訓練付出的成本開始呈現指數型增長;

b2793e72-fecc-11ec-ba43-dac502259ad0.jpg

另一方面,模型性能的提升也已經逐漸到達瓶頸期,哪怕想要讓誤差再下降1%,都需要更多的數據集增量和計算增量。

比如對于Transformer而言,交叉熵損失想要從3.4奈特降低到2.8奈特,就需要原本10倍量的訓練數據。

針對這些問題,AI學者們已經在從各種方向上找解決路子了。

Meta斯坦福的學者們,最近想到了從數據集上切入。

他們提出,對數據集進行知識蒸餾,使得數據集規模雖小,但還能保持模型性能不下降。

實驗驗證,在剪掉ImageNet 20%的數據量后,ResNets表現和使用原本數據時的正確率相差不大。

研究人員表示,這也為AGI實現找出了一條新路子。

b2845424-fecc-11ec-ba43-dac502259ad0.png

超大數據集的效率并不高

本文提出的辦法,其實就是對原本的數據集進行優化精簡。

研究人員表示,過去許多方法都表明,許多訓練示例是高度冗余的,理論上可以把數據集“剪”得更小。

而且最近也有研究提出了一些指標,可以根據訓練示例的難度或重要性對它們進行排序,并通過保留其中一些難度高的示例,就能完成數據修剪。

基于前人的發現和研究,此次學者們進一步提出了一些可具體操作的方法。

首先,他們提出了一種數據分析方法,可以讓模型只學習部分數據,就能實現同等的性能。

b2956eb2-fecc-11ec-ba43-dac502259ad0.png

通過數據分析,研究人員初步得出結論:

一個數據集怎樣修剪效果最好?這和它本身的規模有關。

初始數據量越多,越應該保留難度高的示例;

初始數據量越少,則應該保留難度低的示例。

b29f7cfe-fecc-11ec-ba43-dac502259ad0.png

而在保留困難示例進行數據修剪后,模型和數據規模的對應關系,可以打破冪律分布。

常被提起的二八定律就是基于冪律提出的。

即20%的數據會影響80%的結果。

同時在此情況下,還能找到一個處于帕累托最優的下的極值。

這里所說的帕累托最優是指資源分配的一種理想狀態。

它假設固定有一群人和可分配的資源,從一種分配狀態調整到另一種分配狀態,在沒有使任何一個人變差的前提下,至少使得一個人變得更好。

在本文中,調整分配狀態即可理解為,修剪多少比例的數據集。

然后,研究人員進行了實驗來驗證這一理論。

b2c326f4-fecc-11ec-ba43-dac502259ad0.png

從實驗結果來看,當數據集越大,修剪后的效果就越明顯。

在SVHN、CIFAR-10、ImageNet幾個數據集上,ResNet的錯誤率總體和數據集修剪規模呈反比。

在ImageNet上可以看到,數據集規模保留80%的情況下,和原本數據集訓練下的錯誤率基本相同。

這一曲線也逼近了帕累托最優。

接下來,研究人員聚焦在ImageNet上,對10種不同情況進行了大規模基準測試。

結果表明,隨機修剪以及一些修剪指標,在ImageNet上的表現并不夠好。

b2d27fbe-fecc-11ec-ba43-dac502259ad0.png

所以更進一步,研究人員還提出了一種自監督方法來修剪數據。

也就是知識蒸餾(教師學生模型),這是模型壓縮的一種常見方法。

b2e464fe-fecc-11ec-ba43-dac502259ad0.png

結果顯示,在自監督方法下,它在找數據集中簡單/困難示例上的表現都還不錯。

b2f3c05c-fecc-11ec-ba43-dac502259ad0.png

使用自監督方法修剪數據后,正確率明顯提高(圖C中淺藍色線)。

b308ec34-fecc-11ec-ba43-dac502259ad0.png

還存在一些問題

不過在論文中,研究人員也提到,雖然通過如上方法可以在不犧牲性能的情況下修剪數據集,但是有些問題仍舊值得關注。

比如數據集縮小后,想要訓練出同等性能的模型,需要的時間可能會更長。

因此,在進行數據集修剪時,應該平衡縮減規模和訓練增長時間兩方面因素。

與此同時,對數據集進行修剪,勢必會喪失一些群體的樣本,由此也可能造成模型在某一個方面出現弊端。

在這方面會容易引起道德倫理方面的問題。

研究團隊

本文作者之一Surya Ganguli,是量子神經網絡科學家。

論文地址: https://arxiv.org/abs/2206.14486

審核編輯 :李倩
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4785

    瀏覽量

    101294
  • AI
    AI
    +關注

    關注

    87

    文章

    31931

    瀏覽量

    270757
  • 數據集
    +關注

    關注

    4

    文章

    1211

    瀏覽量

    24890

原文標題:剪掉ImageNet 20%數據量,模型性能不下降!Meta斯坦福等提出新方法,用知識蒸餾給數據集瘦身

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    大連理工提出基于Wasserstein距離(WD)的知識蒸餾方法

    的機制,應用于中間層蒸餾時存在問題,其無法處理不重疊的分布且無法感知底層流形的幾何結構。 為了解決這些問題,大連理工大學的研究人員提出了一種基于 Wasserstein 距離(WD)的知識蒸餾
    的頭像 發表于 01-21 09:45 ?164次閱讀

    大華股份榮獲中國創新方法大賽一等獎

    近日,備受矚目的2024年中國創新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協與重慶市人民政府聯合主辦,吸引了眾多創新企業和團隊參與,共同展示創新成果,角逐榮譽獎項。 在這場創新盛宴中
    的頭像 發表于 12-27 14:50 ?264次閱讀

    基于遺傳算法的QD-SOA設計新方法

    了QD-SOA的設計,提出了一種基于遺傳算法的QD-SOA設計新方法。由于具有用于設計的模型是必不可少的,因此在第一步中獲得數值模型。然后,利用從數值模型中采樣的訓練數據建立人工神經網絡模型。實驗表明,該神經模型具有較高的精度和較
    的頭像 發表于 12-17 09:58 ?175次閱讀
    基于遺傳算法的QD-SOA設計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球一致的定位,無需視覺數據關聯。所提方法為VIO/VSLAM系統提供了緊密
    的頭像 發表于 12-13 11:18 ?280次閱讀
    一種降低VIO/VSLAM系統漂移的<b class='flag-5'>新方法</b>

    大華股份榮獲2024年中國創新方法大賽一等獎

    近日,由中國科協、重慶市人民政府舉辦的2024年中國創新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創新方法、突破行業性技術難題,憑借“不懼強光,分毫必現,基于TRIZ的強逆光銳捕技術”項目,斬獲全國一等獎。
    的頭像 發表于 12-04 17:19 ?415次閱讀

    長安汽車榮獲2024年中國創新方法大賽一等獎

    2024年由中國科學技術協會、重慶市人民政府共同主辦的中國創新方法大賽于近日在重慶落下帷幕。大賽以“發展新質生產力,促進高質量發展”為主題,秉承“企業出題,帶題參賽,以賽促學,以賽促”宗旨,致力于
    的頭像 發表于 11-25 16:28 ?372次閱讀

    利用全息技術在硅晶圓內部制造納米結構的新方法

    本文介紹了一種利用全息技術在硅晶圓內部制造納米結構的新方法。 研究人員提出了一種在硅晶圓內部制造納米結構的新方法。傳統上,晶圓上的微結構加工,僅限于通過光刻技術在晶圓表面加工納米結構。 然而,除了晶
    的頭像 發表于 11-18 11:45 ?433次閱讀

    保護4-20 mA,±20-mA模擬輸入的新方法

    電子發燒友網站提供《保護4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發表于 09-24 09:27 ?0次下載
    保護4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法
    的頭像 發表于 08-08 15:25 ?866次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發表于 07-19 06:20 ?464次閱讀
    一種無透鏡成像的<b class='flag-5'>新方法</b>

    逆變器電池蒸餾水理由,金屬觸點完全浸沒

    如果不使用正確的水,逆變器電池將損壞且無法使用。因此,保持其加滿正確的水非常重要。在本文中,我們將介紹逆變器電池中使用的水、為什么它很重要以及“電池澆水”的頻率。逆變器電池使用蒸餾水您應始終在
    的頭像 發表于 06-07 11:52 ?396次閱讀
    逆變器電池<b class='flag-5'>用</b><b class='flag-5'>蒸餾</b>水理由,金屬觸點完全浸沒

    使隱形可見:新方法可在室溫下探測中紅外光

    MIR振動輔助發光(MIRVAL) 來自伯明翰大學和劍橋大學的科學家們開發了一種新方法,利用量子系統在室溫下探測中紅外線(MIR)光。 這項研究成果發表在《自然·光子學》雜志上,在劍橋大學卡文迪什
    的頭像 發表于 04-19 06:31 ?383次閱讀
    使隱形可見:<b class='flag-5'>新方法</b>可在室溫下探測中紅外光

    軋機牌坊滑板壓虧修復的新方法

    電子發燒友網站提供《軋機牌坊滑板壓虧修復的新方法.docx》資料免費下載
    發表于 03-14 16:16 ?0次下載

    Pyserial庫來進行與stm32的串口通信,write方法32發數據時會出現數據的錯誤和缺失怎么解決?

    我使用的是Pyserial庫來進行與stm32的串口通信,python可以很好地接收32發來的數據,但是我write方法32發數據時會出
    發表于 03-12 07:32

    氫壓機軸承位磨損維修的新方法

    電子發燒友網站提供《氫壓機軸承位磨損維修的新方法.docx》資料免費下載
    發表于 03-01 16:23 ?0次下載
    主站蜘蛛池模板: 国产精品自在线天天看片 | 黄色大片视频在线观看 | susu成人影院 | 日本午夜片 | 四虎影院一级片 | 久久久久久天天夜夜天天 | 女人特黄大aaaaaa大片 | 色婷婷综合激情 | 精品一区二区三区免费爱 | 天天干伊人 | 久热久操 | 久久久久久综合 | 乱色伦短篇小说 | 户外露出 自拍系列 | 都市激情综合网 | 亚洲天堂一区二区三区 | 人人干人人干 | 特黄aa级毛片免费视频播放 | 日韩午夜r电影在线观看 | 成人精品一区二区三区电影 | 黄色三级在线观看 | 一级做a爱片久久毛片 | 久九色| ccav在线永久免费看 | 欧美专区一区二区三区 | 国产三级跑 | 五月天婷亚洲 | 性色xxx | 国产精品嫩草影院午夜 | 特级做a爰片毛片免费看 | 黄网站色成年片大免费软件 | 欧美一区二区三区视频 | 成年人黄色大片大全 | 亚洲精品你懂的 | 国产无圣光高清一区二区 | 在线视频网址免费播放 | 日韩一级精品视频在线观看 | 久久免费福利视频 | 亚洲4区| 午夜久久久久久 | 国产一级大片免费看 |