91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

<abbr id="8wyk8"></abbr>

<abbr id="8wyk8"></abbr>

<rt id="8wyk8"></rt><rt id="8wyk8"><acronym id="8wyk8"></acronym></rt>

<nav id="8wyk8"><dl id="8wyk8"></dl></nav>

<nav id="8wyk8"><dl id="8wyk8"></dl></nav>

<code id="8wyk8"></code>

<li id="8wyk8"><dl id="8wyk8"></dl></li>

<li id="8wyk8"></li>

<bdo id="8wyk8"></bdo>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

新方法：用知識蒸餾給數(shù)據(jù)集瘦身

這兩天，推特上一個任務(wù)懸賞火得一塌糊涂。

一家AI公司提供25萬美金（折合人民幣約167萬元），懸賞什么任務(wù)能讓模型越大、性能反而越差。

評論區(qū)里已經(jīng)討論得熱火朝天了。

不過這事兒倒也不是單純整活，而是為了進(jìn)一步探索大模型。

畢竟，這兩年大家越發(fā)意識到，AI模型不能單純比“大”。

一方面，隨著模型的規(guī)模越來越大，訓(xùn)練付出的成本開始呈現(xiàn)指數(shù)型增長；

另一方面，模型性能的提升也已經(jīng)逐漸到達(dá)瓶頸期，哪怕想要讓誤差再下降1%，都需要更多的數(shù)據(jù)集增量和計算增量。

比如對于Transformer而言，交叉熵?fù)p失想要從3.4奈特降低到2.8奈特，就需要原本10倍量的訓(xùn)練數(shù)據(jù)。

針對這些問題，AI學(xué)者們已經(jīng)在從各種方向上找解決路子了。

Meta斯坦福的學(xué)者們，最近想到了從數(shù)據(jù)集上切入。

他們提出，對數(shù)據(jù)集進(jìn)行知識蒸餾，使得數(shù)據(jù)集規(guī)模雖小，但還能保持模型性能不下降。

實驗驗證，在剪掉ImageNet 20%的數(shù)據(jù)量后，ResNets表現(xiàn)和使用原本數(shù)據(jù)時的正確率相差不大。

研究人員表示，這也為AGI實現(xiàn)找出了一條新路子。

超大數(shù)據(jù)集的效率并不高

本文提出的辦法，其實就是對原本的數(shù)據(jù)集進(jìn)行優(yōu)化精簡。

研究人員表示，過去許多方法都表明，許多訓(xùn)練示例是高度冗余的，理論上可以把數(shù)據(jù)集“剪”得更小。

而且最近也有研究提出了一些指標(biāo)，可以根據(jù)訓(xùn)練示例的難度或重要性對它們進(jìn)行排序，并通過保留其中一些難度高的示例，就能完成數(shù)據(jù)修剪。

基于前人的發(fā)現(xiàn)和研究，此次學(xué)者們進(jìn)一步提出了一些可具體操作的方法。

首先，他們提出了一種數(shù)據(jù)分析方法，可以讓模型只學(xué)習(xí)部分?jǐn)?shù)據(jù)，就能實現(xiàn)同等的性能。

通過數(shù)據(jù)分析，研究人員初步得出結(jié)論：

一個數(shù)據(jù)集怎樣修剪效果最好？這和它本身的規(guī)模有關(guān)。

初始數(shù)據(jù)量越多，越應(yīng)該保留難度高的示例；

初始數(shù)據(jù)量越少，則應(yīng)該保留難度低的示例。

而在保留困難示例進(jìn)行數(shù)據(jù)修剪后，模型和數(shù)據(jù)規(guī)模的對應(yīng)關(guān)系，可以打破冪律分布。

常被提起的二八定律就是基于冪律提出的。

即20%的數(shù)據(jù)會影響80%的結(jié)果。

同時在此情況下，還能找到一個處于帕累托最優(yōu)的下的極值。

這里所說的帕累托最優(yōu)是指資源分配的一種理想狀態(tài)。

它假設(shè)固定有一群人和可分配的資源，從一種分配狀態(tài)調(diào)整到另一種分配狀態(tài)，在沒有使任何一個人變差的前提下，至少使得一個人變得更好。

在本文中，調(diào)整分配狀態(tài)即可理解為，修剪多少比例的數(shù)據(jù)集。

然后，研究人員進(jìn)行了實驗來驗證這一理論。

從實驗結(jié)果來看，當(dāng)數(shù)據(jù)集越大，修剪后的效果就越明顯。

在SVHN、CIFAR-10、ImageNet幾個數(shù)據(jù)集上，ResNet的錯誤率總體和數(shù)據(jù)集修剪規(guī)模呈反比。

在ImageNet上可以看到，數(shù)據(jù)集規(guī)模保留80%的情況下，和原本數(shù)據(jù)集訓(xùn)練下的錯誤率基本相同。

這一曲線也逼近了帕累托最優(yōu)。

接下來，研究人員聚焦在ImageNet上，對10種不同情況進(jìn)行了大規(guī)?；鶞?zhǔn)測試。

結(jié)果表明，隨機(jī)修剪以及一些修剪指標(biāo)，在ImageNet上的表現(xiàn)并不夠好。

所以更進(jìn)一步，研究人員還提出了一種自監(jiān)督方法來修剪數(shù)據(jù)。

也就是知識蒸餾（教師學(xué)生模型），這是模型壓縮的一種常見方法。

結(jié)果顯示，在自監(jiān)督方法下，它在找數(shù)據(jù)集中簡單/困難示例上的表現(xiàn)都還不錯。

使用自監(jiān)督方法修剪數(shù)據(jù)后，正確率明顯提高（圖C中淺藍(lán)色線）。

還存在一些問題

不過在論文中，研究人員也提到，雖然通過如上方法可以在不犧牲性能的情況下修剪數(shù)據(jù)集，但是有些問題仍舊值得關(guān)注。

比如數(shù)據(jù)集縮小后，想要訓(xùn)練出同等性能的模型，需要的時間可能會更長。

因此，在進(jìn)行數(shù)據(jù)集修剪時，應(yīng)該平衡縮減規(guī)模和訓(xùn)練增長時間兩方面因素。

與此同時，對數(shù)據(jù)集進(jìn)行修剪，勢必會喪失一些群體的樣本，由此也可能造成模型在某一個方面出現(xiàn)弊端。

在這方面會容易引起道德倫理方面的問題。

研究團(tuán)隊

本文作者之一Surya Ganguli，是量子神經(jīng)網(wǎng)絡(luò)科學(xué)家。

論文地址： https://arxiv.org/abs/2206.14486

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4814

瀏覽量
103618
AI

AI

+關(guān)注

關(guān)注
88

文章
35164

瀏覽量
279919
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1224

瀏覽量
25447

原文標(biāo)題：剪掉ImageNet 20%數(shù)據(jù)量，模型性能不下降！Meta斯坦福等提出新方法，用知識蒸餾給數(shù)據(jù)集瘦身

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學(xué)堂】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

OpenCV學(xué)堂
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 灰度共生矩陣(GLCM)基本原理
Hot UNet和UNet++：醫(yī)學(xué)影像經(jīng)典分割網(wǎng)絡(luò)對比

New 常見人體姿態(tài)評估顯示方式的兩種方式
New 手寫圖像模板匹配算法在OpenCV中的實現(xiàn)

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實

腦極體
4小時前

168 閱讀

RKDC2025 | 視美泰亮相瑞芯微2025開發(fā)者大會，共探AIoT新藍(lán)海

視美泰
9小時前

275 閱讀

老化測試效率提升，高壓干簧繼電器究竟做對了什么？

Standexe_2021
10小時前

292 閱讀

光儲邊緣智能的核心演進(jìn)方向:MCU + AFE + 通信 + AI 一體化設(shè)計

eeDesigner
12小時前

421 閱讀

線性穩(wěn)壓器和開關(guān)穩(wěn)壓器、串聯(lián)穩(wěn)壓器的區(qū)別

東芝半導(dǎo)體
12小時前

380 閱讀

MIT電磁學(xué)講義(麻省理工大學(xué))

王
34 MB

免費

0下載

RushOrm將java類映射到SQL表來取代對SQL的需求

姚小熊27
11.71 MB

免費

2下載

fscan內(nèi)網(wǎng)綜合掃描工具

辛太勵
3.24 MB

2積分

7下載

FTXUI C++功能性終端用戶界面

從未擁有
1.14 MB

2積分

1下載

TSeer服務(wù)注冊發(fā)現(xiàn)容錯的解決方案

李林
1.56 MB

2積分

1下載

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

156 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

366 閱讀

【RA-Eco-RA6M4開發(fā)板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
2天前

340 閱讀

【VisionFive 2單板計算機(jī)試用體驗】2、打造復(fù)古游戲機(jī)（Batocera鏡像+FBNeo虛擬機(jī)，多款游戲ROM分享）

左岸cpx
2天前

353 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+兩種開發(fā)板間的比較

jinglixixi
2天前

314 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強(qiáng)聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強(qiáng)PCB")

華秋商城(原"華強(qiáng)芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟(jì)技術(shù)開發(fā)區(qū)航空路6號手機(jī)智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
91在线观看视频|91在线观看视频|91在线观看免费视频|91在线观看免费|欧美第二页|欧美第1页

主站蜘蛛池模板：手机看片国产高清 | 在线你懂得 | 欧美色人阁 | 欧美三四级片 | 校园春色欧美另类小说 | 日韩毛片网站 | 久久久午夜视频 | 免费在线色视频 | 久久综合操 | 天天操夜夜嗨 | 三级网站国产 | 最新色视频 | 中国一级毛片aaa片中国一级特黄aa毛片大片 | 狠狠操精品视频 | 欧美亚洲另类在线观看 | 久久婷婷五综合一区二区 | 欧美最猛黑人xxxx黑人猛交69 | 国产一卡二卡3卡4卡四卡在线视频 | 狠狠操夜夜爽 | 欧美天堂视频 | 网女色| 天天综合网天天综合色不卡 | 综合网伊人 | 九草伊人 | 久久mimi色| 午夜在线亚洲男人午在线 | 全部免费特黄特色大片农村 | 国产日韩欧美一区二区 | 亚洲一区二区精品推荐 | 狠狠干狠狠搞 | 亚洲综合区图片小说区 | 生活片一级性 | 亚洲男同tv| 伊人天伊人天天网综合视频 | 欧美69xx性欧美 | 五月婷婷六月丁香 | 性欧美护士18xxxxhd视频 | 又长又大又粗又硬3p免费视 | 曰本毛片 | 黄色网址中文字幕 | 天天骑天天干 |