91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

XLNet vs BERT,對比得明明白白!

WpOh_rgznai100 ? 來源:lq ? 2019-07-27 07:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)語】幾周前,XLNet 團隊發(fā)布了新型預(yù)訓(xùn)練語言模型 XLNet,這個新模型在各項基準(zhǔn)測試中都優(yōu)于谷歌之前發(fā)布的BERT模型,其中模型XLNet-Large 的數(shù)據(jù)量更是 BERT 模型的 10 倍左右。那 XLnet 和 BERT 到底要選誰?

這次 XLnet 團隊進行了一次對比實驗,為了確保對比的公正性,在對比實驗中作者采用相同的環(huán)境和配置,相同的訓(xùn)練數(shù)據(jù),并確保在 BERT 和 XLNet 兩個模型的訓(xùn)練方法中,幾乎每個超參數(shù)(hyperparameter)都是相同的,這些超參數(shù)都是由 BERT作者發(fā)布,并在BERT中使用的。即是說,這些超參數(shù)是為BERT模型設(shè)計選擇的,很可能是針對BERT最優(yōu)化的,而非XLNet。具體超參數(shù)設(shè)置如下(兩個模型的超參數(shù)完全相同):

Batch-size: 256

訓(xùn)練步數(shù):1M

優(yōu)化器:Adam,學(xué)習(xí)率 1e-4,warmup 1萬,線性衰減

訓(xùn)練語料庫:Wikipedia + BooksCorpus,在處理Wikipedia時使用了與BERT repo相同的工具,但出于某種原因,我們的Wiki語料庫僅有20億單詞,BERT使用了25億單詞,因此XLNet的訓(xùn)練數(shù)據(jù)略少于BERT。

模型結(jié)構(gòu)參數(shù):24層,1024個隱層,16 heads

微調(diào)(finetuning)超參數(shù)搜索空間

此外,作者還修改了一些數(shù)據(jù)相關(guān)的實現(xiàn)細(xì)節(jié),以便與BERT模型進行一對一的比較。

在之前的實驗中,預(yù)訓(xùn)練環(huán)節(jié),未被mask的token無法看到分類token CLS和分隔token SEP,而現(xiàn)階段的實現(xiàn)中可以看到了,與BERT模型保持一致。

在微調(diào)環(huán)節(jié),與BERT一樣,用“BERT格式”取代了普通的 XLNet格式,即使用[CLS, A, SEP, B, SEP]取代了[A, SEP, B, SEP, CLS]。

另外,我們考慮了BERT模型的三種變體,并報告了各個單獨任務(wù)的最佳微調(diào)結(jié)果。三種變體如下:

模型1(Model-I):BERT 作者發(fā)布的原始BERT模型

模型2(Model-II):同樣來自作者的中文全詞覆蓋模型

模型3(Model-III):由于考慮到下句預(yù)測(NSP)可能會影響表現(xiàn),我們使用BERT已發(fā)布的代碼針對沒有NSP loss的新模型進行了預(yù)訓(xùn)練

注意:由于通過不同變體可以獲得各個任務(wù)的最佳表現(xiàn),以上設(shè)置也許會讓BERT模型更占優(yōu)勢。

GLUE 和 SQuAD上的開發(fā)設(shè)置結(jié)果,及 RACE 上的測試設(shè)置結(jié)果如下(并未使用數(shù)據(jù)增強、集成或多任務(wù)學(xué)習(xí)):

不同模型對比。XLNet-Large (as in paper)所使用的訓(xùn)練數(shù)據(jù)更多一些,batch size也稍大。BERT模型,針對每個數(shù)據(jù)集我們只報告3個變體中微調(diào)最優(yōu)的結(jié)果。

表格中有些觀測結(jié)果非常有趣:

使用相同的數(shù)據(jù),以及幾乎完全相同的訓(xùn)練方法來訓(xùn)練時,針對所有數(shù)據(jù)集,XLNet都以相當(dāng)?shù)膬?yōu)勢勝過了BERT模型。

投入10倍多數(shù)據(jù)(對比XLNet-Large-wikibooks與XLNet-Large)的性能提升,要小于在11個基準(zhǔn)測試中將其中8個從BERT模型換成XLNet模型的性能提升。

在某些基準(zhǔn)測試(比如CoLA和MRPC)中,使用較少數(shù)據(jù)訓(xùn)練的模型,其表現(xiàn)要優(yōu)于使用較多數(shù)據(jù)訓(xùn)練的模型。

我們相信,從以上結(jié)果中我們也許可以得到一些結(jié)果了。

XLNet的性能提高了:觀測結(jié)果1與我們早期基于基礎(chǔ)模型的對比實驗結(jié)果一致,證明在指定相同的訓(xùn)練條件時,XLNet模型要優(yōu)于BERT模型。

XLNet-Large可以優(yōu)化到更佳:觀測結(jié)果2與觀測結(jié)果3似乎表明,我們之前發(fā)布的XLNet-Large(使用更多數(shù)據(jù)訓(xùn)練)并沒有充分利用數(shù)據(jù)規(guī)模。因此,我們會繼續(xù)研究相關(guān)方法,正確擴展使用XLNet模型進行語言預(yù)訓(xùn)練的規(guī)模。根據(jù)目前有限的觀測結(jié)果,我們推測以下訓(xùn)練細(xì)節(jié)可能發(fā)揮著重要作用:

數(shù)據(jù)相關(guān):數(shù)據(jù)規(guī)模、數(shù)據(jù)來源、數(shù)據(jù)清洗、數(shù)據(jù)編碼、數(shù)據(jù)格式化

優(yōu)化相關(guān):學(xué)習(xí)率(以及計劃)、batch size、訓(xùn)練步驟數(shù)、優(yōu)化器

重要的是:這些超參數(shù)可能彼此有高階交互效果。

Facebook AI近期 GLUE 排行榜,可能也說明了訓(xùn)練細(xì)節(jié)的重要性。

總之,本實驗將算法/模型的影響,與類似訓(xùn)練細(xì)節(jié)、大型計算及大數(shù)據(jù)這樣的其他因素明確分離開來。根據(jù)以上結(jié)果,XLNet 團隊認(rèn)為:算法與模型至少是與其他因素同等重要的,它們很可能都是實現(xiàn)自然語言理解最終目標(biāo)所必需的條件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4900

    瀏覽量

    70738
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    561

    瀏覽量

    10789
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25447

原文標(biāo)題:XLNet:公平PK,BERT你已經(jīng)被超過!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    U盤免費檢測軟件_閃存盤測試工具v2.09綠色版【明明白白買U盤】

    檢測軟件_閃存盤測試工具v2.09綠色版【明明白白買U盤】</strong></font><br/><
    發(fā)表于 04-13 12:35

    LabVIEW入門與提高范例教程

    `這個年代上個圖,看個明明白白比什么都重要,只有眼睛看到的才會稍微有點真實感,你下載了才會真的覺得真實,不參假!~~由于論壇上傳附件有要求,只能把他分為四個部分,請諒解謝謝[hide][/hide]`
    發(fā)表于 10-21 10:17

    太厲害了,終于有人能把IGBT講得明明白白

    太厲害了,終于有人能把IGBT講得明明白白資料分享來自網(wǎng)絡(luò)資源
    發(fā)表于 09-22 22:14

    介紹XLNet的原理及其與BERT的不同點

    1、什么是XLNet?  首先,XLNet是一個類似于bert的模型,而不是一個完全不同的模型。但它是一個非常有前途和潛力的。總之,XLNet是一種廣義的自回歸預(yù)訓(xùn)練方法。  那么,什
    發(fā)表于 11-01 15:29

    了解畫面比例,明明白白選購?fù)队澳?/a>

    了解畫面比例,明明白白選購?fù)队澳?  隨著時代的發(fā)展,投影幕已經(jīng)成為了不少人構(gòu)建家庭影院必定選購的商品??墒敲鎸Σ煌壤耐队澳唬?/div>
    發(fā)表于 02-10 10:33 ?719次閱讀

    明明白白C指針

    發(fā)表于 09-04 20:51 ?0次下載

    明明白白學(xué)C#(大學(xué)霸)

    這本C#教程從入門到精通,非常適合國人的學(xué)習(xí)習(xí)慣,能夠幫助您在最短時間內(nèi)掌握C#學(xué)習(xí),簡潔明了,如果有需要的話,大家可以下載了
    發(fā)表于 05-06 15:06 ?0次下載

    PSoC 4XX8 BLE 4.2系列數(shù)據(jù)手冊

    很不錯的psoc4數(shù)據(jù)手冊,明明白白,清清楚楚。
    發(fā)表于 12-10 13:55 ?11次下載

    你是嵌入式硬件設(shè)計的大神還是小白?

    提到“嵌入式”,想必各位攻城獅都不會陌生,今兒不管您水平幾何,咱們一起聊聊這“嵌入式”,大神&小白,您自個兒就明明白白
    的頭像 發(fā)表于 09-18 17:51 ?3629次閱讀
    你是嵌入式硬件設(shè)計的大神還是小白?

    碾壓Bert?“屠榜”的XLnet對NLP任務(wù)意味著什么

    張俊林新作,一文帶你剖析XLnet的運行機制,與BERT對比異同。
    的頭像 發(fā)表于 06-25 14:11 ?2818次閱讀

    XLNetBert比,有什么不同?要進行改進嗎?

    本文首先講講我對XLNetBert比,有什么異同?有什么模型方面的改進?的理解
    的頭像 發(fā)表于 07-26 14:39 ?5400次閱讀
    <b class='flag-5'>XLNet</b>和<b class='flag-5'>Bert</b>比,有什么不同?要進行改進嗎?

    語言建模中XLNetBERT好在哪里

    XLNet可能會改變語言建模,這就是為什么它是任何NLP從業(yè)者的重要補充。在本文中,我們將討論XLNet背后的原理,它使它比BERT更好。為了更好地理解它,我們還將研究它之前的相關(guān)技術(shù)。
    的頭像 發(fā)表于 04-20 09:30 ?2753次閱讀

    什么是XLNet,它為什么比BERT效果好

    介紹最基本的XLNet的原理,理解XLNetBERT的直覺上的不同點。作者:Xu LIANG編譯:ronghuaiyang首發(fā):AI公園公眾號
    的頭像 發(fā)表于 12-10 19:10 ?898次閱讀

    基于serialX串口驅(qū)動移植freemodbus

    之前,筆者寫過多篇 serialX 的文章,已經(jīng)把它的原理和理念完完全全明明白白講了,包括它的優(yōu)勢以及使用它需要注意的方面和可能遇到的問題。
    的頭像 發(fā)表于 10-13 14:54 ?1213次閱讀

    為什么國外喜歡使用lora?看完你就明明白白!

    近年來,隨著物聯(lián)網(wǎng)的快速發(fā)展,各種無線通信技術(shù)也得到了廣泛應(yīng)用。其中,LoRa技術(shù)以其獨特的優(yōu)勢脫穎而出,在歐美等發(fā)達(dá)國家和地區(qū)備受青睞。 LoRa是一種基于擴頻技術(shù)的超遠(yuǎn)距離無線通信方案,由Semtech公司開發(fā),并由LoRa聯(lián)盟制定開放標(biāo)準(zhǔn)LoRaWAN。它工作在免費的ISM頻段,如歐洲的433MHz和868MHz,美國的915MHz等,無需申請昂貴的頻譜資源。 LoRa最大的特點就是超低功耗和超長距離。得益于擴頻技術(shù),LoRa發(fā)射功率可低至20mW,電池供電的終端設(shè)備可以工作5-10年之久。傳
    的頭像 發(fā)表于 07-02 09:06 ?1076次閱讀
    主站蜘蛛池模板: 欧美综合国产精品日韩一 | 92香蕉视频 | 欧洲成人r片在线观看 | h在线观看网站 | 日韩特黄特色大片免费视频 | 一女被两男吃奶玩乳尖口述 | 免费午夜网站 | 永久免费的拍拍拍网站 | 欧美三级网址 | 国产三级在线 | 欧美3d动漫网站 | 午夜影院性 | www.亚洲免费 | 视频福利网 | 综合99| 久久精品视频国产 | 深夜在线视频免费网址 | 天天色狠狠干 | 国产欧美日韩综合精品一区二区 | 中文字幕一区二区三区乱码aⅴ | 欧美一区二区三区不卡免费观看 | 欧美色影视| 日本免费人成黄页网观看视频 | 亚洲激情视频网站 | 午夜大片在线观看 | 骚黄视频| 天天操 夜夜操 | 国产片在线观看狂喷潮bt天堂 | 欧美有码视频 | www.毛片在线观看 | 美女视频永久黄网站免费观看国产 | 日韩一区二区视频在线观看 | 午夜视频网址 | 免费在线看黄色 | 日韩一级片视频 | 国产高清一区二区 | 天天狠天天干 | 日本大片免费观看视频 | 91av免费在线观看 | 国产免费高清在线精品一区 | 熊出没之环球大冒险旧版免费观看 |