在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦CMU聯手推出XLNet,20項任務全面超越BERT

gckX_aicapital ? 來源:YXQ ? 2019-06-22 11:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦和CMU聯合團隊提出面向NLP預訓練新方法XLNet,性能全面超越此前NLP領域的黃金標桿BERT,在20個任務上實現了性能的大幅提升,刷新了18個任務上的SOTA結果,可謂全面屠榜!

近日,谷歌大腦主任科學家Quoc V. Le在Twitter上放出一篇重磅論文,立即引發熱議:

這篇論文提出一種新的NLP模型預訓練方法XLNet,在20項任務上(如SQuAD、GLUE、RACE) 的性能大幅超越了此前NLP黃金標桿BERT。

XLNet:克服BERT固有局限,20項任務性能強于BERT

本文提出的XLNet是一種廣義自回歸預訓練方法,具有兩大特點:(1)通過最大化分解階的所有排列的預期可能性來學習雙向語境,(2)由于其自回歸的性質,克服了BERT的局限性。

此外,XLNet將最先進的自回歸模型Transformer-XL的創意整合到預訓練過程中。實驗顯示,XLNet在20個任務上的表現優于BERT,而且大都實現了大幅度性能提升,并在18個任務上達到了SOTA結果,這些任務包括問答、自然語言推理、情感分析和文檔排名等。

與現有語言預訓練目標相比,本文提出了一種廣義的自回歸方法,同時利用了AR語言建模和AE的優點,同時避免了二者的局限性。首先是不再像傳統的AR模型那樣,使用固定的前向或后向分解順序,而是最大化序列的預期對數似然性分解順序的所有可能排列。每個位置的上下文可以包含來自該位置前后的令牌,實現捕獲雙向語境的目標。

作為通用AR語言模型,XLNet不依賴于數據損壞。因此,XLNet不會受到BERT受到的預訓練和微調后的模型之間差異的影響。同時以自然的方式使用乘積規則,分解預測的令牌的聯合概率,從而消除了在BERT中做出的獨立性假設。

除了新的預訓練目標外,XLNet還改進了預訓練的架構設計。 XLNet將Transformer-XL的分段重復機制和相對編碼方案集成到預訓練中,從而憑經驗改進了性能,對于涉及較長文本序列的任務效果尤其明顯。

圖1:在給定相同輸入序列x,但分解順序不同的情況下,對置換語言建模目標的預測結果

圖2:(a):內容流注意力機制,與標準的自注意力機制相同。(b)查詢流注意力,其中不含關于內容xzt的訪問信息。(c):使用雙信息流注意力機制的置換語言建模訓練示意圖。

全面屠榜:大幅刷新18項任務數據集SOTA性能

表1:與閱讀理解任務RACE測試集的最新結果的比較。 *表示使用聚集模型。 RACE中的“Middle”和“High”是代表初中和高中難度水平的兩個子集。所有BERT和XLNet結果均采用大小相似的模型(又稱BERT-Large),模型為24層架構。我們的XLNet單一模型在精確度方面高出了7.6分

表2:單XLNet模型在SQuAD1.1數據集上的性能優于分別優于真人表現和最佳聚集模型性能達7.6 EM和2.5 EM。

表3:與幾個文本分類數據集的測試集上錯誤率SOTA結果的比較。所有BERT和XLNet結果均采用具有相似大小的24層模型架構(BERT-Large)

表4:GLUE數據集上的結果。所有結果都基于具有相似模型尺寸的24層架構(也稱BERT-Large)。可以將最上行與BERT和最下行中的結果直接比較。

表5:與文檔排名任務ClueWeb09-B的測試集上的最新結果的比較。 ?表示XLNet的結果。

表6:我們使用BERT官方實現方案和XLNet超參數搜索空間在其他數據集上運行BERT,結果如圖所示,其中K是控制優化難度的超參數。所有模型都在相同的數據上進行預訓練。

從實驗結果可以看出,說XLNet全面超越BERT其實一點都不夸張。

知乎熱議:512TPU訓練,家里沒礦真搞不起

有熱心網友一早將這篇“屠榜”論文發在了知乎上,從網友的評論上看,一方面承認谷歌和CMU此項成果的突破,同時也有人指出,這樣性能強勁的XLNet,還是要背靠谷歌TPU平臺的巨額算力資源,“大力出奇跡”果然還是深度學習界的第一真理嗎?

比如,網友“Towser”在對論文核心部分內容的簡要回顧中,提到了XLNet的優化方法,其中引人注目的一點是其背后的谷歌爸爸的海量算力資源的支持:

512個TPU訓練了2.5天,訓練總計算量是BERT的5倍!要知道作為谷歌的親兒子,BERT的訓練計算量已經讓多數人望塵莫及了。沒錢,搞什么深度學習?

難怪NLP領域的專家、清華大學劉知遠副教授對XLNet一句評價被毫無懸念地頂到了知乎最高贊:

目前,XLNet的代碼和預訓練模型也已經在GitHub上放出。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6230

    瀏覽量

    107854
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22556

原文標題:NLP新標桿!谷歌大腦CMU聯手推出XLNet,20項任務全面超越BERT

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    將HFREFR和LFREFR寄存器值設置為錯誤的值來將故障注入CMU,但CMU_ISR值始終為零,為什么?

    我試圖通過將 HFREFR 和 LFREFR 寄存器值設置為錯誤的值來將故障注入 CMU,但 CMU_ISR值始終為零。
    發表于 03-28 07:41

    谷歌AI智能體執行復雜任務能力大幅提升

    自然語言描述任務,隨后由AI智能體代替用戶執行并最終完成任務,極大地提升工作效率和便捷性。 為了推進這一技術的實現,谷歌正在積極開發兩個相關項目。其中備受矚目的是名為“Mariner”的瀏覽器擴展程序。通過該程序,AI智能體能夠
    的頭像 發表于 02-17 14:39 ?598次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI 大模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 Pro 實驗
    的頭像 發表于 02-07 15:07 ?691次閱讀

    DeepSeek用戶量超越谷歌Gemini

    在聊天AI領域的競爭中,中國AI產品DeepSeek展現出了強勁的增長勢頭。據最新數據顯示,1月底,DeepSeek的用戶量已經成功超越谷歌的Gemini。 具體來看,1月31日這一天
    的頭像 發表于 02-07 14:59 ?527次閱讀

    科技為用戶而生!海爾智家大腦HomeGPT連獲三大獎

    用戶體驗的全面提升。 連獲三大獎,讓家更懂用戶所需 用戶的好評與行業認可是科技實力的最佳證明。短短兩個月內,海爾智家大腦HomeGPT入選“2024年工信部‘數字三品’應用場景典型案例”,榮獲“2024年度山東省信息產業協會科
    的頭像 發表于 01-24 11:36 ?464次閱讀

    三星電子與谷歌聯手研發AR眼鏡

    近日,三星電子在美國加州圣何塞成功舉辦了其一年一度的“Galaxy Unpacked”發布會。會上,三星電子不僅推出了備受期待的新旗艦“Galaxy S25”系列手機,還展示了與谷歌共同研發
    的頭像 發表于 01-24 10:22 ?930次閱讀

    谷歌CEO:Gemini AI技術超越競品,目標年底5億用戶

    近日,谷歌CEO皮查伊近期向員工傳達了他對公司Gemini AI技術的信心。據悉,皮查伊認為Gemini的能力已經超越了當前的競爭對手。 皮查伊表示,他期望到今年年底,全球能有5億人
    的頭像 發表于 01-17 10:37 ?520次閱讀

    馬斯克預言:AI將全面超越人類智力

    近日,科技巨頭馬斯克作出了一個關于人工智能(AI)的大膽預測。他斷言,AI的發展速度將超乎人類的想象,并將在不久的將來全面超越人類的智力。 馬斯克在X平臺上明確表示,AI的迅猛進步不容忽視。他預測
    的頭像 發表于 12-28 14:23 ?715次閱讀

    谷歌量子芯片Willow發布 速度超最快超算

    谷歌最新推出的量子芯片Willow引發了業界的廣泛關注。這款芯片具備105個物理量子比特,并在多個性能指標上處于領先地位,同時實現了兩重要突破。 首先,Willow成功解決了近30年來困擾研究者
    的頭像 發表于 12-13 16:36 ?578次閱讀

    谷歌發布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發表于 12-12 10:13 ?624次閱讀

    谷歌云宣布一重要人事任命

    近日,谷歌云(Google Cloud)正式宣布了一重要人事任命,尹世明將加入谷歌云,擔任大中華區總裁一職。這一任命無疑將為谷歌云在大中華區的業務發展和市場拓展注入新的活力和動力。
    的頭像 發表于 11-18 15:07 ?583次閱讀

    谷歌推出Gemini大型語言模型

    夠協助用戶完成諸如收集研究資料、購買產品或預訂航班等各種日常任務,從而極大地提升用戶的生活便捷性和效率。通過智能分析用戶的瀏覽行為和需求,該項目將為用戶提供個性化的建議和服務,使用戶能夠更加輕松地完成各種任務。 此外,知情人士還透露,
    的頭像 發表于 10-29 15:11 ?634次閱讀

    谷歌推出Gemini Live,開啟AI語音聊天新紀元

    在萬眾矚目的Pixel 9系列手機發布會上,谷歌震撼宣布了一創新服務——Gemini Live,該服務自今日起,率先向使用英語的Gemini Advanced訂閱用戶敞開大門。這一舉措標志著谷歌在人工智能語音交互領域邁出了重要
    的頭像 發表于 08-15 17:29 ?1017次閱讀

    谷歌推出新款電視盒子Google TV Streamer

    據多方媒體報道,谷歌近日推出新款電視盒——Google TV Streamer。相較前幾代Chromecast電視棒,此次新品體積更大、外觀更為搶眼,且不再隱藏在電視I/O面板下方。
    的頭像 發表于 08-07 17:18 ?1509次閱讀

    AWG和BERT常見問題解答

    隨著信號的速率越來越高,調制格式越來越復雜,對測試儀器的性能要求也越來越高。是德科技也一直在推出業界領先的高帶寬、高采樣率的AWG和高性能的BERT
    的頭像 發表于 08-06 17:27 ?1219次閱讀
    主站蜘蛛池模板: 亚洲日本欧美日韩高观看 | 97影院理论片手机在线观看 | 免费看黄在线观看 | free chinese 国产精品 | 久久福利精品 | 伊人成伊人成综合网2222 | 欧美专区在线播放 | 日本不卡视频 | 婷婷丁香综合 | 花怜write. as| 人人做人人爽人人爱秋霞影视 | 欧美xxxx性特级高清 | 国产精品你懂的在线播放 | 午夜一级成人 | bt天堂在线观看 | 一级特级女人18毛片免费视频 | 国产成人啪午夜精品网站男同 | 国产精品福利午夜一级毛片 | 久久精品久| 九九热精品国产 | 1024手机免费看片 | 国产精品三级在线观看 | 日日干夜夜骑 | 伊人亚洲 | 久久网站免费 | 久久精品男人的天堂 | 中文字幕佐山爱一区二区免费 | 毛片的网站| 精品理论片| 天堂网2021天堂手机版 | 欧美视频一区在线观看 | 尤物蜜芽福利国产污在线观看 | 奇米一区二区 | 俺来也俺来也天天夜夜视频 | 91在线播放免费不卡无毒 | 狠狠去 | 国产亚洲精品久久久极品美女 | 欧美日韩性猛交xxxxx免费看 | 国产专区青青草原亚洲 | 色网站在线观看 | h国产在线 |