在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

三種LM任務形式:單向LM,雙向LM,序列到序列LM

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2021-01-03 09:25 ? 次閱讀

今天分享一個論文UniLM[1],核心點是掌握三種LM任務形式:單向LM,雙向LM,序列到序列LM;

1. 生成任務

NLP任務大致可以分為NLU和NLG兩種;Bert在NLU任務上效果很好,但是天生不適合處理生成任務。

原因在于Bert的預訓練過程是使用的MLM,和生成任務的目標并不一致。

生成任務目標是每次蹦出來一個詞,只能看到當前位置之前的詞匯。

而Bert采用的是雙向的語言模型,除了mask的單詞,兩個方向的詞匯都可以被看到。

所以對Bert的一個改進思路就是讓它在具有NLU能力的時候,同時兼備NLG能力。

2. 三種LM任務

UniLM做的就是這樣一個事情。

具體的實現方式是設計了一系列的完形填空任務,這些完形填空任務的不同之處在于對上下文的定義。

從左到右的LM:使用mask單詞的左側單詞來預測被遮掩的單詞

從右到左的LM:和上面第一個相比就是方向的變化,使用mask單詞的右側單詞來預測遮掩的單詞

雙向LM:就是當前mask的左右詞匯都可以看到

sequence-to-sequence LM:這個就是UniLM能夠具有生成能力的關鍵。我們的輸入是source句子和target句子,mask單詞在target上,那么當前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務叫單向LM;

有個點需要注意,三個任務是一起優化的,具體來講是這樣做的:

在訓練的時候,1/3的時候使用雙向LM,1/3的時候使用序列到序列 LM,1/6的時候使用從左到右的LM,1/6的時間使用從右到做的LM。

我們是使用不同的Mask矩陣來對應不同任務輸入數據形式。

文中使用的是這樣一張圖來展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他細枝末節

Gelu 激勵函數

24層TRM,最大長度512,1024Hidden Size,16Heads,340M參數

初始化使用Bert Large

15%被mask,其中80%真正替換mask,10%隨機替換,10%不動。替換的時候,80% 的時候替換單個token,20%的時候替換bigram 或者 trigram

第四個步驟類似中文實體詞的mask,也算是一點改進。

有個細節點需要注意的是,作者強調,不同的segment embedding用來區分不同LM任務。

Bert的時候,區分上下句子,我們使用0和1,在這里,我們使用這個segment embedding用來區分任務:

比如說,雙向對應0和1;單向left-right對應2;單向right-left對應3;序列對應4和5;

4. 總結

掌握以下幾個細節點就可以:

聯合訓練三種任務:單向LM,雙向LM,序列LM

使用不同的attention矩陣控制三種任務形式的參與

segment embedding可以區分不同的任務形式

mask的時候15% 的有被替換的概率,其中80% 被真正替換。在這80%真正替換的里面有80%單個token被替換,20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責任編輯:xj

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自然語言
    +關注

    關注

    1

    文章

    291

    瀏覽量

    13407
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22117

原文標題:如何讓BERT具有文本生成能力

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LM73605/LM73606 EVM用戶指南

    電子發燒友網站提供《LM73605/LM73606 EVM用戶指南.pdf》資料免費下載
    發表于 01-03 15:33 ?0次下載
    <b class='flag-5'>LM</b>73605/<b class='flag-5'>LM</b>73606 EVM用戶指南

    LM74810評估模塊:LM74810EVM

    電子發燒友網站提供《LM74810評估模塊:LM74810EVM.pdf》資料免費下載
    發表于 11-29 16:28 ?0次下載
    <b class='flag-5'>LM</b>74810評估模塊:<b class='flag-5'>LM</b>74810EVM

    LM74800評估模塊:LM74800EVM-CD

    電子發燒友網站提供《LM74800評估模塊:LM74800EVM-CD.pdf》資料免費下載
    發表于 11-29 16:27 ?1次下載
    <b class='flag-5'>LM</b>74800評估模塊:<b class='flag-5'>LM</b>74800EVM-CD

    LM324和LM358器件應用設計指南

    電子發燒友網站提供《LM324和LM358器件應用設計指南.pdf》資料免費下載
    發表于 09-04 10:58 ?7次下載
    <b class='flag-5'>LM</b>324和<b class='flag-5'>LM</b>358器件應用設計指南

    LM339能用LM324代替嗎

    LM339簡介 LM339是一款四路比較器集成電路,由美國國家半導體公司(National Semiconductor)生產。它具有以下特點: 1.1. 四路比較器:LM339包含四個獨立的比較器
    的頭像 發表于 08-26 17:07 ?1695次閱讀

    LM148、LM248和LM348運算放大器數據表

    電子發燒友網站提供《LM148、LM248和LM348運算放大器數據表.pdf》資料免費下載
    發表于 06-18 11:29 ?0次下載
    <b class='flag-5'>LM</b>148、<b class='flag-5'>LM</b>248和<b class='flag-5'>LM</b>348運算放大器數據表

    LM118-N/LM218-N/LM318-N運算放大器數據表

    電子發燒友網站提供《LM118-N/LM218-N/LM318-N運算放大器數據表.pdf》資料免費下載
    發表于 06-13 10:09 ?0次下載
    <b class='flag-5'>LM</b>118-N/<b class='flag-5'>LM</b>218-N/<b class='flag-5'>LM</b>318-N運算放大器數據表

    LM101A/LM201A/LM301A運算放大器數據表

    電子發燒友網站提供《LM101A/LM201A/LM301A運算放大器數據表.pdf》資料免費下載
    發表于 06-13 10:06 ?0次下載
    <b class='flag-5'>LM</b>101A/<b class='flag-5'>LM</b>201A/<b class='flag-5'>LM</b>301A運算放大器數據表

    LM118、LM218和LM318精密、快速運算放大器數據表

    電子發燒友網站提供《LM118、LM218和LM318精密、快速運算放大器數據表.pdf》資料免費下載
    發表于 06-12 10:47 ?0次下載
    <b class='flag-5'>LM</b>118、<b class='flag-5'>LM</b>218和<b class='flag-5'>LM</b>318精密、快速運算放大器數據表

    LM321LV、LM358LV、LM324LV運算放大器數據表

    電子發燒友網站提供《LM321LV、LM358LV、LM324LV運算放大器數據表.pdf》資料免費下載
    發表于 06-04 09:23 ?4次下載
    <b class='flag-5'>LM</b>321LV、<b class='flag-5'>LM</b>358LV、<b class='flag-5'>LM</b>324LV運算放大器數據表

    LM339、LM239、LM139、LM2901 四路差分比較器數據表

    電子發燒友網站提供《LM339、LM239、LM139、LM2901 四路差分比較器數據表.pdf》資料免費下載
    發表于 05-07 16:20 ?2次下載

    有關LM3914N和LM3914N-1應用的疑問

    據手冊中,LM3914N-1的封裝形式按NS叫法為NA18A,LM3914N的封裝形式按NS叫法為N18A。僅此而已,在數據手冊中再無別的區別。
    發表于 04-28 11:36

    1A降壓穩壓器LM1575/LM2575/LM2575HV數據表

    電子發燒友網站提供《1A降壓穩壓器LM1575/LM2575/LM2575HV數據表.pdf》資料免費下載
    發表于 03-28 13:50 ?1次下載
    1A降壓穩壓器<b class='flag-5'>LM</b>1575/<b class='flag-5'>LM</b>2575/<b class='flag-5'>LM</b>2575HV數據表

    電壓軌簡單電源序列發生器LM3880-Q1 數據表

    電子發燒友網站提供《電壓軌簡單電源序列發生器LM3880-Q1 數據表.pdf》資料免費下載
    發表于 03-27 13:50 ?0次下載
    <b class='flag-5'>三</b>電壓軌簡單電源<b class='flag-5'>序列</b>發生器<b class='flag-5'>LM</b>3880-Q1 數據表

    電壓軌簡單電源序列發生器LM3880數據表

    電子發燒友網站提供《電壓軌簡單電源序列發生器LM3880數據表.pdf》資料免費下載
    發表于 03-26 13:45 ?0次下載
    <b class='flag-5'>三</b>電壓軌簡單電源<b class='flag-5'>序列</b>發生器<b class='flag-5'>LM</b>3880數據表
    主站蜘蛛池模板: 老色皮 | xxxx曰本| 四虎永久在线观看视频精品 | 亚洲无吗在线视频 | 又黄又爽又猛大片录像 | 俺去啦在线视频 | 亚洲综合激情 | 久久久精品免费观看 | 婷婷丁香色综合狠狠色 | 免费一级毛片正在播放 | 天天草夜夜草 | 色琪琪一本到影院 | 草久久久久 | 亚洲国产成人精品不卡青青草原 | 一区二区三区伦理高清 | 亚洲一区二区福利视频 | 亚洲综合五月天欧美 | 主人扒开腿揉捏花蒂调教cfh | 一卡二卡三卡四卡无卡在线 | 天天怕夜夜怕狠狠怕 | 亚洲欧美v视色一区二区 | 香蕉视频一级 | 8050网午夜一级毛片免费不卡 | 黄色免费网站在线播放 | 美女 免费 视频 黄的 | 亚洲 另类 在线 欧美 制服 | www一区二区三区 | 六月婷婷在线 | 欧美伦理一区 | 38pao强力打造永久免费高清视频 | 丁香伊人五月综合激激激 | 99热久久精品最新 | 日韩三级在线免费观看 | 思思99re66在线精品免费观看 | 国产片一级aaa毛片视频 | 色婷婷综合在线视频最新 | 午夜老司机永久免费看片 | 久久久久国产 | 天天天色综合 | 黄网站色在线视频免费观看 | 日本欧美一区二区三区不卡视频 |