在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

meta reweighting 策略來增強偽樣本的效果

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-08-03 11:46 ? 次閱讀

自增強(self-augmentation)最近在提升低資源場景下的 NER 問題中得到了越來越多的關注,token 替換和表征混合是對于 NER 這類 token 級別的任務很有效的兩種自增強方法。值得注意的是,自增強的方法得到的增強數據有潛在的噪聲,先前的研究是對于特定的自增強方法設計特定的基于規則的約束來降低噪聲。

本文提出了一個聯合的 meta-reweighting 的策略來自然的進行整合。我們提出的方法可以很容易的擴展到其他自增強的方法中,實驗表明,本文的方法可以有效的提升自增強方法的表現。

27892526-1258-11ed-ba43-dac502259ad0.png

命名實體識別旨在從非結構化文本中抽取預先定義的命名實體,是 NLP 的一個基礎任務。近期,基于神經網絡的方法推動 NER 任務不斷取得更好的表現,但是其通常需要大規模的標注數據,這在真實場景中是不現實的,因此小樣本設置的 NER 更符合現實需求。

數據自增強是一個小樣本任務可行的解法,對于 token-level 的 NER 任務,token 替換和表征混合是常用的方法。但自增強也有局限性,我們需要為每種特定的自增強方法單獨進行一些設計來降低自增強所帶來的噪聲,緩解噪聲對效果的影響。本文提出了 meta-reweighting 框架將各類方法聯合起來。

首先,放寬前人方法中的約束,得到更多偽樣本。然而這樣會產生更多低質量的增強樣本,為此,我們提出 meta reweighting 策略來控制增強樣本的質量。同時,使用 example reweighting 機制可以很自然的將兩種方法結合在一起。實驗表明,在小樣本場景下,本文提出的方法可以有效提升數據自增強方法的效果,在全監督場景下本文的方法仍然有效。

27a37b9c-1258-11ed-ba43-dac502259ad0.png

Method

2.1 Baseline

本文的 basic 模型使用 BERT+BiLSTM+CRF 進行 NER 任務。首先給定輸入序列 ,使用預訓練的 BERT 得到每個 token 的表征。

27c1ad10-1258-11ed-ba43-dac502259ad0.png

然后使用 BiLSTM 進一步抽取上下文的特征:

27cc3f14-1258-11ed-ba43-dac502259ad0.png

最后解碼過程使用 CRF 進行解碼,先將得到的表征過一層線性層作為初始的標簽分數,定義一個標簽轉移矩陣 T 來建模標簽之間的依賴關系。對于一個標簽序列 ,其分數 計算如下:

27d7cb86-1258-11ed-ba43-dac502259ad0.png

其中 W、b 和 T 是模型的參數,最后使用維特比算法得到最佳的標簽序列。訓練的損失函數采用句子級別的交叉熵損失,對于給定的監督樣本對 (X, Y),其條件概率 P(Y|X) 計算如下:

27e5d0f0-1258-11ed-ba43-dac502259ad0.png

其中 為候選標簽序列。

2.2 自增強方法

27eea55e-1258-11ed-ba43-dac502259ad0.png

2.2.1 Token Substitution(TS)

token 替換是在原始的訓練文本中對部分 token 進行替換得到偽樣本。本文通過構建同義詞詞典來進行 token 替換,詞典中既包含實體詞也包含大量的普通詞。遵循前人的設置,我們將所有屬于同一實體類型的詞當作同義詞,并且添加到實體詞典中,作者將其稱為 entity mention substitution (EMS)。同時,我們也將 token 替換擴展到了“O”類型中,作者將其稱為 normal word substitution (NWS)。作者使用 word2vec 的方法,在 wikidata 上通過余弦相似度找到 k 個最近鄰的詞作為“O”類型詞的同義詞。這里作者設置了參數 (此參數代表 EMS 的占比)來平衡 EMS 和 NWS 的比率,在 entity diversity 和 context diversity 之間達到更好的 trade-off。

2.2.2 Mixup for CRF

不同于 token 替換在原始文本上做增強,mixup 是在表征上進行處理,本文將 mixup 的方法擴展到了 CRF 層。形式上,給定一個樣本對 和 ,首先用 BERT 得到其向量表示 和 。然后通過參數 將兩個樣本混合:

2800a5b0-1258-11ed-ba43-dac502259ad0.png

其中,n 為 , 從 分布中采樣。損失函數變為:

280c5248-1258-11ed-ba43-dac502259ad0.png

2.3 Meta Reweighting

有別于句子級的分類任務,NER 這類 token 級別的任務對于上下文高度敏感,一些低質量的增強數據會嚴重影響模型的效果。在本文中,作者使用 meta reweighting 策略為 mini batch 中的訓練數據分配樣本級的權重。

在少樣本設置中,我們希望少量的標注樣本能夠引導增強樣本進行模型參數更新。直覺上看,如果增強樣本的數據分布和其梯度下降的方向與標注樣本相似,說明模型能夠從增強樣本中學到更多有用的信息。

算法流程如下:

2813ff66-1258-11ed-ba43-dac502259ad0.png

實驗

3.1 實驗設置

數據集采用 OntoNotes 4、OntoNotes 5、微博和 CoNLL03,所有數據集均采用 BIOES 標注方式。

283e17ba-1258-11ed-ba43-dac502259ad0.png

對于 NWS,使用在 wikipedia 上訓練的 GloVe 獲取詞向量,取 top5 最近鄰的詞作為同義詞, 取 0.2, 在 Beta (7, 7) 中進行采樣,評價指標使用 F1 值。3.2 主實驗本文在小樣本設置和全監督設置下都做了實驗,結果如下:

284dd362-1258-11ed-ba43-dac502259ad0.png

285dc22c-1258-11ed-ba43-dac502259ad0.png

287441aa-1258-11ed-ba43-dac502259ad0.png

3.3 分析

作者首先在 CoNLL03 5% 設置下做了增強數據量對實驗結果的影響:

2887cdc4-1258-11ed-ba43-dac502259ad0.png

可以看出,在增強數據是原始訓練數據的 5 倍之后,模型的效果就趨于平緩了,單純的增加增強樣本數并不能帶來效果上持續的增長。

作者在三種小樣本設置下對參數 的影響:

2894202e-1258-11ed-ba43-dac502259ad0.png

可以看出在 20% 時效果最好,而且相比之下,只使用 NWS 比只使用 EMS 效果更好。可能的一個原因是實體詞在文本中是稀疏的,NWS 能夠產生更多不同的偽樣本。

接著作者分析了 mixup 參數 (Beta 分布參數 )的取值:

289edc08-1258-11ed-ba43-dac502259ad0.png

因為本文 Beta 分布的兩個參數都取 ,其期望總是 0.5,當 增大時,分布的方差減小,采樣更容易取到 0.5,實驗結果表明當 取 7 時整體效果最好。最后作者還分析了 mixup 添加在不同位置的不同結果:

28b24428-1258-11ed-ba43-dac502259ad0.png

總結

本文提出了 meta reweighting 策略來增強偽樣本的效果。是一篇很有啟發性的文章,從梯度的角度出發,結合類似于 MAML 中 gradient by gradient 的思想,用標注樣本來指導偽樣本訓練,為偽樣本的損失加權,對偽樣本的梯度下降的方向進行修正使其與標注樣本更加相似。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4807

    瀏覽量

    102773
  • 數據
    +關注

    關注

    8

    文章

    7241

    瀏覽量

    91001
  • 解碼
    +關注

    關注

    0

    文章

    185

    瀏覽量

    27752
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于GPS衛星的多徑效應分析與研究

    采用衛星技術增強GPS 定位系統提高定位性能是衛星定位應用的一個研究熱點。在對GPS 衛星應用中出現的多徑效應做較為詳細的特點分析后
    發表于 12-19 13:55 ?12次下載

    基于支持樣本的快速增強學習算法

    針對確定性馬爾克夫決策過程,本文提出了一種基于支持樣本的快速增強學習算法。文章首先把學習問題形式化為一個確定性的馬爾可夫決策過程,并對問題空間中每個狀態的總
    發表于 01-22 12:18 ?5次下載

    采用衛星技術增強GPS定位系統提高定位性能

    采用衛星技術增強GPS定位系統提高定位性能是衛星定位應用的一個研究熱點。在對GPS衛星應用中出現的多徑效應做較為詳細的特點分析后,開
    發表于 07-23 10:51 ?31次下載

    樣本支持向量機分類策略研究_胡紅宇

    樣本支持向量機分類策略研究_胡紅宇
    發表于 03-19 11:28 ?0次下載

    Meta與DassaultSystèmes攜手為Solidworks3DCAD軟件提供增強現實支持

    Meta公司已與DassaultSystèmes開展合作,為后者的Solidworks3DCAD軟件提供增強現實支持。 在推動Meta2成為正當工作場所工具的另一次嘗試中,Meta
    發表于 02-08 07:25 ?1236次閱讀

    Bose推出了一款利用聲音實現增強現實效果的太陽眼鏡

    談及增強現實,可能有人會想到的是那些頭戴式的顯示設備,其通過畫面讓人產生沉浸感。不過近期 Bose 則推出了一款利用聲音實現增強現實效果的太陽眼鏡 Bose Frames。
    發表于 12-12 15:02 ?3810次閱讀

    研究人員們提出了PBA的方法獲取更為有效的數據增強策略

    數據增強策略通常包括剪切、填充、翻轉和旋轉等,但這些基本策略對于深度網絡的訓練還是太簡單,在對于數據增強策略和種類的研究相較于神經網絡的研究
    的頭像 發表于 08-02 15:56 ?5930次閱讀

    一種基于標簽半監督學習的小樣本調制識別算法

    一種基于標簽半監督學習的小樣本調制識別算法 來源:《西北工業大學學報》,作者史蘊豪等 摘 要:針對有標簽樣本較少條件下的通信信號調制識別問題,提出了一種基于標簽半監督學習技術的小
    發表于 02-10 11:37 ?1062次閱讀

    基于k近鄰與高斯噪聲的虛擬困難樣本增強方法

    然而在無監督SimCSE中,作者僅使用dropout的方式進行了正樣本增強,沒有額外引入困難樣本,這在一定程度上限制了模型的能力。基于這個動機,亞馬遜提出了一種基于k近鄰與高斯噪聲的虛擬困難
    的頭像 發表于 05-12 11:31 ?1561次閱讀

    一個聯合的meta-reweighting策略來自然的進行整合

    增強所帶來的噪聲,緩解噪聲對效果的影響。本文提出了 meta-reweighting 框架將各類方法聯合起來。
    發表于 08-03 11:44 ?475次閱讀

    yolov5和YOLOX正負樣本分配策略

    整體上在正負樣本分配中,yolov7的策略算是yolov5和YOLOX的結合。因此本文先從yolov5和YOLOX正負樣本分配策略分析入手,后引入到YOLOv7的解析中。
    發表于 08-14 11:45 ?2598次閱讀
    yolov5和YOLOX正負<b class='flag-5'>樣本</b>分配<b class='flag-5'>策略</b>

    Meta拒絕谷歌合作提議

    近日,科技巨頭Meta拒絕與谷歌母公司Alphabet進行合作,原本的計劃是將Meta的混合現實頭顯產品Quest搭載谷歌的Android XR平臺。然而,盡管Meta作出了這一決定,谷歌方面依然保持開放態度,顯示出其在市場競爭
    的頭像 發表于 03-06 10:27 ?918次閱讀

    高通與Meta合作優化Meta Llama 3,實現終端側運行

    高通技術公司高級副總裁兼技術規劃和邊緣解決方案業務總經理馬德嘉表示:“我們對Meta開放Meta Llama 3的策略表示贊賞,高通與Meta均致力于賦能開發者,推動AI創新。
    的頭像 發表于 04-22 09:51 ?685次閱讀

    Meta重組硬件部門Reality Labs,聚焦增強現實與元宇宙

    科技巨頭Facebook的母公司Meta近日宣布,對其硬件部門Reality Labs進行了一次重大重組。此次重組是自2020年該部門更名以來規模最大的一次,標志著Meta在不斷變化的戰略中更加專注于增強現實(AR)和元宇宙領域
    的頭像 發表于 06-20 10:58 ?921次閱讀

    Meta發布新AI模型Meta Motivo,旨在提升元宇宙體驗

    Meta在人工智能領域邁出了重要一步。通過這款模型,Meta希望能夠為用戶提供更加自然、流暢的元宇宙交互體驗。數字代理在元宇宙中的動作將更加逼真,從而增強用戶的沉浸感和參與度。 除了Meta
    的頭像 發表于 12-16 10:34 ?859次閱讀
    主站蜘蛛池模板: 4438x成人网最大色成网站 | 国产一级aaa全黄毛片 | 三级视频网站 | 奇米奇米 | 精品久久久久久中文字幕欧美 | 精品国产一二三区在线影院 | 极品国产一区二区三区 | 色一乱一伦一区一直爽 | 天天插日日干 | 爽天天天天天天天 | 久久精品伊人波多野结 | 免费毛片大全 | 欧美色图色就是色 | 五月天男人的天堂 | 永久免费人成网ww555kkk手机 | 夜夜操天天爽 | 老师你好滑下面好湿h | 国产一级特黄在线播放 | 全免费午夜一级毛片真人 | 色视频在线观看免费 | 国产精品丝袜xxxxxxx | 免费一看一级毛片 | 天天爱天天射 | 色婷婷狠狠| 午夜神马影院 | 日本免费色 | 欧美日韩看片 | 久久国内 | 成人欧美一区二区三区视频 | 黄色美女网站在线观看 | www懂爱 | 欧洲成人r片在线观看 | 中文天堂在线www | 亚洲精品乱码久久久久久蜜桃图片 | 黄色免费网站在线播放 | 2019天天干| 亚洲高清美女一区二区三区 | 午夜操操操| 在线观看视频一区二区三区 | 能可以直接看的av网址 | www一片黄 |