在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于優化的元學習方法

深度學習自然語言處理 ? 來源:哈工大SCIR ? 作者:哈工大SCIR ? 2022-12-15 15:19 ? 次閱讀

1. 簡介

Prompt通過將輸入文本填入預設prompt模板的方式,將下游NLP任務形式與語言模型預訓練任務統一起來,來更好地利用預訓練階段學習到的知識,使模型更容易適應于下游任務,在一系列NLP任務上取得了很好的效果[1]。Soft prompt方法使用可學習的參數來替代prompt模板中固定的token,盡管在少標注文本分類任務上性能優異[2],但是其表現隨模型初始化參數不同會出現很大的波動[1, 3]。人工選擇soft prompt模型參數需要對語言模型內部工作機理的深入理解和大量試錯,并且在遇到不同少標注任務時難以復用。

e59393fc-7c3f-11ed-8abf-dac502259ad0.png

圖1 MetaPrompting幫助模型找到一個更優參數初始化點,以更快、更好地適應于新的少標注任務

為了解決上述問題,本文將目光從任務專用的soft prompt模型設計轉移到任務通用的模型參數初始化點搜索,以幫助模型快速適應到不同的少標注任務上。本文采用近年提出的基于優化的元學習方法,例如MAML[4]、Reptile[5]等,來搜索更優的soft prompt模型參數初始化點,以解決模型對初始化點過于敏感的問題。

本文在四個常用的少標注文本分類數據集上進行了充分的實驗,結果表明MetaPrompting相比其他基于元學習和prompt方法的強基線模型取得了更好的效果,達到了新的SOTA。

2. 方法

2.1 Soft prompt方法

Prompt方法通過將下游任務轉化成語言模型預訓練目標的形式,幫助模型更好地在下游任務上發揮性能。如圖2所示,對于一個新聞文本分類任務,可以通過將輸入文本填入prompt模板的方式,將該文本分類任務轉化為MLM任務形式。之后將模型在[MASK]位置填入各個詞語的概率映射到不同標簽上,即可完成文本分類任務的處理。

Soft prompt模型中,部分prompt tokens以可訓練embedding的形式給出,并可以和預訓練模型的參數一起進行優化,在保留離散token中語義信息的同時,給予模型更多的靈活性。

e5ad9fe0-7c3f-11ed-8abf-dac502259ad0.png

圖2 Soft prompt方法

2.2 將基于優化的元學習方法應用于soft prompt模型

少標注任務構建

本文使用元階段(episode)風格的少標注學習范式。具體而言,每一個少標注任務包含支持集和查詢集兩個部分,支持集中每個類別所對應標注樣本數量極少,本文通過將模型在支持集上進行適配,在查詢集上進行測試的方法,衡量模型的少標注學習性能。本文將不同標簽對應的樣本分別劃分成用于訓練、驗證和測試的少標注任務,以衡量模型從源領域學習通用元知識來處理目標領域少標注任務的能力。

基于元學習的soft prompt模型優化過程

MetaPrompting的整體優化過程如圖3所示。元訓練階段,模型在少標注任務的支持集上進行試探性參數更新,并在查詢集上進行梯度回傳。元測試階段,模型在未見過的少標注任務上進行適配和預測。令和分別表示預訓練模型和soft prompt的參數,在元訓練階段,模型在一個少標注任務支持集上進行適配的過程如下式所示:

e5d71456-7c3f-11ed-8abf-dac502259ad0.png

其中α是適配過程的學習率,表示模型進行適配學習的步數。令模型在少標注任務上適配學習之后的參數為和,可將模型在該少標注任務上的優化目標描述為:

e5e858ce-7c3f-11ed-8abf-dac502259ad0.png

該優化目標模擬了模型在少標注場景下進行試探性參數更新,并根據試探性更新之后的情況優化模型參數的策略。這種策略更多關注了模型在一步或多步更新之后的情況,因而可以幫助模型找到一個能快速適應于新的少標注任務的參數初始化點。

e6529d24-7c3f-11ed-8abf-dac502259ad0.png

圖3 MetaPrompting模型參數更新過程

實驗中,本文還使用了MAML++[6]中的多步梯度回傳技巧,來使得優化過程更加穩定,達到更好的效果。

3. 實驗

本文分別采用5way 1shot和5way 5shot的少標注學習設定來測試模型性能。實驗選擇了HuffPost、Amazon、Reuters和20newsgroup四個廣泛使用的文本分類數據集,結果以分類準確率%給出。

實驗結果如表1所示,表中20newsgroup數據集性能由于數據構造問題與原文略有出入,現為勘誤后結果,勘誤不影響實驗結論。由實驗結果可見,MetaPrompting性能優于當前的SOTA模型ContrastNet[7]和其他基于元學習和提示學習的方法,取得了明顯的性能提升。相比于不使用元學習優化目標的Ours (Pretrain Init),引入元學習搜索模型參數初始化點的Ours (Meta Init)也得到了更好的性能,說明了元學習方法在soft prompt模型參數優化中的有效性。

表1 MetaPrompting主實驗結果

e67c2004-7c3f-11ed-8abf-dac502259ad0.png

主實驗中,為了與其他基線模型進行公平的對比,將soft prompt參數和預訓練模型參數一起進行了優化。為了更好地說明MetaPrompting針對soft prompt參數初始化的作用,本文還參數進行了固定預訓練模型的實驗。實驗結果如表2所示,相比于參數隨機初始化的soft prompt模型,MetaPrompting取得了明顯的性能提升。

表2 MetaPrompting在固定預訓練模型參數時的性能

e77114c4-7c3f-11ed-8abf-dac502259ad0.png

現實應用場景中,往往難以得到內容、形式十分相近的源領域數據。因此本文還對MetaPrompting在分布外數據上的性能進行了測試。實驗結果如表3所示,即使源領域的數據內容、形式上有較大的差異,MetaPrompting仍然可以學習到任務通用的元知識,來輔助在目標領域少標注任務上的學習。

表3 MetaPrompting在不同內容、形式的源領域數據上進行元學習的性能

e7897e38-7c3f-11ed-8abf-dac502259ad0.png

本文還對MetaPrompting對于不同prompt模板的魯棒性進行了測試。如表4所示,相比于隨機初始化的soft prompt模型,MetaPrompting尋找到的參數初始化點在不同prompt模板下性能方差更小,魯棒性更強。

表4 MetaPrompting在不同prompt模板下性能的方差

e79c70f6-7c3f-11ed-8abf-dac502259ad0.png

4. 總結

本文提出了MetaPrompting,將基于優化的元學習方法推廣到soft prompt模型中,來處理少標注文本任務。MetaPrompting利用源領域數據進行元學習,搜索能夠更快、更好地適應于新的少標注人物的模型參數初始化點。在4個少標注文本分類數據集上的實驗結果表明,MetaPrompting相比于樸素的soft prompt模型以及其他基于元學習的基線模型取得了更好的效果,達到了新的SOTA性能。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3341

    瀏覽量

    49270
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24848
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22116

原文標題:參考文獻

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    帶通濾波器的設計步驟與優化方法

    帶通濾波器作為信號處理領域的重要組件,其設計步驟與優化方法對于確保濾波器性能滿足特定應用需求至關重要。本文將詳細闡述帶通濾波器的設計步驟,并深入探討優化方法,以期為相關領域的研究者和工
    的頭像 發表于 02-05 16:48 ?114次閱讀

    如何快速學習硬件電路

    對于想要學習硬件電路的新手來說,一開始可能感到有些困難,但只要掌握了正確的學習方法和技巧,就能夠快速地成為一名優秀的硬件電路工程師。 首先,新手需要了解基本的電路知識,例如電阻、電容、電感等。這些
    的頭像 發表于 01-20 11:11 ?216次閱讀
    如何快速<b class='flag-5'>學習</b>硬件電路

    焊接技術流程優化方法

    焊接是現代制造業中不可或缺的一部分,廣泛應用于建筑、汽車、航空、船舶等領域。隨著科技的發展,對焊接技術的要求越來越高,優化焊接流程顯得尤為重要。 1. 焊接工藝的優化 1.1 選擇合適的焊接方法
    的頭像 發表于 01-19 13:52 ?372次閱讀

    傳統機器學習方法和應用指導

    用于開發生物學數據的機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比,傳統方法在給定問題上的開發和測試速度更快。
    的頭像 發表于 12-30 09:16 ?418次閱讀
    傳統機器<b class='flag-5'>學習方法</b>和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的機器學習的定義是“利用經
    的頭像 發表于 11-16 01:07 ?530次閱讀
    什么是機器<b class='flag-5'>學習</b>?通過機器<b class='flag-5'>學習方法</b>能解決哪些問題?

    深度學習模型的魯棒性優化

    深度學習模型的魯棒性優化是一個復雜但至關重要的任務,它涉及多個方面的技術和策略。以下是一些關鍵的優化方法: 一、數據預處理與增強 數據清洗 :去除數據中的噪聲和異常值,這是提高模型魯棒
    的頭像 發表于 11-11 10:25 ?397次閱讀

    如何使用 PyTorch 進行強化學習

    強化學習(Reinforcement Learning, RL)是一種機器學習方法,它通過與環境的交互來學習如何做出決策,以最大化累積獎勵。PyTorch 是一個流行的開源機器學習庫,
    的頭像 發表于 11-05 17:34 ?419次閱讀

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發表于 10-28 14:05 ?283次閱讀
    Pytorch深度<b class='flag-5'>學習</b>訓練的<b class='flag-5'>方法</b>

    AI大模型的性能優化方法

    AI大模型的性能優化是一個復雜而關鍵的任務,涉及多個方面和策略。以下是一些主要的性能優化方法: 一、模型壓縮與優化 模型蒸餾(Model Distillation) 原理:通過訓練一個
    的頭像 發表于 10-23 15:01 ?1086次閱讀

    嵌入式學習建議

    學習目的,并注意學習方法。要明確學習目的是打基礎,還是為了適應工作需要而進行的短訓。學習方法方面,要根據學習目的選擇合適的
    發表于 10-22 11:41

    《DNK210使用指南 -CanMV版 V1.0》第一章本書學習方法

    第一章 本書學習方法 為了讓讀者更好地學習和使用本書,本章將為讀者介紹本書的學習方法,包括:本書的學習順序、編寫規范、代碼規范、資料查找和學習
    發表于 08-28 17:57

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法,包括自編碼器、生成對抗網絡、聚類算法等,并分析它們的原理、應用場景以及優
    的頭像 發表于 07-09 10:50 ?984次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度學習簡介 深度學習是一種基于人工神經網絡的
    的頭像 發表于 07-05 09:47 ?1072次閱讀

    深度學習的模型優化與調試方法

    深度學習模型在訓練過程中,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學習模型進行優化與調試是確保其性能優越的關鍵步驟。本文將從數據預處理、模型設計、超參數調整、正則化、模型集成以及調試與驗證等方面
    的頭像 發表于 07-01 11:41 ?1031次閱讀

    深度學習編譯工具鏈中的核心——圖優化

    等,需要調整優化網絡中使用的算子或算子組合,這就是深度學習編譯工具鏈中的核心——圖優化。圖優化是指對深度學習模型的計算圖進行分析和
    的頭像 發表于 05-16 14:24 ?1100次閱讀
    深度<b class='flag-5'>學習</b>編譯工具鏈中的核心——圖<b class='flag-5'>優化</b>
    主站蜘蛛池模板: 亚洲一本视频 | 性欧美大战久久久久久久野外 | 午夜在线免费观看视频 | 永久免费在线观看视频 | 伊人久久大香线蕉观看 | 爱操成人网 | 黄色日本视频网站 | 国产精品久久久久久久久免费观看 | 国产亚洲精品久久久久久牛牛 | a级黑粗大硬长爽猛视频毛片 | 伊人9| 美女一级免费毛片 | 免费成人黄色网址 | 欧美网站色 | 久久国产精品系列 | 日日干夜夜爽 | 黄色毛片免费进入 | 午夜想想爱午夜剧场 | 四虎在线最新永久免费播放 | 亚洲色啦啦狠狠网站 | 天天舔天天射天天干 | 久久99精品久久久久久园产越南 | 欧美爽妇| 亚洲狠狠色丁香婷婷综合 | 香蕉色网| 亚洲国产精品日韩专区avtube | 极品美女洗澡后露粉嫩木耳视频 | 欧美天天视频 | 国产亚洲视频在线播放大全 | 2021国内精品久久久久影院 | luxu259在线中文字幕 | 亚洲三级免费 | 狼色影院| 欧美成人 一区二区三区 | 99久久婷婷国产综合精品电影 | 手机在线观看免费视频 | 女bbbbxxxx毛片视频0 | 夜干夜夜| 国产欧美另类第一页 | 国产欧美一区二区日本加勒比 | 成人中文字幕一区二区三区 |