在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種為小樣本文本分類設計的結合數據增強的元學習框架

深度學習自然語言處理 ? 來源:南大NLP ? 作者:孫鵬飛 ? 2021-05-19 15:54 ? 次閱讀

01

研究背景及動機

近些年,元學習已經成為解決小樣本問題的主流技術,并且取得不錯的成果。然而,由于現有的元學習方法大多數集中在圖像分類上,而對文本分類上的關注比較少。與圖像不同,同一類別中文本具有多種表達方式,這使得當前元學習方法的性能更容易受到每個類別樣本數(即shot的數量)的影響。因此,現有的元學習方法很難在小樣本文本分類上取得令人滿意的結果。

為了解決這個問題,我們在元學習中引入了數據增強,它帶來的好處是我們可以產生增強樣本以增加新類別的樣本數量,并使訓練樣本多樣化。然而,這帶來了一個新的挑戰,如何在小樣本的情況下產生置信度高的樣本?

為此,我們提出了一種新穎的數據增強方法,稱為Ball generator,圖1給出了一個簡單的例子。首先,我們計算支持集的最小包圍球,并在該球中合成樣本。我們認為該球中的樣本具有較高的置信度,因為所有支持集樣本都包含在該球中,并且它們與球心的最遠距離最小。

其次,為避免合成樣本偏差的影響,我們引入了變換模塊,以使合成樣本靠近自己的球心,并遠離其他球心。此外,我們還提出了一個新的基于數據增強的元學習框架(MEta-Learning with Data Augmentation,MEDA),以聯合訓練ball generator和meta-learner,使二者協同進化。與普通元學習相比,通過增加新類別的樣本數量,有效地提高了meta-learning在小樣本情況下的泛化能力。

950a13b4-b4a6-11eb-bf61-12bb97331649.png

圖1:Ball generator示例

02

MEDA

MEDA的框架如圖2所示。它是兩模塊組成:一個是ball generator模塊,它負責利用支持集生成增強支持集,并得到擴展支持集。另一個模塊是meta-learner,它在給定了擴展支持集的條件下計算每個查詢實例在類別上的概率分布,表示為。而不同的meta-learner的區別在于如何實現。這里我們選擇原型網絡和關系網絡作為MEDA的meta-learner。

9536f29e-b4a6-11eb-bf61-12bb97331649.png

圖2: MEDA

其中,ball generator是一種特征空間數據增強方法。它的核心思想是在特征空間中進行樣本的合成,并對合成的樣本進行調整。因此,整個ball generator由兩個子模塊組成:合成模塊和變換模塊。

合成模塊利用空間采樣算法獲得相應的合成樣本。具體是將采樣空間限制為支持集的最小包圍球,這里是球心,是半徑。然后,通過如下公式計算得到合成樣本:

95bedefc-b4a6-11eb-bf61-12bb97331649.png

這里,和。

變換模塊,它是為了進一步避免合成樣本偏差的影響,在特征空間中對合成的樣本進行變換操作,使合成樣本更接近自己類別的球心,而遠離其他球心。因此,我們將變換操作寫成函數,該函數以合成樣本作為輸入,產生一個增強樣本作為輸出。

03

實驗

本文的實驗是在SNIPS和ARSC數據集上進行的。我們將MEDA與三組baseline模型進行了比較。第一組是數據增強的模型;第二組是傳統的元學習模型;第三組是最新的小樣本文本分類的SOTA模型。實驗結果如表1和2所示。

表1:SNIPS實驗結果

9634ec8c-b4a6-11eb-bf61-12bb97331649.png

表2: ARSC實驗結果

967c6e36-b4a6-11eb-bf61-12bb97331649.png

從實驗結果上來看,由于通過數據增強獲得更多的訓練樣本,使得MEDA在兩個數據集上都取得一致且顯著的提升。

為了更進一步說明模型的shot數量對模型的影響,我們設計相應的實驗。如圖3所示,我們可以觀察到MEDA在所有設置中都取得了最好的表現。特別地,MEDA的準確率隨著shot數量的減少而增加(間距變大),這表明當shot數相對較小時,模型效果的提升更明顯。

96bf7cc6-b4a6-11eb-bf61-12bb97331649.png

圖3: 不同shot數量對模型準確率的影響

此外,我們還研究了模型的準確性如何隨著增強樣本數量的變化而變化。我們畫出不同模型在SNIPS數據集上的準確率變化情況。如圖4所示:

970f03f4-b4a6-11eb-bf61-12bb97331649.png

圖4: 不同模型的平均準確率隨增強樣本數量的變化而變化

可以看到,隨著增強樣本數量的增加,模型的準確率有所提高。同時,我們比較5-shot和10-shot的實驗設置,我們發現通過模型增強5個樣本與使用5個真實樣本的效果幾乎相同,這意味著我們的MEDA不是簡單地復制樣本,而是為模型生成有意義的樣本。

04

總結

在本文中,我們提出了一種新穎的數據增強方法,稱為ball generator,以增加新類別的樣本數量。此外,我們還提出了一個新的框架MEDA,該框架聯合優化了ball generator和meta-learner,從而使ball generator可以學習生成最適合meta-learner的增強樣本。更多的細節、結果以及分析請參考原論文。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7246

    瀏覽量

    91124
  • 函數
    +關注

    關注

    3

    文章

    4372

    瀏覽量

    64286

原文標題:IJCAI2021論文:MEDA:一種為小樣本文本分類設計的結合數據增強的元學習框架

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    一種實時多線程VSLAM框架vS-Graphs介紹

    針對現有VSLAM系統語義表達不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實時多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實驗表明
    的頭像 發表于 04-19 14:07 ?296次閱讀
    <b class='flag-5'>一種</b>實時多線程VSLAM<b class='flag-5'>框架</b>vS-Graphs介紹

    嵌入式AI技術之深度學習數據樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經網絡實現機器學習,網絡的每個層都將對輸入的數據次抽象,多層神經網絡構成深度學習框架,可以深度理解
    的頭像 發表于 04-02 18:21 ?760次閱讀

    【「基于大模型的RAG應用開發與優化」閱讀體驗】+Embedding技術解讀

    理和理解這些數據。在自然語言處理中,Embedding常用于將文本數據中的單詞、句子或文檔映射固定長度的實數向量,這些向量包含了豐富的語義信息。RAG技術是一種
    發表于 01-17 19:53

    如何使用自然語言處理分析文本數據

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數據數據清洗 :去除無關字符(如HTML標簽、特殊符號等),確保文本數據干凈且致。 2. 預處理 分詞 :將
    的頭像 發表于 12-05 15:27 ?1391次閱讀

    HarmonyOS NEXT應用服務開發Intents Kit(意圖框架服務)綜述

    、綜述 Intents Kit(意圖框架服務)是HarmonyOS級的意圖標準體系 ,意圖連接了應用/服務內的業務功能。 意圖框架能幫開發者將應用/
    發表于 11-28 10:43

    一種面向飛行試驗的數據融合框架

    天地氣動數據一致性,針對某外形飛行試驗數據開展了典型對象的天地氣動數據融合方法研究。結合數據挖掘的隨機森林方法,本文提出了
    的頭像 發表于 11-27 11:34 ?739次閱讀
    <b class='flag-5'>一種</b>面向飛行試驗的<b class='flag-5'>數據</b>融合<b class='flag-5'>框架</b>

    HarmonyOS NEXT應用服務開發Intents Kit(意圖框架服務)習慣推薦方案概述

    、習慣推薦是HarmonyOS學習用戶的行為習慣后做出的主動預測推薦。 1.開發者將用戶在應用/服務內的使用行為向HarmonyOS共享,使得HarmonyOS可以基于共享的數據
    發表于 11-19 17:59

    主動學習在圖像分類技術中的應用:當前狀態與未來展望

    本文對近年來提出的主動學習圖像分類算法進行了詳細綜述,并根據所用樣本數據處理及模型優化方案,將現有算法分為三類:基于數據
    的頭像 發表于 11-14 10:12 ?1150次閱讀
    主動<b class='flag-5'>學習</b>在圖像<b class='flag-5'>分類</b>技術中的應用:當前狀態與未來展望

    HarmonyOS NEXT應用服務開發Intents Kit(意圖框架服務)本地搜索方案概述

    本地搜索”特性例,當用戶在使用音樂應用/服務產生行為時,應用/服務可以將音樂的數據通過意圖框架API接口共享到HarmonyOS。這里的音樂
    發表于 11-06 10:59

    雷達的基本分類方法

    電子發燒友網站提供《雷達的基本分類方法.pdf》資料免費下載
    發表于 09-11 09:09 ?6次下載

    光學字符識別是什么的一種技術

    光學字符識別(Optical Character Recognition,簡稱OCR)是一種文本資料轉換為計算機可編輯和可搜索的數據格式的技術。這項技術廣泛應用于文檔掃描、數據錄入、
    的頭像 發表于 09-10 15:48 ?1015次閱讀

    利用TensorFlow實現基于深度神經網絡的文本分類模型

    要利用TensorFlow實現個基于深度神經網絡(DNN)的文本分類模型,我們首先需要明確幾個關鍵步驟:數據預處理、模型構建、模型訓練、模型評估與調優,以及最終的模型部署(盡管在本文
    的頭像 發表于 07-12 16:39 ?1433次閱讀

    增強現實是虛實結合嗎為什么

    增強現實(Augmented Reality,簡稱AR)是一種將虛擬信息與現實世界相結合的技術,它通過計算機生成的圖像、聲音、觸覺等感官信息,增強用戶對現實世界的感知和理解。
    的頭像 發表于 07-08 10:58 ?829次閱讀

    神經分類包括哪些

    )是神經系統的基本功能單位,是一種高度分化的細胞,具有接收、傳遞和處理信息的能力。神經通過電信號和化學信號進行信息傳遞和處理,是神經系統中最重要的細胞類型。 1.2 神經的結構 神經元由細胞體(soma)、樹突(dendri
    的頭像 發表于 07-03 11:36 ?2515次閱讀

    卷積神經網絡在文本分類領域的應用

    在自然語言處理(NLP)領域,文本分類直是個重要的研究方向。隨著深度學習技術的飛速發展,卷積神經網絡(Convolutional Neural Network,簡稱CNN)在圖像識
    的頭像 發表于 07-01 16:25 ?1129次閱讀
    主站蜘蛛池模板: 欧美黄页网 | 好爽毛片一区二区三区四区 | 亚洲光棍天堂 | 九九人人| 性孕妇洗澡video国产 | 噜啪啪| 国产美女作爱全过程免费视频 | 亚洲福利一区福利三区 | 你懂的在线观看网站 | 久久国产精品久久久久久 | 久久人人干 | 在线观看免费黄视频 | 伊人久久大香线蕉电影院 | 亚洲va欧美va国产综合久久 | 三级在线观看视频网站 | 巨乳色网站 | 久久综合中文字幕 | 免费啪啪网站 | 国产女人在线观看 | 久久精品视频网站 | 亚洲国产成人在人网站天堂 | 玖操在线 | 亚洲天天做夜夜做天天欢人人 | 国产三级 在线播放 | 色99色| 色网综合 | 六月丁香色婷婷 | 精品久草 | 最近2018免费中文字幕视频 | 国产精品午夜自在在线精品 | 亚洲夂夂婷婷色拍ww47 | 欧美区一区 | 亚州视频一区二区 | 亚洲三级小视频 | 色播欧美 | 亚洲一区二区三区深夜天堂 | 男人的午夜影院 | 四虎影院网址大全 | 中文字幕日韩三级 | 国产黄色小视频 | 夜夜操天天射 |