在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種簡單而有效的轉換方法來降低預測情感標簽的難度

深度學習自然語言處理 ? 來源:南大NLP ? 作者:趙飛 ? 2022-09-20 12:04 ? 次閱讀

01

研究動機

面向目標的多模態情感分類(TMSC)是方面級情感分析的一個新的子任務,旨在預測一對句子和圖片中提到的意見目標的情感極性。該任務背后的假設是圖片信息可以幫助文本內容識別意見目標的情感。圖1給出了兩個代表性的示例。我們可以看到僅僅根據非正式的簡短句子很難檢測出意見目標的情感,但與意見目標相關的視覺內容(即笑臉)可以清晰地反映其情感極性。

4daad74a-3896-11ed-ba43-dac502259ad0.png

圖1:面向目標的多模態情感分類 (TMSC) 的兩個示例。意見目標及其相應的情感極性在句子中突出顯示。紅色邊框表示意見目標關注到的視覺線索。

從上面的示例中我們可以看出,對齊兩種模態的意見目標并捕獲有用的視覺情感特征在TMSC任務中起著至關重要的作用。鑒于其重要性,主流的工作采用了注意力機制來自動學習文本和圖片的對齊關系,然后將捕獲的意見目標的視覺表示聚合為證據來進行情感預測。

盡管取得了一些改進,但上述方法仍然存在兩個關鍵問題:

(1)由于文本和圖片中意見目標的粒度存在很大的差距,之前的這些方法很難對齊兩種模態。具體來說,圖片中出現的意見目標通常是指粗粒度的對象(例如,圖片中的man),而句子中的意見目標通常是細粒度的實體(例如,人名 “Vince Gilligan)。意見目標粒度的不一致導致視覺注意力有時無法捕捉到相應的視覺表征。

(2)即使捕獲到了,表達相同情緒的多樣化視覺表示也給情感預測帶來了很大的挑戰。以圖1(c)和圖1(d)為例,意見目標“Vince Gilligan”和“Sammy”分別關注了圖片中的粗粒度對象man和girl,從他們的面部表情我們可以看出他們都在微笑,但微笑的角度和幅度卻大不相同。視覺表示的多樣性不可避免地導致其稀疏性,這使得學習視覺表示和情感標簽之間的映射函數變得困難。

在這項工作中,我們提供了解決上述問題的新思路,即利用從圖片中提取的形容詞-名詞對 (ANPs) .(例如圖2(a)中的“nice clouds”, “bad car”, “happy man”, “clear sky”和“dry grass”)。對于第一個問題,我們觀察到ANPs中的名詞也是粗粒度的概念,因此一個很直觀的想法是將細粒度的意見目標(例如“Vince Gilligan”)映射到粗粒度名詞中(例如“man”)。

通過這種方式更容易彌合兩種模態的粒度差距并對齊文本和圖片。對于第二個問題,我們觀察到 ANPs 通常可以從表達相同情緒的不同視覺內容中提取到相同的形容詞,因此一個很直觀的想法是將多樣化的視覺表征(例如笑臉)映射到同一個形容詞(例如“happy”)。顯然,學習這些相同形容詞和情感標簽之間的映射函數更容易。

4eb97678-3896-11ed-ba43-dac502259ad0.png

圖2:從每個圖片中提取前 5 個形容詞-名詞對 (ANPs)

為了使用 ANPs促進 TMSC 任務,我們提出了一個知識增強框架(簡稱KEF), 它主要包含兩個組件:視覺注意力增強器和情感預測增強器。前者首先使用我們設計的映射方法從 ANPs 中找到與意見目標最相關的名詞,然后用它來提高視覺注意力的有效性。后者的目的是建立形容詞和目標相關視覺表示之間的聯系,然后將其用作視覺表示的補充信息,以降低預測情感標簽的難度。

02

貢獻

1.據我們所知,我們是第一個提出利用從圖片中提取的形容詞-名詞對(ANPs)來幫助TMSC 任務對齊文本和圖片的工作;

2.我們提出了一種新穎的知識增強框架(KEF),它包含一個視覺注意力增強器來提高視覺注意力的有效性,以及一個情感預測增強器來降低情感預測的難度。

3.KEF 具有良好的兼容性,很容易組合或者擴展到現有的基于注意力的多模態模型。在這項工作中,我們將其應用于兩個最新的 TMSC 模型:SaliencyBERT[6]和 TomBERT[2]。兩個公開數據集的實驗結果證明了我們框架的有效性。

03

解決方案

圖 3 展示了 KEF 的整體架構,主要包含兩個組件:視覺注意力增強器和情感預測增強器。具體來說,我們首先基于TomBERT[2]和 SaliencyBERT模型抽象出一個通用的注意力架構。然后,在 ANPs 的幫助下,我們依次提出了視覺注意力增強器和情感預測增強器。前者旨在通過映射方法和重構損失來提高視覺注意力的有效性,后者引入了一種簡單而有效的轉換方法來降低預測情感標簽的難度。

4ef4a54a-3896-11ed-ba43-dac502259ad0.png

圖3:知識增強框架(KEF)的整體架構

3.1 視覺注意力增強器

問題

如前所述,圖片中出現的意見目標是一個粗粒度的概念,而句子中提到的意見目標是一個細粒度的概念,意見目標粒度的不一致導致了視覺注意力有時無法捕獲到相應的視覺表示。

基本的直覺

顯然,從圖片中提取出來的名詞也是粗粒度的概念,所以一個直觀的想法是將細粒度的意見目標映射到粗粒度的名詞上,然后將它作為橋梁來捕獲粗粒度的視覺特征.。但是,從圖片中提取的大部分名詞都是與意見目標無關的,因此我們不能直接使用它們。

映射方法(Mapping Method.)

為了應對上述挑戰,我們首先通過計算嵌入空間中名詞表示和目標表示之間的語義相似度來衡量目標-名詞相關性的強度:

4f330056-3896-11ed-ba43-dac502259ad0.png

根據最大相似度得分,我們可以找到與意見目標最相關的名詞:

4f4de11e-3896-11ed-ba43-dac502259ad0.png

接下來,我們將它們聚合在一起作為意見目標的補充信息以捕獲相應的視覺表示:

4f6f6f8c-3896-11ed-ba43-dac502259ad0.png

重構損失(Reconstruction Loss.)

為了確保視覺注意力能夠更準確地捕獲到與意見目標相關的視覺特征,我們還設計了一種重構損失來最小化目標相關名詞表示和目標相關視覺表示之間的差異:

4f954dc4-3896-11ed-ba43-dac502259ad0.png

3.2 情感預測增強器

問題

即使視覺特征被捕獲到了,但是表達相同情緒的視覺表征之間仍然存在顯著差異,這給學習視覺表征和情感標簽之間的映射函數帶來了挑戰。

基本的直覺

考慮到 ANPs 通常可以從表達相同情緒的不同視覺表征中提取相同的形容詞,因此一個直觀的想法是將多樣化的視覺表征映射到同一個形容詞。然而,與視覺表示最相關的形容詞是未知的,我們需要明確地找到它。

轉換方法(Transformation Method.)

實際上,在映射方法中,我們發現名詞表示與目標感知視覺表示最相關。由于形容詞是名詞的修飾語,因此與該名詞對應的形容詞也與目標感知視覺表示最相關。最后,我們將其用作視覺表示的補充信息,以降低情感預測的難度:4ff737aa-3896-11ed-ba43-dac502259ad0.png

04

實驗

我們在兩個公開的數據集Twitter2015和Twitter2017上進行了實驗,并且使用準確率(Accuracy)和Macro-F1分數作為評估指標。KEF包含兩個即插即用的組件,可以輕松組合或擴展到現有的基于注意力的方法。為了更好地驗證KEF的有效性,我們選擇了兩個最近的基于BERT的多模態模型作為我們工作的基礎,即TomBERT和Saliencybert。

換句話說,我們將KEF集成到TomBERT和Saliencybert中,得到最終模型KEF-TomBERT和KEF-Saliencybert。從表1可以看出,KEF-Saliencybert和KEF-TomBERT在TWITTER-15和TWITTER-17數據集上均取得了具有競爭力的結果。

具體來說,與TomBERT相比,KEF-TomBERT在Macro-F1和Accuracy分別獲得了大約2.0%和1.5%的改進。相比之下,KEF-Saliencybert的表現平均優于Saliencybert1.5%和1.7%。這些結果表明我們的框架具有良好的兼容性。此外,在大多數情況下,KEF-TomBERT的表現優于KEFSaliencybert,這表明我們的框架對TomBERT更有效。

表1:主實驗結果

5015b54a-3896-11ed-ba43-dac502259ad0.png

在不失一般性的情況下,我們選擇 KEF-TomBERT 模型進行消融實驗,以研究 KEF 中單個模塊對模型整體效果的影響。視覺注意力增強器簡稱VAE,-情感預測增強器簡稱SPE。根據表2報告的結果,我們可以觀察到以下幾點:

表2:消融實驗結果

504b2d6a-3896-11ed-ba43-dac502259ad0.png

1. 與基礎模型 TomBERT 相比,TomBERT+VAE 和TomBERT+SPE在兩個數據集上均取得了具有競爭力的表現,這驗證了利用形容詞-名詞對提高視覺注意力能力和情感預測能力的合理性;

2. 將SPE集成到TomBERT+VAE后,KEF-TomBERT實現了state-of-the-art的性能,這證明了SPE可以通過形容詞-名詞對提高情感預測能力;

3. VAE 比 SPE 更有效,這是合理的因為注意力機制的有效性是情感預測的核心因素。因此,它對我們的框架貢獻更大;

4. 如圖 4 所示,我們可以看到 KEF-TomBERT 學習到的多模態表示明顯比 TomBERT+VAE 學習的更可分離,這表明SPE確實可以降低情感預測的難度。

50add73a-3896-11ed-ba43-dac502259ad0.png


圖4:TomBERT+VAE 和 KEF-TomBERT 的多模態表示的可視化

為了驗證 ANPs 對 KEF-TomBERT 模型的影響,我們從每張圖片中提取前 1、3、5 和 7 個 ANPs進行了實驗,結果如圖 5 所示。顯然,隨著 ANPs 數量的增加,KEF-TomBERT 的性能變得更好。而且當 ANPs 的數量等于 5 時,KEF-TomBERT 的效果最好。

但是,一旦 ANP 的數量大于 5,性能就不會繼續增加,甚至開始下降。這背后的原因可能是:每個句子最多包含5個意見目標,所以當ANPs的數量大于意見目標的最大數量時會帶來一些噪音。

50e1304e-3896-11ed-ba43-dac502259ad0.png

圖5:不同數量 ANPs 對KEF-TomBERT的影響

05

案例分析

為了更好地理解視覺注意力增強器 (VAE) 和情感預測增強器 (SPE) 的優勢,我們從 Twitter 數據集中隨機選擇一些樣本進行案例研究。

視覺注意力增強器的影響

如圖 6(a) 所示,基礎模型 TomBERT 錯誤地預測了意見目標“Korkie”的情感。這是合理的因為我們發現 TomBERT關注了與意見目標無關的視覺線索(由黃色邊界框突出顯示)。在將 VAE 集成到 TomBERT 之后,TomBERT+VAE將細粒度的意見目標“Korkie”映射到 ANPs 中的粗粒度名詞“man”。在名詞“man”的幫助下,TomBERT+VAE 成功地捕捉到了目標相關的視覺線索(由紅色邊界框突出顯示),從而給出了正確的預測。

情感預測增強器的影響

如圖 6(b) 和6(c) 所示,雖然 TomBERT+VAE 準確地捕捉到了意見目標的相應視覺表征(即笑臉),但微笑表情的多樣化增加了情感預測的難度,因此 TomBERT +VAE 錯誤地預測了圖 6(c) 中“Sammy”的情感。在將 SPE 集成到 TomBERT+VAE 之后,KEFTomBERT 將不同的笑臉映射到同一個形容詞“happy”。顯然,KEF-TomBERT 更容易學習這些“happy”和情感標簽“positive”之間的映射函數,從而做出正確的預測。

511c0b7e-3896-11ed-ba43-dac502259ad0.png

圖6:案例分析

06

總結

在本文中,我們為 TMSC 任務提出了一種新穎的知識增強框架 (KEF)。具體來說,在 ANPs 的幫助下,我們設計了兩個新穎的知識增強器,視覺注意力增強器和情感預測增強器,以提高 TMSC 任務的視覺注意力能力和情感預測能力。大量實驗的結果表明,我們的框架與其它最先進的方法相比具有更好的性能。進一步的分析也驗證了我們框架的優越性。

在未來,我們希望將我們的想法應用于其他多模態任務,因為從圖片中提取的形容詞-名詞對很容易擴展到其他多模態任務,例如多模態實體鏈接、多模態機器理解和多模態對話生成。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 增強器
    +關注

    關注

    1

    文章

    47

    瀏覽量

    8433
  • ANP
    ANP
    +關注

    關注

    0

    文章

    4

    瀏覽量

    6394

原文標題:COLING2022 | 南大提出:面向目標的多模態情感分類的知識增強框架

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用ad9467-250采集低頻信號,請問有什么方法來提高sfdr嗎?

    你好,我現在在使用ad9467-250采集低頻信號,在測試3Mhz部分時sfdr只有86,采樣頻率是102.4Mhz,請問有什么方法來提高sfdr嗎
    發表于 04-24 06:05

    如何使用NTAG213單擊次即可執行多項作?

    于我的用例來說并不理想。 我正在尋找一種方法來執行所有這些任務(設置密碼、刪除密碼、讀取和寫入) 單擊單擊.NTAG213 可以嗎?如果沒有,是否有其他 NFC 標簽(例如 NTAG216、NTAG424
    發表于 04-11 08:03

    用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎?

    您好!我現在用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎。 我現在用普通的信號發生器產生了個正弦波,1KHz的頻率,用采集卡采集了16*1
    發表于 02-10 07:49

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出了一種方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球致的定位,無需視覺數據關聯。所提方法為VIO/VSLAM系
    的頭像 發表于 12-13 11:18 ?522次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>降低</b>VIO/VSLAM系統漂移的新<b class='flag-5'>方法</b>

    如何有效提高BUCK電路占空比的方法

    BUCK電路,也稱為降壓轉換器,是一種直流-直流轉換器,用于將輸入電壓降低到較低的輸出電壓。占空比(Duty Cycle)是BUCK電路中的
    的頭像 發表于 12-12 16:58 ?1026次閱讀

    一種使用LDO簡單電源電路解決方案

    本期我們介紹一種使用LDO簡單電源電路解決方案,該方案可以處理12V/24V、多節鋰離子電池和4節干電池等相對較高的輸入電壓。
    的頭像 發表于 12-04 16:05 ?658次閱讀
    <b class='flag-5'>一種</b>使用LDO<b class='flag-5'>簡單</b>電源電路解決方案

    基于LSTM神經網絡的情感分析方法

    能力而受到廣泛關注。 1. 引言 情感分析在商業智能、客戶服務、社交媒體監控等領域具有廣泛的應用。傳統的情感分析方法依賴于手工特征提取和機器學習算法,但這些方法往往難以處理文本中的長距
    的頭像 發表于 11-13 10:15 ?1036次閱讀

    一種創新的動態軌跡預測方法

    本文提出了一種動態軌跡預測方法,通過結合歷史幀和歷史預測結果提高預測的穩定性和準確性。它引入了
    的頭像 發表于 10-28 14:34 ?817次閱讀
    <b class='flag-5'>一種</b>創新的動態軌跡<b class='flag-5'>預測</b><b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設備。這種方法減少了硬件組件、板空間和成
    的頭像 發表于 10-24 14:57 ?1251次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>簡單</b>高效配置FPGA的<b class='flag-5'>方法</b>

    文看懂如何降低貼片微型共模電感的噪音

    在電子設備中,貼片微型共模電感是應用非常廣泛的一種電子元器件,作為家擁有20年電感研發和制造經驗的車規級電感制造商,我們積累了豐富的經驗解決電感噪聲問題。今天將討論幾種有效
    的頭像 發表于 10-08 10:41 ?452次閱讀

    簡單認識雙積分型A/D轉換

    雙積分型A/D轉換器是一種重要的模擬到數字轉換器(Analog-to-Digital Converter,簡稱A/D轉換器),它采用獨特的雙積分方法
    的頭像 發表于 09-06 16:22 ?2093次閱讀

    rup是一種什么模型

    部分)開發的,它基于統建模語言(UML)和面向對象的軟件開發方法。RUP提供了一種結構化的方法來開發軟件,它包括系列的階段、迭代和里程碑
    的頭像 發表于 07-09 10:13 ?1966次閱讀

    基于助聽器開發的一種高效的語音增強神經網絡

    受限的微控制器單元(microcontroller units,MCU)上,內存和計算能力有限。在這項工作中,我們使用模型壓縮技術彌補這差距。我們在HW上對RNN施加約束,并描述了一種方法來滿足它們
    發表于 06-07 11:29

    伺服電機最簡單控制方法是什么

    伺服電機是一種高精度、高響應速度的電機,廣泛應用于工業自動化、機器人、航空航天等領域。伺服電機的控制方法有很多種,這里我們將介紹一種簡單、最基礎的控制
    的頭像 發表于 06-05 15:49 ?1196次閱讀

    AD8338有沒有可行的方法來測量大增益?

    AD8338是款VGA芯片,可變增益范圍為-10dB至70dB。然而,理論上的70dB增益過大,導致來自源的輸入信號非常小,容易受到干擾,導致70dB增益未得到驗證。有沒有可行的方法來測量大增益?
    發表于 05-21 07:06
    主站蜘蛛池模板: 国内精品哆啪啪 | caoporn成人免费公开 | 美女被免费视频网站九色 | 96一级毛片| 亚洲一区二区三区免费在线观看 | 干一干操一操 | 美女扒开尿口给男人桶动态图 | 在线播放免费视频 | www.激情五月| 四虎国产永久免费久久 | 国模欢欢大尺度 | 99色视频在线观看 | 欧美一级黄色片在线观看 | 国内自拍露脸普通话对白在线 | 欧美激情亚洲精品日韩1区2区 | 日本高清色图 | 三级网址在线观看 | 在线观看视频一区 | 最近高清免费观看视频大全 | а8天堂资源在线官网 | 免费一级欧美片在线观免看 | 丁香婷婷亚洲六月综合色 | 天天干天天做天天操 | 欧美性猛交xxxx黑人猛交 | 天天操天天看 | 久久久久国产精品免费免费不卡 | 天堂网www在线资源链接 | www.99色| 天天色综合4 | 456主播喷水在线观看 | 福利片在线观看免费高清 | 草草影院私人免费入口 | 欧美午夜视频一区二区 | 免费男女视频 | 搞黄视频网站 | 国产片在线 | 河南毛片 | 国产伦精品一区二区三区女 | 色色免费| 伦理片日本韩国电影三级在线观看 | 国内一级特黄女人精品毛片 |