完结小说排行榜,完结小说排行榜,欢乐颂小说在线阅读

研究動機

抱怨是一種表達現實和人類期望之間不一致的言語行為[1]。人們會根據情況的嚴重性和緊迫性，用抱怨來表達他們的擔憂或不滿。輕微的抱怨可以達到發泄情緒以促進心理健康的目的，但嚴重的抱怨可能會導致仇恨甚至欺凌行為[2]。之前的研究主要集中在識別抱怨是否存在或其類型上，但是分析抱怨強度尤其重要，因為一定程度的抱怨可能會對公司或組織造成嚴重的負面后果。

圖1 Jin數據集中同類別抱怨博文

在計算語言學中，先前的研究主要集中在建立自動分類模型來識別抱怨是否存在。Jin提供了一個數據集，基于語用學注釋了不同嚴重程度的抱怨博文，分別為“沒有明確的指責”、“反對”、“指責”、“指控”和“責備”[3]。在這些研究中，我們注意到一個缺失的部分是測量抱怨的強度。

為了說明這一點，我們展示了Jin最新數據集中的四個例子，如圖1所示：“我能向你抱怨我剛剛收到的咖啡嗎？”和“維珍媒體如往常一樣充滿謊言謊言謊言！！！”，這兩句話被分為同一類型“指控”，但顯然它們在抱怨的程度上是不同的。另一個例子是，“完全不酷”和“請盡快回復我的消息！！！”，這兩句都被歸類為“反對”，然而，后者明顯提出了更強烈的抱怨。

分析不同的抱怨水平是有利的。公司需要定期監控來自用戶的反饋，因為某些抱怨可能會嚴重影響其產品的聲譽。組織或政府需要監控民眾的抱怨，以了解他們的迫切需求。

貢獻

1、我們提出一個新穎的工作：即自動捕捉文本中抱怨強度

2、我們展示了第一個中文抱怨強度數據集，包含來自微博平臺的3103條數據。

3、通過一系列分析實驗進一步證明研究抱怨強度的必要性和重要性，以及一些有趣的實證發現。

4、我們展示了我們的數據集如何幫助預測社交媒體上博文的流行度。

數據標注

在這項工作中，我們使用Louviere and Woodworth（1991）提出的最佳最差比例法（Best-Worst Scaling, BWS）[4]注釋了抱怨強度。這種方法通過相互比較，可以比直接評分產生更穩定和細粒度的分數。類似的方法也被廣泛應用于計算語言學的各種任務中，例如測量攻擊性，親密度等等。我們通過簡單的計數百分比統計最終為每個博文分配抱怨強度評分，范圍從-1（最不抱怨）到1（最抱怨）。部分標注結果如圖2所示：

圖2部分數據標注結果

主實驗

我們建立計算模型來預測一個給定博文的抱怨強度，使用SVR,Bidirectional LSTM,和BERT, RoBERTa等預訓練模型。我們在兩種情況下評估模型的性能：(1)混合話題（Mix Hashtag），我們將來自不同話題的微博博文組合在一起；(2)交叉話題（Cross Hashtag），其中訓練、開發和測試集的博文與不同的話題分開。我們使用皮爾遜相關性和MSE（均方誤差）作為我們所有實驗的度量標準。實驗結果如圖3所示：

圖3用于評估預測抱怨強度的Pearson系數的r和均方誤差(MSE)

分析實驗

抱怨和情緒之間的差異

我們注意到更強烈的抱怨似乎與消極詞匯有關。先前的研究也指出，抱怨可以被視為一個有影響的情感維度[2].我們展示在標準情緒數據集上訓練的模型在我們的抱怨強度預測任務中表現情況，如圖4所示，使用來自情緒模型的概率分數在我們的抱怨強度預測任務中表現出不錯的表現，這表明了抱怨和情緒之間的明確聯系。同時在我們的標注語料庫上訓練的模型優于情緒模型，這證明了我們的工作的必要性。

圖4抱怨強度預測任務中情緒模型和抱怨模型的表現

抱怨可以加強情感分析任務

我們將抱怨分數作為一個附加的特性輸入被添加到模型中。從圖5中，我們觀察到具有抱怨特征的模型比原始模型表現得更好。表明一個簡單的附加組件可以提高非神經模型和傳統神經模型的情緒分類預測精度，分析抱怨可以有助于二元情感分析任務。

圖5二元情緒預測的結果（顯著性測試p-vlaue < 0.01, t-test）

跨語言分析

我們最新收集的抱怨強度數據集是中文的，而當前現有的數據集包含英文推文。這為我們提供了一個機會來了解在社交媒體上使用中文和英語的人在抱怨上的語言差異。

（1）直接和間接抱怨：中文博文中80%為間接抱怨；相反，英文推文91%的都是直接抱怨。

（2）策略：圖6顯示了不同語言的策略有所不同。我們發現，中文使用者更傾向于不補償策略，而英文使用者最常用的策略是補償策略。

圖6跨語言分析中不同策略所占百分比。

（3）諷刺：10%的中文數據包含諷刺，26%的英文數據包含諷刺。圖7展示了詞性分析，中文諷刺表達中名詞比例最高，其次是動詞；而在英文諷刺表達中，動詞最多，其次是名詞。此外，英語中的形容詞和副詞比中文的要多。

圖7跨語言分析的POS標簽的百分比

預測博文流行度

我們設想將抱怨強度分數納入現有的社交媒體監控系統中，以提高它們的預測準確性，證明了來自我們的計算模型的抱怨強度得分可以幫助估計社交媒體上的帖子流行度。

我們遵循Szabo的流行度計算方法[5]，使用早期流行度進行預測的基線，為了顯示我們的抱怨分數的有效性，我們添加了抱怨強度作為一個新的術語來估計最終的對數流行度，公式如下所示：

圖8顯示，我們結合了抱怨密度的方法優于基線方法。

圖8 RMSE和MAE的流行度預測

我們還展示了隨時間變化的單一話題下的流行度預測，如圖9所示。我們觀察到，增加了抱怨分數有助于更好地估計發布后的流行度，特別是在早期階段。這可能是因為抱怨可能會吸引用戶的注意力，以便參與討論，從而提高活動的流行度。

圖9比較實際的博文流行度和對單一話題的流行度預測

總結

我們提出了第一個測量文本抱怨強度的研究。我們構建了一個包含3103篇關于抱怨的中國微博文章的語料庫，并使用BWS方法標注了抱怨強度評分。然后，我們證明了我們的語料庫支持自動計算模型的發展，以準確的抱怨強度預測。此外，我們還研究了抱怨與情緒之間的聯系，并對中文和英文之間的抱怨表達進行了跨語言比較。我們最終證明，我們的抱怨強度得分有助于更好地估計社交媒體上的博文的流行度。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

SVR

SVR

+關注

關注
0

文章
7

瀏覽量
10789

原文標題：NAACL'22 Findings | 社交媒體上的抱怨強度分析

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

信道預測模型在數據通信中的作用

在現代通信系統中，數據傳輸的可靠性和效率是衡量系統性能的關鍵指標。信道預測模型作為通信系統中的一個核心組件，其作用在于預測信道條件的變化，從

發表于 01-22 17:16 ?536次閱讀

電子發燒友榮獲電子工業出版社博文視點 “2024 年度卓越合作伙伴”

近日，憑借過去一年在書籍測評活動等方面的深度合作與卓越表現，電子發燒友榮膺電子工業出版社博文視點 “2024 年度卓越合作伙伴” 的殊榮，表彰電子發燒友在過去一年中與

發表于 01-20 15:46

一文說清楚什么是AI大模型

DALL-E）、科學計算模型（如 AlphaFold）以及多模態模型。這些模型通過海量數據訓練，展現出高度的泛用性。比較有代表性的大語言模型

發表于 01-02 09:53 ?1083次閱讀

介紹FIR濾波模型的建立，分4個步驟

本帖介紹FIR濾波模型的建立，分以下幾個步驟：選定濾波結構：低通、高通、帶通、帶阻；選定合適的窗函數，常見的有hamming、hanning、blackman、ExactBlackman

發表于 09-04 09:08

BP神經網絡預測模型的建模步驟

BP（Backpropagation）神經網絡是一種多層前饋神經網絡，其核心思想是通過反向傳播算法來調整網絡中的權重和偏置，從而實現對輸入數據的預測或分類。BP神經網絡預測

發表于 07-11 16:57 ?2087次閱讀

matlab預測模型怎么用

MATLAB預測模型是一種基于統計和數學方法的預測工具，廣泛應用于各種領域，如金融、氣象、生物醫學等。本文將介紹MATLAB預測

發表于 07-11 14:33 ?836次閱讀

MATLAB預測模型哪個好

在MATLAB中，預測模型的選擇取決于數據類型、問題復雜度和預測目標。以下是一些常見的預測模型及

發表于 07-11 14:31 ?570次閱讀

如何使用MATLAB創建預測模型

在這篇文章中，我們將討論如何使用MATLAB創建預測模型。MATLAB（矩陣實驗室）是一種用于數值計算、可視化和編程的高級編程語言和交互式環境。它廣泛應用于工程、科學研究和金融領域。

發表于 07-11 14:29 ?926次閱讀

matlab預測模型有哪些

環境，使其成為預測模型開發和實現的理想平臺。本文將詳細介紹MATLAB中常用的預測模型及其應用。線性回歸模型線性回歸是

發表于 07-11 14:27 ?1050次閱讀

bp神經網絡預測模型建模步驟

BP神經網絡（Backpropagation Neural Network）是一種多層前饋神經網絡，其核心思想是通過反向傳播算法來調整網絡中的權重和偏置，從而實現對輸入數據的預測或分類。本文將詳細

發表于 07-11 10:52 ?833次閱讀

arimagarch模型怎么預測

ARIMA-GARCH模型是一種時間序列預測方法，它結合了自回歸積分滑動平均（ARIMA）模型和廣義自回歸條件異方差（GARCH）模型。AR

發表于 07-09 10:22 ?752次閱讀

神經網絡預測模型的構建方法

神經網絡模型作為一種強大的預測工具，廣泛應用于各種領域，如金融、醫療、交通等。本文將詳細介紹神經網絡預測模型的構建方法，包括

發表于 07-05 17:41 ?1120次閱讀

如何使用PyTorch建立網絡模型

PyTorch是一個基于Python的開源機器學習庫，因其易用性、靈活性和強大的動態圖特性，在深度學習領域得到了廣泛應用。本文將從PyTorch的基本概念、網絡模型構建、優化方法、實際應用等多個方面，深入探討使用PyTorch

發表于 07-02 14:08 ?647次閱讀

建立神經網絡模型的三個步驟

建立神經網絡模型是一個復雜的過程，涉及到多個步驟和細節。以下是對建立神經網絡模型的三

發表于 07-02 11:20 ?1467次閱讀

這個CRC計算單元是如何基于固定的生成多項式(0x4C11DB7)來獲取給定數據緩沖區的CRC碼的？

這個CRC計算單元是如何基于固定的生成多項式(0x4C11DB7)來獲取給定數據緩沖區的CRC碼的？

發表于 05-16 16:06 ?1193次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

建立計算模型來預測一個給定博文的抱怨強度

評論

信道預測模型在數據通信中的作用

電子發燒友榮獲電子工業出版社博文視點 “2024 年度卓越合作伙伴”

一文說清楚什么是AI大模型

介紹FIR濾波模型的建立，分4個步驟

BP神經網絡預測模型的建模步驟

matlab預測模型怎么用

MATLAB預測模型哪個好

如何使用MATLAB創建預測模型

matlab預測模型有哪些

bp神經網絡預測模型建模步驟

arimagarch模型怎么預測

神經網絡預測模型的構建方法

如何使用PyTorch建立網絡模型

建立神經網絡模型的三個步驟

這個CRC計算單元是如何基于固定的生成多項式(0x4C11DB7)來獲取給定數據緩沖區的CRC碼的？