91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于改進文本分類的特征投影

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2021-03-05 15:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TL; DR

在情感分類中,一些good features,比如”good“、”nice“表示積極,”bad“、“terrible”表示消極。但是,還有許多common features,比如voice、screen就沒有特別的情感性。

盡管深度學習擁有強大的representation learning(表征學習,即同一個數(shù)據(jù)用不同的表示形式)。但我們認為還有可以改進的地方。

在本文中,我們提出了一種新的角度來進一步改善這種表示學習,即特征投影(feature projection):將現(xiàn)有特征投影到common特征的正交空間中。

所得的投影向量垂直于common特征,能更好的進行分類。

將該方法用于改進基于CNN,RNN,Transformer和Bert的文本分類模型,獲得更好的結果。

網(wǎng)絡結構

Feature Purification Network 特征凈化網(wǎng)絡

模型分為兩部分:

projection network (P-net);

common feature learning network (C-net)

P-net:計算凈化的向量特征,通過將學習到的輸入文本的信息向量投影到更具區(qū)分性的語義空間中來消除共同特征的影響。

C-net:提取common features。

P-net由四部分組成:

輸入層X

特征提取器Fp

正交投影層(OPL,Orthogonal Projection Layer)

分類層Cp

C-net也由四部分組成:

輸入層X

特征提取器Fc(Fp和Fc的參數(shù)不共享)

漸變反向層(GRL,Gradient Reverse Layer)

分類層Cc

技術的關鍵思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是說,將fp(從輸入文檔中提取的完整信息)投影到更具區(qū)分性的語義空間中,以進行最終分類。

圖2:正交投影層的工作方式。這里的示例是在二維空間中。

fp表示傳統(tǒng)特征向量;

fc表示公共特征向量;

fp?是投影特征向量;

fp~是最終的正交投影特征向量。

我們首先將傳統(tǒng)特征向量fp投影到共同特征向量fc,得到fp?。

等式9中的fp?即表示對共同特征向量fc的約束。

再將fp投影到fp-fp*得到fp~

也就是說:通過將輸入的傳統(tǒng)特征向量fp投影到公共特征向量fc來限制公共特征向量的模,因此新的公共特征向量fp*的語義信息僅包含xi的公共語義信息。

這使得最終的純化特征向量fp~來自傳統(tǒng)特征向量fp,而不是與公共特征向量fc正交的任何平面中的任何向量。

最后,我們使用純化的特征向fp~進行分類。

Experiments實驗

1 實驗使用數(shù)據(jù)集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基準模型進行對比實驗,已驗證特征投射的有效性。

3 實施細節(jié)

首先,我們將實驗中的所有詞嵌入隨機初始化為200維向量,然后在訓練過程中進行修改(Bert除外)。對于每種類型的特征提取器,我們具有以下配置:

對于RNN模型,使用兩層LSTM進行特征提取,每層的hidden state=256;

對于CNN模型,為了獲得更多的細粒度特征,我們分別使用了[2,3,4,5,6]的濾波器大小,每個濾波器都有100個特征圖。

對于Transformer的模型,我們使用Transformer的編碼器作為特征提取器,使用單頭和3個block。

對于Bert模型,我們微調了預訓練的基于Bert的參數(shù)。這些設置與FP-Net中的基線完全相同。

在C-net模塊的訓練中,我們以0.9為初始學習率的隨機梯度和隨后的退火學習率(Ganin and Lempitsky,2014)。

其中,訓練進度p從0線性變化為1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超參數(shù)λ為[0.05,0.1,0.2,0.4,0.8,1.0]。

4 實驗結果

5 消融實驗與分析

消融實驗類似于“控制變量法”。假設在某任務中,使用了A,B,C,取得了不錯的效果,但是這個時候你并不知道效果是由A,B,C中哪一個起的作用,于是你保留A,B,移除C進行實驗來看一下C在整個任務中所起的作用。

結論

在本文中,我們提出了一種新的特征凈化網(wǎng)絡(FP-Net),以改進文本分類的表示;

該方法基于特征投影。所提出的模型使用兩個子網(wǎng),一個用于識別對分類沒有區(qū)別的共同特征common features,另一個用于將傳統(tǒng)特征投射到共同特征的正交方向的特征投影;

我們當前的方法僅用于傳統(tǒng)文本分類方法,例如LSTM,CNN和Transformer。在未來的工作中,我們將考慮將其擴展到基于圖的方法(例如用于圖形數(shù)據(jù)的GCN),以及擴展到基于生成的方法(例如用于對抗性學習的GAN)。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 文本分類
    +關注

    關注

    0

    文章

    18

    瀏覽量

    7400
  • 深度學習
    +關注

    關注

    73

    文章

    5561

    瀏覽量

    122799
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22743

原文標題:【ACL2020】用于改進文本分類的特征投影

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DLP4500連續(xù)觸發(fā)投影,大約投影一百多次后,再觸發(fā)就不投影了,為什么?

    在vs程序總將投影的控制進行了實現(xiàn),投影序列設置如下圖: 1. 測試連續(xù)觸發(fā)時:每隔一秒觸發(fā)一次投影,大約投影一百多次后,再觸發(fā)就不投影
    發(fā)表于 03-03 08:33

    DLP LightCrafter 3000 evm按照教程進行標定,沒有投影白色而是投影的綠色,為什么?

    (tidu985a.pdf)文檔進行標定,運行程序到第四五步時,投影投影出來的是純綠色光線和綠色棋盤格,請問如何設置投影出白色和白色棋盤格。 我修改了config_projector.txt配置文件中
    發(fā)表于 03-03 06:13

    用DLP4500投影正弦光柵時存在高頻噪聲,應該如何改進正弦光柵質量?

    用DLP4500投影正弦光柵時存在高頻噪聲,應該如何改進正弦光柵質量?
    發(fā)表于 02-26 07:24

    dlpc3479用于dlp4710這款DMD上,該系統(tǒng)的最大投影幀率是多少?

    請問一下,dlpc3479用于dlp4710這款DMD上, 該系統(tǒng)的最大投影幀率是多少?以及相應的文檔資料, 非常感謝
    發(fā)表于 02-24 07:21

    DLP4710EVM-LC兩個條紋集合投影沖突怎么解決?

    如圖所示,我將條紋圖寫入投影用于投影,當只有一個條紋集合時投影正常,因為一個集合最多投影7張圖片,而我需要
    發(fā)表于 02-19 08:36

    使用DLP4500進行圖片投影時,內置Flash太小,無法投影更多的圖片,怎么解決?

    在使用DLP4500進行圖片投影時,內置Flash太小,無法投影更多的圖片,請問有其他方法能夠投影更多的圖片嗎?或者有其他flash更大的型號DLP推薦嗎?
    發(fā)表于 02-18 07:33

    DLP4500怎么確定投影儀開始投影的同時相機的c++代碼開始運行?

    投影儀通過trig1 鏈接相機,投影儀投圖同時觸發(fā)相機,相機采集圖像并傳回電腦,相機的代碼里需要添加dlp4500的api或sdk代碼嗎,怎么確定投影儀開始投影的同時相機的c++代碼
    發(fā)表于 02-18 07:16

    液晶投影儀與傳統(tǒng)投影儀的比較

    液晶投影儀與傳統(tǒng)投影儀在多個方面存在顯著差異,以下是對兩者的比較: 一、成像技術 液晶投影儀 :采用液晶板作為成像元件,通過液晶分子的排列變化來調控光線,從而實現(xiàn)色彩的精準還原與高清顯示效果。 傳統(tǒng)
    的頭像 發(fā)表于 12-26 18:10 ?1015次閱讀

    如何使用自然語言處理分析文本數(shù)據(jù)

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數(shù)據(jù)。 數(shù)據(jù)清洗 :去除無關字符(如HTML標簽、特殊符號等),確保文本數(shù)據(jù)干凈且一致。 2. 預處理 分詞 :將文本分割成有意義的單元(單詞、短語或句子),這取決于使用的語言和分析
    的頭像 發(fā)表于 12-05 15:27 ?1583次閱讀

    DMD芯片應用于投影儀的優(yōu)勢

    DMD(Digital Micromirror Device)芯片是數(shù)字光學投影技術(DLP)的核心組件,它將數(shù)字信號轉換成可見的投影圖像。DMD芯片應用于投影儀時,具有顯著的優(yōu)勢,具
    的頭像 發(fā)表于 12-05 10:47 ?1714次閱讀

    圖紙模板中的文本變量

    進行定義。無論是系統(tǒng)內置的變量,還是用戶自定義的變量,都以這種方式表述。 系統(tǒng)內置文本變量 以下表格展示系統(tǒng)內置的文本變量,無需定義,可以直接使用: 比如說,如果在圖紙編輯器中定義了以下標題欄: 當該圖紙模板應用于原理圖或PCB
    的頭像 發(fā)表于 11-13 18:21 ?661次閱讀
    圖紙模板中的<b class='flag-5'>文本</b>變量

    RK3588 技術分享 | 在Android系統(tǒng)中使用NPU實現(xiàn)Yolov5分類檢測

    : NPU幫助機器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術的發(fā)展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 10-24 10:13

    雷達的基本分類方法

    電子發(fā)燒友網(wǎng)站提供《雷達的基本分類方法.pdf》資料免費下載
    發(fā)表于 09-11 09:09 ?6次下載

    遙感傳感器的主要成像投影方式有哪些

    遙感傳感器的成像投影方式是遙感技術中的一個重要概念,它決定了傳感器如何捕捉地球表面的特征,并將其轉換為圖像數(shù)據(jù)。 中心投影(Perspective Projection) : 特點:傳感器與地球表面
    的頭像 發(fā)表于 09-04 14:23 ?1541次閱讀

    RK3588 技術分享 | 在Android系統(tǒng)中使用NPU實現(xiàn)Yolov5分類檢測

    : NPU幫助機器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術的發(fā)展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統(tǒng)使用NPU,也可以
    發(fā)表于 08-20 11:13
    主站蜘蛛池模板: 国产精品一区二区三区四区 | 欧美在线一级视频 | 深点再深一点好爽好多水 | 三级理论手机在线观看视频 | 黄色在线观看网址 | 日本高清高色 | 手机看片欧美日韩 | 涩涩97在线观看视频 | 午夜特片网 | 在线视频图片小说 | 狠狠色丁香婷婷综合小时婷婷 | 啪啪网站免费看 | 激情九月婷婷 | 国产成人mv 在线播放 | 1024人成网色www| 视频在线观看网站 | 99r8这里精品热视频免费看 | 天天插夜夜| 天天干天天干天天 | 思思99re66在线精品免费观看 | 999影院成 人在线影院 | 亚洲成人看片 | 天天射干 | 妹子干综合网 | 美女黄色毛片 | 国产高清小视频 | 亚洲最大黄色网址 | a久久久久一级毛片护士免费 | 午夜久久福利 | 人人草草 | vip影视免费观看 | 美日韩一级 | 国产伦精品一区二区三区四区 | 色屋网| 欧美片欧美日韩国产综合片 | 免费的两性视频网站 | 狠狠叉| 小毛片在线观看 | 福利视频亚洲 | 手机看片自拍自自拍日韩免费 | 国产精品免费看久久久久 |