在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FLAT的一種改進方案

深度學(xué)習(xí)自然語言處理 ? 來源:小任學(xué)不廢 ? 作者:小任學(xué)不廢 ? 2022-08-19 11:55 ? 次閱讀

許久沒有更新,今天來水一篇之前在arXiv上看到的論文,這篇NFLAT是對FLAT的改進(其實也是對TENER的改進),F(xiàn)LAT在文本后面掛單詞的方式可能會導(dǎo)致文本長度過長,論文中講長度平均會增加40%,從而導(dǎo)致:

self-attention的時候計算量和顯存占用量增大,限制了FLAT對更大更復(fù)雜的詞表的使用;

有一些冗余計算,比如“word-word”和“word-character”級別的self attention是沒有必要做的,因為在FLAT中word部分在解碼的時候會被mask掉(如下圖),不參與后續(xù)計算,所以只需要"character-character"和“character-word”級別的self-attention。

4eb1877a-19eb-11ed-ba43-dac502259ad0.pngFLAT中word部分在解碼的時候會被MASK掉

其實講到這里,相信讀者們也看出來了,改進思路已經(jīng)比較明顯了:既然只要"character-character"和“character-word”級別的self-attention,那么就拆開搞,「不要把word往句子后面拼了,而是character有一個序列(原始文本序列),word有一個序列(原始文本序列在外部詞表中匹配出來的單詞序列)」

先進行“character-word”的attention,獲得融合了word邊界和語義信息的character表征——論文中稱這部分叫「InterFormer」;

再做"character-character"級別的self-attention,獲取最終character表征——「Transformer Encoder」,論文這部分用的TENER對Transformer Encoder的改動,所以其實這篇論文也是對TENER的改進方案,「是TENER+外部詞典的解決方案」。

Linear Project + CRF

模型分為上面所說的三個模塊,接下來我們一個一個介紹。

模型

4ed113ba-19eb-11ed-ba43-dac502259ad0.pngNFLAT模型結(jié)構(gòu)

1. InterFormer

其實就是Transformer Encoder的改進版,InterFormer包含多頭inter-attention和一個FFN,目的是構(gòu)建non-flat-lattice,可以同時對character和word兩個不同長度的序列進行建模,讓他們交互,從而獲得融合了word邊界和語義信息的character表征。

對Transformer Encoder的改進主要是:

「attention中query/key/value不再同源」,也就不再是self-attention,「character序列作為query的輸入,word序列作為key和value的輸入」。這樣的話attention在character序列中每個字上的輸出就是word序列中與這個字相關(guān)的word表征(value)的加權(quán)求和的結(jié)果。

他們在word序列中加入了一個標(biāo)記,這樣的話,如果character序列中的某個character與單詞序列沒啥關(guān)系的時候,總不至于強行加權(quán)求和,論文的分析部分表示這個還是有用的,但論文沒有做消融實驗,這里我就不列了,感興趣可以去看一下原文。

「參考了TransformerXL和FLAT中的相對位置編碼部分,同時做了一些改動」。

下面直接列公式了:

輸入:character序列embedding ,word序列embedding。

獲取QKV表征:

計算Inter-Attention

4eec8d3e-19eb-11ed-ba43-dac502259ad0.png

是attention中常規(guī)操作,就是對序列中padding部分的score賦一個很小的值,讓softmax后結(jié)果為0的;

的計算方法參考了TransformerXL,只是相對距離的表征的計算方式不太一樣,是參考FLAT,但也做了一些改動,F(xiàn)LAT中計算了四種位置距離表征:head-head, head-tail, tail-head, tail-tail,但這里只有兩種位置距離:character head - word head ()和 character tail - word tail ()。

同樣這個Inter-attention也可以做成multi-head attention的方式:

4f0c8972-19eb-11ed-ba43-dac502259ad0.png

然后是FFN、殘差連接、PostNorm

4f233546-19eb-11ed-ba43-dac502259ad0.png

通過上面的這一系列操作,我們就獲得了“「融合了word邊界和語義信息的character表征」”。

2. Transformer Encoder

然后進行"character-character"級別的上下文編碼,用TENER中改造的Transformer Encoder,也就是兩部分改動:

Un-scaled Dot-Product Attention,TENER中發(fā)現(xiàn)不進行scale的attention比進行了scale的在NER上的效果要好;

使用了對方向和距離敏感的相對位置編碼,其實和上面Inter-attention中相對位置編碼差不多,就是就只有query位置-value位置。

4f32ae0e-19eb-11ed-ba43-dac502259ad0.png

所以NFLAT其實就是在TENER前面加了一個模塊。

3. 最后就是CRF層

實驗結(jié)果

數(shù)據(jù):

4f43dcb0-19eb-11ed-ba43-dac502259ad0.png數(shù)據(jù)集

外部詞表:

外部詞表他們主要采用了:https://github.com/jiesutd/RichWordSegmentor

結(jié)果:

如下圖,可以看到,NFLAT在4個數(shù)據(jù)集上效果都還挺好的,達到了SOTA。

4f52a7fe-19eb-11ed-ba43-dac502259ad0.png實驗結(jié)果

效率分析

時間復(fù)雜度:

n是character序列長度,m是word序列的長度,一般n越長,m越長,所以看復(fù)雜度的話NFLAT還是降低了許多了,作者們還做了相關(guān)的實驗,每種長度挑選1000個句子,用batch_size=1計算跑完1k條句子的時間(3090的卡),發(fā)現(xiàn)句子長度大于400的時候,NFLAT與FLAT的速度才會有差距。

4f6ae2ec-19eb-11ed-ba43-dac502259ad0.png運行時間對比

FLAT:

NFLAT:

空間復(fù)雜度:

顯存占用還是有明顯差別的:

4f81568a-19eb-11ed-ba43-dac502259ad0.png顯存占用對比

FLAT:O((n+m)^{2})

NFLAT:

差不多,這篇論文就到這里吧。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼
    +關(guān)注

    關(guān)注

    0

    文章

    184

    瀏覽量

    27686
  • 顯存
    +關(guān)注

    關(guān)注

    0

    文章

    111

    瀏覽量

    13827
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1220

    瀏覽量

    25183

原文標(biāo)題:中文NER | 江南大學(xué)提出NFLAT:FLAT的一種改進方案

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    一種改進的DSP固定點采樣算法

    一種改進的DSP固定點采樣算法
    發(fā)表于 08-20 23:34

    分享一種DTMF信號檢測器工程的應(yīng)用方案

    基于改進的ADALINE神經(jīng)網(wǎng)絡(luò)的DTMF檢測算法基于改進的ADALINE神經(jīng)網(wǎng)絡(luò)的DTMF解碼仿真結(jié)果分享一種DTMF信號檢測器工程的應(yīng)用方案
    發(fā)表于 06-03 07:03

    一種消息恢復(fù)型數(shù)字簽名方案改進

    研究一種消息恢復(fù)型數(shù)字簽名方案,該方案不需要hash函數(shù)和消息冗余就能抵抗偽造攻擊。討論已有的攻擊方法和一種能夠抵抗這些攻擊的改進
    發(fā)表于 04-23 10:08 ?14次下載

    一種改進的強代理簽名方案

    基于Lee 等人提出的修改的LKK 型方案,提出了一種改進的強代理簽名方案。新方案在授權(quán)階段采用CA 認證的密鑰生成協(xié)議,解決了原
    發(fā)表于 08-13 08:54 ?23次下載

    一種離線模式下CRL機制的改進方案

    本文分析了幾種主要的CRL 機制及OCSP 協(xié)議,并提出了一種離線模式下CRL 機制的改進方案——基于P2P 分布式CRL 列表的證書撤消系統(tǒng),此系統(tǒng)利用CRL 發(fā)布點技術(shù)與重疊發(fā)布增量 CRL 機
    發(fā)表于 08-13 09:23 ?12次下載

    一種改進的TPM檢測方案

    在保持TPM高匿名度的前提下,針對可信計算(TC)的直接匿名驗證(DAA)協(xié)議中使用可變名字基時檢測克隆可信平臺模塊(TPM)存在的困難,提出了一種基于DAA證書頒發(fā)者的檢測方案,該方案不僅
    發(fā)表于 03-01 15:41 ?13次下載

    一種改進的各向異性高斯濾波算法

    一種改進的各向異性高斯濾波算法摘 要:為了抑制更好的抑制噪聲保留邊緣信息, 提出了一種各向異性高斯濾波的改進方法, 該方法先用中值濾波去除椒鹽噪聲, 再
    發(fā)表于 04-23 14:59 ?19次下載

    一種改進的AODV路由算法設(shè)計

    本內(nèi)容提出了一種改進的AODV路由算法設(shè)計
    發(fā)表于 05-26 16:23 ?32次下載
    <b class='flag-5'>一種</b><b class='flag-5'>改進</b>的AODV路由算法設(shè)計

    Whirlpool的一種改進算法

    文中借鑒分組密碼AES-256的密鑰擴展思想,提出一種Whirlpool的消息擴展改進方案,同時增加分組迭代的輪數(shù)。改進方案在不降低原算法的
    發(fā)表于 11-30 17:18 ?13次下載
    Whirlpool的<b class='flag-5'>一種</b><b class='flag-5'>改進</b>算法

    一種改進的鄰近粒子搜索算法

    一種改進的鄰近粒子搜索算法
    發(fā)表于 01-07 20:32 ?0次下載

    基于一種改進PSO辨識算法的DOB設(shè)計_陳鵬亮

    基于一種改進PSO辨識算法的DOB設(shè)計_陳鵬亮
    發(fā)表于 01-21 12:16 ?1次下載

    一種改進的自由搜索算法_任誠

    一種改進的自由搜索算法_任誠
    發(fā)表于 03-14 17:47 ?3次下載

    一種改進的MIMOOFDM幀同步算法.pdf

    一種改進的MIMOOFDM幀同步算法.pdf
    發(fā)表于 04-19 11:15 ?0次下載

    一種改進的web威脅態(tài)勢力分析方法

    一種改進的web威脅態(tài)勢力分析方法
    發(fā)表于 06-08 15:22 ?9次下載

    一種基于自適應(yīng)鄰域策略的改進算法

    一種基于自適應(yīng)鄰域策略的改進算法
    發(fā)表于 06-27 15:27 ?10次下載
    主站蜘蛛池模板: 色综合亚洲天天综合网站 | 在线天堂bt种子资源 | 欧美伊人网 | 久久婷婷午色综合夜啪 | 爱爱小说视频永久免费网站 | 在线观看深夜观看网站免费 | 好硬好湿好爽再深一点h | 欧美色图影院 | 91久久夜色精品国产网站 | 精品国产污网站在线观看15 | 成人性视屏 | 天天做天天爽天天谢 | 综合网伊人 | 精品日韩 | 国产在线高清精品二区色五郎 | 最新版天堂资源8网 | 午夜看一级特黄a大片黑 | 成人影院久久久久久影院 | 亚洲国产精品久久久久婷婷软件 | 中文字幕精品一区二区三区视频 | 欧美高清免费一级在线 | 天天操天天射天天色 | 日鲁夜鲁鲁狠狠综合视频 | 丁香六月 久久久 | 欧美在线观看一区二区三 | 末满18以下勿进色禁网站 | ⅹxxxx68日本老师hd | 曰本aaaaa毛片午夜网站 | 国产天天射 | 寄宿日记在线看 | 色爱综合网欧美 | 天天做天天爱夜夜爽毛片毛片 | 伊人久久大线蕉香港三级 | 午夜神马嘿嘿 | 色中色软件 | 亚洲综合情 | 三级理论手机在线观看视频 | 91日本在线观看亚洲精品 | 如果我们是季节韩剧在线观看 | 亚洲婷婷在线视频 | 亚洲成a人片777777久久 |