在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詞義消歧與實(shí)體消歧

深度學(xué)習(xí)自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-08-02 14:41 ? 次閱讀

寫在前面

最近剛開始調(diào)研實(shí)體消歧方面的相關(guān)工作,這里先開一個(gè)頭吧。希望大家可以通過這篇簡要的文章對實(shí)體消歧任務(wù)本身有一個(gè)基本的認(rèn)識。

1. 背景:詞義消歧與實(shí)體消歧

1.1 詞義消歧

自然語言文本中存在著大量的多義詞,而多義詞的存在也會影響人對文本的語義理解,讓人對文本的意思產(chǎn)生混淆。

詞義消岐(Word Sense Disambiguation,簡稱WSD) 是NLP中一個(gè)非常基本的任務(wù),旨在確定多義詞在具體語境中的確切意義。

在詞義消歧中,同一詞語的不同義項(xiàng)會作為候選詞。我們需要在所有候選詞中找到與文本中目標(biāo)詞語最接近的那個(gè)義項(xiàng)。這里“義項(xiàng)”指的是詞是詞典中的某個(gè)具體表示。

0ffbd464-118e-11ed-ba43-dac502259ad0.png

如上圖所示,「蘋果」在百度百科中共有25個(gè)義項(xiàng),單說「蘋果」我們可能并不知道說的是「蘋果公司」還是「水果里的蘋果」。但結(jié)合具體的上下文語境,我們就可以很好地對「蘋果」消歧,從而明確「蘋果」的具體含義:

10309532-118e-11ed-ba43-dac502259ad0.png

1.2 實(shí)體消歧

實(shí)體鏈指/實(shí)體鏈接(Entity Linking,簡稱 EL) 在知識圖譜構(gòu)建、信息檢索和問答系統(tǒng)等領(lǐng)域具有廣泛的應(yīng)用價(jià)值。

實(shí)體鏈指的主要目標(biāo)是識別上下文中的實(shí)體指稱具體指代現(xiàn)實(shí)世界中的哪一個(gè)實(shí)體,也就是將實(shí)體指稱項(xiàng)映射到知識庫中的相應(yīng)實(shí)體上去。

具體而言,實(shí)體鏈指一般包括實(shí)體識別、候選實(shí)體獲取、實(shí)體消歧這三個(gè)主要環(huán)節(jié)。之所以需要實(shí)體消歧,而不是直接將實(shí)體識別的結(jié)果放入知識圖譜的原因主要有兩方面:

多樣性(即多詞同義):同一實(shí)體在文本中會有不同的指稱。比如:甜瓜、安東尼、和瓜哥都指美國職業(yè)籃球運(yùn)動員卡梅隆·凱恩·安東尼。

歧義性(即一詞多義):相同的實(shí)體指稱在不同的上下文中可以指不同的實(shí)體。比如:邁克爾·喬丹可能指美國籃球運(yùn)動員,也可能指愛爾蘭政治家等。

1.3 總結(jié)

從以上說明來看,其實(shí)詞義消歧與實(shí)體消歧具有一定相似性, 二者的目的都是處理文本中詞匯歧義的問題. 主要區(qū)別在于:

在詞義消歧中的詞義通常是固定的, 可根據(jù)目標(biāo)詞在詞典中的義項(xiàng)來列舉;

在實(shí)體消歧中, 實(shí)體詞義無法列舉,所以需要前序步驟候選實(shí)體獲取;

此外,實(shí)體詞的詞義數(shù)目大于普通詞,這個(gè)主要還是跟知識庫的量級相關(guān)。

2. 相關(guān)論文

這里我們主要給大家推薦兩篇近期發(fā)表的論文:

詞義消歧:《ESC: Redesigning WSD with Extractive Sense Comprehension》

實(shí)體消歧:《ExtEnD: Extractive Entity Disambiguation》

兩篇論文的模型都非常簡單,個(gè)人覺得關(guān)鍵或者說亮點(diǎn)主要在于他們對問題的轉(zhuǎn)換。其實(shí),從這兩篇論文的名字就能看出端倪:都是將消歧問題轉(zhuǎn)換成了抽取式問題。

2.1 EXTENE 實(shí)體消歧

論文名稱:《ExtEnD: Extractive Entity Disambiguation》

論文鏈接:https://aclanthology.org/2022.acl-long.177.pdf

代碼地址:https://github.com/SapienzaNLP/extend.

105e153e-118e-11ed-ba43-dac502259ad0.png

如上圖所示,EXTEND將實(shí)體消歧任務(wù)轉(zhuǎn)換為了抽取式任務(wù),或者說MRC類任務(wù)。具體地:

將含有目標(biāo)實(shí)體指稱項(xiàng)的文本當(dāng)作Query;

將知識庫中對應(yīng)的所有候選實(shí)體及其描述當(dāng)作Context;

二者拼接然后預(yù)測Answer的Span(startend prediction,start-end matching),這里的Answer就是在知識庫中目標(biāo)實(shí)體指稱實(shí)際關(guān)聯(lián)的實(shí)體。

好了,這就是EXTEND論文的核心思想。是不是感覺模型已經(jīng)躍然紙上了,整體上應(yīng)該和我們之前在 一文詳解關(guān)系抽取模型 CasRel、實(shí)體識別LEAR論文閱讀筆記、 實(shí)體識別BERT-MRC論文閱讀筆記中介紹過的模型類似。

2.2 ESC 詞義消歧

論文名稱:《ESC: Redesigning WSD with Extractive Sense Comprehension》

論文鏈接:https://aclanthology.org/2021.naacl-main.371.pdf

代碼地址:https://github.com/SapienzaNLP/esc

1070bb3a-118e-11ed-ba43-dac502259ad0.png

ESC的模型架構(gòu)和EXTEND是相似的。整體上首先將輸入的上下文和目標(biāo)詞的所有義項(xiàng)拼接,模型的輸出則是目標(biāo)詞真正義項(xiàng)的起始和終止位置。

2.3 總結(jié)

論文的具體細(xì)節(jié)就不在本文里贅述了,大家可根據(jù)鏈接下載原文閱讀。此外,兩篇論文都公布了源碼,大家也可以快速利用源碼在一些開源數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)。

當(dāng)然也有一些相關(guān)比賽,比如百度:實(shí)體鏈指[1]目前就還在進(jìn)行中:

10a33e7a-118e-11ed-ba43-dac502259ad0.png

我目前看到的幾個(gè)還是比較一致的做法,打分排序:

比如實(shí)體鏈指比賽方案分享[2]:

10b95016-118e-11ed-ba43-dac502259ad0.png

CCKS&百度 2019中文短文本的實(shí)體鏈指 第一名解決方案[3]:

10e2a970-118e-11ed-ba43-dac502259ad0.png

大家可以將論文的模型適配到中文場景下,然后嘗試在這個(gè)比賽的實(shí)體消歧環(huán)節(jié)使用,看看效果如何。

還是一樣,如果本文對你有幫助的話,歡迎點(diǎn)贊&在看&分享,這對我繼續(xù)分享&創(chuàng)作優(yōu)質(zhì)文章非常重要。感謝!

參考資料

[1]

百度:實(shí)體鏈指: https://aistudio.baidu.com/aistudio/competition/detail/83/0/introduction

[2]

實(shí)體鏈指比賽方案分享: https://aistudio.baidu.com/aistudio/projectdetail/1331020?channelType=0&channel=0

[3]

CCKS&百度 2019中文短文本的實(shí)體鏈指 第一名解決方案: https://github.com/panchunguang/ccks_baidu_entity_link

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    17307
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22403

原文標(biāo)題:一文簡要了解詞義消歧與實(shí)體消歧

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    諧裝置的作用

    諧裝置是電力系統(tǒng)中防止鐵磁諧振過電壓的關(guān)鍵設(shè)備,主要用于保護(hù)電壓互感器(PT)及電網(wǎng)安全。當(dāng)系統(tǒng)因單相接地、操作過電壓或雷擊引發(fā)PT鐵芯飽和時(shí),可能產(chǎn)生分頻、工頻或高頻諧振,導(dǎo)致PT過熱、絕緣損壞
    的頭像 發(fā)表于 04-24 10:23 ?49次閱讀
    <b class='flag-5'>消</b>諧裝置的作用

    微機(jī)諧器與一次諧器區(qū)別與聯(lián)系

    微機(jī)諧器與一次諧器都是用于電力系統(tǒng)中抑制諧波和消除鐵磁諧振的設(shè)備,
    的頭像 發(fā)表于 04-22 16:21 ?69次閱讀

    #微機(jī)諧裝置工作原理

    微機(jī)
    aozhuogeng
    發(fā)布于 :2025年04月18日 09:07:52

    STM32F334比較器隱和HRTIM的事件隱功能如何實(shí)現(xiàn)?

    1,使用STM32F334制作的數(shù)字電源,用EVENT事件來實(shí)現(xiàn)逐周期電流檢測功能,現(xiàn)在開關(guān)管開通瞬間過沖較大,導(dǎo)致比較器誤觸發(fā),比較器隱功能一直配置不起作用,不明白比較器的窗口隱的PWM
    發(fā)表于 03-11 06:08

    微機(jī)諧裝置的定義

    微機(jī)諧裝置是一種智能保護(hù)設(shè)備,專門應(yīng)用于電力系統(tǒng)。
    的頭像 發(fā)表于 01-24 15:58 ?298次閱讀

    微機(jī)諧裝置功能是否正常該如何測試

    微機(jī)諧裝置功能是否正常該如何測試?在微機(jī)諧正常使用之前我們?nèi)绾尾拍苤肋@個(gè)諧裝置各個(gè)功能合不合格,又測試哪些方面呢?今天我把這幾個(gè)問題一一做個(gè)解答! ? ? ? 測試微機(jī)諧我們
    的頭像 發(fā)表于 11-11 10:57 ?324次閱讀

    半導(dǎo)體少長針雷裝置SLE-v

    半導(dǎo)體少長針避雷針雷裝置SLE
    發(fā)表于 11-06 10:56 ?0次下載

    超聲波泡器的工作原理及特點(diǎn)

    超聲波泡器作為一種物理泡方式,不需要添加任何化學(xué)物質(zhì),因此不會對環(huán)境造成二次污染。
    的頭像 發(fā)表于 10-09 15:07 ?523次閱讀

    WXZ196微機(jī)諧裝置的特征具體體現(xiàn)在哪里

    WXZ196微機(jī)諧裝置的特征具體體現(xiàn)在哪里?微機(jī)諧裝置(全稱:微機(jī)電力諧振診斷消除裝置)是放在放在PT的二次側(cè)(所以也叫二次諧)消除鐵磁諧振的儀器。它與一次諧器的區(qū)別在于微機(jī)
    的頭像 發(fā)表于 10-08 14:17 ?277次閱讀

    如何在FPGA中實(shí)現(xiàn)按鍵

    在FPGA(現(xiàn)場可編程門陣列)中實(shí)現(xiàn)按鍵抖是一個(gè)重要的設(shè)計(jì)環(huán)節(jié),特別是在處理用戶輸入時(shí),由于物理按鍵的機(jī)械特性和電氣特性,按鍵在按下和釋放的瞬間會產(chǎn)生抖動現(xiàn)象,這種抖動可能導(dǎo)致系統(tǒng)錯誤地識別為多次
    的頭像 發(fā)表于 08-19 18:15 ?2802次閱讀

    WXZ196微機(jī)諧對諧振故障是如何判斷的

    微機(jī)諧裝置,采用高性能的單片微機(jī)作為核心元件,對PT開口三角電壓進(jìn)行循環(huán)檢測。正常工作下,該電壓小于30V,裝置內(nèi)的大功率諧元件(固態(tài)繼電器)處于阻斷狀態(tài),對系統(tǒng)運(yùn)行不產(chǎn)生影響。當(dāng)系統(tǒng)發(fā)生故障后
    的頭像 發(fā)表于 07-23 09:27 ?490次閱讀

    微機(jī)諧裝置是什么,微機(jī)諧裝置有什么特點(diǎn)?

    微機(jī)諧裝置主要是由微處理器、傳感器、控制模塊、電容器、開關(guān)等組成。它通過對電網(wǎng)中的無功功率進(jìn)行檢測、計(jì)算和監(jiān)控,并按照一定的算法自動調(diào)節(jié)電容器組合的電容量,從而達(dá)到提高功率因數(shù)的目的。微機(jī)諧裝置
    的頭像 發(fā)表于 06-20 10:07 ?705次閱讀

    STM32F334比較器隱和HRTIM的事件隱功能如何實(shí)現(xiàn)?

    1,使用STM32F334制作的數(shù)字電源,用EVENT事件來實(shí)現(xiàn)逐周期電流檢測功能,現(xiàn)在開關(guān)管開通瞬間過沖較大,導(dǎo)致比較器誤觸發(fā),比較器隱功能一直配置不起作用,不明白比較器的窗口隱的PWM
    發(fā)表于 06-04 08:38

    一次諧器的構(gòu)造

    今天來給大家介紹一下一次諧器的構(gòu)造。 一次諧器是一種用于消除電力系統(tǒng)中的諧波及無功功率的裝置,它由感性元件和電容器構(gòu)成,感性元件用于吸收系統(tǒng)中的無功功率,而電容器則用于補(bǔ)償系統(tǒng)中的感性無功功率
    的頭像 發(fā)表于 05-30 14:55 ?674次閱讀

    微機(jī)諧裝置應(yīng)用在哪些領(lǐng)域

    微機(jī)諧裝置應(yīng)用在哪些領(lǐng)域?微機(jī)諧裝置是一種先進(jìn)的電力設(shè)備,能夠有效地消除電力系統(tǒng)中的諧波,提高電力質(zhì)量。它具有體積小、功耗低、可靠性高等優(yōu)點(diǎn),被廣泛應(yīng)用于各個(gè)領(lǐng)域。 在電氣行業(yè)領(lǐng)域,長條形微機(jī)
    的頭像 發(fā)表于 05-21 08:43 ?465次閱讀
    主站蜘蛛池模板: 欧美精品一区在线看 | 亚洲好骚综合 | 手机看片福利日韩 | 爽爽爽爽爽爽a成人免费视频 | lsj老司机精品视频在线观看 | 日韩一级在线视频 | 欧美黄又粗暴一进一出抽搐 | 狠狠色丁香婷婷综合久久片 | 公妇乱淫日本免费观看 | 婷婷丁香六月天 | 77久久| 亚洲综合国产一区二区三区 | 国产色产综合色产在线观看视频 | www.男人| yellow中文字幕久久网 | 一女被两男吃奶玩乳尖口述 | 四虎永久精品免费网址大全 | 天天操天天摸天天碰 | 免费黄色福利视频 | 欧美操bb| 一区二区三区伦理高清 | 在线视频网址免费播放 | 色多多黄 | 国产农村女人一级毛片了 | 性free中国美女hd | 黄色三级免费网站 | 二级黄绝大片中国免费视频0 | 欧美草逼 | 亚洲美女高清一区二区三区 | 轻点灬大ji巴太大太深了 | 欧美黄色tv | sihu永久在线播放地址 | 免费久久精品国产片香蕉 | 色偷偷成人网免费视频男人的天堂 | 天天操天天干天天插 | 黄黄视频免费看 | 亚洲香蕉毛片久久网站老妇人 | 日日夜夜操天天干 | 511韩国理论片在线观看 | 国产精品久久久久久久9999 | 亚洲成人激情片 |