文本相似度計算旨在識別兩段文本在語義上是否相似,是自然語言處理領(lǐng)域的一個重要研究方向,其在智能問答、信息檢索等領(lǐng)域都發(fā)揮重要作用,具有很高的商業(yè)價值。
近期,思必馳知識服務(wù)團(tuán)隊在中文文本相似度計算方向投入研究,并取得階段性成果:
1)在第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)[1]上發(fā)表相關(guān)論文一篇《Neural Fusion Model for Chinese Semantic Matching》。
該會議是國內(nèi)知識圖譜、語義技術(shù)、鏈接數(shù)據(jù)等領(lǐng)域的核心學(xué)術(shù)會議,聚集了知識表示、自然語言理解、知識獲取、智能問答、鏈接數(shù)據(jù)、圖數(shù)據(jù)庫、圖計算、自動推理等相關(guān)技術(shù)領(lǐng)域的和研究人員的學(xué)者和研究人員。
2)在“千言數(shù)據(jù)集:文本相似度”評測[2]中取得階段性進(jìn)展。該評測的文本相似度數(shù)據(jù)集包括公開的三個文本相似度數(shù)據(jù)集,分別為哈工大(深圳) LCQMC 、 BQ Corpus和谷歌的 PAWS-X(中文)。目前,思必馳知識服務(wù)團(tuán)隊在三個數(shù)據(jù)集上均暫列第一。
針對中文文本相似度計算的魯棒性和泛化性問題,思必馳知識服務(wù)團(tuán)隊在以下幾個方面開展了技術(shù)研究: 1)針對中文特點的字、詞融合編碼器; 2)基于預(yù)訓(xùn)練模型的領(lǐng)域自適應(yīng)訓(xùn)練; 3)目標(biāo)應(yīng)用領(lǐng)域?qū)虻亩嚯A段模型微調(diào)。 相關(guān)技術(shù)實現(xiàn)在上述公開評測中得到了應(yīng)用和驗證。 語言智能常被稱為人工智能皇冠上的一顆明珠。在未來,思必馳知識服務(wù)團(tuán)隊將繼續(xù)深耕認(rèn)知智能領(lǐng)域,在面向通用領(lǐng)域的文本相似度計算基礎(chǔ)上,打造領(lǐng)域自適應(yīng)的文本相似度計算系統(tǒng),推動文本相似度在垂直領(lǐng)域的應(yīng)用和發(fā)展。
原文標(biāo)題:【會員風(fēng)采】思必馳在中文文本相似度計算任務(wù)上的探索與進(jìn)展
文章出處:【微信公眾號:深圳市汽車電子行業(yè)協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240306 -
思必馳
+關(guān)注
關(guān)注
4文章
289瀏覽量
14322
原文標(biāo)題:【會員風(fēng)采】思必馳在中文文本相似度計算任務(wù)上的探索與進(jìn)展
文章出處:【微信號:qidianxiehui,微信公眾號:深圳市汽車電子行業(yè)協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
思必馳入選國家級專精特新“小巨人”企業(yè)
思必馳參與的智能家居團(tuán)體標(biāo)準(zhǔn)發(fā)布
思必馳11月行業(yè)事件回顧
帶來全新辦公體驗!思必馳發(fā)布AI辦公本Turbo
思必馳發(fā)布AI辦公本Turbo,搭載專業(yè)級跨模態(tài)會議大模型
思必馳AI辦公本Turbo重磅發(fā)布
江蘇省科技廳領(lǐng)導(dǎo)蒞臨思必馳調(diào)研
思必馳9月份大事件盤點
思必馳獲得TISAX最高等級AL3級認(rèn)證
廣西柳州的思必馳智能制造基地正式投入試運行
廣西思必馳通過IATF16949汽車行業(yè)質(zhì)量管理體系認(rèn)證
![廣西<b class='flag-5'>思</b><b class='flag-5'>必</b><b class='flag-5'>馳</b>通過IATF16949汽車行業(yè)質(zhì)量管理體系認(rèn)證](https://file1.elecfans.com/web2/M00/CF/CD/wKgZomYiIWCASmhJAAAtYP3L3BQ148.png)
評論