在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

會話式機器閱讀理解概述

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 作者:通信信號處理研究 ? 2020-11-25 16:07 ? 次閱讀

1

會話式機器閱讀理解是什么?

如何在會話式閱讀理解里面能夠建模它的implicative reasoning,即如何去學習會話與閱讀理解篇章之間的蘊含關系。 在這篇文章中,講者概述了兩種常見閱讀理解的類型: 第一種是標準的閱讀理解,該模式是指,給定一篇描述型的文章和一個基于事實型的問題,通過匹配文章和問題,從文章中抽取一個span來回答這個問題; 第二種是會話式的問答,與標準的單輪問答不同,需要追問新問題,即follow up question,同時問題是以交互的形式出現。會話式問答,存在兩個挑戰,一個是需要能理解篇章,另一個是能夠理解交互的會話本身。 基于會話式問答,講者引入一個例子簡單說明(圖1)。

比如,用戶簡單描述了自己的情況(Scenario),但用戶的問題并不能直接從文章(Rule Text)中獲取,往往這個文章可能是一個比較通用的、相當于是一個法規或者法律的篇章。 比如,說明能夠申請7a貸款的人,需要具備什么樣的條件,但針對用戶問題在文章中沒有直接的答案,必須和用戶進行一個交互,才能得到明確的回答。例子中,成功申請貸款的條件有三個,所以還需再問另外的條件。 比如,能不能夠在別的地方獲取它的資金來源,假如用戶說no的話,這時候就可以給他一個答案,也就是說你可以申請。 因此,在這種情形下,就需要既能夠讀懂這篇文章,理解文章中的規則,也要能夠主動地和用戶交互,從用戶那邊獲取一些需要知道的信息,最終再給他一個決策。

圖1 定義該項任務常用的數據集是ShARC (shaping answers with rules through conversation 的簡稱),數據集的設定是:給定Rule Text;用戶描述自己的Scenario(Background);用戶提出question;已有的問答(Dialog History)。 整個過程可以概述為,由于用戶給定的background往往不明確,機器需要進行幾輪交互,然后從交互中獲取一些跟規則有關的信息,然后告訴用戶具體答案。 整個任務有兩個子任務: 任務一,整合Rule Text,Scenario,Question以及通過幾輪交互從用戶獲取的信息,作為模型輸入,然后做出決策(Decision Making)。

該決策包含四種類型:一種是根據現有的信息能夠作出yes or no 的決策;或者有些情況下,用戶的問題可能與給定Rule Text無關,或根據Rule Text并不能解決問題,則會出現unanswerable的答案;另一種情況是Rule Text中需要滿足很多條件,但有些條件機器不確定是否滿足,需要作出inquire的決策,主動從用戶那里獲取更多信息,直至幾輪交互后能夠作出yes or no的決策。 任務二,如果生成的決策是inquire,則需要機器問一個follow-up question,該問題能根據Rule Text引導用戶提供一些沒有提供的信息,便于進一步的決策。

圖2 2

會話式機器閱讀理解的初探

2.1 模型介紹 負采樣 針對于該任務,講者主要介紹了兩項工作,首先是發表于ACL2020的文章“Explicit Memory Tracker with Coarse-to-Fine Reasoning for Conversational Machine Reading”。 該工作的貢獻有兩個: a. 針對決策,提出了explicit tracker,即能夠顯示的追蹤文章中條件是否被滿足; b. 采用coarse-to-fine方法抽取Rule Text中沒有被問到的規則、條件等。

圖3 模型主要包括了四部分:1.Encoding→ 2.Explicit Memory Tracking→ 3.Decision Making→ 4.Question Generation,整體結構如下:

圖4 (1) Encoding 將Rule Text中的句子分開,比如分為三個句子,在每個句子前加一個[CLS]表征句子特征,同時把queestion,scenario以及用戶的會話歷史加起來,也用[CLS]表征,拼接起全部特征后,通過BERT進行encoding。

圖5 (2) Explicit Memory Tracking 該部分的目的在于挖掘出存在于Relu Text的句子中與用戶提供的信息(比如initial question 和dialog history)之間的implication。 針對于此,提出了explict memory tracker,類似于recurrent的思想,逐步的把用戶的信息和Relu Text中的規則進行交互,從而更新每一個規則的memory里對應的value,最終得到每一個條件滿足,不滿足或者不知道的一個狀態。 經過n次更新完后,每一個rule 都會得到key-value對。

圖6 (3)Decision Making 對n次更新完后的key-value做self-attention,經過一個線性層做四分類,即Yes, No, Irrelevant, Inquire。

圖7 同時,還設計了一個subtask,即對最終更新完之后的key-value做一個預測,顯示的預測該規則是Entailment,Prediction還是Unknown。該預測任務和Decision Making一起進行訓練。

圖8 (4)Question Generation 若得到的決策是Inquire,就要求繼續做一個follow-up question的generation。 主要包括兩個步驟: 第一步,從rule 中抽取一個span,具體是使用了一種coarse-to-fine 的做法,如下圖所示。由于在Entailment prediction,句子的unknown分數越高,表示該句子越可能被問;若句子狀態是Entailment或者Contradiction,說明該句子狀態已知,沒必要繼續問下去。 因此,選擇每一個句子在Entailment prediction中unknown的分數,并在每一個句子中計算抽取start和end的分數,然后將這兩個分數相乘,綜合判斷哪一個span最有可能被問到。

圖9 第二步,就是把span和rule 拼接起來,經過一個預訓練模型將其rephrase一個question。

圖10 2.2 實驗驗證 負采樣 使用ShARC數據集進行實驗驗證,包含了兩個任務的評價:分別為對于Decision Making任務采用 Marco-Accuracy 和Micro-Accuracy評價;以及對于問題生成采用BLEU Score評價。 此外,講者考慮到在end-to-end evaluation時,存在一個缺點,也就是說,對于評價問題生成時,模型是基于決策這部分的水平去做問題生成的評價,這使得每個模型之間問題生成的表現不好比較,因此提出一個oracle question generation evaluation,即只要當Ground truth decision 是inquire,就對其問題生成的水平進行評價。 在測試集上得到的結果驗證了所提出的Entailnment Memory Tracker(EMT)模型較其他模型效果有很大提升,尤其在問題生成方面效果顯著。

表1 具體分析每一類決策的準確率,可驗證Inquire的效果要更好,主要因為模型能顯式的追蹤模型的一些狀態,而不是簡單的學習模型中一些Pattern。 此外,在oracle question generation evaluation數據集上,與之前最好的模型E3,以及加上UniLM的模型進行對比,同樣也證明了采用Coarse-to-Fine的方法抽取span,在問題生成方面具有更好的效果。

表2 同時,講者給出了一個例子,更形象明白的說明了所提出的模型具備可解釋性。

圖11 3

如何更好地進行會話式機器閱讀理解

3.1 問題提出負采樣 進一步,講者介紹了第二項工作,該工作與前者的側重點有所不同,存在兩個差異: 第一,document interpretation,主要由于第一項工作只是簡單的對句子進行了一個切分,但實際上有些conditions(比如,上述例子中的American small business for profit business)是長句子中從句的條件,因此,第二項工作側重如何去理解這樣的條件。比如,能申請7(a)貸款,需要滿足(①==True and ②==True and ③==True)的條件,這在第一項工作中是沒有被建模的。

圖12 第二,dialogs understanding,即對于會話并沒有做特別顯式的理解。比如,在會話第一輪發現rule之間是and的關系,并且在Scenairo中抽取出條件,說明第一個rule是true,但還要繼續問第二個和第三個rule,所以給定Inquire的決策,直至滿足所有的rule后,才能給一個“You can apply the loan”的回答。

3.2 模型介紹負采樣 因此,該項工作主要基于這兩點,提出先采用Discourse Segmentation的方法顯式的把條件更好地抽取出來,之后做Entailment Reasoning 顯式地預測每一個狀態是否被滿足,如果預測結果是Inquire,還需要做一個Follow-up Question Generation。

具體的,在discourse segmentation 中主要有兩個目標:其一是明白Rule Text中的邏輯關系;其二是將句子中的條件更好地抽取出來。比如,對于一個rule采用Discourse Segmentation的方法將其抽取成三個elementary discourse unit (EDU),比如,下圖中EDU1 ,EDU3是條件,然后EDU2是一個結果,這樣的一個關系。

圖15 如何實現Entailment Reasoning? 與工作一類似,在EDU抽取之后,將其與之前的用戶Question,Scenairo 以及Dialog History拼接起來,經過預訓練模型,得到每一個phrase的表征。然后采用多層transformer模型預測rule中每一個EDU 的狀態,是Entailment、Contradiction,或者Neutral。 多層transformer模型較之前recurrent思想的模型更優秀,其不僅能在用戶信息與rule之間做交互,也能更好的理解rule本身的邏輯結構(比如,conjunction,disconjunction等 )。 進一步,如何實現Decision Making? 在做決策時,根據學習到的Entailment、 Contradiction、Neutral向量,去映射前一步做Entailment Prediction的三個分數,得到每一個EDU的狀態vector,同時拼接該狀態vector與EDU本身的語義表示,作為Decision Classifier 輸入,從而得到決策。

圖163.3實驗驗證及結論負采樣 同樣地,實驗也是在ShARC數據集上進行。實驗結果表明,使用discourse segmentation加上更好的更顯式的Reasoning的模式,較之前使用EMT模型具有更好的性能表現,在Micro Accuracy和Macro Accuracy上差不多高出4%。

表3 在Ablation Study中,首先對比了RoBERTa和BERT之間的區別,表明了RoBERTa對于Reasoning的任務具有一定的貢獻;其次,說明了采用discourse segmentation劃分一個句子為多個EDU形式的效果優于僅對句子進行劃分的結果;然后,證明了采用Transformer顯示地對用戶信息和問題之間做交互是有必要的;最后,證明了拼接Entailment vector和EDU本身的語義表示,對最終決策具有相當大的貢獻。

表4 進一步,分析了不同邏輯結構下模型的結果表現。這里粗略分成4種規則的邏輯結構,即Simple、Disjunction、Conjunction以及Other。結果表示,模型在Simple形式下具有最好效果,然而在Disjunction形式下效果較差。

圖17 為什么模型對于Disjunction,做出的決策效果較差? 考慮到模型涉及兩部分內容,一是dialogue understanding;二是對 scenario的理解。 因此,講者進一步做了如下實驗,就是把這兩塊內容分開,選擇一個只用到dialogue understanding 的子集,再選擇一個只用到scenario Interpretation的子集,進行實驗。 結果表明,只用到dialogue understanding 的子集的模型效果要優于用到整個數據集的效果,但在scenario Interpretation的子集上,實驗效果差了很多。 該現象的原因在于,用戶自己的background (scenario)可能用到了很多reasoning的方式,與rule 不完全一樣,因此對scenario的理解是比較差的。很多時候scenario里提到了關鍵信息但是模型并沒有抽取成功,從而繼續做出inquire的決策。這也可能是導致Disjunction決策效果較差的原因。

圖18 4

總結

綜上,講者團隊分別提出了Explicit Memory Tracker with Coarse-to-Fine Reasoning 以及Discourse aware Entailment Reasoning的方法,并且在ShARC數據集上效果很好,同時設計實驗分析了數據集本身的難點以及模型的缺陷,為后續研究指明可拓展方向。

責任編輯:xj

原文標題:香港中文大學高一帆博士:會話式機器閱讀理解

文章出處:【微信公眾號:通信信號處理研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 閱讀
    +關注

    關注

    0

    文章

    10

    瀏覽量

    11615
  • 機器學習
    +關注

    關注

    66

    文章

    8487

    瀏覽量

    133975

原文標題:香港中文大學高一帆博士:會話式機器閱讀理解

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    、深度學習視覺巡線、相機標定、OpenCV圖像處理等。這些內容雖然在本次閱讀體驗中沒有詳細展開,但它們同樣對于機器人的視覺感知和環境理解具有重要作用。
    發表于 04-27 11:42

    《AI Agent 應用與項目實戰》閱讀心得2——客服機器人、AutoGen框架 、生成代理

    繼續分享第2篇閱讀心得。 傳統客服系統在知識庫更新和多輪對話管理方面存在諸多技術瓶頸,本書第3章中提出的AI課程客服機器人架構巧妙地解決了這些問題。該架構采用Replit作為開發環境
    發表于 02-25 21:59

    HarmonyOS NEXT 原生應用/元服務-DevEco Profiler會話

    DevEco Profiler左側為會話區,可以分為三個部分: ① 調優目標選擇區域:選擇設備及要分析的應用和進程。 選定被調優的設備、應用包及應用進程作為后續調優會話的分析對象。依次點擊設備
    發表于 02-18 11:11

    【「具身智能機器人系統」閱讀體驗】+兩本互為支持的書

    最近在閱讀《具身智能機器人系統》這本書的同時,還讀了 《計算機視覺之PyTorch數字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇。《計算機視覺之PyTorch數字圖像處理》是介紹
    發表于 01-01 15:50

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    的局限性以及衡量大模型的關鍵指標。閱讀了該部分后,我感受到了一種前所未有的震撼,這種震撼不僅來源于技術本身的先進性,更來源于它對傳統機器人控制方式的顛覆。 傳統機器人的局限性與大模型的變革 傳統的
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

    人的影響與發展 隨著具身智能機器人數量的爆炸增長,我們已經進入了一個新的技術時代:自主經濟時代。自主經濟時代是指通過使用具身智能機器人提供商品和服務的時代,如自動駕駛汽車、送貨機器
    發表于 12-28 21:12

    【「具身智能機器人系統」閱讀體驗】+初品的體驗

    的快速發展,相關人才的需求也在不斷增加,通過閱讀該書可以幫助大家系統性地了解和分析當前具身智能機器人系統的發展現狀和前沿研究,為未來的研究和開發工作提供指導。此外,本書還可以為研究人員和工程師提供具體
    發表于 12-20 19:17

    【「嵌入系統設計與實現」閱讀體驗】全書概覽與內容簡介

    的領域廣泛而深入,如人工智能、無線通信、物聯網、無人系統、智能家居和機器人等多個嵌入熱門方向。無論你是剛入門的學習者,還是經驗豐富的開發者,都可以從中獲取靈感和經驗。 目錄概覽 本書目錄頁如下所示
    發表于 12-01 17:05

    【「嵌入Hypervisor:架構、原理與應用」閱讀體驗】+第三四章閱讀報告

    在深入閱讀了《嵌入Hypervisor:架構、原理與應用》的第三、四章后,我對嵌入Hypervisor的設計與實現技術有了更為詳盡和系統的理解。以下是我對這兩章內容的
    發表于 10-09 18:29

    【「嵌入Hypervisor:架構、原理與應用」閱讀體驗】+第一二章讀后感

    。 總的來說,《嵌入Hypervisor:架構、原理與應用》的第一、二章為我提供了一個全面而深入的學習起點,讓我對Hypervisor技術有了更清晰的認識和理解。我相信,通過繼續閱讀本書的其他章節,我能夠更深入地掌握嵌入
    發表于 10-09 18:22

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨大潛力,使得
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    相等間隔的時間段內依照給定的采樣率對某種潛在過程進行觀測的結果。時間序列數據本質上反映的是某個或者某些隨機變量隨時間不斷變化的趨勢。 因此,時間序列可以簡單的理解為不同時刻采集的一串數據,使用機器
    發表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    與時間序列概述閱讀,對概述整體輪廓有初步了解把握,對時間序列概念及應用有了進一步深入理解,是一個良好的開端。
    發表于 08-07 23:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    今天開始學習《大語言模型應用指南》第一篇——基礎篇,對于人工智能相關專業技術人員應該可以輕松加愉快的完成此篇閱讀,但對于我還是有許多的知識點、專業術語比較陌生,需要網上搜索學習更多的資料才能理解書中
    發表于 07-25 14:33

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    ,了解此書的主要內容: 書分四篇,基礎、入門、進階和展望。 基礎篇從人工智能起源開始、之后又介紹了機器學習、神經網絡和大語言模型的基礎知識,如果讀者學習過機器學習相關課程,那這個基礎篇的閱讀就會很輕
    發表于 07-21 13:35
    主站蜘蛛池模板: 久久天天躁狠狠躁夜夜 | 成人夜色香网站在线观看 | 日本免费xxxx色视频 | 国产综合图区 | 网www天堂资源在线 网红和老师啪啪对白清晰 网络色综合久久 | 午夜亚洲国产 | 中文一区在线观看 | 国产高清网站 | 日本片免费观看一区二区 | 日韩欧美在线第一页 | 四虎国产精品免费入口 | 亚洲欧洲国产精品你懂的 | 欧美不卡视频在线观看 | 又粗又长又色又爽视频 | 亚洲人成伊人成综合网久久 | 国产综合精品久久久久成人影 | 亚洲jjzzjjzz在线观看 | 国产成人精品亚洲77美色 | 美女扒开尿口给男人桶视频免费 | 网色| 久久精品人人爽人人爽快 | 亚洲高清美女一区二区三区 | 色噜噜中文网 | 午夜高清视频 | 激情九月 | 亚洲最新 | 国产福利精品视频 | 久久久久国产精品免费看 | 天天插天天射天天干 | 国外精品视频在线观看免费 | 色综合天天综合网看在线影院 | 五月婷婷在线观看 | 日本黄色大片在线播放视频免费观看 | www.毛片.com | 老师在办公室被躁得舒服小说 | 国内精品手机在线观看视频 | 222aaa天堂 | 久久婷人人澡人人爽 | 一级做a爰片久久毛片人呢 一级做a爰片久久毛片图片 | 嘿嘿嘿视频在线观看网站 | 精品精品国产高清a毛片牛牛 |