在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌重磅發(fā)布自然問題數(shù)據(jù)集,包含30萬個自然發(fā)生的問題和人工注釋的答案

DPVg_AI_era ? 來源:lq ? 2019-01-25 09:07 ? 次閱讀

今天,谷歌重磅發(fā)布自然問題數(shù)據(jù)集(Natural Questions),包含30萬個自然發(fā)生的問題和人工注釋的答案,16000個示例,并發(fā)起基于此數(shù)據(jù)集的問答系統(tǒng)挑戰(zhàn)賽。有望成為自然語言理解領(lǐng)域的SQuAD!

開放領(lǐng)域問題回答(QA)是自然語言理解(NLU)中的一項基準任務(wù),它的目的是模擬人類如何查找信息,通過閱讀和理解整個文檔來找到問題的答案。

比如,給定一個用自然語言表達的問題“為什么天空是藍色的?”("Why is the sky blue?”),QA系統(tǒng)應(yīng)該能夠閱讀網(wǎng)頁(例如“天空漫射”的維基百科頁面)并返回正確的答案,即使答案有些復(fù)雜和冗長。

然而,目前還沒有可以用于訓(xùn)練和評估QA模型的大型、公開的自然發(fā)生問題(即由尋求信息的人提出的問題)和答案數(shù)據(jù)集。

這是因為構(gòu)建用于QA任務(wù)的高質(zhì)量數(shù)據(jù)集需要大量的真實問題來源,并且需要大量人力來為這些問題尋找正確答案。

為了促進QA領(lǐng)域的研究進展,谷歌今天發(fā)布自然問題數(shù)據(jù)集(Natural Questions, NQ),這是一個用于訓(xùn)練和評估開放領(lǐng)域問答系統(tǒng)的新的、大規(guī)模語料庫,也是第一個復(fù)制人類查找問題答案的端到端流程的語料庫。

Natural Questions數(shù)據(jù)集

NQ的規(guī)模非常龐大,包含30萬個自然發(fā)生的問題,以及來自Wikipedia頁面的人工注釋答案,用于訓(xùn)練QA系統(tǒng)。

此外,NQ語料庫還包含16000個示例,每個示例都由5位不同的注釋人提供答案(針對相同的問題),這對于評估所學(xué)習(xí)的QA系統(tǒng)的性能非常有用。

Natural Questions數(shù)據(jù)集中的示例

由于回答NQ中的問題比回答瑣碎問題(這些問題對計算機來說已經(jīng)很容易解決)需要有更深入的理解,谷歌還發(fā)起了一項基于此數(shù)據(jù)集的挑戰(zhàn)賽,以幫助提高計算機對自然語言的理解。

NQ挑戰(zhàn)賽排行榜

NQ數(shù)據(jù)集包含307K訓(xùn)練示例、8K開發(fā)示例和8K測試示例。

目前,NQ挑戰(zhàn)賽排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成績。在論文中,谷歌證明在長答案選擇任務(wù)上的人類的最優(yōu)成績?yōu)?7% F1,在短答案選擇任務(wù)上人類的最優(yōu)成績?yōu)?6%。

來自谷歌搜索的真實問題

NQ是第一個使用自然發(fā)生的查詢創(chuàng)建的數(shù)據(jù)集,并專注于通過閱讀整個頁面來查找答案,而不是從一個短段落中提取答案。

為了創(chuàng)建NQ,我們從用戶提交給Google搜索引擎的真實、匿名、聚合的查詢開始。

然后,我們要求注釋者通過通讀整個維基百科頁面來找到答案,就好像這個問題是他們自己提出的一樣。注釋者需要找到一個長答案和一個短答案,長答案涵蓋推斷問題所需的所有信息,短答案需要用一個或多個實體的名稱簡潔地回答問題。

對NQ語料庫的注釋質(zhì)量進行評估,顯示準確率達到90%。

注釋包含一個長答案和一個短答案

研究人員在論文《自然問題:問答研究的基準》(Natural Questions: a Benchmark for Question Answering Research)中對數(shù)據(jù)收集的過程進行了全面描述,論文已發(fā)表在《計算語言學(xué)協(xié)會會刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ網(wǎng)站上查看更多來自數(shù)據(jù)集的示例。

自然語言理解挑戰(zhàn)

NQ的目的是使QA系統(tǒng)能夠閱讀和理解完整的維基百科文章,其中可能包含問題的答案,也可能不包含問題的答案。

系統(tǒng)首先需要確定這個問題的定義是否足夠充分,是否可以回答——許多問題本身基于錯誤的假設(shè),或者過于模糊,無法簡明扼要地回答。

然后,系統(tǒng)需要確定維基百科頁面中是否包含推斷答案所需的所有信息。我們認為,相比在知道長答案后在尋找短答案,長答案識別任務(wù)——找到推斷答案所需的所有信息——需要更深層次的語言理解。

我們希望NQ的發(fā)布以及相關(guān)的挑戰(zhàn)賽將有助于推動更有效、更強大的QA系統(tǒng)的開發(fā)。我們鼓勵NLU社區(qū)參與進來,并幫助縮小目前最先進方法的性能與人類上限之間的巨大差距。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6207

    瀏覽量

    106148
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1210

    瀏覽量

    24861
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    291

    瀏覽量

    13410

原文標題:NLP新基準!谷歌重磅發(fā)布開放問答數(shù)據(jù)集,30萬自然提問+人工注釋答案

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    自然語言處理與機器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一核心領(lǐng)域,它使計算機能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測或決策。自然語言處理與機器學(xué)習(xí)之間有著密切的關(guān)系,因為機器學(xué)習(xí)提供了一種強大的工具,用于從大
    的頭像 發(fā)表于 12-05 15:21 ?795次閱讀

    語音識別與自然語言處理的關(guān)系

    人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩重要的技術(shù)支柱。語音識別技術(shù)使得機器能夠理解人類的語音,而自然語言處理則讓機器能夠理解、解釋和生成人類語言。這兩項技術(shù)
    的頭像 發(fā)表于 11-26 09:21 ?642次閱讀

    ASR與自然語言處理的結(jié)合

    ASR(Automatic Speech Recognition,自動語音識別)與自然語言處理(NLP)是人工智能領(lǐng)域的兩重要分支,它們在許多應(yīng)用中緊密結(jié)合,共同構(gòu)成了自然語言理解和
    的頭像 發(fā)表于 11-18 15:19 ?558次閱讀

    自然語言處理與機器學(xué)習(xí)的區(qū)別

    人工智能的快速發(fā)展中,自然語言處理(NLP)和機器學(xué)習(xí)(ML)成為了兩核心的研究領(lǐng)域。它們都致力于解決復(fù)雜的問題,但側(cè)重點和應(yīng)用場景有所不同。 1. 自然語言處理(NLP) 定義:
    的頭像 發(fā)表于 11-11 10:35 ?820次閱讀

    AI智能化問答:自然語言處理技術(shù)的重要應(yīng)用

    自然語言處理(NLP)是人工智能領(lǐng)域的一重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。問答系統(tǒng)作為NLP的一重要應(yīng)用,能夠精確地解析用戶以
    的頭像 發(fā)表于 10-12 10:58 ?606次閱讀
    AI智能化問答:<b class='flag-5'>自然</b>語言處理技術(shù)的重要應(yīng)用

    自然語言處理技術(shù)有哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的一分支,它致力于使計算機能夠理解、解釋和生成人類語言。自然語言處理技術(shù)的發(fā)展已經(jīng)取得
    的頭像 發(fā)表于 07-03 14:30 ?1420次閱讀

    自然語言處理模式的優(yōu)點

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的一重要分支,它致力于使計算機能夠理解、生成和處理人類語言。隨著技術(shù)的發(fā)展,自然語言處
    的頭像 發(fā)表于 07-03 14:24 ?895次閱讀

    自然語言處理是什么技術(shù)的一種應(yīng)用

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學(xué)領(lǐng)域的一分支,它涉及到使用計算機技術(shù)來處理、分析和生成自然語言文本。
    的頭像 發(fā)表于 07-03 14:18 ?1211次閱讀

    自然語言處理包括哪些內(nèi)容

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領(lǐng)域的一重要分支,它涉及到計算機與人類語言之間的交互。NLP的目標是讓計算機能夠理解、生成和處理人類語言
    的頭像 發(fā)表于 07-03 14:15 ?1247次閱讀

    自然語言處理屬于人工智能的哪個領(lǐng)域

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能(Artificial Intelligence,簡稱AI)領(lǐng)域的一重要分支。它涉及到計算機與人類語言
    的頭像 發(fā)表于 07-03 14:09 ?1599次閱讀

    什么是自然語言處理 (NLP)

    自然語言處理(Natural Language Processing, NLP)是人工智能領(lǐng)域中的一重要分支,它專注于構(gòu)建能夠理解和生成人類語言的計算機系統(tǒng)。NLP的目標是使計算機能夠像人類一樣
    的頭像 發(fā)表于 07-02 18:16 ?1367次閱讀

    自然語言處理技術(shù)的原理的應(yīng)用

    自然語言處理(Natural Language Processing, NLP)作為人工智能(AI)領(lǐng)域的一重要分支,旨在使計算機能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大
    的頭像 發(fā)表于 07-02 12:50 ?785次閱讀

    神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用

    自然語言處理(NLP)是人工智能領(lǐng)域中的一重要分支,它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-01 14:09 ?610次閱讀

    **十萬級口語識別,離線自然說技術(shù),讓智能照明更懂你**

    隨著人工智能技術(shù)的普及,智能家居設(shè)備開始走進千家戶。而智能照明系統(tǒng)作為其不可或缺的一部分,占據(jù)著舉足輕重的地位。 所謂智能照明,就是通過語音、手機/平板應(yīng)用程序、無線面板或遙控技術(shù)實現(xiàn)智能控制
    發(fā)表于 04-29 17:09

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06
    主站蜘蛛池模板: 美女网站视频一区 | 色中色在线视频 | 在线看欧美成人中文字幕视频 | 婷婷影院在线综合免费视频 | 都市禁忌猎艳风流美妇 | 四虎精品永久在线 | 夜夜爱夜夜爽 | 国产好深好硬好爽我还要视频 | 午夜理伦| 4tube高清性欧美 | 天天摸日日摸人人看 | 日本人视频-jlzz jlzz jlzz | 欧美午夜大片 | 中文字幕第一 | 色播视频网站 | 中文字幕第十页 | aaaa黄色片| 激情网网站 | 国产网站免费视频 | 天堂自拍| 综合精品| 大伊人网| 亚洲视频一 | 国外一级毛片 | 欧美日韩生活片 | 亚洲欧美一区二区三区麻豆 | 四虎成人免费影院网址 | 国产精品久久久久久久久免费观看 | 亚欧乱色束缚一区二区三区 | 欧美影院 | 激情婷婷综合 | 日本高清午夜色wwwσ | 色婷婷婷丁香亚洲综合不卡 | 色综合小说天天综合网 | 中文天堂最新版www 中文天堂最新版在线精品 中文天堂最新版在线中文 中文天堂最新版资源新版天堂资源 | 操美女免费视频 | 一级片免费在线观看 | 麦克斯奥特曼免费观看 | www狠狠操| 日韩一级在线播放免费观看 | 天天爱天天射 |