在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀

近日,科技公司谷歌和微軟相繼在一份權威自然語言理解榜單中超越人類的表現,微軟宣稱這“標志著邁向通用人工智能的重要里程碑?!?/p>

自然語言理解(Natural Language Understanding,簡稱NLU)任務在人工智能領域歷史悠久,被譽為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實現高質量的自然語言理解有相當的難度。

為了衡量人工智能模型的自然語言理解能力,紐約大學、華盛頓大學、Facebook和DeepMind在2019年合作提出一個名為SuperGLUE的人工智能基準測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準線(human baseline)。這是人工智能首次在SuperGLUE中表現超越人類。

盡管在SuperGLUE測試上取得令人滿意的結果,但微軟坦言,DeBERTa模型還沒有達到人類智能的自然語言理解水平。人類非常善于利用從不同任務中學到的知識來解決新的任務,這是AI模型需要學習的地方。

排名第一的微軟模型DeBERTa共有15億個參數。在SuperGLUE測試中,單個DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(89.8分);模型整體得分(90.3分)也超過人類基準線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個孩子對疾病產生了免疫力”,問“這是由什么導致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個簡單的因果推理任務,人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰。為了得出正確答案,模型需要理解已知條件和選項之間的因果關系。

2021年1月6日,微軟在博客發文詳細介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個基于Transformer架構的神經語言模型,采用自監督學習方法對大量原始文本語料庫進行預訓練。DeBERTa的目標是學習通用的語言表達形式,適用于各種自然語言理解任務。DeBERTa主要用到三種新技術,分別是分離注意力機制、增強的掩碼解碼器和用于微調的虛擬對抗訓練方法。

排名第二的T5+Meena技術來自谷歌。谷歌團隊尚未詳細解釋其模型在SuperGLUE創紀錄的原因。但微軟在博客文章中評價稱,谷歌的T5模型由110億個參數組成,相比之下,15億參數的DeBERTa在訓練和維護上更加節能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準備向公眾公開15億參數的DeBERTa模型及其源代碼。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6676

    瀏覽量

    105463
  • 人工智能
    +關注

    關注

    1805

    文章

    48843

    瀏覽量

    247405
  • 自然語言
    +關注

    關注

    1

    文章

    291

    瀏覽量

    13617
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    谷歌新一代 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?

    電子發燒友網報道(文 / 李彎彎)日前,谷歌 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據悉,該芯片預計于今年晚些時候面向 Google
    的頭像 發表于 04-12 00:57 ?2211次閱讀

    谷歌 Gemini 2.0 Flash 系列 AI 模型上新

    谷歌旗下 AI模型 Gemini 系列全面上新,正式版 Gemini 2.0 Flash、Gemini 2.0 Flash-Lite 以及新一代旗艦大模型 Gemini 2.0 P
    的頭像 發表于 02-07 15:07 ?665次閱讀

    大舉投資750億、800億美元押注AI!抗衡DeepSeek,谷歌微軟財報揭秘

    AI 模型的效率可與DeepSeek相媲美。 1月29日,美國微軟公司公布了2025財年第二季度財報,值得關注的
    的頭像 發表于 02-06 09:10 ?2761次閱讀
    大舉投資750億、800億美元押注<b class='flag-5'>AI</b>!抗衡DeepSeek,<b class='flag-5'>谷歌</b>和<b class='flag-5'>微軟</b>財報揭秘

    微軟尋求365 Copilot多元化AI模型

    此舉旨在應對企業用戶對于成本和速度的擔憂。目前,Microsoft 365 Copilot主要依賴于OpenAI的技術,但微軟正尋求通過引入更多元化的AI模型來降低這種單一依賴的風險。 微軟
    的頭像 發表于 12-26 10:25 ?440次閱讀

    微軟尋求365 Copilot引入非OpenAI模型

    擔心企業用戶使用365 Copilot時面臨的成本和速度問題,因此正在尋求更多樣化的技術來源。盡管微軟與OpenAI之間有著緊密的合作關系,并允許微軟定制OpenAI的模型,但
    的頭像 發表于 12-25 10:41 ?576次閱讀

    谷歌發布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名為“深度研究”的新特性,旨在為用戶提供更加全面和深入的復雜主題探索與報告撰寫輔助。 Gemini 2.0通過高級推理和長上
    的頭像 發表于 12-12 10:13 ?613次閱讀

    微軟GitHub與Anthropic和谷歌合作

    近日,微軟旗下的GitHub宣布了一項重要合作,將Anthropic和谷歌AI模型整合到其代碼助理,為數百萬軟件開發者提供新的
    的頭像 發表于 10-30 16:25 ?492次閱讀

    AI模型智能座艙軟件測試的應用與思考

    背景下,AI模型作為一種強大的工具,有望提升自動化測試效率、改善用戶體驗,進而推動整個行業的發展。 01 智能座艙軟件測試現狀 智能座艙嵌入了大量的軟件系統,包括娛樂信息、導航、安全
    的頭像 發表于 10-28 16:49 ?795次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b><b class='flag-5'>在</b>智能座艙軟件<b class='flag-5'>測試</b><b class='flag-5'>中</b>的應用與思考

    如何評估AI模型的效果

    、SuperGLUE、SQuAD等。這些數據集提供了不同任務上的基準評估,使得不同模型同一任務上的性能可以進行直接比較。 二、多樣性和覆蓋性測試
    的頭像 發表于 10-23 15:21 ?2858次閱讀

    AI模型圖像識別的優勢

    AI模型圖像識別展現出了顯著的優勢,這些優勢主要源于其強大的計算能力、深度學習算法以及大規模的數據處理能力。以下是對AI
    的頭像 發表于 10-23 15:01 ?2335次閱讀

    AI模型自然語言處理的應用

    AI模型自然語言處理(NLP)的應用廣泛且深入,其強大的語義理解和生成能力為NLP任務帶來了顯著的性能提升。以下是對AI
    的頭像 發表于 10-23 14:38 ?1409次閱讀

    新火種AI模型公司紛紛被收編!創始人們逐漸變成了“最討厭的自己”?

    谷歌,微軟一類的大廠正在快速展開行動,不過,它們并不是單純要給大模型公司進行投資回血,而是對其展開了圍剿行動。 就在本月初,谷歌就“買下”了AI
    的頭像 發表于 08-21 15:05 ?488次閱讀
    新火種<b class='flag-5'>AI</b> 大<b class='flag-5'>模型</b>公司紛紛被收編!創始人們逐漸變成了“最討厭的自己”?

    谷歌獲Character.AI模型技術授權,創始人重歸谷歌懷抱

    8月5日最新資訊,創新企業Character.AI在上周五正式宣布,他們已經與科技巨頭谷歌的母公司Alphabet達成了一項重要合作,非獨家授權谷歌使用其先進的大型語言模型技術。此次合
    的頭像 發表于 08-05 14:35 ?704次閱讀

    微軟計劃在搜索引擎Bing引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing引入先進的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發表于 07-26 14:23 ?724次閱讀

    AI模型MCU的應用

    機遇。將AI模型集成到MCU,不僅提升了設備的智能化水平,還使得設備能夠執行更復雜的任務,實現自主決策和實時響應。本文將從AI模型
    的頭像 發表于 07-12 10:24 ?1798次閱讀
    主站蜘蛛池模板: 一区二区不卡视频在线观看 | 午夜一级精品免费毛片 | 日本黄色片免费看 | 97精品伊人久久久大香线焦 | 国产视频观看 | 四虎影院永久在线观看 | 久久免费99精品久久久久久 | 国产成人在线播放视频 | 精品国产成人系列 | 7086bt伙计 福利一区 | 男女交性视频播放视频视频 | 在线永久免费播放视频 | 天堂资源网| semimi亚洲综合在线观看 | 性欧美巨大 | 天天干天天操天天操 | 免费大秀视频在线播放 | 五月天六月丁香 | 欧美性色欧美a在线观看 | 免费黄色大片在线观看 | 男女午夜特黄毛片免费 | 91亚洲视频| 免费成人看片 | 亚洲国产精品乱码在线观看97 | 九九国产精品视频 | 四虎永久免费网站入口2020 | 久久三级国产 | 性夜黄a爽影免费看 | 男人的天堂一区二区视频在线观看 | 97se亚洲综合 | 在线视频黄 | 午夜免费剧场 | 人人干人人搞 | 午夜精品久久久久久影视riav | 韩毛片| h视频在线观看免费网站 | 色琪琪一本到影院 | 亚洲日本一区二区 | 一级特黄性色生活片一区二区 | 天天色啪 | 久久亚洲综合色 |