在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

心智理論測試:人工智能擊敗人類

AI智勝未來 ? 來源:悅智網 ? 2024-11-08 10:54 ? 次閱讀

測試結果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態的能力,正是它驅使著人類社會運轉。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以及與電影中的角色產生共鳴。一項最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現得非常出色。

“在進行這項研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷不易察覺的心理狀態能力的測試。”該研究的合著者克里斯蒂娜?貝奇奧(Cristina Becchio)說,她是德國漢堡-埃彭多夫大學醫學中心的認知神經科學教授。這項她認為“出乎意料和令人驚訝”的研究結果發表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據表明大語言模型的反應能夠表現這種推理能力的人。在2023年發表的一篇預印本論文中,斯坦福大學心理學家邁克爾?科辛斯基(Michal Kosinski)報告了幾個模型在幾種常見心智理論測試中的測試情況。他發現,其中最好的是OpenAI的GPT-4,它正確完成了75%的任務,他說,這相當于過去研究中6歲兒童的表現。不過,這項研究中的方法遭到了其他研究人員的批評,他們進行了后續實驗,并得出結論,大語言模型之所以能得出正確答案,往往是基于“淺顯的啟發”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭論。“在論文中,我們的目標是使用廣泛的心理測試,以更加系統的方式來應對機器心智理論的評估挑戰。”該研究的合著者詹姆斯?斯特拉坎(James Strachan)說,他是一名認知心理學家,目前是漢堡-埃彭多夫大學醫學中心的訪問科學家。他指出,進行嚴謹的研究意味著要測試人類和大語言模型處理相同任務的能力,這項研究比較了1907個人與幾個流行的大語言模型的能力。

大語言模型和人類都完成了5種典型的心智理論測試,前3種是理解暗示、反語和失禮。此外,他們還回答了“錯誤信念”問題,這些問題通常用于確定幼兒心智理論的發展程度。這些問題是這樣的:如果愛麗絲在鮑勃不在房間的時候移動了某樣東西,那么鮑勃回來后應該去哪里找這個東西?最后,他們回答了“奇怪故事”中一些相當復雜的問題,這些故事中的人物相互撒謊、操縱并產生了很多誤解。

總體而言,GPT-4占據了優勢。它的得分在錯誤信念測試中與人類相當,在反語、暗示和奇怪故事方面的總分高于人類,只在失禮測試中表現不如人類。為了理解失禮測試結果有所不同的原因,研究人員對該模型進行了一系列后續測試,探索了幾種假設。他們得出的結論是,GPT-4能夠對有關失禮的問題給出正確答案,但在固執己見方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設置了許多圍欄,“旨在保持模型真實、誠實和正確”,他認為,旨在防止GPT-4產生幻覺(即編造內容)的策略可能會妨礙它對一些問題輸出觀點,比如故事角色是否在高中同學聚會上無意間侮辱了老同學。

研究人員很謹慎。他們沒有說自己的研究結果表明大語言模型實際上擁有心智理論能力,而是說大語言模型“在心智理論任務中的表現與人類行為沒有區別”。這就引出了一個問題:如果一個仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說,這是一個社會科學家以前從未嘗試回答的問題,因為對人類的測試會假設這種品質在某種程度上是存在的。“我們目前還沒有一種方法甚至是一種理念來測試心智理論的存在,這是一種現象學品質。”他說。

華盛頓大學計算語言學教授艾米麗?本德(Emily Bender)因堅持揭露人工智能行業的膨脹炒作而成為了該領域的傳奇人物。她對這個激勵著研究人員的問題提出了異議。“面對相同問題,文本處理系統能否產生與人類相似的答案為什么如此重要?”她問道,“我們能夠了解大語言模型內部是如何運作的嗎?它們可能有什么用處,又可能帶來哪些危險?”

本德對論文中的擬人化表示擔憂,論文研究人員說大語言模型有認知、推理和作出選擇的能力,還使用了“大語言模型和人類參與者之間的物種公平比較”這一措辭。本德說,這“完全沒有將軟件囊括在內”。

漢堡-埃彭多夫大學醫學中心團隊的研究結果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會帶來什么影響。雖然這種大語言模型在與人類用戶交互和預測用戶需求方面會做得更好,但它們也可能更多地用于欺騙和操縱。它們會引來更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48788

    瀏覽量

    246915

原文標題:人工智能在心智理論測試中戰勝人類

文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    人工智能和機器學習以及Edge AI的概念與應用

    作者:DigiKey Editor 人工智能(AI)已經是當前科技業最熱門的話題,且其應用面涉及人類生活的各個領域,對于各個產業都帶來相當重要的影響,且即將改變人類未來發展的方方面面。本文將為您介紹
    的頭像 發表于 01-25 17:37 ?842次閱讀
    <b class='flag-5'>人工智能</b>和機器學習以及Edge AI的概念與應用

    Reddit測試人工智能問答功能Reddit Answers

    近日,Reddit公司宣布了一項重要的新功能測試計劃,旨在通過人工智能技術為用戶提供更加便捷的問答體驗。這項新功能被命名為Reddit Answers。 據Reddit官方介紹,Reddit
    的頭像 發表于 12-12 09:46 ?591次閱讀

    嵌入式和人工智能究竟是什么關系?

    領域,如工業控制、智能家居、醫療設備等。 人工智能是計算機科學的一個分支,它研究如何使計算機具備像人類一樣思考、學習、推理和決策的能力。人工智能的發展歷程可以追溯到上世紀50年代,經
    發表于 11-14 16:39

    人工智能人類的影響有哪些

    人工智能(AI)作為現代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會結構。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著一系列挑戰和問題。 一、積極影響 工作變革與經濟增長
    的頭像 發表于 10-22 17:23 ?5636次閱讀

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    農業、環保等,為人類社會的可持續發展做出貢獻。 總結 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們展示了一個充滿希望和機遇的未來。在這個未來中,人工智能
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    ,還促進了新理論、新技術的誕生。 3. 挑戰與機遇并存 盡管人工智能為科學創新帶來了巨大潛力,但第一章也誠實地討論了伴隨而來的挑戰。數據隱私、算法偏見、倫理道德等問題不容忽視。如何在利用AI提升科研效率
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發表于 09-28 11:00

    人工智能ai 數電 模電 模擬集成電路原理 電路分析

    人工智能ai 數電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料。看能否有助于入門和提高ss
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    大力發展AI for Science的原因。 第2章從科學研究底層的理論模式與主要困境,以及人工智能三要素(數據、算法、算力)出發,對AI for Science的技術支撐進行解讀。 第3章介紹了在
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產品
    發表于 08-22 15:00

    FPGA在人工智能中的應用有哪些?

    FPGA(現場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發表于 07-29 17:05

    人工智能模型有哪些

    行為的關鍵。這些模型基于不同的算法、架構和設計理念,旨在模擬、延伸和擴展人類智能的某些方面。下面,我們將深入探討幾種主流的人工智能模型,涵蓋其基本原理、應用領域、發展現狀及未來趨勢。
    的頭像 發表于 07-04 17:28 ?1937次閱讀

    人工智能新紀元:具身智能引領機器人深度融入人類生活

    成為了窺見未來科技趨勢的重要窗口。在這場科技盛宴中,擎朗智能創始人兼CEO李通先生以其深刻的見解和前瞻性的預測,為我們描繪了一幅人工智能深度融入物理世界、與人類生活緊密相連的宏偉藍圖。
    的頭像 發表于 07-03 16:57 ?682次閱讀
    主站蜘蛛池模板: 日本xxxxxxx69xx | 国产网站免费 | 香蕉视频在线免费播放 | 久久五月网| 九九福利 | gay超刺激污文 | 日韩三级中文字幕 | 日日干狠狠操 | 有码视频在线观看 | 婷婷激情亚洲 | 国产一区二区三区不卡观 | 亚洲综合校园春色 | 午夜精品福利影院 | 四大名著成人高h肉版 | 免费网站黄色 | 久久综合社区 | 黄床大片 | 狠狠色噜噜 | wwwwwww色| 国产精品99r8在线观看 | 久久久久久全国免费观看 | 欧美成人影院免费观 | 人阁色第四影院在线观看 | 国产一级特黄在线播放 | 嗯好舒服好爽好快好大 | 日本人zzzwww色视频 | 婷婷 综合网站 | 日韩毛片一级 | 黄色网在线看 | 热久久久 | 久碰香蕉精品视频在线观看 | 美女露出尿口让男人桶爽网站 | 久久久久久久综合狠狠综合 | 插插天天| 天堂黄网| 一级特黄特色的免费大片视频 | 高颜值美女啪啪 | 亚洲欧美色图 | 奇米影视777欧美在线观看 | 成人啪啪免费视频 | 免费看片你懂的 |