91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPT-3通過了大部分課程的寫作測試

深度學習自然語言處理 ? 來源:機器之心 ? 作者:機器之心 ? 2021-03-05 15:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPT-3 寫的論文及格了嗎?教育資源網站 EduRef 對此進行了一項測試,效果還行,及格水平。

2020 年 5 月,OpenAI 推出了具有 1750 億參數的史上最大 AI 模型 GPT-3,該模型不僅可以更好地答題、翻譯、寫文章,還帶有一些數學計算的能力。自推出以來,該模型就開始在不同的領域大顯身手,如基于問題的搜索引擎、與歷史人物對話、基于文本描述生成代碼以及繪圖和圖像補全等等。

但 GPT-3 的應用之路遠未結束…

近日,教育資源網站 EduRef 進行了一項測試,他們找了一組教授創建了一個寫作提示,然后讓應屆畢業生和本科生以及 GPT-3 同時根據該提示寫作,最后教授組對匿名提交的作文打分,并對作者進行追蹤調查。那么,究竟結果如何呢?GPT-3 的分數能夠超過人類作者嗎?未必!

GPT-3 通過了大部分課程的寫作測試

常言道:「評級為 C 就可以畢業(C’s get degrees)」。AI 遠遠達不到完美,GPT-3 的寫作水平大概相當于自由寫作者(freelance writer)。

結果顯示,在 COVID-19 疫苗效力的研究方法論文寫作上,人類作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美國歷史類的測試中,人類作者可以在美國例外主義論文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法學課上的政策函寫作中,GPT-3 得到了 B-,而 3 個學生中只有 1 個能夠得到高分。

下圖為人類作者與 GPT-3 在不同學科寫作中的得分情況:

由此可見,GPT-3 的寫作技能主要體現在技術類文檔中。在創意寫作課程中的地點記敘文(place narrative)寫作中,GPT-3 僅得到了 F,沒有通過測試。作為對比,自由寫作者得到了 A、B + 和 D+。盡管在創意寫作教授的眼中,GPT-3 失敗了,但自然語言生成(NLG)軟件依然可以用于編寫各類內容,包括一部幾乎獲獎的小說《The Day a Computer Writes a Novel》。先前的成功也預示著以后的失敗,GPT-3 或許只需要一些調整即可以成為一名合格的創意作家。總的來說,AI 幾乎通過了所有的課程寫作測試。

GPT-3 20 分鐘完成論文

雖然每個教授打分都不一樣,但該評分小組包括兩名博士和一名醫學碩士。他們總共有超過 55 年的高中和各種大學水平的教學經驗。寫作者包括應屆畢業生和本科生,其中一些人在他們的研究領域寫了提示。平均來說,他們需要 3 天時間完成任務。

對于絕大多數學生來說,3 天內完成大學論文似乎是很難的事情,主要原因在于時間太短,但是 GPT-3 在 20 分鐘內就完成了這個任務。GPT-3 利用深度學習產生類似人類的文本,每項任務花費 3 到 20 分鐘完成,并且用最長的時間來編寫創造性的寫作敘述。為了避免人為干擾,GPT-3 只對輸出長度和重復文本進行了輕微的編輯,其生成的內容、真實信息和語法都沒有受到影響。

GPT-3 生成的美國歷史類作文示例如下:

GPT-3 可生成類似人類寫作的內容

即使沒有人為干擾,GPT-3 的任務也或多或少地收到了與人類作者相同的反饋。49.2% 的評論涉及語法和句法,26.2% 的評論涉及重點和細節,語氣與行文結構等也被提及,但分別只有 12.3% 和 10.8%。這與人類作家收到的評論比例幾乎相同,近 50% 的評論與語法和句法有關,25.4% 的評論與焦點和細節有關。超過 13% 的評論是關于人類專業知識,而 10.4% 的評論是關于整體風格等。

人類作者與 GPT-3 的寫作結果收到的評論反饋情況:

盡管收到了同樣風格的評論,GPT-3 生成的內容與人類作者并不那么相似。以排名靠前的兩個單詞組合為例,GPT-3 和人類作者只分享了排名靠前的組合:「of the」。「People who」、「it is」和「those who」常被 GPT-3 使用,而人類作者經常使用的是「to the」、「in the」和「on the」。總體來說,這些單詞是在英語中經常使用的,組合上的差異顯示出 AI 和人類在寫作結構上的一些差異。

人類作者與 GPT-3 在寫作用詞上的差異分析:

考慮到 GPT-3 超高的論文得分,搭配統計數據的差異表明,人類作者比 AI 產生的獨特內容明顯更多。

盡管 GPT-3 具有出色的產出,但其生成的論文在短期內還無法獨立獲得大學學位。當與人類作者競爭時,GPT-3 獲得了一些及格分數,但在創意寫作方面有所欠缺。盡管它在眾多領域的成功為 AI 的未來帶來了希望,但對大學教授來說,AI 依然存在不足。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    35121

    瀏覽量

    279669
  • 模型
    +關注

    關注

    1

    文章

    3519

    瀏覽量

    50418

原文標題:【GPT-3】除了缺少點創意,GPT-3寫出了及格的大學畢業論文,只需20分鐘

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    震驚,原來大部分電器都離不開它

    大部分電器都離不開變壓器嗎 是的,絕大多數電器設備都直接或間接依賴變壓器,但具體形式因用電場景而異。以下是詳細分析: 1. 哪些電器必須用變壓器? 交流電(AC)設備: 家用電器
    的頭像 發表于 06-24 14:10 ?185次閱讀

    【技術分享】從EMC到極限溫升,插板式模組都通過了哪些“地獄測試”?

    插板式模組是ZLG致遠電子開發的可靈活設計的遠程I/O擴展模塊,可通過定制化底板集成各類接口,搭配多種功能模塊,那它們的穩定性能得到保證嗎?本文來講一講插板式模組經歷的那些“地獄測試”。九大測試
    的頭像 發表于 06-17 11:36 ?186次閱讀
    【技術分享】從EMC到極限溫升,插板式模組都<b class='flag-5'>通過了</b>哪些“地獄<b class='flag-5'>測試</b>”?

    知行科技全資子公司擬收購小工匠機器人大部分股份

    近日,知行科技旗下專注機器人研發及商業化的全資子公司艾摩星機器人與蘇州小工匠機器人有限公司(“小工匠”)簽署股權轉讓框架協議,艾摩星機器人將出資收購小工匠大部分股份,成為控股股東。以此為開端,知行科技正快速提升在機器人關鍵部件層面的技術積累,在加速拓展具體場景應用方面,邁出堅實一步。
    的頭像 發表于 05-13 14:51 ?440次閱讀

    馬斯克發布Grok 3大模型,超越GPT-4o

    多項benchmark測試中,Grok 3取得了比DeepSeek-v3GPT-4o以及Gemini-2 pro更優的效果。這一成績無疑彰顯了Grok
    的頭像 發表于 02-19 13:50 ?428次閱讀

    大部分的干擾問題都來自電源和地

    大部分的干擾問題都來自電源和地,分享一個很好的PDF文檔,文末附文檔獲取方式。 ?
    的頭像 發表于 01-15 17:37 ?569次閱讀
    <b class='flag-5'>大部分</b>的干擾問題都來自電源和地

    OpenAI正式推出Canvas:寫作編碼新平臺,支持Python

    近日,OpenAI在連續發布新功能的節奏中,正式向全體ChatGPT用戶開放了全新交互界面Canvas。這款工具基于OpenAI最新的GPT-4o模型,旨在為用戶提供一個強大的寫作和編碼協作平臺
    的頭像 發表于 12-12 10:06 ?714次閱讀

    法官駁回大部分 GitHub Copilot 版權索賠要求

    在開發者對 GitHub、微軟和 OpenAI 提起的版權訴訟中,法官駁回了大部分訴訟請求。
    的頭像 發表于 11-13 12:13 ?615次閱讀

    AGM32VF407的大部分IO可以隨意配置,這是這么做到的?

    AGM32VF407的大部分IO可以隨意配置,除了少數的專用引腳外,這是這么做到的?這里包括異構的RISC-V內核的外設哦。非常感興趣呢。
    發表于 10-31 19:07

    英偉達預測機器人領域或迎“GPT-3時刻”

    未來2-3年內,機器人基礎模型的研究將迎來重大突破,這一時刻被形象地比喻為機器人領域的“GPT-3時刻”。
    的頭像 發表于 09-20 17:05 ?1073次閱讀

    Jim Fan展望:機器人領域即將迎來GPT-3式突破

    英偉達科學家9月19日,科技媒體The Decoder發布了一則引人關注的報道,英偉達高級科學家Jim Fan在近期預測,機器人技術將在未來兩到三年內迎來類似GPT-3在語言處理領域的革命性突破,他稱之為機器人領域的“GPT-3時刻”。
    的頭像 發表于 09-19 15:13 ?942次閱讀

    THS7001前級放大部分可以正常工作,后級PGA部分如何連接?

    我THS7001前級放大部分可以正常工作,但后級PGA部分不知道如何連接,那個CLAMP (H,L)不知道是什么意思,該如何連接? 我現在的連接方法原本是想按G2 G1 G0= 110 指令放大的。結果PGA輸出為0,求解!!謝謝!!!
    發表于 09-19 06:20

    傳感器的基本組成包括哪兩大部分

    傳感器是一種將物理量或化學量轉換為電信號的裝置,廣泛應用于工業、農業、醫療、環保等領域。傳感器的基本組成包括兩大部分:敏感元件和轉換元件。 一、敏感元件 敏感元件是傳感器的核心部分,它能夠感知被測量
    的頭像 發表于 08-19 09:47 ?3174次閱讀

    EU104:一款支持1擴4的通用異步串口擴展芯片,滿足絕大部分串口設備的通訊要求

    EU104:一款支持1擴4的通用異步串口擴展芯片,滿足絕大部分串口設備的通訊要求 EU104是一款支持1擴4的通用異步串口擴展芯片,具有靈活配置通訊參數的UART接口。該芯片提供了5個UART接口
    的頭像 發表于 08-08 10:21 ?857次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測試中表現優于
    的頭像 發表于 07-21 10:20 ?1677次閱讀
    OpenAI 推出 <b class='flag-5'>GPT</b>-4o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> 4 而且更快 API KEY更便宜

    紫光展銳5G系列移動通信芯片順利通過Telcel技術測試

    7月17日,紫光展銳傳來捷報,宣布其5G系列移動通信芯片成功跨越重要里程碑,順利通過了墨西哥知名運營商Telcel的嚴苛技術測試,證明這些芯片能在Telcel覆蓋的5G、4G及3G網絡上實現穩定且
    的頭像 發表于 07-17 16:50 ?1272次閱讀
    主站蜘蛛池模板: 国产高清免费在线观看 | 四虎国产成人亚洲精品 | 欧美大黄 | 亚洲成成品网站有线 | 欧美成人性色区 | 欧美三级日韩三级 | 久久亚洲国产午夜精品理论片 | 嘿嘿嘿视频在线观看网站 | 日干夜操 | 欧美天天性影院 | 国产乱码精品一区二区三区四川人 | 日本aaaaa毛片在线视频 | 午夜精品久久久久 | 香港三级理论在线影院 | 99精品久久久久久久婷婷 | 天天干天天操天天操 | 一级片在线免费看 | 国模娜娜扒开嫩木耳 | 天天干在线播放 | 人人天天夜夜 | 欧美激情五月 | 女人张开腿 让男人桶视频 女人张开腿等男人桶免费视频 | 国产成人v爽在线免播放观看 | 久久精品伊人波多野结 | 亚洲婷婷综合中文字幕第一页 | 五月婷婷丁香花 | 成人午夜视频免费看欧美 | 午夜一级 | 一卡二卡≡卡四卡亚洲高清 | 成人网中文字幕色 | 国产破苞合集 magnet | 精品久久中文网址 | 国产性大片黄在线观看在线放 | 日韩激情淫片免费看 | 亚洲国产成人久久一区www | 天天视频官网天天视频在线 | 国产婷婷综合丁香亚洲欧洲 | 亚洲一本视频 | 国产美女精品一区二区三区 | 2021久久精品免费观看 | 69久久夜色精品国产69 |