在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開源風波后在AlpacaEval直追GPT4,零一靠技術如何重建生態信心

AI科技大本營 ? 來源:AI科技大本營 ? 2023-12-11 17:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

斯坦福大學研發的大語言模型評測 AlpacaEvalLeaderboard備受業內認可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的勝率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 經認證的模型類別中,成為僅次于 GPT-4 英語能力的大語言模型。

3ed85ecc-9808-11ee-8b88-92fbcf53809c.jpg

同一周,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat也以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。

多個Benchmark遙遙領先

在五花八門的大模型評測中,伯克利LMSYS ORG排行榜采用了一個最為接近用戶體感的「聊天機器人競技場」特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲測和匿名投票,11月份經25000的真實用戶投票總數計算了20個大模型的總得分。
Elo評分越高,說明模型在真實用戶體驗上的表現越出色,可說是眾多大模型評測集中最能展現「Moment of Truth」真實關鍵一刻” 的用戶導向體驗對決。

3ee46bb8-9808-11ee-8b88-92fbcf53809c.jpg

在開源模型中,Yi-34B-Chat成為當之無愧的「最強王者」之一(英語能力),LMSYS ORG 在12月8日官宣11月份總排行時評價:「Yi-34B-Chat 和 Tulu-2-DPO-70B 在開源界的進擊表現已經追平 GPT-3.5」。

風波終結,爭議理清

Yi-34B開源發布后,開發者Eric Hartford發現了模型存在的一個問題,就簡略留言在 Yi 的項目頁面。然而Eric自己也沒有預想到,他的留言引發了后續輿論關于Yi模型「抄襲」LLaMA的質疑。

他在郵件中寫道,「感謝你們提供了一個優秀的模型。Yi模型使用了與LLaMA模型完全相同的架構,只是將兩個張量改了名字。由于圍繞LLaMA架構有很多投資和工具,保持張量名稱的一致性是有價值的。」Eric建議,在Yi被廣泛傳播前,及時恢復張量名稱。 客觀來說,一個模型核心技術護城河是在架構之上,通過數據訓練獲得的參數和代碼。大多數有志于參與基座大模型競爭的團隊,也多是從零開始,用高質量的數據集再進行訓練,普遍都是在沿用LLaMA架構。零一后來解釋他們為了執行對比實驗的需要,對部分推理參數進行了重新命名,原始出發點是為了充分測試模型,而非刻意隱瞞來源。

身處這場輿論風暴的中心,Eric 意識到了可能給一些人帶來了誤解,開始解釋自己之前的發言。

3ef41dba-9808-11ee-8b88-92fbcf53809c.jpg

他在X(twitter)上寫道,「他們沒有在任何事情上撒謊。所有的模型都是在相互借鑒架構。架構是學術研究的產物,已經發表在論文中,任何人都可以自由使用,這絲毫不減損Yi團隊的成就。他們從零開始使用自己創建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的。使用Llama架構沒有任何問題。訓練才是關鍵。Yi給了我們目前可獲得的最佳模型,沒有任何可抱怨的。」 現在,Eric 自己也在使用Yi-34B 系列,用Yi-34b-200k數據集訓練其他的模型產品。 Yi模型開源首月,數據也很亮眼。在Hugging Face社區下載量為16.8萬,魔搭社區下載量1.2萬。在GitHub 獲得超過4900個Stars。

由于性能表現強勁,多家知名公司和機構推出了基于Yi模型基座的微調模型,比如獵豹旗下的獵戶星空公司推出的OrionStar-Yi-34B-Chat模型,南方科技大學和粵港澳大灣區數字經濟研究院(簡稱IDEA研究院)認知計算與自然語言研究中心(簡稱CCNL中心)聯合發布的SUS-Chat-34B等,均性能表現優異。 而AMD和Hugging Face合作的GPU加速大模型的實驗中,也選擇了Yi-6B作為范例項目。

模型好不好,開發者最知道在大模型實際使用體驗上,最有發言權的還是一線的開發者。 知名技術作者蘇洋表示,在他觀察的近期Hugging Face榜單中,前三十名有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,「從這點看 Yi 對于開源生態的幫助還是非常巨大的。」 他會時不時的瀏覽下 HF 的榜單,在最近榜單中的前三十名,有一半多都是 Yi 和其他用戶微調的 Yi-34B 的變體模型,原本占據榜單頭部的 68B 和 70B 模型的數量目前只留有幾個,從這點看 Yi 對于開源生態的幫助還是非常巨大的。

蘇洋還將他的訓練經驗和心得在CSDN上做了分享(https://blog.csdn.net/soulteary/article/details/134904434)。

3f1c556e-9808-11ee-8b88-92fbcf53809c.png

蘇洋認為 34B 普通用戶努努力還是能自己相對低成本跑起來的,68 和 70B 的模型想要本地運行,需要更多的資源。但其實目前分數其實相比較 34B 拉不開太多,也就三四分平均分,但參數量差了一倍。換言之,企業想部署使用,所需要的成本也可以得到非常大的節約。

目前國產大模型在開源榜單上已經是第一梯隊,但如果把競爭范圍追加到閉源模型、尤其是海外的模型,仍有很大的距離要去追趕。目前的普遍體驗是開源模型最多只有 GPT-3.5 + 的水平。

蘇洋認為國產大模型,是能夠很快追趕至第一梯隊的。時間也會證明大模型自身的價值,以及驗證出團隊是否對開源有真的持續投入。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    561

    瀏覽量

    10739
  • 聊天機器人
    +關注

    關注

    0

    文章

    348

    瀏覽量

    12766
  • 大模型
    +關注

    關注

    2

    文章

    3094

    瀏覽量

    3984

原文標題:開源風波后在 AlpacaEval 直追 GPT4,零一靠技術如何重建生態信心

文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開源鴻蒙硬件生態分論壇圓滿舉辦

    近日,開源鴻蒙開發者大會2025(OHDC.2025)硬件生態分論壇深圳圓滿舉辦。本次論壇主題為“開源鴻蒙硬件新生態”,特邀行業
    的頭像 發表于 06-05 15:35 ?424次閱讀

    開源鴻蒙大屏生態分論壇圓滿舉辦

    近日,開源鴻蒙開發者大會2025(OHDC.2025)深圳成功舉辦。主論壇上隆重舉行了“開源鴻蒙TV SIG”成立儀式,開源鴻蒙TV S
    的頭像 發表于 06-05 15:27 ?522次閱讀

    誠邁科技攜HongZOS亮相開源鴻蒙開發者大會,加速生態繁榮與產業躍遷

    5月24日,開源鴻蒙開發者大會2025深圳隆重舉行。作為開源鴻蒙生態的核心共建者和A類捐贈人,誠邁科技深度參與本次盛會:共同發布開源鴻蒙5
    的頭像 發表于 05-26 11:59 ?482次閱讀
    誠邁科技攜HongZOS亮相<b class='flag-5'>開源</b>鴻蒙開發者大會,加速<b class='flag-5'>生態</b>繁榮與產業躍遷

    OpenAI宣布GPT 4o升智計劃

    透露,GPT 4o的智力水平將得到顯著提升,目標直指o3 pro的水平。這一升級不僅意味著GPT 4o在理解和生成文本方面的能力將得到質的飛躍,更將使其
    的頭像 發表于 02-17 14:24 ?575次閱讀

    OpenAI即將發布GPT-4.5與GPT-5

    GPT-4.5將在未來幾周內率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術上進行了諸多優化和升級,旨在為用戶提供更加精準、高效的AI服務。 而在GPT-4
    的頭像 發表于 02-13 13:43 ?621次閱讀

    deepin社區助力開源教育與生態發展

    大賽全國總決賽”近期湖北大學圓滿落幕。 ? 本次大賽致力于利用開源工具集,鼓勵參賽者開源數字生態的不同應用場景中開展創新實踐。大賽不僅為
    的頭像 發表于 01-24 10:00 ?407次閱讀

    開源鴻蒙技術分論壇武漢成功舉辦

    舉行。本次論壇通過南北向開發賦能,融合前沿的行業案例經驗,生動展現了開源鴻蒙在驅動技術創新與產業升級中的優勢與無限潛能。 開源技術引領變革,構建枝繁葉茂
    的頭像 發表于 12-24 13:38 ?763次閱讀

    OpenHarmony人才生態大會南向生態社區發展論壇武漢圓滿舉辦

    OpenHarmony進行開發設計的產品方案。 (深圳觸覺智能科技有限公司軟件工程師、Laval社區資深開發者賈佳豪) 開源4年多,OpenHarmony南向生態建設與人才培養碩果
    發表于 11-29 09:54

    Llama 3 與 GPT-4 比較

    沿。 一、技術架構 Llama 3和GPT-4都是基于深度學習的自然語言處理(NLP)模型,但它們的設計理念和技術細節有所不同。 Llama 3 采用了一種創新的混合架構,結合了傳統的Transformer模型和最新的神經網絡
    的頭像 發表于 10-27 14:17 ?1111次閱讀

    如何使用 ChatGPT 進行內容創作

    到ChatGPT平臺。 選擇模型 : ChatGPT目前支持GPT3.5和GPT4兩個模型。根據創作需求,選擇合適的模型。一般來說,GPT4性能和生成質量上可能更優。 明確創作目標
    的頭像 發表于 10-25 16:08 ?979次閱讀

    請回答OpenHarmony | 關于開源生態的未來想象,我們現場回答

    第三屆OpenHarmony技術大會即將啟幕 今年相聚,OpenHarmony又迎來了怎樣的突破與發展? 萬物智聯的時代,如何通過技術創新引領智能未來? OpenHarmony的開源
    發表于 10-12 00:09

    迅龍軟件出席2024開放原子開源生態大會,共謀開源生態繁榮之路

    2024開放原子開源生態大會于9月25至27日北京亦莊開幕。大會將以“開源賦能產業,生態共筑未來”為主題,匯聚政、產、學、研、用、金等各領
    的頭像 發表于 09-26 13:51 ?718次閱讀
    迅龍軟件出席2024開放原子<b class='flag-5'>開源</b><b class='flag-5'>生態</b>大會,共謀<b class='flag-5'>開源</b><b class='flag-5'>生態</b>繁榮之路

    開放原子開源生態大會OpenHarmony生態主題演講報名開啟

    展示OpenHarmony的技術創新和產業落地成果,分享開源社區生態進展。 誠邀全球開源操作系統產業伙伴、技術大咖和學術專家,共同見證
    發表于 09-19 22:02

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型MMLU上得分為82%, LMSYS排行榜上的聊天偏好測試中表
    的頭像 發表于 07-21 10:20 ?1646次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    【議題征集】國際開源及RISC-V人才暨開源技術生態之旅

    【議題征集】國際開源及RISC-V人才暨開源技術生態之旅
    的頭像 發表于 07-02 08:36 ?484次閱讀
    【議題征集】國際<b class='flag-5'>開源</b>及RISC-V人才暨<b class='flag-5'>開源</b><b class='flag-5'>技術</b>與<b class='flag-5'>生態</b>之旅
    主站蜘蛛池模板: 国产精品亚洲一区二区三区在线播放 | 亚洲午夜免费视频 | 日本一本视频 | 色香蕉在线 | 天天操丝袜 | 美女被免费网站在线视频九色 | 日本午夜大片免费观看视频 | 精品你懂的 | 综合精品| 国产香蕉视频在线播放 | 高清视频在线观看+免费 | 人人舔| 男女同床爽爽视频免费 | 欧美巨波霸乳影院67194 | 毛片视频免费网站 | 免费人成年短视频在线观看免费网站 | 色婷婷综合久久久 | 日本丝瓜着色视频 | 日日搞夜夜操 | 热久久综合这里只有精品电影 | 四虎影院在线免费观看视频 | 午夜爱爱网站 | 性欧美video视频另类 | 1024你懂的在线观看 | 久久免费视频精品 | 性欧美xxxx | 综合色影院 | 97色网| 免费网站看av片 | 好硬好大好爽女房东在线观看 | 操你啦网站| 夜夜嘿视频免费看 | 又粗又大撑满了好爽 | 中出丰满大乳中文字幕 | 天天狠天天操 | 操您啦 | 91成人免费视频 | 男女一级大黄 | 日本在线观看www | 日本黄色免费大片 | 色噜噜成人综合网站 |