在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國內大模型爭霸賽,你最看好哪家?

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-05-19 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI Vs Google

e597a338-f620-11ed-90ce-dac502259ad0.png

目前大模型 top2 應該就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。這兩家公司早已布局,而且技術實力雄厚。國內大模型和 GPT-4 相比,還是有比較大的差距。

但是國內的勢頭目前不錯,百家齊鳴,還沒有一家有絕對的優勢。

讓人頭暈的排名

e5a19d3e-f620-11ed-90ce-dac502259ad0.png

之前有媒體給出了目前國內Top-5的大模型公司,分別是:百度的文心一言、阿里的通義千問、騰訊的混元、華為的盤古以及360的智腦。

而最近,中文通用大模型基準(SuperCLUE)評測公布了最新結果,GPT-4 遙遙領先,而國內成績最好的是科大訊飛的星火認知大模型。這里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分還低,實在難以置信。

e5aa4c36-f620-11ed-90ce-dac502259ad0.png

但是我又仔細看了一下這個評測。媽呀,評測集是SuperCLUE,而非SuperGLUE。

眾所周知,在國際NLP領域,有大名鼎鼎的數據集 GLUE 和 SuperGLUE,非常權威,OpenAI、谷歌等的大模型都在上面評測,極大推動了 NLP 領域的發展。

這次這份 SuperCLUE 評測的發起方為 Chinese GLUE 組織 (簡稱 CLUE),CLUE 是仿照 GLUE由國內民間組織的評測,權威度和影響力與 GLUE 相比差很遠,其微信賬號主體屬性為個人。但這也迷惑了不少圈內人,GLUE和 CLUE 分不清楚,堪稱李逵和李鬼。

還有一點存疑,評測榜單發布當天5月9日,其官網顯示信息,中文基準測評成員顧問中排名第一的是崔一鳴,身份為學術顧問委員會主任,哈工大訊飛聯合實驗室(HFL)資深級研究員。而5月10日,官網已刪除此條顧問的信息。

而001號創始會員徐亮,是會長,相當于這個榜單的實際負責人。昵稱 brightmart,中文任務基準測評發起人。多個預訓練模型中文版、文本分類和數據集開源項目作者。

徐亮還有另一個身份,在5月9日官網中顯示,他是杭州實在智能算法專家,也就是元語智能的創始人,曾在2月份發布自稱“國內首個功能對話大模型ChatYuan”,不僅無法測試,發布幾天即被監管叫停。4月,又被報道套殼推出開源組件。有分析人士認為,不排除創業公司有融資壓力,蹭熱度吸引投資人關注。

該 SpuerClue 榜單發起方,001號顧問是訊飛身份背景、001號基準發起人是創業公司創始人。在榜單發布后,擔心行業質疑其公平、公正,相關信息還被刪除。這就有點不言而喻了。

僅用100道評測題目就出來了一份“權威報告”

最后來說下這個榜單本身,業內人士一眼就可以看出來,評測的很不合理,首先,沒有公布評估數據,以及具體的評估方式。同時從它的公開表述,可推斷總共題目就 100 道題目。這個題目量少到難以置信。專業人士可能有參與過,像國際權威 SuperGlue 榜單,題目一般都得有 2 萬多道,離權威可是差了幾萬倍。況且,它的評測得分榜首都是人類,那這個評分的基準到底是什么?是否有很多主觀性因素在里面?是否某些大模型提前在這個數據集上已經訓練過?

任務設計太武斷,所謂“通用”基準,是用以測試通用的人工認知能力的,那么我們自然希望,評測任務是參考了模型想要模擬的認知能力及相關理論,系統化地選擇出來的。而實際上,我們觀察到的則是,基準的作者們在選擇任務的時候,更像是圖方便、省事。以往,CLUE 中存在著部分數據集,一味考慮任務的復雜性,卻在最起碼的分布邊界劃分上(如NER各個類別的邊界,如場所、景點類,組織機構及其子類),模糊不清,且數據的一致性無法保證。

要么別比,要比就來點正規的比賽。自己出題自己考,說不準還搶跑,自己還是評委,那這是欺不負了解真相的吃瓜群眾。投機取巧,終皆散去。苦練內功,才是王道。

國內大模型排名(僅供參考)

拋開這些,從模型規模、模型效果、市場占有率等多個角度,百度的文心一言、華為的盤古、阿里的通義千問、騰訊的混元排在前四,應該是比較合理的,至于后面的排名,就不大能保證了。不過下面的排名也可以參考一下:

e5b3b104-f620-11ed-90ce-dac502259ad0.png

下面是一份完整的名單:

e5b8a9b6-f620-11ed-90ce-dac502259ad0.png

e5c31432-f620-11ed-90ce-dac502259ad0.png

按發布時間排序:

e5c914ea-f620-11ed-90ce-dac502259ad0.png

百度:文心一言

作為國內最早發布的大模型,百度的文心一言在今年3月16號就發布了,隨后經過了多個版本的迭代。目前已經有上千家企業接入。文心一言支持圖片、語音等多模態。

3月16日,百度在全球大廠中率先發布對標 ChatGPT 的大模型產品文心一言。據了解,文心一言內測一個多月,就完成了4次大的技術升級,大模型推理性能提升近10倍。

李彥宏在5月4日百度內部活動中表示,百度之所以能夠在Google、Meta、Amazon等大廠之前率先發布生成式大模型產品,是因為百度在芯片、框架、模型、應用等四個層面做到全棧布局、層層領先。

360:360智腦

百度是國內搜索市場排名第一公司,而排名第二就是360。

大模型依靠的算力、數據、算法、場景,這兩家公司都具備,這也是搜索公司的優勢,有業務和數據支撐大模型研發和落地。

5月16日,360集團和智譜AI宣布達成戰略合作,雙方共同研發的千億級大模型“360GLM”已具備新一代認知智能通用模型水準。

而在今天的世界智能大會上,周鴻祎展示了“360智腦”的多輪對話和“360鴻圖”的AI生圖兩個能力。

e5d272d8-f620-11ed-90ce-dac502259ad0.png

就像谷歌和微軟,一個擁有谷歌搜索,一個擁有必應。國內的百度和360,一個擁有百度搜索,一個擁有360搜索。

搜索公司應該是這場大模型爭霸賽最后的贏家。(只是個人看法)

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3501

    瀏覽量

    50165
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    15997
  • OpenAI
    +關注

    關注

    9

    文章

    1204

    瀏覽量

    8717

原文標題:國內大模型爭霸賽,你最看好哪家?這是你心目中的大模型排名嗎?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    可編程SLIC語音芯片哪家好?

    呢?思電子科技無疑是其中的佼佼者。思電子科技作為國內知名的數?;旌闲酒瑥S商,在可編程SLIC語音芯片領域展現出了強大的實力。其推出的ASX630系列芯片,堪稱
    的頭像 發表于 06-12 13:55 ?165次閱讀
    可編程SLIC語音芯片<b class='flag-5'>哪家</b>好?

    商湯日日新SenseNova融合模態大模型 國內首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態大模型首輪評估。 商湯日日新SenseNova融合模態大模型在所有模型中,獲得當前最高評級——4+級,并成為國內首家
    的頭像 發表于 06-11 11:57 ?518次閱讀

    手表芯片多強爭霸賽開啟!小米玄戒T1入局,格局生變?

    電子發燒友網報道(文/莫婷婷)當前,國內可穿戴設備主控芯片市場呈現出“一超多強、梯度競爭”的競爭態勢,就在5月,小米重磅推出智能手表玄戒T1,在通信性能、功耗控制和功能擴展方面展現了新的突破,標志著
    的頭像 發表于 05-29 01:05 ?7533次閱讀
    手表芯片多強<b class='flag-5'>爭霸賽</b>開啟!小米玄戒T1入局,格局生變?

    當我問DeepSeek國內壓力傳感器哪家強,它這樣回答

    特意問DeepSeek國內壓力傳感器發展現狀,以及國內壓力傳感器到底哪家強,DeepSeek這樣回復我——壓力傳感器在工業自動化、汽車電子和醫療設備領域有著廣泛應
    的頭像 發表于 05-28 14:48 ?222次閱讀
    當我問DeepSeek<b class='flag-5'>國內</b>壓力傳感器<b class='flag-5'>哪家</b>強,它這樣回答

    時鐘系統推薦,時鐘系統哪家好?思時鐘系統助力中國氣象科學研究院構建智慧氣象網絡

    時鐘系統推薦,時鐘系統哪家好?思時鐘系統助力中國氣象科學研究院構建智慧氣象網絡
    的頭像 發表于 05-20 09:32 ?290次閱讀
    時鐘系統推薦,時鐘系統<b class='flag-5'>哪家</b>好?<b class='flag-5'>賽</b>思時鐘系統助力中國氣象科學研究院構建智慧氣象網絡

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸
    的頭像 發表于 05-17 17:31 ?196次閱讀
    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄<b class='flag-5'>爭霸</b>”

    西威端側大模型重塑智能座艙體驗

    智能汽車產業發展正從規模擴張向質量躍升轉變,其中大模型驅動的智能化升級將成為產業突破的核心引擎。在日前召開的2025上海車展國際汽車關鍵技術論壇上,德西威技術中心人工智能實驗室專家張書赫博士以《端側智能·重塑體驗》為題,分享了對大模型
    的頭像 發表于 05-15 09:13 ?1065次閱讀

    西威與面壁智能發布端側大模型語音交互方案

    日前,全球領先的移動出行科技公司德西威與端側大模型技術領軍企業面壁智能共同發布業界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側大模型語音交互方案,這是雙方自2024年12月簽署戰略合作協議以來發布的首個合作成果。
    的頭像 發表于 05-14 17:40 ?524次閱讀

    當 RDK X3 遇上倉儲機器人,智鏈團隊讓效率原地起飛

    倉儲界現在是"卷王"爭霸賽!2023年全國消費狂飆47萬億,網購更是坐火箭般漲了11%,但老派倉儲還在用"人海戰術",設備像戴著近視眼鏡,看啥都不清不楚。別急
    的頭像 發表于 04-21 01:18 ?237次閱讀
    當 RDK X3 遇上倉儲機器人,智鏈團隊讓效率原地起飛

    智慧路燈哪家強?看完這些案例就心里有數了

    智慧路燈哪家強?看完這些案例就心里有數了
    的頭像 發表于 11-14 18:05 ?763次閱讀
    智慧路燈<b class='flag-5'>哪家</b>強?看完這些案例<b class='flag-5'>你</b>就心里有數了

    第一屆“澎峰云?大模型AI校園應用創新完美結束

    在大模型人工智能的浪潮中,澎峰科技與中科曙光強強聯合,共同打造了一場大模型AI創新應用盛宴——第一屆“澎峰云?大模型 AI 校園應用創新”。這場賽事不僅是技術的較量,更是智慧的火花碰
    的頭像 發表于 11-11 10:59 ?681次閱讀

    GAP!對AI大模型到底了解多少?

    談到 AI 大模型,最先想到的是什么?很多人首先關心的還是它的商業變現,而非這些技術術語。AI 大模型訓練是一個端到端的復雜系統工程,技術門檻很高,需要強大的算力支撐,尤其是參數量大的模型
    的頭像 發表于 09-07 09:40 ?964次閱讀

    【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)

    接入文心一言、通義千問、豆包、智譜glm、kimi等國內的大模型,但由于各家接口和數據格式不一樣,調試驗證會浪費很多時間。因此本篇以聆思CSK6大模型開發板接入為例,分享具體的接入步驟和接入模板,大家
    發表于 08-22 10:12

    思爾芯題正式發布,邀共戰EDA精英挑戰!

    題發布COMPETITIONRELEASE2024中國研究生創芯大賽·EDA精英挑戰(原“集成電路EDA設計精英挑戰”)現已正式拉開帷幕。作為核心出題企業之一思爾芯(S2C),已經為你們準備了
    的頭像 發表于 08-03 08:24 ?1063次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發布,邀<b class='flag-5'>你</b>共戰EDA精英挑戰<b class='flag-5'>賽</b>!

    基于大模型的仿真系統研究一——三維重建大模型

    問題,目推出了基于大模型的仿真系統,利用機器學習、深度學習等人工智能技術,不僅推出自動標注大模型、多模態檢測大模型和場景生成大模型等模塊,
    的頭像 發表于 07-30 14:51 ?2561次閱讀
    基于大<b class='flag-5'>模型</b>的仿真系統研究一——三維重建大<b class='flag-5'>模型</b>
    主站蜘蛛池模板: 黄色短视频免费观看 | 人与牲动交xxxbbb | 一二三四日本视频社区 | 四虎精品影院在线观看视频 | 国产精品三级在线播放 | 2018天天弄| 三级毛片在线看 | 激情九月婷婷 | 亚洲综合精品一区二区三区中文 | 视频一区 在线 | 恐怖片大全恐怖片免费观看好看的恐怖片 | 一级毛片aaa片免费观看 | 午夜免费福利在线观看 | 日本一卡二卡3卡四卡网站精品 | 桃桃酱无缝丝袜在线播放 | 狠狠婷婷 | 天天摸夜班摸天天碰 | 国产高清免费在线观看 | 男人天堂网在线观看 | 九九九国产在线 | 黄网站免费视频 | 手机在线看片国产 | 国产欧美日韩va | 久热中文字幕在线精品免费 | 欧美一级一一特黄 | bt天堂在线最新版在线 | 在线免费看高清视频大全 | 福利视频自拍偷拍 | 亚洲精品美女久久久aaa | 欧美深深色噜噜狠狠yyy | 天天操天天干天天爽 | 一区二区三区视频网站 | 欧美三级欧美一级 | 69xxx网站| 美女免费视频色在线观看 | 办公室桌震娇喘视频大全在线 | 国语自产免费精品视频一区二区 | 美国bj69video18视频 | 免费看日本黄色片 | 高清xxx | 免费午夜视频 |