在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型位居全球大模型第一梯隊(duì)

云知聲 ? 來(lái)源:云知聲 ? 2024-09-12 14:41 ? 次閱讀

SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2024上半年報(bào)告》,報(bào)告選取國(guó)內(nèi)外有代表性的33個(gè)大模型在6月份的版本,通過(guò)多維度綜合性測(cè)評(píng),對(duì)國(guó)內(nèi)外大模型發(fā)展現(xiàn)狀進(jìn)行觀察與思考。

報(bào)告顯示,云知聲山海大模型在本次半年度評(píng)測(cè)中取得總分72的優(yōu)異成績(jī),與360gpt2-pro、字節(jié)跳動(dòng)豆包、月之暗面Kimi、百川智能Baichuan4并列國(guó)內(nèi)大模型第四,穩(wěn)居全球大模型第一梯隊(duì)。

SuperCLUE作為國(guó)內(nèi)權(quán)威通用大模型綜合性測(cè)評(píng)基準(zhǔn),其前身可追溯至第三方中文語(yǔ)言理解評(píng)估基準(zhǔn)CLUE(The Chinese Language Understanding Evaluation)。自2019年成立以來(lái),CLUE基準(zhǔn)一直致力于提供科學(xué)、客觀、中立的語(yǔ)言模型評(píng)測(cè),其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多個(gè)被廣泛認(rèn)可的評(píng)估標(biāo)準(zhǔn)。根據(jù)CLUE多年測(cè)評(píng)經(jīng)驗(yàn),SuperCLUE基于通用大模型在學(xué)術(shù)、產(chǎn)業(yè)與用戶側(cè)的廣泛應(yīng)用,構(gòu)建了多層次、多維度的綜合性測(cè)評(píng)基準(zhǔn)。

作為一個(gè)完全獨(dú)立的第三方評(píng)測(cè)機(jī)構(gòu),SuperCLUE采用自動(dòng)化評(píng)測(cè)技術(shù),有效消除人為因素帶來(lái)的不確定性,確保提供無(wú)偏倚的客觀評(píng)測(cè)結(jié)果。不同于傳統(tǒng)測(cè)評(píng)通過(guò)選擇題形式的測(cè)評(píng),SuperCLUE納入開放主觀問(wèn)題的測(cè)評(píng),通過(guò)多維度多視角多層次的評(píng)測(cè)體系以及對(duì)話的形式,模擬大模型的應(yīng)用場(chǎng)景,真實(shí)有效考察模型生成能力。與此同時(shí),SuperCLUE根據(jù)全球的大模型技術(shù)發(fā)展趨勢(shì),不斷升級(jí)迭代測(cè)評(píng)體系、測(cè)評(píng)維度和方法,以保證盡可能精準(zhǔn)量化大模型的技術(shù)演進(jìn)程度。

為進(jìn)一步真實(shí)反映大模型能力,本次通用測(cè)評(píng)采用多維度、多層次的綜合性測(cè)評(píng)方案,由理科、文科和Hard三大維度構(gòu)成:理科任務(wù)分為計(jì)算、邏輯推理、代碼測(cè)評(píng)集;文科任務(wù)分為知識(shí)百科、語(yǔ)言理解、長(zhǎng)文本、角色扮演、生成與創(chuàng)作、安全和工具使用七大測(cè)評(píng)集;Hard任務(wù)聚焦精確指令遵循測(cè)評(píng)集,未來(lái)將陸續(xù)推出復(fù)雜多步推理和高難度問(wèn)題解決等評(píng)測(cè)。

從代表通用能力的一級(jí)總分來(lái)看,山海大模型得分72,與360gpt2-pro、字節(jié)跳動(dòng)豆包、月之暗面Kimi、百川智能Baichuan4并列國(guó)內(nèi)大模型第四,位居全球大模型第一梯隊(duì)。

具體到二級(jí)維度得分,山海大模型在理科和文科領(lǐng)域均表現(xiàn)優(yōu)異——在理科能力方面,山海大模型以76分的高分緊隨GPT-4o、GPT-4-Turbo-0409之后,力壓一眾國(guó)內(nèi)大模型,并列排名國(guó)內(nèi)第一;文科能力以75分的成績(jī)并列國(guó)內(nèi)第二,實(shí)力同樣不容小覷。

在SuperCLUE基于基礎(chǔ)能力和應(yīng)用能力兩個(gè)維度構(gòu)建的模型象限圖中,山海大模型被定位為“卓越領(lǐng)導(dǎo)者”。這一分類反映了山海大模型在基礎(chǔ)和場(chǎng)景應(yīng)用能力上均達(dá)到了領(lǐng)先水平,持續(xù)引領(lǐng)國(guó)內(nèi)大模型技術(shù)發(fā)展和創(chuàng)新。

此外,與GPT4-Turbo-0409的對(duì)戰(zhàn)勝率統(tǒng)計(jì)數(shù)據(jù)顯示,山海勝率為17.67%,和率為65.37%,位列國(guó)內(nèi)大模型第五,整體實(shí)力依舊不俗。

自2023年5月問(wèn)世以來(lái),山海大模型已相繼在C-Eval全球大模型綜合性評(píng)測(cè)、OpenCompass大模型評(píng)測(cè)、MedBench評(píng)測(cè)等多個(gè)權(quán)威評(píng)測(cè)中屢創(chuàng)佳績(jī),充分展現(xiàn)出業(yè)界一流的通用能力和領(lǐng)先于世界的行業(yè)大模型能力。

正如報(bào)告所言,隨著技術(shù)進(jìn)步和應(yīng)用場(chǎng)景拓展,2024年下半年國(guó)內(nèi)外大模型市場(chǎng)競(jìng)爭(zhēng)將持續(xù)加劇,推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)升級(jí)。接下來(lái),云知聲將繼續(xù)保持大模型能力穩(wěn)步提升,以山海為抓手,在產(chǎn)業(yè)側(cè)實(shí)現(xiàn)加速落地,致力成為真正助力各行各業(yè)的“新質(zhì)生產(chǎn)力”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    214

    瀏覽量

    8622
  • 字節(jié)跳動(dòng)
    +關(guān)注

    關(guān)注

    0

    文章

    345

    瀏覽量

    9295
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2961

    瀏覽量

    3714

原文標(biāo)題:SuperCLUE 2024半年度報(bào)告:云知聲山海大模型位居全球大模型第一梯隊(duì),理科能力國(guó)內(nèi)并列第一,文科能力并列國(guó)內(nèi)第二

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    商湯科技位列中國(guó)大模型應(yīng)用市場(chǎng)領(lǐng)域第一梯隊(duì)

    國(guó)際權(quán)威咨詢機(jī)構(gòu)IDC最新發(fā)布的《中國(guó)大模型應(yīng)用市場(chǎng)份額,2024:格局巨變》報(bào)告顯示,2024年中國(guó)大模型應(yīng)用市場(chǎng)規(guī)模達(dá)47.9億元人民幣,行業(yè)競(jìng)爭(zhēng)格局經(jīng)歷重大變革。在眾多技術(shù)企業(yè)的激烈競(jìng)爭(zhēng)中,商湯科技占據(jù)13.8%的市場(chǎng)份額進(jìn)入前三,位列中國(guó)大
    的頭像 發(fā)表于 03-19 15:00 ?463次閱讀

    商湯“日日新”融合大模型登頂大語(yǔ)言與多模態(tài)雙榜單

    據(jù)弗若斯特沙利文(Frost & Sullivan, 簡(jiǎn)稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國(guó)大模型年度評(píng)測(cè)》結(jié)果顯示:在語(yǔ)言和多模態(tài)核心能力測(cè)評(píng)中,商湯“日日新”融合大模型斬獲國(guó)內(nèi)第一梯隊(duì)成績(jī)。
    的頭像 發(fā)表于 03-18 10:35 ?412次閱讀

    商湯科技位列GenAI IaaS領(lǐng)域第一梯隊(duì)

    國(guó)際權(quán)威咨詢機(jī)構(gòu)IDC近日發(fā)布《中國(guó)智算服務(wù)市場(chǎng)(2024上半年)跟蹤》報(bào)告。報(bào)告顯示,2024年上半年,商湯科技作為國(guó)內(nèi)領(lǐng)先的智算服務(wù)商,以13.3%的市場(chǎng)份額穩(wěn)居GenAI IaaS市場(chǎng)Top3,位列GenAI IaaS領(lǐng)域第一梯隊(duì)
    的頭像 發(fā)表于 12-24 09:23 ?646次閱讀

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海模型的多元智慧場(chǎng)景

    ?? 12月6日,(上海)智能科技有限公司(以下簡(jiǎn)稱““)與上海英內(nèi)物聯(lián)網(wǎng)科技股份有
    的頭像 發(fā)表于 12-06 20:05 ?1157次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>的多元智慧場(chǎng)景

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領(lǐng)未來(lái)·向新而行—2024人工智能大模型產(chǎn)業(yè)大會(huì)在京召開,會(huì)上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,
    的頭像 發(fā)表于 11-29 17:52 ?787次閱讀

    商湯日日新·商量大模型位列國(guó)內(nèi)大模型第一梯隊(duì)

    剛剛,中文大模型測(cè)評(píng)基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測(cè)評(píng)2024年10月報(bào)告》。
    的頭像 發(fā)表于 11-08 15:38 ?826次閱讀

    山海模型多項(xiàng)能力全球領(lǐng)跑

    國(guó)內(nèi)人工智能權(quán)威機(jī)構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評(píng)測(cè)選取海內(nèi)外24個(gè)具有代表性的大模型,結(jié)果顯示,山海模型對(duì)齊、智能體、安全等多項(xiàng)能力
    的頭像 發(fā)表于 10-12 14:30 ?715次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>多項(xiàng)能力<b class='flag-5'>全球</b>領(lǐng)跑

    山海模型的訓(xùn)練優(yōu)化方法及應(yīng)用實(shí)踐

    由AI大模型工場(chǎng)主辦的AI大模型生態(tài)暨算力大會(huì)在京舉行。作為國(guó)內(nèi)最具影響力與最懂大模型的AI生態(tài)大會(huì),此次大會(huì)以「AI NATIVE,生成未來(lái)」為主題,圍繞大模型、算力、數(shù)據(jù)產(chǎn)業(yè)、基礎(chǔ)
    的頭像 發(fā)表于 10-12 14:12 ?531次閱讀

    山海多模態(tài)大模型UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    近日,多模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,山海多模態(tài)大模型UniGPT-mMed
    的頭像 發(fā)表于 10-12 14:09 ?561次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    山海模型醫(yī)療專業(yè)能力全球第一

    近日,由上海AI實(shí)驗(yàn)室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評(píng)測(cè)更新榜單,繼4月份奪冠后,山海模型醫(yī)療行業(yè)版(UniGP
    的頭像 發(fā)表于 09-19 15:47 ?622次閱讀

    山海模型助力司法領(lǐng)域智慧化升級(jí)

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?781次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來(lái)的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?540次閱讀

    GenAI IaaS增速驚人,商湯科技躋身第一梯隊(duì)

    ,與火山引擎、阿里巴巴共同躋身2023年下半年中國(guó)GenAI IaaS服務(wù)廠商TOP 3,以顯著的市場(chǎng)份額優(yōu)勢(shì)位居GenAI IaaS領(lǐng)域的第一梯隊(duì)
    的頭像 發(fā)表于 07-30 11:00 ?1018次閱讀
    GenAI IaaS增速驚人,商湯科技躋身<b class='flag-5'>第一梯隊(duì)</b>

    在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

    解決的課題。 2024高工智能汽車開發(fā)者大會(huì)暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來(lái)智能座艙交互新體驗(yàn)》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?1104次閱讀

    曝華為Mate 70將迎重大突破,性能重回第一梯隊(duì)!

    會(huì)很明顯,將重回第一梯隊(duì),而最快9月份發(fā)布。 此外,華為Mate 70系列的備貨量相比Mate 60系列將有顯著提升,預(yù)計(jì)增長(zhǎng)幅度在40%至50%之間。 這意味著相較于Mate 60系列的供應(yīng)緊張情況,Mate 70系列的市場(chǎng)供應(yīng)壓力將大為緩解。 在這之前,就已經(jīng)有消息稱,華為的新麒麟CPU已調(diào)試很好,
    的頭像 發(fā)表于 05-17 09:22 ?494次閱讀
    主站蜘蛛池模板: 激情伦成人综合小说 | 国语自产免费精品视频一区二区 | 乱小说录目伦800 | 亚洲免费小视频 | 婷婷操| 91啦中文在线观看 | 天天擦天天干 | 99精品久久久久久久婷婷 | 欧美一级特黄乱妇高清视频 | 日本免费黄视频 | 午夜影院在线视频 | 在线你懂的 | 在线精品一区二区三区 | 丁香婷婷综合网 | 久久99热久久精品99 | a级男女性高爱潮高清试 | xxxxxxxx日本69 | 免费一级牲交毛片 | 美国色网站 | 国产a一级毛片午夜剧场14 | 免费精品99久久国产综合精品 | 国产―笫一页―浮力影院xyz | 久久亚洲国产成人精品性色 | 免费一级特黄3大片视频 | 91极品视频在线观看 | 资源种子在线观看 | 欧美精品一区视频 | 色婷婷5月| 爽死你个放荡粗暴小淫视频 | 特黄aaaaa日本大片免费看 | 激情文学综合网 | 午夜国产福利在线观看 | 偷偷操不一样的久久 | 一级特黄女人生活片 | 国产馆精品推荐在线观看 | 2021久久天天躁狠狠躁夜夜 | 国产福利99| 如色网| 天天草天天| 国产黄色a三级三级三级 | 久久天天躁狠狠躁夜夜躁综合 |