智譜AI領跑司南OpenCompass 2.0月度榜單，GLM-4展示強大實力

近期，大模型開源開放評測體系司南（OpenCompass 2.0）公布了2024年4月大語言模型最新評測榜單，智譜AI的GLM-4繼續保持國產大模型第一的領先身位。

大模型開源開放評測體系司南（OpenCompass 2.0）由上海人工智能實驗室發布。其月度榜單從基礎能力和綜合能力的設計出發，構建了一套高質量的中英文雙語評測基準體系，對主流開源模型和商業API模型進行了全面評測分析。評測榜單涉及的大語言模型和多模態大模型超過150個，更有包括Meta、阿里巴巴、騰訊、百度等30余家國內外企業和科研機構采用OpenCompass助力開展技術研發。

在4月客觀評測榜單中，OpenCompass基于語言、知識、推理、數學、代碼、智能體六個維度構建了15000余道高質量中英文雙語問題，并引入OpenCompass團隊首創的循環評估 (Circular Evalution) 策略，系統性分析了國內外大模型的客觀性能。其中，GLM-4位列第四名，僅次于GPT-4-Turbo系列與Claude3-Opus，成為國內大模型客觀評測月度總榜第一名。在語言維度方面，GLM-4分數達到57.7分表現突出，超過GPT-4-Turbo系列與Claude3-Opus。在知識維度上，GLM-4得到68.9分，超過第二名的GPT-4-Turbo-1106，與第三名Claude3-Opus不相上下。

值得一提的是，GLM-4此前便長期占據OpenCompass 2.0榜單前列，并多次在權威榜單與全球頂級大模型一較高下。清華《SuperBench大模型綜合能力評測報告》顯示，GLM-4在語義理解等方面的能力表現超過了GPT-4-Turbo等國際一流模型，在代碼、智能體等方面，排名國內第一。在SuperCLUE-Fin(SC-Fin)中文原生金融大模型測評基準中，GLM-4斬獲一項A+及多項A級評價，在國內大模型中排名第一。

據了解，GLM-4是由智譜AI于今年1月推出的新一代基座大模型。GLM-4整體性能逼近GPT-4，它可以支持更長的上下文，具備更強的多模態能力。同時，它的推理速度更快，支持更高的并發，大大降低推理成本。依托GLM-4 All Tools能力，GLM-4智能體能夠實現自主根據用戶意圖，自動理解、規劃復雜指令，自由調用網頁瀏覽器、Code Interpreter代碼解釋器和多模態文生圖大模型以完成復雜任務。

開發者可以通過智譜AI大模型開放平臺bigmodel.cn接入GLM-4模型開放API，便捷高效地體驗GLM-4的強大能力。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

API

API

+關注

關注
2

文章
1595

瀏覽量
63931
AI

AI

+關注

關注
88

文章
35007

瀏覽量
278709
開源

開源

+關注

關注
3

文章
3668

瀏覽量
43768
大模型

大模型

+關注

關注
2

文章
3124

瀏覽量
4034

獨角獸科技
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 史上最全百吋陣營！海信電視新品被曝畫質“炸裂”，或掀市場新風暴？
Hot 解讀NFC技術原理，所謂“NFC風險”皆為妄言！

New 高精度三維掃描助力中埃聯合考古，揭示“薩卡拉的秘密”
New LeadeRobot具身智能應用標桿：柔韌自動充電機器人加速智能化出行體驗閉環

精選推薦
更多

文章

資料

帖子

CW/CCW，無霍爾感應：310V無刷工業高壓風扇驅動方案--【其利天下】

其利天下技術
15分鐘前

3 閱讀

Allegro Skill工藝輔助之導入疊層模板

凡億PCB
1小時前

117 閱讀

從手寫代碼到AUTOSAR工具鏈：J1939Tp應用篇

ETAS易特馳
1小時前

123 閱讀

樹莓派WiFi設置終極指南：分步方法與故障排除技巧！

上海晶珩電子科技有限公司
2小時前

132 閱讀

安森美EliteSiC MOSFET與柵極驅動器在電動汽車電力系統的應用

安森美
2小時前

175 閱讀

LG等離子屏電源板(V6,V7)電路原理及維修

lanlanw
14.8 MB

免費

635下載

kvstore Redis集群解決方案

gvxiaot
2.02 MB

2積分

1下載

NewsCommentLayout仿網易客戶端跟帖蓋樓布局

姬房有
0.16 MB

2積分

2下載

MHImageTabBar iOS選擇卡

李紅
0.07 MB

免費

0下載

Arduino合成器V3設計案例

張強
0.01 MB

2積分

3下載

無位置傳感器無刷直流電機的＋FPGA＋控制實現

jf_89421697
18小時前

42 閱讀

【RK3568+PG2L50H開發板實驗例程】FPGA部分 | 光纖通信測試實驗例程

jf_10450402
18小時前

169 閱讀

HarmonyOS AI輔助編程工具（CodeGenie）UI生成

李洋水蛟龍
18小時前

159 閱讀

【匯思博SEEK100開發板試用體驗】05 天氣app開發--支持24小時+7天天氣預報

jf_83922529
2天前

129 閱讀

這次你說了算！先楫半導體開發者生態技術日

Lisa_cab
18小時前

156 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

智譜AI領跑司南OpenCompass 2.0月度榜單，GLM-4展示強大實力

評論