商湯日日新·商量大模型位列國內大模型第一梯隊

模型表現好，金牌少不了。

剛剛，中文大模型測評基準SuperCLUE發布《中文大模型基準測評2024年10月報告》：

商湯日日新·商量大模型(SenseChat5.5)憑借出色的能力表現，總得分位列國內大模型第一梯隊，獲得金牌。

本次SuperCLUE10月報告覆蓋23個國內模型，聚焦語言大模型的通用能力評估，分為三大維度：除了考察“文科”、“理科”基礎能力外，還有考察模型更高階能力的“Hard”附加任務，總共2900+道題：

【理科任務】分為計算、邏輯推理、代碼、工具使用測評集;

【文科任務】分為知識百科、語言理解、長文本、角色扮演、生成與創作、安全六大測評集;

【Hard任務】分為精確指令遵循測評集，復雜任務高階推理測評集。

商湯SenseChat5.5在多項評測任務中均位列第一梯隊，文科中語言理解、安全等維度表現突出，也是理科中邏輯推理、代碼學科的“尖子生”。

值得注意的是，在【Hard】的兩項任務——精準指令遵循和高階推理中，商湯SenseChat5.5是唯一兩項任務均位于國內第一梯隊的大模型，體現了模型優秀的復雜推理智能。

未來，商湯將繼續堅持基礎大模型的持續研發與投入，不斷提升真正高階推理及“慢思考”能力。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

商湯科技

商湯科技

+關注

關注
8

文章
556

瀏覽量
36686
大模型

大模型

+關注

關注
2

文章
3058

瀏覽量
3888

原文標題：近3000道題，商湯大模型拿了金牌

文章出處：【微信號：SenseTime2017，微信公眾號：商湯科技SenseTime】歡迎添加關注！文章轉載請注明出處。

商湯科技SenseTime
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot SenseCare胸部X線輔助診斷軟件通過歐盟CE認證
Hot 基于單目圖像的深度估計算法，大幅度提升基于單目圖像深度估計的精度

New 爆款應用背后的商湯大裝置
New 商湯科技與東明石化、好雅創科簽署戰略合作協議

精選推薦
更多

文章

資料

帖子

SiC MOSFET模塊的損耗計算

三菱電機半導體
7小時前

258 閱讀

適用TI ADS1299器件的ADS129x設備SPI通信問題調試步驟教程

向上
9小時前

210 閱讀

5G-A與AI共舞，廣東移動烹出高鐵網絡加速包

腦極體
14小時前

438 閱讀

性能提升2.7倍！索尼推出新款車載激光雷達傳感器，助力L3級自動駕駛落地

章鷹觀察
14小時前

2774 閱讀

LHE7909與ADS1299兩款模數轉換器(ADC)在腦電圖實驗中的對比測試

領慧立芯
15小時前

372 閱讀

Gitleaks git存儲庫中的敏感信息檢測

李歡
0.14 MB

2積分

1下載

Firefox Send簡單的文件加密共享

王銀喜
6.02 MB

2積分

1下載

WSLg在Windows上無縫運行Linux GUI程序

siyugege
1.38 MB

免費

0下載

Diy Lillypad Arduino

王磊
0.06 MB

5積分

25下載

72×4/68x8/60x16 LCD顯示驅動芯片VK2C24數據手冊

駱宇祺
8.57 MB

免費

0下載

【正點原子STM32MP257開發板試用】4.人臉識別體驗

jf_47210120
1天前

132 閱讀

過孔處理：SMT訂單中的隱形裁判

鄒夢雨
1天前

158 閱讀

30V30A開關電源電路圖

yuu_cool
1天前

157 閱讀

HarmonyOS NEXT意圖框架習慣推薦一場景說明

李洋水蛟龍
1天前

166 閱讀

反激電源——TL431及光耦反饋電路計算

yuu_cool
1天前

137 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

商湯日日新·商量大模型位列國內大模型第一梯隊

評論