衛(wèi)冕“雙冠”! 通用語言能力并列國內(nèi)榜首、多模態(tài)能力全球最強,商湯「日日新V6」近期斬獲“雙料第一”。
5月28日,權(quán)威大模型測評機構(gòu)SuperCLUE《中文大模型基準測評2025年5月報告》全新出爐!商湯「日日新 V6」(SenseNova-V6 Reasoner)憑借出色的綜合能力表現(xiàn),以62.96分的優(yōu)異成績,與Doubao-1.5-thinking-pro并列國內(nèi)第一,摘得金牌,并在智能體Agent測試任務(wù)中獲得國內(nèi)最高分。
同時,根據(jù)Hugging Face——全球最大的AI開源社區(qū)上的數(shù)據(jù),在Open Compass本月的多模態(tài)大模型評測榜單中,商湯「日日新 V6」(SenseNova-V6 Pro)曾以80.4的總分,超越Gemini 2.5 Pro,位居第一,成為全球最強多模態(tài)大模型。
這是商湯日日新大模型半年內(nèi)第二次斬獲“雙冠”! 今年年初,商湯日日新就用同一個模型,在SuperCLUE《中文大模型基準測評2024年度報告》評測和OpenCompass多模態(tài)多模態(tài)評測中,獲得雙第一,不但引發(fā)強烈關(guān)注,還引領(lǐng)了業(yè)界大語言模型和多模態(tài)大模型的一統(tǒng)化大潮。 此次成功衛(wèi)冕“雙冠”——同時在通用語言和多模態(tài)兩大權(quán)威榜單中奪冠,意味著商湯「日日新V6」已成為全球最領(lǐng)先的大模型之一,持續(xù)引領(lǐng)多模態(tài)大模型突破AI能力邊界。
憑借多模態(tài)長思維鏈訓(xùn)練、全局記憶、強化學(xué)習(xí)等技術(shù)創(chuàng)新,商湯「日日新V6」以單一模型即可完成文本、多模態(tài)等多種任務(wù),在推理、數(shù)理、代碼等方面擁有顯著優(yōu)勢,能夠深度理解人類意圖,處理各類復(fù)雜信息和復(fù)雜問題,為真實的業(yè)務(wù)應(yīng)用提供強大助力。同時,商湯「日日新 V6」的多模態(tài)訓(xùn)練整體效率對齊語言訓(xùn)練,實現(xiàn)業(yè)內(nèi)最優(yōu)水平,推理成本亦實現(xiàn)業(yè)界最低。
得益于高效能與低成本的完美結(jié)合,商湯「日日新V6」自今年4月發(fā)布以來,獲得了行業(yè)各界的廣泛支持,已在具身智能、智慧教育、智慧文旅等領(lǐng)域攜手多家合作伙伴,將共同推動多行業(yè)、多場景落地。
秉承“大裝置-大模型-應(yīng)用”三位一體的發(fā)展戰(zhàn)略,商湯科技通過AI基礎(chǔ)設(shè)施系統(tǒng)與模型算法的聯(lián)合優(yōu)化,使模型的多模態(tài)和深度思考能力不斷提升,訓(xùn)練與推理成本持續(xù)降低,推動生成式AI飛速發(fā)展,快速融入“百姓之日用”。
-
商湯科技
+關(guān)注
關(guān)注
8文章
557瀏覽量
36692 -
大模型
+關(guān)注
關(guān)注
2文章
3062瀏覽量
3903
原文標題:一項國內(nèi)榜首,一個全球第一
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論