作者:一號
編輯:美美
沉寂多時(shí)的AI巨頭商湯,這次站在了市場焦點(diǎn)上。
股價(jià)沉寂多日的AI巨頭商湯,在4月24日迎來了大爆發(fā),當(dāng)日股價(jià)飆升31.15%。這樣的大漲行情,也讓商湯成為了市場焦點(diǎn),在當(dāng)天上午11時(shí)15分起,公司股票暫停了買賣。
而到了4月25日,商湯已漲超15%,如此火熱的背后,是商湯在4月23日推出了其6000億參數(shù)的大模型“日日新5.0”,在知識、數(shù)學(xué)、推理和代碼能力方面大幅提升,綜合性能甚至能夠全面對標(biāo)GPT-4 Turbo。
誰能想到,如此火熱的商湯,在之前還面臨著虧損危機(jī)。
暴打GPT-4,推理速度快到看不清
目前市場上將商湯近期股價(jià)暴漲歸功于其日前發(fā)布的“日日新5.0”大模型。第一代“日日新”大模型體系發(fā)布于2023年4月,并在同年8月獲批上線。據(jù)其官網(wǎng)資料顯示,日日新大模型體系包括了商量大語言模型、秒畫文生圖大模型、語音大模型和向量模型等。
時(shí)隔一年,“日日新5.0”正式誕生,它基于超過10TB tokens訓(xùn)練,覆蓋了大量合成數(shù)據(jù);同時(shí)也采用了當(dāng)前業(yè)內(nèi)主流的混合專家架構(gòu)(MoE架構(gòu)),上下文窗口可達(dá)到200K左右,在綜合能力上,可以全面對標(biāo)GPT-4 Turbo,“主流客觀評測上達(dá)到或超越GPT-4 Turbo”。
在發(fā)布會(huì)現(xiàn)場上,商湯還上演了一次《街頭霸王》游戲PK,兩個(gè)角色分別由商湯新發(fā)布的日日新端側(cè)大模型SenseChat Life(商量輕量版)和GPT-4操縱,其中綠人由GPT-4操縱,紅人則由商量輕量版操作,當(dāng)GPT-4還在思考如何決策時(shí),商量輕量版的拳頭就已經(jīng)打了上去,名副其實(shí)的“暴打GPT-4”,生動(dòng)地體現(xiàn)了商量輕量版推理速度之快。
而且它還是一個(gè)端側(cè)大模型,采用了端云聯(lián)動(dòng)的MoE框架,“以小博大”,已經(jīng)在多項(xiàng)測試中擊敗了Llama2-7B,甚至是13B,在同等尺度上性能已經(jīng)達(dá)到了SOTA水平。在中等性能手機(jī)上,商量輕量版可以達(dá)到18.3字/秒的推理速度,而人眼一般的閱讀速度為20字/秒。而在高端旗艦手機(jī)上,它的推理速度更是可以達(dá)到78.3字/秒。
大版本升級,全面對標(biāo)GPT-4 Turbo
除了端側(cè)大模型的展示,商湯在此次發(fā)布會(huì)上還在“大基座”方面,把自家的日日新大模型來了個(gè)大版本升級——日日新SenseNova 5.0,全面對標(biāo)GPT-4 Turbo!
從評測榜單的數(shù)據(jù)上來看,商量5.0在常規(guī)客觀評測已經(jīng)達(dá)到或超越了GPT-4 Turbo。其主要依靠兩點(diǎn)做到了這一點(diǎn),一是數(shù)據(jù),二是算力。首先,商湯采用了超過10T的tokens,讓日日新5.0具備了高質(zhì)量數(shù)據(jù)的完備性,此外,商湯還合成構(gòu)造了高達(dá)數(shù)千億tokens的思維鏈數(shù)據(jù),以激活大模型推理的能力。
在算力方面,商湯將算法設(shè)計(jì)和算力設(shè)施進(jìn)行了聯(lián)合的優(yōu)化:算力設(shè)施的拓?fù)錁O限用來定義下一階段的算法,而算法上的新進(jìn)展又要重新指導(dǎo)算力設(shè)施的建設(shè)。
整體上來說,日日新5.0的亮點(diǎn)可以總結(jié)為:①采用MoE架構(gòu);②基于超過10TB tokens訓(xùn)練,擁有大量合成數(shù)據(jù);③推理上下文窗口達(dá)到200K;④知識、推理、數(shù)學(xué)和代碼等能力全面對標(biāo)GPT-4 Turbo。
在多模態(tài)能力方面,日日新5.0也有整體的提升,在識圖、生圖以及代碼能力等方面均可比肩行業(yè)領(lǐng)先模型,可以說是夠全面了,這也是商湯所一直強(qiáng)調(diào)的“大模型+大裝置”的打法。
股價(jià)暴漲之后,商湯能否走出虧損陰云?
作為“AI四小龍”之首的商湯,不久前,剛發(fā)布了2023年年度業(yè)績公告,公司實(shí)現(xiàn)營收34億元,同比下滑10.6%;年度虧損64.95億元,較2022年同期的60.93億元增加了6.6%,自2018年以來,商湯已經(jīng)虧損了近500億。
但與此同時(shí),年報(bào)顯示,生成式AI成為了商湯業(yè)績的亮點(diǎn),生成式AI收入突破11.84億元,實(shí)現(xiàn)199.9%的飛速增長,占公司總收入的比例由2022年的10.4%提升到了34.8%。因此,商湯在2024年戰(zhàn)略目標(biāo)中提到,推動(dòng)核心業(yè)務(wù)盈利,集中資源于生成式AI業(yè)務(wù)以改善現(xiàn)金流和減少虧損。
可見,商湯正在踐行這一目標(biāo),在日日新5.0的發(fā)布會(huì)上,商湯也交出了一份客戶的使用反饋。華為、WPS、小米、閱文、海通證券,從辦公到文娛,從金融到終端,均分享了他們使用商湯日日新大模型體系后,給自身業(yè)務(wù)帶來的獎(jiǎng)杯呢增效,也因此,商湯股價(jià)在發(fā)布會(huì)之后迎來了大漲。
可見,有技術(shù)、有算力、有方法論還有使用場景的商湯,或許真的成功轉(zhuǎn)型稱為生成式AI新的龍頭,在AIGC時(shí)代,獲得不錯(cuò)的發(fā)展。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
88文章
34778瀏覽量
277044 -
AIGC
+關(guān)注
關(guān)注
1文章
385瀏覽量
2363
發(fā)布評論請先 登錄
商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型
商湯科技日日新V6大模型斬獲“雙料第一” 一項(xiàng)國內(nèi)榜首,一個(gè)全球第一

評論