基于“大模型+大算力”推進AGI(通用人工智能)發展的戰略布局,商湯“日日新SenseNova”大模型體系,正式問世。這一大模型體系,可提供自然語言、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力,同時結合決策智能大模型,為AGI實現提供重要起點。
商湯不僅展示了“日日新SenseNova”大模型體系下的語言大模型,還展示了AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,還揭開了依托商湯AI大裝置SenseCore實現“大模型+大算力”融合創新的研發體系。
當前業界訓練大模型,對大算力的需求非常旺盛,而真正好用的基礎設施卻十分稀缺。
商湯歷時五年,建設了業界領先的AI大裝置,共有2萬7千塊GPU芯片卡,可輸出5000P的總算力,是亞洲目前最大的智能計算平臺之一。基于大裝置,商湯已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,持續演進能力并廣泛支持各種應用。
商湯科技董事長兼CEO徐立表示:“在AI大模型時代,數據、算法和算力這三要素在經歷新的演變,大模型參數量將以指數級速率提升,而數據量隨著多模態的引入也將大規模增長,因此必然會導致對算力需求的劇增。我們以商湯AI大裝置SenseCore打造AGI時代的基礎設施,并基于此將大模型體系命名為‘日日新’,寓意‘茍日新、日日新、又日新’,希望在模型迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”
商湯提供一個大模型的“超市”,在這個“日日新”大模型超市里面,有數據、模型訓練以及部署的三位一體的飛輪,以此來作為上下游合作的基礎。
“AGI催生了新的研究范式,即基于一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現從‘數據飛輪’到‘智慧飛輪’的演進,最終邁向人機共智。”商湯科技聯合創始人、首席科學家王曉剛表示:“商湯已建立全棧的大模型研發體系,并在多個行業場景中落地,場景的多樣性、任務的復雜度、數據的豐富度均充分展示了我們大模型的能力和未來潛力。商湯將持續推動基礎設施建設,期待和合作伙伴一起投入到AGI的時代大潮中。”
從以前的投喂數據,讓機器按照既定路線機械處理;到如今我們授“機”以漁,適當引導,它就能自己舉一反三,遇到新問題能自己處理。
“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,包括圖片生成、自然語言生成、視覺感知通用任務與標注服務,客戶可根據實際應用需求,調用日日新SenseNova大模型的各項AI技術能力,低門檻、低成本、高效率地實現各類AI應用。
自然語言是人機溝通的關鍵手段,“日日新SenseNova”也推出了商湯最新研發的語言大模型“商量SenseChat”。作為千億級參數的自然語言處理模型,“商量”使用大量數據訓練,并充分考慮了中文語境,能夠更好地理解和處理中文文本。
活動現場,“商量”展現了出色的多輪對話和超長文本的理解能力。商湯也展示了語言大模型支持的幾項創新應用:包括編程助手,可幫助開發者更高效地編寫和調試代碼;健康咨詢助手,為用戶提供個性化的醫療建議;PDF文件閱讀助手,能輕松從復雜文檔中提取和概括信息等。
擴散模型引爆了AIGC應用的流行,商湯“日日新SenseNova”也具有各種AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用。
“秒畫SenseMirage”文生圖創作平臺,展現了光影真實、細節豐富、風格多變的文生圖能力,可支持6K高清圖生成;客戶還可根據自身需求訓練生成模型。
“如影SenseAvatar”AI數字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。
“瓊宇SenseSpace”和“格物SenseThings”3D內容生成平臺,可以高效低成本生成大規模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。
大模型的發展,離不開大規模AI基礎設施的算力支持。
商湯AI大裝置SenseCore,擁有行業領先的算力輸出能力、超大模型訓練及大規模推理能力,將成為AGI和大模型時代的基礎設施服務領導者。
基于商湯AI大裝置SenseCore 和“日日新SenseNova”大模型體系,商湯面向行業伙伴提供涵蓋自動化數據標注、自定義大模型并行訓練、模型增量訓練、模型推理部署、開發者效率提升等多種大模型即服務(Model-as-a-Service)。
基于預訓練大模型的自動化數據標注可實現相較于人工數據標注近百倍的效率提升。
大模型并行訓練和模型增量訓練服務能夠幫助客戶快速利用自有數據訓練模型,包括在預訓練大模型之上進行垂域行業模型的開發,生產千行千面的自定義模型。
模型推理部署服務可將大模型推理效率提高100%以上,降低用模型提供服務的成本。
商湯也向行業開發人員開放大量預訓練模型及AI開發工具鏈,全面賦能客戶提升開發效率。
商湯將持續推進“日日新SenseNova”大模型體系建設。
商湯大模型研發期待在數據量上、參數結構上、以及能處理的問題上,可以日復一日地提高,攜手行業生態共同迎來更強大的AGI技術突破。
審核編輯:湯梓紅
-
gpu
+關注
關注
28文章
4788瀏覽量
129433 -
AI
+關注
關注
87文章
31711瀏覽量
270515 -
人工智能
+關注
關注
1796文章
47791瀏覽量
240581 -
商湯科技
+關注
關注
8文章
520瀏覽量
36185
原文標題:商湯“日日新SenseNova”大模型超市,來了!
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
商湯“日日新”融合大模型榮獲雙料冠軍
商湯科技推出“日日新”融合大模型
商湯日日新多模態大模型權威評測第一
商湯日日新大模型中標上海電信訂單
商湯科技"日日新SenseNova 5.5"大模型閃耀WAIC,引領AI新紀元
商湯“日日新”大模型全面賦能2024 WAIC
商湯科技發布日日新5.5大模型體系
中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內最好成績
![中文大<b class='flag-5'>模型</b>測評基準SuperCLUE:<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>5.0,刷新國內最好成績](https://file1.elecfans.com/web2/M00/E7/A4/wKgZomZMQ--ASmW1AABKUiL82nM339.png)
評論