“計算機技術的發(fā)展史告訴我們,當更多的計算能力交到開發(fā)者手中時,他們總能發(fā)掘出新的應用場景和更多的任務去解決以前所解決不了的問題,或者是更高程度的優(yōu)化以前的Solution。”——中軟國際金融AI實驗室主任簡仁賢
小執(zhí):歡迎簡總做客《前行者》訪談欄目!最近DeepSeek迅速出圈火爆全球,前不久您也剛接受了鳳凰衛(wèi)視直播間訪問。請問DeepSeek到底好在哪里?又會帶來怎樣的影響?
簡仁賢:DeepSeek憑借低成本、高效能的全開源模式,打破了訓練大語言模型需巨額投入,和大語言模型只有閉源模型才能夠做得最好的迷思。DeepSeek-V3基礎模型通過混合精度優(yōu)化、混合專家模型等技術,將訓練成本降低至十分之一甚至二十分之一;R1推理模型則通過多階段訓練大幅降低推理成本,顯著降低了AI模型開發(fā)的門檻。全開源優(yōu)勢讓開發(fā)者可直接基于現(xiàn)有成果微調,無需從零訓練。這些技術使DeepSeek以不到600萬美元成本訓練出與上億美元模型相當?shù)男阅埽破鹆艘粓鯝I革命。
今年,DeepSeek帶來的幾個重大的趨勢會更為明顯。閉源模型(如OpenAI)主導的"黑盒時代"正在終結,開源模型將成為主流;高端訓練芯片需求增長放緩,推理芯片市場爆發(fā);AI Agent將進一步繁榮,以及由此帶來的對數(shù)據(jù)中心和GPU計算資源的需求將持續(xù)上升。
小執(zhí):您能具體闡釋下DeepSeek帶來的這幾點影響嗎?
簡仁賢:DeepSeek的技術架構顯著降低了對高端硬件的依賴。傳統(tǒng)大模型訓練需數(shù)千塊高端GPU,而DeepSeek通過優(yōu)化算法,使得中小機構甚至可用消費級顯卡(如NVIDIA 4090)進行微調。低功耗、低成本顯卡(如未來NVIDIA 5090/6090)將成為主流,Mac mini等設備已能流暢運行DeepSeek 7B/14B模型。芯片毛利率或從當前的92%高位回落,推動硬件普惠化。由此,DeepSeek-R1增強技術進一步釋放潛力:通過注入領域專家數(shù)據(jù)(如醫(yī)療、法律、金融的鏈式思考數(shù)據(jù)),開發(fā)者能快速訓練出專業(yè)級模型,每個企業(yè)都可擁有專屬智能體。軟件架構開始深度集成開源模型生態(tài),DeepSeek的開源模式和多模態(tài)分析技術也將催生更多創(chuàng)新應用,一些缺乏透明度的閉源公司可能面臨泡沫化風險,被迫轉向開源架構或垂直場景。
企業(yè)可企業(yè)通過云端算力資源與本地化部署結合,自主部署本地模型,擺脫對云端模型API的依賴,實現(xiàn)"模型自由"。預計全球將有超10萬家企業(yè)基于其模型開發(fā)定制化智能體(如投資分析Agent、醫(yī)療診斷Agent),中小型企業(yè)首次獲得與大廠對等的AI能力。軟件行業(yè)迎來模型應用定制化服務紅利期。結合低訓練成本與開源生態(tài),可負擔的通用人工智能(Affordable AGI)將成為現(xiàn)實。
DeepSeek通過創(chuàng)新的技術整合(如混合專家模型、混合精度計算等),在保持強大推理能力的同時,大幅降低了AI模型的訓練和推理成本,降幅達50-60倍,調用價格也降低了96.3%。盡管單次計算成本下降,根據(jù)杰文斯悖論,技術效率提升往往會刺激需求增長。隨著AI在各行各業(yè)的廣泛應用(如醫(yī)療、教育、金融等),更多的場景模型和AI智能體將涌現(xiàn),帶動數(shù)據(jù)中心、邊緣及端側算力建設,驅動算力整體需求增長。
小執(zhí):基于以上改變,您對政府/企業(yè)決策者有什么建議?
簡仁賢:從微軟、亞馬遜、英偉達等科技巨頭,到Perplexity等企業(yè)都已經(jīng)上線DeepSeek,再到600萬美元訓練頂尖模型的成本突破,這場由開源力量驅動的變革,正在重構全球AI產業(yè)格局,從芯片、軟件到商業(yè)模式的未來的軟件的范式將因此革新。全球AI正實現(xiàn)從“主權AI”到平權AI”,開啟一個前所未有的創(chuàng)新爆炸時代。對于決策者而言,理解DeepSeek的技術貢獻與邏輯至關重要,在技術層,優(yōu)先采用開源架構,建立本地化模型部署能力,避免受制于閉源服務商;在戰(zhàn)略層,聚焦高質量領域數(shù)據(jù)積累,利用R1推理能力打造垂直場景護城河;在生態(tài)層,參與開源社區(qū)協(xié)作,推動模塊化Agent開發(fā),搶占AI軟件新生態(tài)的先機。
小執(zhí):對此,中軟國際有什么舉措?
簡仁賢:目前,中軟國際已將自主研發(fā)的JointPilot人工智能平臺接入DeepSeek-R1,中軟國際模型工場基于昇騰云、DeepSeek模型,推出升級版一站式AI解決方案服務。例如,在金融領域,可助力智能風險評估、精準客戶營銷;在制造業(yè),可賦能設備故障預測、生產流程優(yōu)化;在醫(yī)療領域,可實現(xiàn)智能診斷、輔助治療決策等,進一步提升企業(yè)生產效率、打造新質生產力。中軟國際科創(chuàng)中心以“DeepSeek+昇騰”為引擎,將DeepSeek全參模型滿血版部署在全國產化智算環(huán)境中,實現(xiàn)671B參數(shù)的DeepSeek模型穩(wěn)定運行,并面向社會提供DeepSeek的昇騰遷移、模型部署、模型蒸餾、模型精調、SAAS應用、Agent開發(fā)等多樣化AI服務。
未來,中軟國際也將幫助企業(yè)和開發(fā)者把更多以DeepSeek-R1為代表的推理模型接入實際應用場景,更廣泛的滿足生產級、高要求場景的業(yè)務提效需求,并助力各個領域提供服務,各行各業(yè)推出更多適配場景的AI應用和服務。
-
AI
+關注
關注
88文章
34553瀏覽量
276106 -
中軟國際
+關注
關注
0文章
626瀏覽量
7517 -
DeepSeek
+關注
關注
1文章
785瀏覽量
1474
原文標題:前行者|中軟國際金融AI實驗室主任簡仁賢:DeepSeek將推動AI Agent生態(tài)爆發(fā)
文章出處:【微信號:CSI00354,微信公眾號:中軟國際】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
中軟國際打造票據(jù)智能風控解決方案
中軟國際推出DeepSeek生態(tài)環(huán)境綜合執(zhí)法大模型一體機
HarmonyOS NEXT開發(fā)實戰(zhàn):DevEco Studio中DeepSeek的使用
中軟國際發(fā)布基于昇騰計算架構的“DeepSeek社保基金監(jiān)管大模型一體機”解決方案

評論