電子發(fā)燒友原創(chuàng) 章鷹
近日,DeepSeek推出的AI大模型R1火爆,隨著DeepSeek的開源和國(guó)產(chǎn)大模型成本的下降,人工智能技術(shù)在企業(yè)的應(yīng)用場(chǎng)景大幅度拓展,國(guó)產(chǎn)算力也有機(jī)會(huì)在更多行業(yè)應(yīng)用。業(yè)內(nèi)人士表示,DeepSeek的開源讓行業(yè)應(yīng)用AI門檻大幅度降低,政府及企業(yè)應(yīng)用有望在2025年產(chǎn)生裂變式增長(zhǎng)。最新,中國(guó)電信、華為、京東、聯(lián)想都相繼加入了DeepSeek一體機(jī)的矩陣。
2月11日,中國(guó)電信宣布推出了息壤智算一體機(jī)-DeepSeek版,在硬件層面以華為昇騰芯片為基礎(chǔ),提供8卡、16卡、32卡等多種規(guī)格型號(hào)。
2月13日,華為宣布推出昇騰DeepSeek大模型一體機(jī),從服務(wù)器、推理卡、到加速模組等豐富的DeepSeek一體機(jī)產(chǎn)品形態(tài),全面適配DSV3/R1滿血版/蒸餾版本全系列模型,涵蓋智能對(duì)話、智能編程、文檔分析、開發(fā)板等全場(chǎng)景應(yīng)用。
華為表示,DeepSeek V3/ R1 671B旗艦?zāi)P停M血版)通常需要高端GPU進(jìn)行推理,現(xiàn)在基于華為云昇騰云服務(wù)的全棧優(yōu)化適配可以獲得持平全球高端GPU部署模型的效果,提供穩(wěn)定的生產(chǎn)級(jí)服務(wù)能力,滿足業(yè)務(wù)商用部署需求。
近日,聯(lián)想百應(yīng)總經(jīng)理魏東表示,聯(lián)想開發(fā)的DeepSeek一體機(jī)得到來(lái)自政府、醫(yī)療行業(yè)、制造行業(yè)、教育行業(yè)的關(guān)注。不少企業(yè)和聯(lián)想溝通希望做一些本地的部署。
據(jù)悉,目前上市的DeepSeek推理一體機(jī)內(nèi)置DeepSeek-R1 32B、70B、滿血版671B等不同尺寸模型,價(jià)格在幾十萬(wàn)到數(shù)百萬(wàn)不等,主要面向?qū)?shù)據(jù)安全、數(shù)據(jù)隱私較為敏感的企業(yè)用戶。而訓(xùn)推一體機(jī)的售價(jià)更高,用于DeepSeek-R1 32B模型的預(yù)訓(xùn)練和微調(diào)的一體機(jī)價(jià)格就達(dá)到數(shù)百萬(wàn)。
對(duì)比其他AI大模型,DeepSeek的兩大優(yōu)勢(shì)
DeepSeek R1是一個(gè)基于混合專家(MOE)架構(gòu)的 AI 對(duì)話模型。盡管中國(guó) AI 公司 DeepSeek 發(fā)布的模型相當(dāng)新,但它已經(jīng)被稱為 ChatGPT、Perplexity 和 Gemini 等較老 AI 模型的強(qiáng)勁競(jìng)爭(zhēng)對(duì)手。
DeepSeek 的與眾不同之處在于其開源特性和高效架構(gòu)。這使得開發(fā)人員能夠適應(yīng)并在此基礎(chǔ)上進(jìn)行構(gòu)建,而無(wú)需承擔(dān)與資源密集型模型相關(guān)的高昂基礎(chǔ)設(shè)施成本。對(duì)于想要使用 AI 但預(yù)算不足的初創(chuàng)公司和小型企業(yè)來(lái)說,DeepSeek R1 是一個(gè)不錯(cuò)的選擇。
DeepSeek R1總共擁有驚人的 6710 億個(gè)參數(shù),但每個(gè)任務(wù)僅激活約 370 億個(gè)參數(shù)——這就像為手頭的工作召集了合適的專家。這種選擇性激活是通過 DeepSeek R1 的創(chuàng)新多頭潛在注意力 (MLA) 機(jī)制實(shí)現(xiàn)的。這種方法使 DeepSeek R1 能夠以驚人的效率處理復(fù)雜任務(wù),處理信息的速度通常比傳統(tǒng)模型快兩倍,例如編碼和數(shù)學(xué)計(jì)算等任務(wù)。
ChatGPT 建立在 OpenAI 的 GPT 架構(gòu)之上,該架構(gòu)利用基于 Transformer 的神經(jīng)網(wǎng)絡(luò)。該模型采用自注意力機(jī)制來(lái)處理和生成文本,從而能夠捕捉輸入數(shù)據(jù)中的復(fù)雜關(guān)系。ChatGPT 的架構(gòu)擁有 1750 億個(gè)參數(shù),確保其所有“知識(shí)”可用于每項(xiàng)任務(wù)。這意味著,與 DeepSeek R1 不同,ChatGPT 不會(huì)只調(diào)用提示所需的參數(shù)。相反,它每次都會(huì)使用所有1750 億個(gè)參數(shù),無(wú)論它們是否是必需的。這種廣泛的參與令ChatGPT能夠提供高度準(zhǔn)確且具有情境感知能力的響應(yīng)。但也意味著它消耗了大量的計(jì)算能力和能源資源,不可持續(xù)。
國(guó)產(chǎn)算力支持DeepSeek一體機(jī)部署,前景如何?
聯(lián)想集團(tuán)和沐熙公司聯(lián)合發(fā)布基于DeepSeek大模型的一體機(jī)解決方案,以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體GPU+自主算法”為核心架構(gòu)。京東云的DeepSeek大模型一體機(jī),支持華為昇騰、海光、寒武紀(jì)、摩爾線程、天數(shù)智芯等國(guó)產(chǎn)AI加速芯片。
行業(yè)專家指出,大模型一體機(jī)主要是本地化部署,解決的是數(shù)據(jù)隱私問題。之前大模型一體機(jī)的經(jīng)濟(jì)價(jià)值不高,高投入影響了其落地,未來(lái)還是需要應(yīng)用能有更大的發(fā)展。
據(jù)悉,國(guó)內(nèi)多家國(guó)產(chǎn)芯片廠商完成了對(duì)DeepSeek滿血版和蒸餾版開源模型的適配工作。但是目前主要針對(duì)的中小模型,而滿血版的V3/R1擁有6710億參數(shù),對(duì)硬件要求大大提高。需要推理的時(shí)候用到320個(gè)GPU,這對(duì)于成本和芯片性能提出了更高要求。
DeepSeek對(duì)核心產(chǎn)業(yè)的相互滲透,將助力中國(guó)從“算力追求者”向“生態(tài)主導(dǎo)者”轉(zhuǎn)型。DeepSeek一體機(jī)的密集發(fā)布,對(duì)中小企業(yè)的AI應(yīng)用落地是一個(gè)極大助力,未來(lái)在行業(yè)拓展應(yīng)用口碑如何,我們將拭目以待。
-
DeepSeek
+關(guān)注
關(guān)注
1文章
391瀏覽量
161
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
華為推出昇騰DeepSeek大模型一體機(jī)
標(biāo)普云DeepSeek一體機(jī)發(fā)布:零門檻部署企業(yè)DeepSeek
曙光云發(fā)布DeepSeek大模型超融合一體機(jī)
澎峰科技發(fā)布萬(wàn)元級(jí)DeepSeek智算一體機(jī)
梯度科技推出DeepSeek智算一體機(jī)
澎峰科技發(fā)布DeepSeek智算一體機(jī)
寧暢推出DeepSeek大模型一體機(jī)
曙光云推出DeepSeek大模型一體機(jī)
云從科技從容大模型訓(xùn)推一體機(jī)成功適配DeepSeek
云天天書大模型訓(xùn)推一體機(jī)成功適配DeepSeek
拓維信息×整數(shù)智能:聯(lián)合首發(fā)搭載DeepSeek的智能數(shù)據(jù)標(biāo)注一體機(jī)

新華三發(fā)布DeepSeek大模型一體機(jī)UniCube
智海AI教育一體機(jī):加速人工智能教育普及
邊緣計(jì)算AI一體機(jī)常見應(yīng)用場(chǎng)景有哪些?

評(píng)論