完美世界小说下载,小说阅读网,琅琊榜海宴小说

電子發(fā)燒友原創(chuàng) 章鷹

近日，DeepSeek推出的AI大模型R1火爆，隨著DeepSeek的開源和國產(chǎn)大模型成本的下降，人工智能技術(shù)在企業(yè)的應(yīng)用場景大幅度拓展，國產(chǎn)算力也有機(jī)會在更多行業(yè)應(yīng)用。業(yè)內(nèi)人士表示，DeepSeek的開源讓行業(yè)應(yīng)用AI門檻大幅度降低，政府及企業(yè)應(yīng)用有望在2025年產(chǎn)生裂變式增長。最新，中國電信、華為、京東、聯(lián)想都相繼加入了DeepSeek一體機(jī)的矩陣。

2月11日，中國電信宣布推出了息壤智算一體機(jī)-DeepSeek版，在硬件層面以華為昇騰芯片為基礎(chǔ)，提供8卡、16卡、32卡等多種規(guī)格型號。

2月13日，華為宣布推出昇騰DeepSeek大模型一體機(jī)，從服務(wù)器、推理卡、到加速模組等豐富的DeepSeek一體機(jī)產(chǎn)品形態(tài)，全面適配DSV3/R1滿血版/蒸餾版本全系列模型，涵蓋智能對話、智能編程、文檔分析、開發(fā)板等全場景應(yīng)用。

華為表示，DeepSeek V3/ R1 671B旗艦?zāi)Ｐ停M血版）通常需要高端GPU進(jìn)行推理，現(xiàn)在基于華為云昇騰云服務(wù)的全棧優(yōu)化適配可以獲得持平全球高端GPU部署模型的效果，提供穩(wěn)定的生產(chǎn)級服務(wù)能力，滿足業(yè)務(wù)商用部署需求。

近日，聯(lián)想百應(yīng)總經(jīng)理魏東表示，聯(lián)想開發(fā)的DeepSeek一體機(jī)得到來自政府、醫(yī)療行業(yè)、制造行業(yè)、教育行業(yè)的關(guān)注。不少企業(yè)和聯(lián)想溝通希望做一些本地的部署。

據(jù)悉，目前上市的DeepSeek推理一體機(jī)內(nèi)置DeepSeek-R1 32B、70B、滿血版671B等不同尺寸模型，價(jià)格在幾十萬到數(shù)百萬不等，主要面向?qū)?shù)據(jù)安全、數(shù)據(jù)隱私較為敏感的企業(yè)用戶。而訓(xùn)推一體機(jī)的售價(jià)更高，用于DeepSeek-R1 32B模型的預(yù)訓(xùn)練和微調(diào)的一體機(jī)價(jià)格就達(dá)到數(shù)百萬。

對比其他AI大模型，DeepSeek的兩大優(yōu)勢

DeepSeek R1是一個(gè)基于混合專家（MOE）架構(gòu)的 AI 對話模型。盡管中國 AI 公司 DeepSeek 發(fā)布的模型相當(dāng)新，但它已經(jīng)被稱為 ChatGPT、Perplexity 和 Gemini 等較老 AI 模型的強(qiáng)勁競爭對手。

DeepSeek 的與眾不同之處在于其開源特性和高效架構(gòu)。這使得開發(fā)人員能夠適應(yīng)并在此基礎(chǔ)上進(jìn)行構(gòu)建，而無需承擔(dān)與資源密集型模型相關(guān)的高昂基礎(chǔ)設(shè)施成本。對于想要使用 AI 但預(yù)算不足的初創(chuàng)公司和小型企業(yè)來說，DeepSeek R1 是一個(gè)不錯(cuò)的選擇。

DeepSeek R1總共擁有驚人的 6710 億個(gè)參數(shù)，但每個(gè)任務(wù)僅激活約 370 億個(gè)參數(shù)——這就像為手頭的工作召集了合適的專家。這種選擇性激活是通過 DeepSeek R1 的創(chuàng)新多頭潛在注意力 (MLA) 機(jī)制實(shí)現(xiàn)的。這種方法使 DeepSeek R1 能夠以驚人的效率處理復(fù)雜任務(wù)，處理信息的速度通常比傳統(tǒng)模型快兩倍，例如編碼和數(shù)學(xué)計(jì)算等任務(wù)。

ChatGPT 建立在 OpenAI 的 GPT 架構(gòu)之上，該架構(gòu)利用基于 Transformer 的神經(jīng)網(wǎng)絡(luò)。該模型采用自注意力機(jī)制來處理和生成文本，從而能夠捕捉輸入數(shù)據(jù)中的復(fù)雜關(guān)系。ChatGPT 的架構(gòu)擁有 1750 億個(gè)參數(shù)，確保其所有“知識”可用于每項(xiàng)任務(wù)。這意味著，與 DeepSeek R1 不同，ChatGPT 不會只調(diào)用提示所需的參數(shù)。相反，它每次都會使用所有1750 億個(gè)參數(shù)，無論它們是否是必需的。這種廣泛的參與令ChatGPT能夠提供高度準(zhǔn)確且具有情境感知能力的響應(yīng)。但也意味著它消耗了大量的計(jì)算能力和能源資源，不可持續(xù)。

國產(chǎn)算力支持DeepSeek一體機(jī)部署，前景如何？

聯(lián)想集團(tuán)和沐熙公司聯(lián)合發(fā)布基于DeepSeek大模型的一體機(jī)解決方案，以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體GPU+自主算法”為核心架構(gòu)。京東云的DeepSeek大模型一體機(jī)，支持華為昇騰、海光、寒武紀(jì)、摩爾線程、天數(shù)智芯等國產(chǎn)AI加速芯片。

行業(yè)專家指出，大模型一體機(jī)主要是本地化部署，解決的是數(shù)據(jù)隱私問題。之前大模型一體機(jī)的經(jīng)濟(jì)價(jià)值不高，高投入影響了其落地，未來還是需要應(yīng)用能有更大的發(fā)展。

據(jù)悉，國內(nèi)多家國產(chǎn)芯片廠商完成了對DeepSeek滿血版和蒸餾版開源模型的適配工作。但是目前主要針對的中小模型，而滿血版的V3/R1擁有6710億參數(shù)，對硬件要求大大提高。需要推理的時(shí)候用到320個(gè)GPU，這對于成本和芯片性能提出了更高要求。

DeepSeek對核心產(chǎn)業(yè)的相互滲透，將助力中國從“算力追求者”向“生態(tài)主導(dǎo)者”轉(zhuǎn)型。DeepSeek一體機(jī)的密集發(fā)布，對中小企業(yè)的AI應(yīng)用落地是一個(gè)極大助力，未來在行業(yè)拓展應(yīng)用口碑如何，我們將拭目以待。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

DeepSeek

DeepSeek

+關(guān)注

關(guān)注
1

文章
798

瀏覽量
1759

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

DeepSeek一體機(jī)發(fā)布！四大廠商入局，加速AI應(yīng)用落地

評論