電子發(fā)燒友網(wǎng)報道(文/黃晶晶)DeepSeek-R1是幻方量化旗下深度求索(DeepSeek)公司研發(fā)的推理模型。DeepSeek-R1于2025年1月20日正式發(fā)布。該模型采用強(qiáng)化學(xué)習(xí)進(jìn)行后訓(xùn)練,旨在提升推理能力,尤其擅長數(shù)學(xué)、代碼和自然語言推理等復(fù)雜任務(wù)。
DeepSeek-R1在發(fā)布后迅速引發(fā)了廣泛關(guān)注,以高性能與低訓(xùn)練成本令外界震驚。DeepSeek表示, DeepSeek-R1在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩 OpenAI o1 正式版。
去年12月底發(fā)布的DeepSeek-V3模型,整個訓(xùn)練使用2048塊英偉達(dá)H800 GPU僅花費(fèi)約557.6萬美元,不到其他頂尖模型訓(xùn)練成本的十分之一。H800是英偉達(dá)特供中國顯卡,相較于它的旗艦芯片H100降低了部分性能。OpenAI的GPT-4o模型訓(xùn)練采用的是上萬個H100 GPU。DeepSeek-V3性能與GPT-4o相近。而DeepSeek-R1與OpenAI的o1相比,其成本僅為3%-5%。
這意味著,高性能AI模型的開發(fā)不必依賴于昂貴的算力和海量的數(shù)據(jù),卻能達(dá)到國外頂級AI大模型的效果。DeepSeek讓大模型推理應(yīng)用更加平民化、普及化,于存儲行業(yè)而言,它既能降低存儲成本,又能激發(fā)更多存儲技術(shù)的創(chuàng)新,拓展存儲應(yīng)用,真正利好存儲行業(yè)的發(fā)展。
降低存儲成本
DeepSeek通過算法優(yōu)化和模型壓縮等技術(shù)大幅降低了AI模型的訓(xùn)練成本。也令一些企業(yè)看到軟件和硬件的結(jié)合,比單純地堆硬件能獲得更佳的效果。DeepSeek不僅降低了對高端GPU的需求,對于高性能計(jì)算的關(guān)鍵存儲高帶寬內(nèi)存(HBM)的需求也可能放緩。這使得一些企業(yè)對AI服務(wù)器的投入或?qū)⒉辉僦塾诟?a target="_blank">規(guī)格的配置,從而降低了其購置成本。
不過,DeepSeek本身在大模型訓(xùn)練和推理時,仍然離不開高性能存儲。從長期來看,AI應(yīng)用對數(shù)據(jù)存儲容量和速率都有著更高要求。
DeepSeek大模型訓(xùn)練需要處理海量的數(shù)據(jù),像DeepSeek-V3訓(xùn)練使用了大規(guī)模的語料庫,總參數(shù)達(dá)6710億,這些數(shù)據(jù)的存儲、讀取和傳輸都需要大量高性能存儲芯片來支持。在推理階段,DeepSeek-R1應(yīng)用于智能客服、圖像識別、自然語言處理等眾多場景時,會產(chǎn)生大量的中間數(shù)據(jù)和結(jié)果數(shù)據(jù),需要存儲芯片進(jìn)行臨時或長期存儲。隨著AI應(yīng)用場景的廣泛落地,存儲芯片的總需求有望增加。
促進(jìn)存儲創(chuàng)新
DeepSeek的技術(shù)發(fā)展可能會促使存儲芯片制造商探索新的存儲架構(gòu)和解決方案,以更好地滿足AI應(yīng)用的需求。例如,隨著AI模型的本地部署量增加,對低功耗、高能效的存儲芯片如LPDDR以及高速內(nèi)存的需求可能會增長。
近期DeepSeek運(yùn)行在AMD EPYC CPU上,無需顯卡支持,而搭配高頻內(nèi)存多通道內(nèi)存能夠有效提升運(yùn)行速度,token/秒值得到明顯提升,且功耗低、成本更低。
DeepSeek的算法可適配存內(nèi)計(jì)算架構(gòu),減少數(shù)據(jù)搬運(yùn)能耗。例如,優(yōu)化神經(jīng)網(wǎng)絡(luò)模型以匹配ReRAM(阻變存儲器)的模擬計(jì)算特性。還可與存儲廠商合作優(yōu)化AI加速器與存儲的接口協(xié)議(如CXL),降低系統(tǒng)級延遲。
計(jì)算和存儲能力的提升是AI技術(shù)持續(xù)進(jìn)步和廣泛應(yīng)用的硬件基礎(chǔ)。AI訓(xùn)練和推理過程中,需要頻繁地讀取和處理海量數(shù)據(jù),高性能計(jì)算芯片要充分發(fā)揮其性能優(yōu)勢,需要高性能的內(nèi)存系統(tǒng)與之匹配。因此,HBM仍然是滿足高強(qiáng)度數(shù)據(jù)處理所不可或缺的內(nèi)存。SK海力士、三星電子、美光三大家的HBM內(nèi)存競賽也來到了HBM4階段,隨著技術(shù)研發(fā)的深入將不斷推出高帶寬HBM內(nèi)存進(jìn)階。
除HBM之外,AI服務(wù)器對于傳統(tǒng)高性能DIMM內(nèi)存的容量與讀取性能要求也明顯提升,與此相應(yīng)的,DDR5在RDIMM產(chǎn)品的滲透率大幅增長。同時,AI服務(wù)器進(jìn)行大模型訓(xùn)練時產(chǎn)生的數(shù)據(jù)相較傳統(tǒng)服務(wù)器的中間數(shù)據(jù)極具保存價值,因此保存次數(shù)大幅度增加。在此情形下eSSD的高速度、低能耗優(yōu)勢決定其可以大面積取代HDD,全球各大云服務(wù)提供商均開始大規(guī)模采購eSSD。江波龍表示eSSD與RDIMM產(chǎn)品已在互聯(lián)網(wǎng)、運(yùn)營商等領(lǐng)域的多個知名客戶處完成了產(chǎn)品驗(yàn)證和批量出貨,未來公司將通過與大客戶的深度長期合作,實(shí)現(xiàn)企業(yè)級業(yè)務(wù)的持續(xù)高速增長。
AI推理廣泛落地,存儲需求增長
根據(jù) IDC 數(shù)據(jù),隨著人工智能進(jìn)入大規(guī)模落地應(yīng)用的關(guān)鍵時期,云端推理占算力的比例將逐步提升,“預(yù)計(jì)到 2026 年,推理占到 62.2%,訓(xùn)練占 37.8%。”這一預(yù)測進(jìn)一步強(qiáng)調(diào)了 AI 推理在未來市場競爭中的核心地位。
根據(jù)機(jī)構(gòu)測算,到2028年人工智能的推理負(fù)載占比有望達(dá)到85%,考慮到云端和邊緣側(cè)巨大的推理需求,未來推理芯片的預(yù)期市場規(guī)模將是訓(xùn)練芯片的4~6倍。
在邊緣計(jì)算場景下,DeepSeek-R1推理大模型應(yīng)用于AIoT設(shè)備,必將對低功耗、高耐久存儲提出需求,推動NOR Flash、MRAM等細(xì)分市場增長。
兆易創(chuàng)新談到NOR Flash在 AI終端的應(yīng)用。AIPC方面,隨著BIOS程序量代碼量的不斷增長,對NORFlash提出了更大容量的需求,即便PC總量維持不變,程序量的增長也會帶動NORFlash 容量的提升。
AI眼鏡是新的品類,期待AI眼鏡能夠發(fā)展成與TWS可比的品類,新需求對于NORFlash將會形成較明顯的拉動作用。耳機(jī)方面,目前除了行業(yè)頭部品牌對于NORFlash的容量需求比較大,大部分中低端的TWS耳機(jī),由于功能相對簡單,所以對NORFlash的容量要求很小。未來如果AI耳機(jī)能夠升級,對NORFlash容量的拉動就會比較明顯。如果未來消費(fèi)者要求耳機(jī)必須加入AI功能,那么隨著AI耳機(jī)滲透率的提升,對NOR Flash 容量的需求也會增長,即便耳機(jī)總的銷售臺數(shù)不增加,只要單機(jī)容量提升,對市場規(guī)模也是有拉動效果的。
寫在最后
DeepSeek的算法革新降低了對最尖端算力的依賴,最近一大批國內(nèi)CPU、GPU、AI芯片廠商踴躍適配DeepSeek,將有利于國產(chǎn)芯片在AI推理市場的競爭力提升。DeepSeek推理模型在邊緣計(jì)算設(shè)備和企業(yè)本土化的部署,也將刺激更多推理芯片需求。存儲芯片作為AI存力的組成部分,最先受益的莫過于HBM,如今DeepSeek帶來的AI推理應(yīng)用大爆發(fā),將帶動主流存儲芯片品類真正的市場機(jī)會。
-
存儲
+關(guān)注
關(guān)注
13文章
4359瀏覽量
86204 -
DeepSeek
+關(guān)注
關(guān)注
1文章
172瀏覽量
65
發(fā)布評論請先 登錄
相關(guān)推薦
寒武紀(jì)3000億市值與GPU廠商密集IPO,AI芯片正是當(dāng)打之年
![<b class='flag-5'>寒武紀(jì)</b>3000億市值與GPU廠商密集IPO,AI芯片正是當(dāng)打之年](https://file1.elecfans.com/web3/M00/06/8A/wKgZPGeMb1iAPf16AAVOZ5diCnU391.png)
軟通動力“軟硬一體”戰(zhàn)略轉(zhuǎn)型,攜手DeepSeek引領(lǐng)AI新時代
萬里紅全面支持DeepSeek系列大模型
部署DeepSeek R1于AX650N與AX630C平臺
![部署<b class='flag-5'>DeepSeek</b> R1于AX650N與AX630C平臺](https://file1.elecfans.com/web3/M00/07/93/wKgZPGeoBhiAbFSOAAAYmyujFsI606.jpg)
DeepSeek如何成為黑馬,打造國產(chǎn)算力閉環(huán)
![<b class='flag-5'>DeepSeek</b>如何成為黑馬,打造國產(chǎn)算力閉環(huán)](https://file1.elecfans.com/web3/M00/07/87/wKgZO2emzBGAXienAAAOebs7G-o369.jpg)
芯動力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!
![芯動力神速適配<b class='flag-5'>DeepSeek</b>-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!](https://file1.elecfans.com//web3/M00/07/6E/wKgZPGelyoOABzheAAIATfZvII4602.png)
寒武紀(jì)增資全資子公司上海寒武紀(jì)
寒武紀(jì)發(fā)布2024年度業(yè)績預(yù)告
算力概念股寒武紀(jì)20cm漲停市值重回千億
寒武紀(jì)2023年報出爐:營收穩(wěn)健虧損收窄 毛利率達(dá)69.16%
火了這么久的大模型,到底能為模組產(chǎn)業(yè)帶來什么?
![火了這么久的大模型,到底能為模組<b class='flag-5'>產(chǎn)業(yè)</b>帶來什么?](https://file.elecfans.com/web2/M00/12/48/poYBAGEnTsKAasIPAAHPy18CSIY818.jpg)
針對高速光模塊應(yīng)用,小華半導(dǎo)體推出HC32F472系列模擬豐富MCU新品
![針對高速光模塊應(yīng)用,小華半導(dǎo)體推出HC32F472系列模擬豐富MCU新品](https://file1.elecfans.com/web2/M00/C4/8A/wKgZomX0FTKANvC0AAAan5ncIF0734.png)
“AI芯片第一股”寒武紀(jì)發(fā)布2023年度業(yè)績快報 虧8.36億元!
![“AI芯片第一股”<b class='flag-5'>寒武紀(jì)</b>發(fā)布2023年度業(yè)績快報 虧8.36億元!](https://file1.elecfans.com/web2/M00/C2/81/wKgZomXlX02AbB79AAAdnEw2KCg995.jpg)
Sora出世 服務(wù)器產(chǎn)業(yè)鏈?zhǔn)芤鏄O大!
賈揚(yáng)清質(zhì)疑Groq CEO“其芯片價格接近免費(fèi)” 前員工:不切實(shí)際!
![賈揚(yáng)清質(zhì)疑Groq CEO“其芯片價格接近免費(fèi)” 前員工:不切實(shí)際!](https://file1.elecfans.com/web2/M00/C0/E7/wKgZomXa2SiAHJ3HAABAg2haTn4315.png)
評論