在AI技術重塑全球產(chǎn)業(yè)格局的進程中,計算范式正經(jīng)歷從運算器為中心到存儲器為中心的范式躍遷。這一變革重新定義了“先進存力”的邊界。
得一微電子首次創(chuàng)造性地提出“AI存力芯片”的技術概念。未來 AI 系統(tǒng)的每個單元都將智能體化。AI 存力芯片致力于將先進存力的 AI 智能體用芯片實現(xiàn),并主動為 AI 系統(tǒng)的GPU/NPU提供有價值的計算卸載和數(shù)據(jù)洞察。這一創(chuàng)新成果將大大提升整個系統(tǒng)的運行效率和智能化水平。
從存儲到存力,技術路徑的跨越式升級
作為國內(nèi)少數(shù)具備完整存儲控制芯片自主研發(fā)能力的企業(yè),得一微正迎來其發(fā)展歷程中的“高光時刻”:一方面,公司的存儲控制芯片產(chǎn)品順利導入手機頭部廠商,PCIe SSD主控產(chǎn)品線持續(xù)突破;另一方面,得一微在工規(guī)和車規(guī)存儲市場取得重要突破。尤其是在車規(guī)產(chǎn)品方面,公司更是連續(xù)多年實現(xiàn)了翻倍式增長,這進一步鞏固了公司的實力。
在AI席卷全球的當下,得一微與時俱進,啟動開拓AI存力芯片的戰(zhàn)略升級。
“在過去的計算范式中,存儲只是圍繞著 CPU,為其提供服務,存儲的數(shù)據(jù)也僅僅是數(shù)據(jù)。但進入AI時代,存儲的核心數(shù)據(jù)變成了大模型的參數(shù),神經(jīng)網(wǎng)絡的權重,還有向量化的知識。與此同時,GPU也取代CPU,成為了存儲的新‘大哥’”,得一微電子市場總監(jiān)羅挺在此前的CFMS|MemoryS 2025 現(xiàn)場告訴半導體行業(yè)觀察。
伴隨著這種情況的產(chǎn)生,對系統(tǒng)的理解變了,存儲及其在系統(tǒng)中扮演的角色也變了。
如羅挺所說,當前,AI無論是存儲和推理都用到了很多的GPU,GPU逐漸顯現(xiàn)出算力主導地位。在GPU的指導下,數(shù)據(jù)按照需求在系統(tǒng)中高速運轉(zhuǎn)。但在這個過程中,系統(tǒng)開始出現(xiàn)了諸多問題。例如,HBM成為了成本和性能的瓶頸,SSD/UFS的設計依然是以CPU為中心,這都是AI系統(tǒng)的方案供應商和供應鏈需要著重解決的關鍵問題。
作為一家以芯片創(chuàng)新和解決方案聞名的供應商,得一微對此也有了自己的思考。
“在AI快速發(fā)展的時代,我們需要調(diào)整整個產(chǎn)品的思路。”羅挺表示。他以Transformer架構的LLM舉例說道,當前,無論是Prefill和Decode,注意力還是KV Cache, 向量數(shù)據(jù)庫還是知識圖譜的訪問,都是在GPU上運行。然而,這種高度集中的計算方式很快遇到了帶寬的瓶頸。
“在得一微看來,以存算一體為核心的存力芯片,將改變神經(jīng)網(wǎng)絡的計算方式,AI存力芯片才是未來。”羅挺說。
AI-MemoryX,是AI存力芯片的探索
得一微此前發(fā)布的AI-MemoryX顯存擴展卡,就是得一微針對新型需求的成功嘗試。
該方案通過創(chuàng)新架構,將單機顯存容量從傳統(tǒng)顯卡的幾十GB提升至10TB級別,僅需1到16張顯卡,即可支持32B至671B等超大模型的微調(diào)訓練,大幅降低對GPU的數(shù)量需求,突破大模型訓練的顯存瓶頸。
“AI-MemoryX不僅是一張擴展卡,更是一套完整的微調(diào)訓練機解決方案。”羅挺強調(diào)。該技術涵蓋大模型訓練框架、顯存擴展卡軟件棧以及顯存擴展卡X200系列,為大模型微調(diào)訓練提供全方位的技術支持與賦能。目前,該方案已成功應用于DeepSeek等大模型的訓練優(yōu)化,協(xié)助開發(fā)者發(fā)掘微調(diào)的潛力和價值,推動AI技術在各行業(yè)的快速落地。
隨著AI-MemoryX技術的迭代創(chuàng)新,得一微將在各個應用場景推出AI存力芯片和解決方案。
AI存力芯片,重構計算范式
也許很多讀者會和筆者一樣,對于以前專注于存儲的得一微,為何能夠迅速轉(zhuǎn)向這些看來與計算有著更多關系的產(chǎn)品。
針對這個問題,羅挺表示,公司做的產(chǎn)品創(chuàng)新和產(chǎn)品線拓展,主要還是圍繞著存儲(存儲控制,存算一體,存算互聯(lián))展開。在公司過去打造這些產(chǎn)品的過程中,長年積累的硬件、軟件、算法和SoC等方面的經(jīng)驗和人才,這也是公司能構建AI存力芯片新技術路徑的底氣。
展望未來的發(fā)展,羅挺表示,公司會堅持三步走戰(zhàn)略:第一,利用現(xiàn)有的芯片和軟件,打造出能快速創(chuàng)造價值的AI存力解決方案;第二,把軟件的創(chuàng)新放到芯片里面固化,將算法創(chuàng)新轉(zhuǎn)化為芯片能力;第三,推動AI存力芯片的應用和生態(tài)建設。
過去幾年,國內(nèi)芯片行業(yè)最大的狀態(tài)就是內(nèi)卷,眾多廠商圍繞著類似的產(chǎn)品定義展開激烈的競爭,除了精益求精,如何尋找方向?得一微通過AI存力芯片的創(chuàng)新,開辟了新的技術賽道,更為中國存儲產(chǎn)業(yè)的升級發(fā)展提供了示范。未來,隨著AI存力需求的持續(xù)增長,存力將從被動支撐算力到主動驅(qū)動算力,得一微的“AI存力芯片”,讓每比特數(shù)據(jù)創(chuàng)造更多智能。
審核編輯 黃宇
-
芯片
+關注
關注
459文章
52243瀏覽量
436757 -
AI
+關注
關注
88文章
34378瀏覽量
275601
發(fā)布評論請先 登錄
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

得一微:AI存力芯片,重構計算范式

首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手
得一微電子亮相2025中國閃存市場峰會
存力接棒算力,慧榮科技以主控技術突破AI存儲極限

評論