(電子發燒友網報道 文/章鷹) 2025年是端側AI爆發元年,以AI眼鏡為例,Meta的Ray-Ban系列價格已降至299美元,2025年預計出貨200萬副,此外,混合AI在端側實現手機拍照功能優化,汽車自動駕駛的本地決策,都依賴算力提升,這對端側AI SoC的性能帶來挑戰,上游IP廠商的新品可以給SoC廠商帶來最新助力。
7月9日,在上海張江舉辦的端側AI技術論壇上,安謀科技(中國)有限公司高級產品經理葉斌表示,當前端側AI正從概念走向現實,安謀科技自研“周易”NPU可驅動終端算力躍遷,助力產業把握端側AI“芯”機遇。
端側大模型參數提升,安謀科技DSA架構驅動芯片能效比
“當前,端側設備部署的AI大模型10B為上限,Meta開源了LIama3大模型,包括8B、30B、70B模型。未來,數據將在云端匯集訓練,云端AI模型將具備更強的通用性。終端設備上則進行輕量化模型運用,體現出更低延遲、更具個性化和隱私安全等優勢。端側設備,從旗艦平板、手機、智慧屏到PC,硬件平臺的演進中,對AI SoC來講,多核、算力提升成為當前主流發展趨勢。”安謀科技葉斌分析說。
在他看來,隨著技術發展,計算重心將進一步向更高效、更專業的計算架構或芯片轉移,以平衡性能與成本,更好地支撐大模型及各類AI應用的發展。這種情況下,DSA架構仍然是端側追求能效比和面效比的選擇。端側利用NPU IP等多核協同,實現算力提升,將成為技術發展的關鍵。
安謀推出新一代周易NPU IP,支持高精度浮點運算,應對未來應用場景
葉斌指出,安謀科技推出新一代自研周易“NPU” IP,從架構設計角度對于transformer繼續優化,兼容CNN超分場景和大模型場景加速,并且持續大規模軟件投入,不斷完善算字庫,支持大語言模型輕量化部署與快速響應,快速滿足AI PC、手機、智能座艙,ADAS等新興端側AI應用需求。
AI大模型要提升理解能力,必然要增加上下文窗口、序列長度來達到一個效果。AI處理器的架構設計上,充分考慮算力配比平衡的需求。
端側AI能力受制于算力墻、內存墻和功耗墻。從應用和場景算力匹配的能力看,從存儲的演進路線來說,LPDDR5X可以支持端側10B以下的模型,主要應用在手機、PAD和PC端,汽車智能座艙都是在10B上下的模型,物聯網設備的模型體量更小,未來存儲演進到LPDDR6,預期模型的容量可以提升50%以上。
葉斌表示,大模型是算法、硬件平臺雙向奔赴的一個過程,隨著更低位寬的算法應用,效果提升,最終令這些模型可以部署到端側。未來2年到3年,更大的模型在端側部署的場景。我們預測,20B、30B的AI模型部署在端側,甚至到30B、40B的模型在端側部署。
在當前趨勢下,端側AI應用對算力的需求將持續增加,從CNN時代的INT低精度變為需要高精度的FLOAT浮點運算。安謀科技最新發布新一代周易NPU,做了性能的升級和優化,支持多數據類型,從INT4、 INT8、INT16以及FLOAT 浮點運算。考慮到能效比,硬件上面做到充分的復用。未來在端側減少內存數據的搬運,中間做一個專用的加速優化。長下文場景,安謀科技在AI加速部分進行了增強。此外,我們對于多任務執行QOS技術進行增強,確保端側AI多樣應用的使用體驗。
葉斌強調說:“我們看到AI大模型對帶寬提出更高要求及AI計算中心偏移。結合端側大模型訴求,端側從NPU,追求能效比和面效比的選擇。加上多級緩存,硬件流水的結構,使得數據本地化,節省數據搬運和功耗的開銷。”
在端側AI設備加速落地,AI SoC芯片設計熱潮的推動下,半導體IP的戰略價值不斷顯現。IP授權模式,安謀科技采取靈活的架構授權模式,無論是硬件、軟件,NPU除了DSK架構外,軟件生態也非常關鍵。安謀科技繼承了ARM的基因,NPU IP有一套完整的軟件工具鏈,GPU最新量化工具,還有動態識別的支持和開源的模型庫,安謀科技加大投入不斷完善算子庫,憑借軟硬件的創新系統,新一代周易NPU IP能更好滿足新興端側AI應用需求,滿足用戶兼具功耗和性能優勢的端側算力體驗。
-
NPU
+關注
關注
2文章
327瀏覽量
19713 -
安謀科技
+關注
關注
0文章
116瀏覽量
7847
發布評論請先 登錄
安謀科技CEO陳鋒:立足全球標準與本土創新,賦能AI計算“芯”時代

蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
安謀科技“周易”NPU成功部署DeepSeek-R1
軟硬協同優化,安謀科技新一代“周易”NPU實現DeepSeek-R1端側高效部署

炬芯科技發布ATS323X系列端側AI音頻芯片
智能無處不在:安謀科技“周易”NPU開啟端側AI新時代

端側AI浪潮已來!炬芯科技發布新一代端側AI音頻芯片,能效比和AI算力大幅度提升

端側AI應用趨熱:NPU如何解決其關鍵痛點
安謀科技發布“玲瓏”DPU和新一代VPU
安謀科技異構算力組合,破局生成式AI算力挑戰
安謀科技異構算力賦能AI計算,此芯科技首款AI PC芯片發布

評論