電子發燒友網報道(文/李彎彎)在數字化浪潮席卷全球的當下,邊緣人工智能正以前所未有的速度重塑產業格局。根據市場調研機構數據顯示,2025年全球AI芯片市場規模預計突破1200億美元,年均復合增長率超25%,其中,邊緣計算芯片增速達35%。這一增長勢頭背后,是可穿戴、智能安防、智慧工業等場景對低功耗、低延遲、高隱私性計算的迫切需求。
然而,行業高速發展的同時,傳統馮·諾依曼架構的“存儲墻”瓶頸、高功耗與能效比失衡等技術挑戰,正成為制約邊緣AI大規模落地的關鍵掣肘。在此背景下,電子發燒友特別采訪了存算一體芯片企業——蘋芯科技,探尋其突破技術困局的創新路徑。
蘋芯科技:存算一體架構重構邊緣計算范式
蘋芯科技成立于 2021 年,是一家專注于存算一體技術的芯片設計企業。致力于利用新興存算一體技術對人工智能計算進行加速,目標是低成本實現高性能AI計算引擎,引領構建非馮架構計算體系與生態系統。其核心團隊由清華系科學家與高通、美光等半導體巨頭的技術專家組成,在存儲器設計、神經網絡加速、低功耗架構等領域擁有深厚積累。
“傳統馮·諾依曼架構面臨嚴重的‘存儲墻’和‘功耗墻’瓶頸,數據在存儲器與計算單元間頻繁遷移導致60%~80%的能耗浪費,嚴重制約了邊緣AI芯片的實時性能。”蘋芯科技聯合創始人兼CEO楊越表示,“我們的存算一體架構從根本上突破了這一限制,通過在SRAM存儲器內部直接完成乘累加運算,實現了計算與存儲的深度融合。”
蘋芯科技采用了多項關鍵技術創新構建競爭壁壘:其一是混合精度存算陣列設計,通過純數字計算和數字域控制的協同優化,實現高并行度的矩陣-向量乘法運算,在28nm工藝下達到27 TOPS/W的能效比。其二是自適應稀疏化計算引擎,利用神經網絡的稀疏性特征,通過硬件加速器動態識別,實現2-5倍的性能提升。其三是多級功耗管理技術,集成了時鐘門控、電壓島和動態電壓頻率調節,在保證計算性能的同時將待機功耗降低至μW級別。
“另外,在系統架構層面,我們也通過數據流優化技術,算子融合技術,配合零拷貝數據處理機制等等方式,使我們的存算一體芯片在關鍵指標上實現了顯著突破,如:核心計算能效比達到27 TOPS/W,推理延遲降低至毫秒級別。”楊越介紹:“這些技術優勢使得我們的方案在很多對實時性和功耗敏感的邊緣AI應用場景中具備了獨特的競爭優勢,為客戶提供了更優的性價比和更強的產品差異化能力。”
蘋芯科技目前已經開發多款產品,包括PIMCHIP-S300、PIMCHIP-N300等。PIMCHIP-S300是一款多模態智慧感知決策AI芯片,搭載基于SRAM的存算一體計算加速單元,具備AI算力整合、多模態融合感知、跨領域智慧決策、超低功耗、極速響應等特點。可提供端到端的語音、圖像、雷達等完整解決方案和應用,為智能可穿戴設備、智能安防、具身智能、AI大模型、健康數據分析等領域提升運算效率、降低能耗。
PIMCHIP-N300是新一代存算一體神經網絡處理單元,專為機器學習和人工智能領域設計,能高效處理人工神經網絡等算法和模型。同時團隊提供免費軟件工具鏈,具有高度靈活性和易集成性,可縮短產品開發周期,加速客戶品牌智能化升級。
目前蘋芯科技的芯片主要應用于智能可穿戴設備、智能安防、智慧工業、智慧醫療、教育智能化等行業。
談到其產品的獨特優勢,楊越認為主要體現在三個方面:其一,能效比領先優勢。通過存算一體架構實現數據“零搬運”,在28nm工藝下達到27 TOPS/W的能效比,相比傳統架構提升了一個數量級。這一技術突破使得蘋芯科技的芯片在同等算力下功耗僅為競品的1/10,在同等功耗下算力提升10倍以上。
其二,快速迭代驗證能力。基于模塊化IP核設計和成熟SRAM工藝,蘋芯科技能夠快速的完成從算法優化到芯片驗證的完整迭代,相比傳統12-18個月的開發周期縮短60%以上,幫助客戶快速搶占市場先機。
其三,邊緣場景深度優化。針對邊緣AI應用的“低功耗、小體積、高實時性”需求,蘋芯科技開發了專用的神經網絡加速引擎和自適應功耗管理技術,在保證計算精度的同時實現毫秒級響應。
“我們的客戶廠商在開發新一代智能健康監測產品時遇到了嚴峻挑戰。該產品需要實時處理心音心電、體溫、運動狀態等多維生理數據并進行AI算法分析,但原有ARM+DSP架構方案存在AI推理功耗高達2.5W、數據處理延遲100-200ms、長時間運行導致設備表面溫度超過40°C等問題,嚴重影響用戶體驗和產品競爭力。”楊越舉例道:“客戶在對比了多家廠商方案后,最終選擇集成了我們的PIMCHIP-N300加速單元。關鍵原因在于我們的NPU在處理相同AI算法時功耗相比原方案降低80%,通過存算一體架構將數據處理延遲降低至5-10ms,顯著改善了用戶體驗。”
經過6個月的技術適配、原型驗證和芯片集成,客戶產品成功交付。實際效果超出預期:設備續航時間從原來的12小時提升至72小時,實時健康監測功能獲得用戶高度認可,同時幫助客戶節省電池成本約30%,整體BOM成本降低20%。楊越強調:“這一案例充分體現了我們存算一體技術在邊緣AI應用中的顯著優勢,不僅解決了客戶的技術難題,更帶來了實質性的商業價值和市場競爭力提升。”
創新方案、生態構建,精準捕捉和解決行業痛點
邊緣AI芯片的落地高度依賴場景需求,針對如何精準捕捉不同行業痛點的問題,楊越談到:“我們建立了‘三層深入、四維分析’的行業痛點捕捉機制。通過深入產業鏈上游(算法開發商)、中游(設備制造商)和下游(最終用戶)進行需求調研,從技術性能、成本控制、功耗管理和部署便利性四個維度全面評估行業需求。通過與行業龍頭企業建立聯合實驗室、參與標準制定等方式,我們能夠在技術趨勢萌芽期就準確識別行業痛點。”
以智能安防監控行業為例,蘋芯科技通過深度調研發現了兩個核心痛點:首先是電池驅動場景下的超低功耗智能化需求,傳統方案在待機狀態下功耗仍達到數百毫瓦,導致電池續航僅能維持幾天,無法滿足偏遠地區、臨時部署等場景的長期監控需求;其次是成本壓力,隨著AI算法復雜度提升,傳統GPU方案成本激增,中小型安防廠商難以承受。
“基于上述痛點,我們充分發揮存算一體架構的獨特優勢,設計了‘超低功耗待機+多模態識別喚醒’的創新方案。”楊越介紹:“在待機狀態下,我們通過存算一體架構實現了微瓦級的功耗控制,芯片僅保持基礎的音頻和紅外傳感器監測功能運行。當檢測到聲音異常、人體熱源或運動軌跡等多模態信號時,系統能夠在毫秒級時間內從待機狀態喚醒至全功能運行模式。”
楊越進一步介紹說:“具體技術實現上,我們在存算一體陣列中集成了專用的多模態信號處理單元,通過硬件加速音頻特征提取、紅外圖像處理和運動檢測算法,實現了超低功耗的智能喚醒功能。同時,采用成熟的28nm工藝節點,有效控制了單顆芯片的實際成本,相比傳統方案降低了70%以上。”
實際測試結果顯示,蘋芯科技的芯片在待機狀態下功耗為微瓦級別,在客戶的常規狀態使用模式下,保證系統的電池續航可達6個月以上,喚醒響應時間小于10ms,多模態識別準確率達到92%以上。這一方案不僅解決了電池驅動安防設備的續航難題,更以極具競爭力的成本優勢幫助客戶快速占領市場。
在生態合作伙伴網絡構建上,蘋芯科技也有自己的獨到見解。蘋芯科技通過“分層聯動、場景綁定”的模式構建生態合作伙伴網絡。在技術層與芯片制造企業、算法供應商建立聯合研發機制,共建技術驗證平臺;在產品層為設備廠商提供從芯片到解決方案的全棧支持,包括硬件參考設計、軟件工具鏈及測試服務;在市場層與系統集成商深度協同,針對垂直領域打造端到端行業方案。通過這種多層級合作體系,實現從技術創新到商業落地的全鏈路貫通。
目前,蘋芯科技已形成覆蓋產業鏈關鍵環節的戰略級合作矩陣。在供應鏈端,與頭部晶圓制造企業、封裝測試廠商建立長期聯合開發關系;在終端,與消費電子、工業設備等領域的龍頭企業達成深度合作,共同定義下一代產品規格;在 AI基礎設施端,與主流算法框架廠商、云服務提供商構建技術適配聯盟,推動存算一體技術與開源生態的融合。
“這些合作精準解決了產業鏈各環節的核心痛點。”楊越談道:“與芯片制造企業合作時,我們針對存算一體架構的特殊工藝需求,聯合優化光刻精度控制、存儲單元一致性校準等關鍵環節,將量產良率大幅提升,同時解決了新型計算單元與現有產線的兼容性問題,使芯片量產周期縮短的同時確保高性能芯片的穩定供應。”
蘋芯科技還與算法供應商協同突破“算法-芯片”適配瓶頸,針對傳統架構中90%算力浪費在數據搬運的問題,通過定制化指令集與算法算子的深度綁定,將有效算力利用率大幅提升;同時開發跨框架遷移工具,解決了主流算法在存算一體芯片上的適配難題,顯著提升AI處理效率。
與設備廠商及系統集成商合作聚焦場景落地障礙,楊越表示:“我們為設備廠商提供模塊化硬件接口和功耗調節SDK,解決了芯片在智能耳機、工業傳感器等不同終端的供電穩定性與空間適配問題。此外,我們聯合系統集成商開發行業專用固件,將產品在各行業的部署調試周期縮短,加速技術方案向商業應用的轉化。”
邊緣AI芯片商業化阻礙及技術演進趨勢
邊緣AI芯片大規模商用面臨幾大核心阻礙:其一是成本與ROI的矛盾,當前AI芯片的設計、制造和部署成本相對較高,而許多應用場景的商業回報周期較長,企業難以在短期內看到明確的投資回報,這在很大程度上制約了大規模商用的積極性。
其二是技術門檻與人才短缺,邊緣AI芯片涉及算法優化、硬件設計、軟件開發等多個專業領域,企業往往缺乏既懂AI算法又懂芯片架構的復合型人才,同時開發工具鏈不夠完善,增加了產品開發的難度和周期。
其三是標準化與生態協同問題,不同廠商的芯片架構、接口標準、軟件生態各不相同,導致系統集成復雜度高,互操作性差,企業在選擇方案時面臨較大的技術風險和遷移成本。
從行業的角度來看,該如何應對這些阻礙呢?楊越認為:“需要建立統一的行業標準和認證體系,降低不同廠商產品間的集成難度;完善開源工具鏈和開發生態,降低技術門檻;加強產學研合作,培養更多復合型人才;推動產業鏈上下游協同,通過規模效應降低整體成本。只有通過行業協作才能真正推動邊緣AI芯片的大規模商用落地。”
為了應對挑戰,蘋芯科技采取的行動主要是:采取優化芯片架構設計、應用高性能傳統工藝降低成本;加強軟件研發,完善軟件工具鏈和生態;積極參與行業標準制定等。
楊越認為,未來3~5年,邊緣AI芯片將呈現這樣幾個趨勢:其一,多模態AI融合成為主流。單一模態的AI應用將向多模態融合演進。視覺、語音、文本、傳感器數據的協同處理將成為標配,要求芯片具備更強的異構計算能力和跨模態數據處理效率。
其二,邊緣大模型輕量化部署。隨著大語言模型和多模態大模型的快速發展,如何在邊緣設備上高效部署輕量化大模型將成為關鍵挑戰。這要求芯片在保持低功耗的同時,具備處理復雜推理任務的能力。
其三,超低功耗與長續航需求激增。物聯網設備、可穿戴設備、智能家居等應用場景對功耗要求越來越苛刻,毫瓦級甚至微瓦級的功耗控制將成為基本要求,電池續航需要達到月級別甚至年級別。
其四,實時性要求持續提升。自動駕駛、工業控制、醫療監測等關鍵應用對延遲的容忍度進一步降低,從毫秒級向微秒級演進,對芯片的實時響應能力提出更高要求。
其五,成本壓力與規模化部署。隨著AI應用的普及,成本將成為決定性因素,芯片需要在保證性能的前提下實現更低的單位成本,以支撐大規模商業化部署。
對此,蘋芯科技也有自己的應對布局。蘋芯科技將持續深化存算一體架構技術,重點突破三個方向:一是提升存算一體陣列的密度和效率;二是開發支持多精度、多數據類型的靈活計算單元,適應不同AI算法的精度需求;三是構建硬件級的多模態數據融合處理能力,通過專用的跨模態特征提取和融合單元,實現視覺、語音、傳感器數據的高效協同處理。
同時基于超低功耗優勢,蘋芯科技也將重點布局三個高增長賽道:一是智能物聯網領域的環境監測、跟蹤等應用,目標實現年級別的電池續航;二是醫療健康領域的連續監測設備,重點突破生理信號的實時AI分析;三是工業4.0場景的邊緣智能,專注于預測性維護和質量檢測等應用。
“這些戰略布局的核心目標是,確保我們在未來3~5年的技術演進中始終保持領先地位,不僅要在技術指標上持續突破,更要在商業化落地和生態建設上形成競爭壁壘,最終實現從技術領先到市場領導的轉變。”楊越強調。
寫在最后
邊緣AI芯片作為推動各行業智能化轉型的核心部件,其發展前景廣闊。然而,面對低功耗、高性能、低成本等多重挑戰,行業需要不斷創新與協作。蘋芯科技憑借其存算一體架構的技術優勢,在邊緣AI芯片領域取得了顯著突破,為行業提供了高效、低功耗的解決方案。未來,隨著多模態AI融合、邊緣大模型輕量化部署等趨勢的加速推進,邊緣AI芯片將迎來更加廣闊的發展空間。蘋芯科技將繼續深耕存算一體技術,為構建智能化的未來世界貢獻力量。
-
邊緣AI
+關注
關注
0文章
164瀏覽量
5463 -
存算一體
+關注
關注
0文章
109瀏覽量
4667 -
蘋芯科技
+關注
關注
1文章
25瀏覽量
377
發布評論請先 登錄
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

存算一體行業2024年回顧與2025年展望
開源芯片系列講座第24期:基于SRAM存算的高效計算架構

存算一體架構創新助力國產大算力AI芯片騰飛
科技新突破:首款支持多模態存算一體AI芯片成功問世

評論