電子發燒友網報道(文/李彎彎)在人工智能技術飛速發展的今天,端邊算力的升級已成為推動行業變革的核心動力。7月25日,WAIC 2025前夕,后摩智能正式發布全新端邊大模型AI芯片——后摩漫界?M50,同步推出力擎?系列M.2卡、力謀?系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產品矩陣。這一系列動作標志著后摩智能在存算一體技術領域的突破性進展,更預示著端邊智能新生態的全面開啟。
M50芯片:高算力、低功耗的端邊革命
后摩智能此次發布的M50芯片實現了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB內存與153.6GB/s的超高帶寬,而典型功耗僅10W,相當于手機快充的功率。這一性能指標意味著,PC、智能語音設備、機器人等智能移動終端無需依賴云端,即可高效運行1.5B到70B參數的本地大模型,真正實現了“高算力、低功耗、即插即用”的愿景。
除了 M50 芯片,后摩智能此次發布的產品矩陣形成了覆蓋端側到邊緣的多元算力方案。力擎?LQ50 M.2卡以口香糖大小的標準M.2規格,為AI PC、AI Stick、陪伴機器人等移動終端提供“即插即用”的端側AI能力,支持7B/8B模型推理超25tokens/s;力擎?LQ50 Duo M.2卡集成雙M50芯片,以320TOPS算力突破14B/32B大模型端側部署瓶頸;力謀?LM5050加速卡與力謀?LM5070加速卡分別集成2顆、4顆M50芯片,為單機及超大模型推理提供高密度算力,最高達640TOPS;BX50計算盒子則以緊湊機身適配邊緣場景,支持32路視頻分析與本地大模型運行。
這些產品的應用場景廣泛覆蓋消費終端、智能辦公、智能工業等領域,且均能在離線狀態下實現全流程本地處理,從源頭杜絕數據聯網傳輸風險。例如,在消費終端,M50芯片賦能筆記本、平板電腦、學習機等設備本地大模型推理能力,無需聯網即可完成智能交互、內容生成等任務,用戶隱私數據全程閉環留存;在智能辦公場景中,智能會議系統在斷網環境下仍能實現多語種翻譯、紀要生成,會議內容不觸云、不泄露;在智能工業領域,產線質檢與車路云協同通過本地算力完成實時分析決策,生產數據與運營信息在設備端閉環處理,避免云端傳輸隱患。
后摩智能通過存算一體技術與大模型的深度融合,推動AI大模型在端邊側實現“離線可用、數據留痕不外露”,構建起“低功耗、高安全、好體驗”的端邊智能新生態。這一生態的建立,不僅解決了傳統云端計算的高延遲、高帶寬成本問題,更為隱私敏感型應用提供了可靠的解決方案。
技術深耕與戰略聚焦:吳強博士的創業哲學
在發布會現場,后摩智能創始人兼CEO吳強博士分享了他的創業初衷與技術追求。吳強博士的創業故事始于一個樸素的愿望:希望通過AI技術彌補子女不在身邊的缺憾,讓智能無處不在。2020年底,他選擇存算一體作為技術方向,開啟了后摩智能的征程。
“當時存算一體并不像今天這樣被主流芯片公司廣泛討論,”吳強博士回憶道,“但我們堅信,要解決功耗墻和存儲墻的問題,必須走存算一體的路線。”這一選擇在四年后得到了驗證。后摩智能通過存算一體技術,成功將計算單元與存儲單元深度融合,大幅提升了算力密度與帶寬效率,為端邊大模型的部署提供了可能。
吳強博士的技術執著不僅體現在芯片設計上,更貫穿于他的生活方式。他分享了自己對運動的熱愛,尤其是足球、籃球與長跑。“我對運動的自律和堅持,恰似我對技術的執著。一旦認定方向,便矢志不渝。”這種精神也體現在后摩智能的團隊文化中——公司規模穩步增長,團隊精干高效,成為應對行業變化與快速響應的基石。
在戰略層面,后摩智能經歷了從通用AI計算到端邊大模型AI計算的聚焦過程。吳強博士指出,大模型時代對算力的需求呈現出兩大趨勢:一是重心逐漸從訓練向推理遷移,二是從云端智能向邊端智能遷移。基于這一認知,后摩智能決定以存算一體技術為矛,直穿端邊大模型計算的最后一公里,致力于成為端邊大模型AI芯片的領跑者。
這一戰略聚焦在M50芯片上得到了充分體現。M50不僅在物理算力上達到160TOPS,更通過存算一體技術實現了能效比的質的飛躍。吳強博士透露,后摩智能已啟動下一代DRAM-PIM技術研發,通過將計算單元直接嵌入DRAM陣列,使計算與存儲的協同更加緊密高效。該技術將突破1TB/s片內帶寬,能效較現有水平再提升三倍,推動百億參數大模型在終端設備的普及。
在技術細節上,M50芯片的存算一體IP采用了第二代設計,包括雙端口加載與計算的并行、混合精度設計以及電源穩定性優化等。這些創新使得M50在極小的面積下實現了極高的面效比,成為市場上能效比最高的端邊大模型AI芯片。此外,M50還配備了新一代編譯器工具鏈——后摩大道,通過細顆粒的算子支持與自動化優化策略,大幅降低了模型部署的復雜度,提升了應用落地的效率。
吳強博士的分享不僅揭示了后摩智能的技術實力,更展現了其對行業趨勢的深刻洞察。他提到,未來大模型的應用將更依賴于算力與帶寬的密集支持,而存算一體技術正是解決這一需求的關鍵。通過與北京大學的合作,后摩智能在DRAM存算用在大模型推理框架上的研究已取得突破性進展,相關論文入選今年ISCA最佳論文,進一步鞏固了其在學術界與產業界的領先地位。
總結
后摩智能的M50芯片及其產品矩陣的發布,標志著端邊智能新時代的正式開啟。通過存算一體技術的深度融合,后摩智能成功解決了端邊設備在算力、功耗與帶寬方面的痛點,為消費終端、智能辦公與智能工業等領域提供了高效、安全、低成本的AI解決方案。吳強博士的創業故事與技術追求,則為這一成就增添了人文溫度與技術深度。
面向未來,后摩智能將繼續深耕存算一體技術,推動DRAM-PIM芯片的研發與落地,進一步鞏固其在端邊大模型AI芯片領域的領跑地位。隨著百億參數大模型在終端設備的普及,后摩智能的愿景——讓AI走出云端,真正走入千家百戶,賦能千行百業——正逐步成為現實。
-
AI芯片
+關注
關注
17文章
1990瀏覽量
35988 -
存算一體
+關注
關注
1文章
110瀏覽量
4701 -
后摩智能
+關注
關注
0文章
38瀏覽量
1395
發布評論請先 登錄
2025端側AI芯片爆發:存算一體、非Transformer架構誰主浮沉?邊緣計算如何選型?
后摩智能入圍工信部算力強基揭榜行動
蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程

后摩漫界M30芯片成功適配DeepSeek-R1系列模型
存算一體架構創新助力國產大算力AI芯片騰飛
科技新突破:首款支持多模態存算一體AI芯片成功問世

評論