電子發燒友網報道(文/李彎彎)2025年6月6日,面壁智能CEO李大海在北京智源大會上發布有史以來最具想象力的面壁小鋼炮模型MiniCPM4.0,代號“前進四”,開源兩個版本,8B閃電稀疏版和0.5B最強小小鋼炮。

李大海表示,面壁智能是第一個把全模態模型帶到端側的公司。面壁智能小鋼炮,旨在把大模型放到離用戶最近的地方,做高效的端側智能。
MiniCPM4.0最大的特點——快
2019年面壁智能超前入局大模型,發布世界首個知識增強大模型ERNE,2020年發布國內首個中文大模型CPM-1,2021年發布持續學習發模型CPM-2,2022年發布可控生成大模型CPM-3;2023年,面壁智能又發布CPM-Bee多語言百億大模型,之后還發布了第三代千億參數多模態大模型CPM-Cricket,評分超越GPT-3.5,邏輯能力比肩GPT-4。
2024年面壁智能領先走向端側智能。2月發布MiniCPM-2B旗艦級端側模型;4月發布MiniCPM 2.0;9月發布MiniCPM-V 2.6,在端側性能實現全面對標 GPT-4V;12月發布MiniCPM 3.0,在包括自然語言理解、知識、代碼、數學等多項能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能發布MiniCPM-o 2.6端側全模態模型,性能比肩GPT-4o;2025年3月發布cpmGO,首個純端側智能體助手。

李大海介紹,面壁智能端側大模型面壁小鋼炮包括基座模型MiniCPM、旗艦多模態模型MiniCPM-V、旗艦全模態模型MiniCPM-o。截至目前,面壁小鋼炮旗艦端側大模型有超過1000萬下載量。李大海表示:“這是千千萬萬開發者對我們的認可,未來還會持續發布更好的端側大模型,賦能智能硬件的創新和開發。”

“這次發布的面壁小鋼炮模型MiniCPM4.0版本,最大的特點就是快。”李大海談到,“相比其他模型,MiniCPM4.0-8B僅22%訓練開銷,在同等參數下,性能更強,可對標Qwen3-8B,超越Gemma3-12B。”
MiniCPM4-MCP支持15個主流應用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端側版表現比肩DeepResearch。

面壁小鋼炮正在進行廣泛的生態適配,適配主流芯片與開源框架部署,芯片如括華為、英特爾、聯發科、高通;開源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海強調,依托分塊稀疏注意力機制,MiniCPM4.0在英特爾平臺上推理深度優化實現兩倍加速。
多維度技術創新——架構高效、推理高效
MiniCPM4.0之所以能夠做到又快又好,源于系統級層層效率優化,包括四個層面:架構高效、推理高效、學習高效、數據高效。

架構高效方面,MiniCPM4.0采用InfLLM升級版InfLLM 2.0稀疏注意力結構。李大海介紹說,稀疏度越高,計算量越小,速度越快。傳統Transformer模型每token需和序列中所有token進行相關性計算逐字重復計算,效率低下。InfLLM 稀疏注意力機制,對文本分塊分區域處理,只對最具相關性重點區城進行注意力計算“抽查”,更高效。
而且MiniCPM4.0采用高效雙頻換擋,即長文本用稀疏,短文本用稠密。

推理高效方面,面壁智能自研全套端側高性能推理框架。CPM.cu自研極速端側推理框架,稀疏、投機和量化的高效結合,FR-Spec輕量化投機采樣,并給小模型減負加速,使得速度提升5倍;BitCPM極致低位寬量化,端側極致內存容量友好,4-bit量化達業界SOTA等級,瘦身90%;Arklnfer自研跨平臺部署框架,面向多平臺端側芯片極致優化,跨平臺高效投機采樣和限制解碼,端側多平臺 ModelZoo絲滑使用,速度提升2倍。
李大海表示,與云端不同,云端多采用英偉達、昇騰的芯片,而端側較為復雜,這種跨平臺部署框架對于大模型端側部署來說就極為重要。在他看來,面壁智能新帶來的面壁小鋼炮模型MiniCPM4.0,在多項技術的加持下,使用更少的數據,需要更少的訓練、更少的算力,因而成本也會下降,這有助于大模型能在更多場景實現落地。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
模型
+關注
關注
1文章
3520瀏覽量
50421 -
云模型
+關注
關注
0文章
10瀏覽量
7095
發布評論請先 登錄
相關推薦
熱點推薦
Nordic PMIC全家桶,讓電源管理和節能更進一步!
使用 nPM2100 開始設計和開發應用。此外,nPM2100 評估套件 (EK) 也已全面上市,多家分銷商在發布當天提供庫存套件并進行銷售。
nPM2100 是一款電源管理集成電路 (PMIC),旨在
發表于 06-29 17:19
恩智浦技術賦能下一代家庭能源管理系統
2024年11月發布了Matter 1.4版本,其中一大亮點是它極大地擴展了對家庭能源管理系統 (HEMS) 的支持。Matter 1.3引入了能源報告功能,實現大型家電和供電設備能源管理用例,而Matter 1.4則更進一步,
英特爾與面壁智能宣布建立戰略合作伙伴關系,共同研發端側原生智能座艙,定義下一代車載AI
今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰略級合作伙伴關系,旨在打造端側原生智能座艙,定義下一代車載AI。目前,雙方已合作推出“英

首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
AI巨頭強強聯手,勢必為智能體化AI體驗時代按下超級加速鍵。
AI終端的下一步是“普適智能”,而不是“極限性能”。聯發科憑借天璣9400+強悍的端
發表于 04-13 19:52
廣和通CES 2025發布Fibocom AI Stack,賦能千行百業端側應用
近日盛大舉行的國際消費電子產品展覽會(CES 2025)上,廣和通隆重發布了其創新的Fibocom AI Stack解決方案。這一方案的發布,標志著廣和通在推動端
黑芝麻智能端到端算法參考模型公布
黑芝麻智能計劃推出支持華山及武當系列芯片的端到端算法參考方案。該方案采用One Model架構,并在決策規劃單元引入了VLM視覺語言大模型和PRR行車規則的概率化表征子模塊,

谷歌計劃12月發布Gemini 2.0模型
近日,有消息稱谷歌計劃在12月發布其下一代人工智能模型——Gemini 2.0。這一消息引發了業界的廣泛關注,因為谷歌在人工智能領域
科大訊飛發布訊飛星火4.0 Turbo大模型及星火多語言大模型
近日,科大訊飛正式推出了其最新研發成果——訊飛星火4.0 Turbo大模型。這一發布不僅標志著科大訊飛在人工智能領域的又一次重大突破,也預示
聯發科天璣9400發布:能效比與端側AI引領移動芯片行業革新
在AI大模型的推動下,智能手機市場的高端化進程進一步加速,旗艦機型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質的提升。特別是在手機芯片領域,高性能與低功耗、高能效比的平衡成為了新的競爭焦點。
三星計劃10月發布Galaxy S24 FE,拓展中端AI手機市場
據8月14日外媒報道,三星電子正積極籌備在今年10月推出其全新的Galaxy S24 FE手機,并計劃在隨后的12月發布Galaxy A16手機,以此進一步鞏固和拓展其在中端AI手機市場的地位。這
評論