2025 年春節前后,DeepSeek 橫空出世,改變了全球 AI 產業的市場格局與發展范式。DeepSeek 爆火進一步激發了“邊緣 + AI”的市場剛需,顯著降低了大模型在邊緣設備的部署及運營成本。一時間,各類應用紛紛接入 DeepSeek,包括搜索引擎、機器人、汽車、智能手機等。
移遠通信產品總監王韜在“綻放通信之美—預見端側 AI 未來”主題直播中指出,DeepSeek 推動端側 AI 從被動智能邁向主動智能,但也引發了關于算力、算法與應用的新思考和新挑戰。移遠通信提供的端側大模型解決方案,深度融合 LLM(大語言模型)、RAG(檢索增強生成)與 Agent(智能體)等前沿技術,賦能端側 AI 方案創新。
DeepSeek帶來端側AI發展新范式
端側 AI 并非新興概念。早期,產業借助 DSP 等專用芯片處理語音識別、圖像增強等基礎任務。隨著芯片算力提升,產業開始探索將復雜算法融入終端設備。2021 年前后,將 AI 大模型能力植入端側興起,標志著端側 AI 進入認知智能階段。根據頭豹研究院發布的《2024 年中國端側 AI 場景應用分析:智能終端與邊緣計算的融合創新》報告,2023 年中國端側 AI 市場規模達 1939 億元,預計 2028 年將增至 19071 億元,年均復合增長率為 58%。
中國端側 AI 市場規模,圖源:頭豹研究院
從千億級邁向萬億級,端側 AI 后續更大的增量源于端側應用與邊緣計算、AI 大模型的融合。這種融合從技術架構、場景創新和產業生態三個維度重塑端側 AI 的邊界。移遠通信產品經理王柯指出,相較于云端 AI,端側 AI 實時性更佳,推理成本更低,且保障了用戶隱私安全。此外,端側 AI 使大模型推理擺脫網絡依賴,在信號不佳或無網絡服務區域也能提供推理服務。
然而,將云端AI 大模型部署到端側面臨諸多難題。比如,如何平衡端側推理效率與模型能力,怎樣實現硬件、軟件與商業模式的協同發展等。在 DeepSeek 出現前,端側 AI 發展的難題是云端依賴與端側限制并存。端側設備受算力、存儲和功耗制約,難以承載超 10B 參數的大模型,需借助云端協同完成復雜任務,這導致響應延遲和隱私風險。同時,模型功能單一,無法支持多模態交互或主動決策。
DeepSeek 的出現對端側 AI 發展具有革新意義。它采用創新的 MoE(混合專家)架構,如在 DeepSeek-V3 模型中,每層包含 256 個路由專家和 1 個共享專家,每個 Token 僅激活 8 個專家,大幅降低了訓練和推理成本;通過高效蒸餾技術,將大模型推理能力遷移至更小、更高效的版本,彌補了小推理模型 Self-play 學習的不足;此外,DeepSeek-R1-Zero 實驗性版本表明,僅通過強化學習就能獲得強大推理能力。
DeepSeek 的方法論使端側能夠獨立完成復雜任務,將應用決策權從云端真正下放至邊端。王柯認為,DeepSeek 闡釋了一種 “少即是多” 的 AI 大模型部署理念,進一步推動模型小型化發展。現階段,3B 或 4B 參數級別的模型已等效于之前的 7B 參數模型。
移遠通信產品經理羅錚談到,從硬件角度看,DeepSeek 的一大優勢在于以更小體量模型帶來更強能力,這使得小算力芯片、小容量存儲及小 BOM 就能實現高性能端側 AI 方案。
當前,端側 AI 大模型主要落地場景包括 AI PC、AI 手機、AI 可穿戴設備、AI 智能家居、AI 智能汽車、AI 零售等。機器人應用,尤其是人形機器人,則是端側 AI 落地的藍海市場。端側 AI 大模型部署通過技術架構革新和場景適配能力突破,推動機器人產業向更高階的自主化、智能化方向發展。一方面,端側部署大模型可提升機器人實時性和可靠性,通過本地化運算大幅降低數據傳輸延遲,使機器人能在毫秒級的時間內完成環境感知 - 決策 - 執行閉環,滿足工業場景中精準抓取、避障等高實時性需求;另一方面,端側部署大模型還可提升機器人交互性能,支持視覺、語音、觸覺等多模態數據實時融合處理,使服務型機器人實現更自然的擬人化交互。
移遠通信產品經理沈鋒稱,對于機器人等端側 AI 應用而言,DeepSeek 帶來的直觀影響是能以更低成本實現相同性能,使越來越多領域愿意投資端側 AI。
移遠通信為端側AI落地提供一站式解決方案
正如移遠通信幾位產品經理在直播中所分享,移遠通信為端側 AI 落地提供涵蓋智能硬件、算力、算法和服務的完整解決方案,助力用戶快速實現端側 AI 從概念到落地的商業轉化。
高效支持主流 AI 大模型
AI 大模型是 AI Agent 的核心。目前,移遠大模型解決方案可實現 AI 模型的端側部署,支持通義千問、DeepSeek 等主流 AI 大模型。
針對當下大熱的 DeepSeek,DeepSeek-R1 版本專注于強化學習技術路線,其蒸餾版本參數范圍為 1.5B 至 70B。得益于蒸餾技術,這些小模型雖體量小但性能強勁,是端側 AI 部署的理想選擇。目前,移遠通信高算力AI智能模組 SG885G已能穩定運行 DeepSeek-R1 蒸餾小模型,并完成了針對性微調。
實測數據顯示,移遠通信 SG885G 模組運行 DeepSeek-R1 蒸餾小模型的方案,其生成 Tokens 的速度超每秒 40 個 Tokens。按人類講話速度換算,人類每分鐘能講 300 - 400 個字,約 500 - 600 個 Tokens。因此,能支持每秒準確輸出 10 個Tokens 的 AI 模型即可滿足商業落地條件。
未來,隨著性能持續優化,該方案的速度還將進一步提升,為智能終端設備賦予更強大的 AI 能力。該方案適用于智能機器人、智能座艙、機器視覺、個性化虛擬助理、平板電腦、老人監護、智能家居、AI 玩具及可穿戴設備等多元場景。
王柯表示,在眾多廠商還在探索如何支持 DeepSeek 模型時,移遠通信已率先取得突破,這充分彰顯了移遠通信技術團隊卓越的工程化能力,能夠快速完成方案設計、模型微調、端側部署和資源調度等工作。
在端側 AI 交互至關重要的語音交互領域,移遠通信大模型解決方案在全語音鏈路上實現無縫銜接與高效運行,涵蓋 KWS 語音喚醒、VAD 人聲檢測、ASR 語音識別和 TTS 語音播報等主流功能,助力用戶快速實現基于語音的無感交互。
滿足端側 AI 廣泛需求的模組產品矩陣
邊緣計算智能模組是AI Agent 的基石。移遠通信面向端側 AI 應用提供豐富的模組產品。SG885G-WF 是該公司目前在端側 AI 領域主推的一款智能模組,集成高通 QCS8550 芯片,綜合算力高達 48 TOPS,并提供 LCM、攝像頭、觸摸屏、I2S、PCIe、UART、USB、I2C 等豐富接口資源。為滿足端側 AI 在不同算力、成本、功耗方面的需求,移遠通信還提供包括但不限于以下產品系列:
■ 基于高通 QCS8250 的 SG865W 系列,算力為 15 TOPS;
■ 基于高通 QCM6490 的 SG560D 系列,算力為 12 TOPS;
■ 基于展銳 UIS7885 的 SG530C 系列,算力為 8 TOPS;
■ 基于瑞芯微 RK3568 的 SG368Z 系列,算力為 1 TOPS。
羅錚介紹,總體而言,移遠通信的智能模組可覆蓋 1 TOPS 到 48 TOPS 的算力需求,公司還在規劃 80 - 100 TOPS 甚至更高算力的產品,以滿足客戶在端側 AI 不斷增長的算力需求。
同時,移遠通信也打造了有利于用戶方案實現的開發板,比如MWC 2025上公司推出QuecPi Alpha智能生態開發板,基于高通躍龍QCS6490處理器打造,AI算力高達12 TOPS,能夠滿足眾多AIoT應用場景中對物體識別、圖像識別等功能的多樣化需求。這些硬件方案都能靈活支持安卓、Linux 和 Ubuntu 等操作系統,充分滿足客戶在高端機器人和端側 AI 方面的開發需求。移遠通信的軟硬件產品組合及背后的技術服務,能讓用戶便捷地完成不同算力平臺間的切換,加速產品升級迭代進程。
QuecPi Alpha智能生態開發板
智能模組 + AI 大模型,重構端側 AI 應用
如前所述,移遠通信的智能模組和大模型解決方案有著豐富的應用場景。下面通過具體案例,看看移遠通信如何借助智能模組 + AI 大模型賦能端側 AI 應用。
第一個案例是當下熱門的 AI 機器人。基于移遠通信端側大模型解決方案中的 SG885G-WF 智能模組和全語音鏈路架構,服務機器人能對指令、提問或求助迅速響應,準確理解用戶意圖,并以清晰自然的語音反饋,實現無感交互。尤其值得一提的是,得益于 SG885G-WF的高算力,移遠“大模型+AI 機器人”解決方案在離線狀態下也能提供完整 AI 性能。
這一方案使服務機器人在終端市場具備巨大應用價值,涵蓋醫療康養、智能客服、接待導覽和零售導購等領域。在具體落地過程中,移遠通信技術團隊提供高效、全面的工程化支持,助力客戶產品快速進入市場,并形成差異化競爭優勢。比如,在醫療康養領域,德壹機器人基于移遠通信集成SG885G-WF模組的端側AI解決方案推出了全能王AI具身機器人,支持8自由度3D視覺導航,融合尖端AI技術、中醫理療智慧與具身智能,重新定義了智能理療服務邊界。
沈鋒認為,DeepSeek 等 AI 大模型的推出為機器人行業發展注入新活力,重塑了機器人的 “大腦”。現階段,機器人僅具備一些基礎能力,交互方面存在較大欠缺,AI 大模型的加入將改善這一狀況。未來,落地到終端的AI機器人會越來越多,這將是一個在未來 5 年增長率極高的領域。
第二個案例是 AI 智能無人零售解決方案,移遠通信通過大模型重新定義無人零售的交互體驗。在 MWC 2025 上,移遠通信宣布推出圍繞 “動態視覺 + 邊緣計算” 構建的全新 AI 智能無人零售解決方案。該方案基于移遠高性能5G AI算力模組 SG560D,支持先進的全鏈路商品識別算法,識別準確率高達 99%,還具備創新的上新平臺等軟硬件服務,可無縫對接客戶應用程序。除 SG560D 模組搭載的QCM6490平臺外,移遠通信這套方案還能兼容更多算力平臺,滿足零售機廠商的差異化競爭需求。
目前,移遠 AI 智能無人零售解決方案已與興元科技 “喵星人” 智能售貨機等多家客戶產品完成系統集成,并進入實地場景測試階段。
結語
作為端側 AI 生態的重要構建者,移遠通信正通過“智能模組 + AI 大模型”雙輪驅動,重塑端側 AI 的產業格局。其一站式大模型解決方案深度融合 DeepSeek 等前沿 AI 模型,結合SG885G-WF 等高性能AI模組,成功突破端側部署的算力瓶頸與工程難題,在機器人、智能零售、汽車電子等場景中,構建起 “本地決策 - 實時交互 - 隱私保護” 的閉環能力。
未來,移遠通信將持續深化算力平臺迭代,推出 80 – 100 TOPS 甚至更高算力的智能模組,結合場景化算法優化,將 AI 大模型的能力拓展至更廣泛的端側 AI 場景。
-
人機交互
+關注
關注
12文章
1231瀏覽量
56114 -
AI
+關注
關注
87文章
33714瀏覽量
274490 -
移遠通信
+關注
關注
6文章
728瀏覽量
19346
發布評論請先 登錄
聲學技術如何重構人機交互生態
移遠通信重磅發布“模音云犀”解決方案:賦能萬物智聯,開啟AI大模型普惠時代

AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式

移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

移遠通信聯合德壹發布全球首款搭載端側大模型的AI具身理療機器人

端側AI模組再進化!移遠通信和美格智能在MWC如何放大招?

移遠通信AI玩具整體解決方案全面升級:融合火山引擎RTC大模型,打造實時交互新體驗

移遠通信邊緣計算模組成功運行DeepSeek模型
移遠通信邊緣計算模組成功運行DeepSeek模型,以領先的工程能力加速端側AI落地

新的人機交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰

評論