大模型從最初的“不計成本”探索,到如今的“可持續”商業化落地,經歷了從技術突破到工程優化,再到產業融合的深度演進。在這一過程中,虹軟始終走在創新前沿,依托深厚的視覺AI技術積累,以ArcMuse計算技術引擎為核心,不斷推動視覺大模型的技術進步與行業落地,加速AI在各領域的深度應用。
自2023年推出以來,ArcMuse計算技術引擎憑借持續的 算法創新與工程優化 ,構建起多層次架構、跨模型協同優化、高效能計算引擎等核心能力,不斷突破通用大模型在計算成本、適配效率、推理速度等方面的局限。如今,經過對算法、數據、工程及大模型生態的全面優化,ArcMuse迎來了全新升級 —— ArcMuse 2025 V1.1版本。新一代ArcMuse在生成質量、計算效率、端側適配性等方面取得了顯著突破 , 進一步 增強了視覺大模型的泛化能力與實用性 。其先進的視覺AI能力全面支持智能手機、智能汽車、AI眼鏡、機器人、服裝智造以及智能商拍的創新發展。
ArcMuse 2025 總體架構與核心愿景:視覺AI核心基座引擎,不止大模型
ArcMuse是一個 兼顧效果和性能的緊湊AI綜合體 ,它以大底模和強化的垂直大模型為基礎,用以生成遠觀悅目的基礎效果,并利用一系列復雜或簡單細分小模型、淺層模型、用于約束的CV&CG引擎包對基礎效果進行控制,以達到近看自然、結構信息正確、細節豐富合理的最終圖像和視頻效果。
ArcMuse 2025核心思想與架構:
ArcMuse是一套深度耦合底模、細分大模型、控制淺層復雜模型和視覺庫、約束細節的淺層小模型和視覺庫,數據預處理引擎包、CV&CG處理引擎包、定制化文本生成模型的緊湊穩定AI平臺庫。
CPG(Control Packages) : 利用五大類小模型和引擎包對期望的結果進行約束與控制。
人 物: 手、臉、腳、四肢、體
深度: 各類攝像頭、模組、模式的輸入,都能得到高質量的深度
分割: 基于對象、區域、語義等
分類: 景、物、影調、情感等
邊緣: 強、弱、結構、遮擋、懸空等
KDE(Keep Details Engines) :利用一些淺層模型保留弱紋理和細節,利用光照模型分析、去除、重光照處理和維持影調(Shading)。
高效計算優化: 采用FP8混合精度計算,對核心計算復雜度高的OPs進行匯編級優化。
訓練和推理時的減冗余并行處理引擎包 :這點得益于公司定位實際應用落地有回報的降本壓力,進而研發出高效的基礎引擎和策略。
平臺無關化的各種處理 :依托虹軟 20 余年的視覺AI技術積累,使 ArcMuse 具備跨平臺適配能力,可靈活部署于云端、高性能計算平臺、移動端及嵌入式設備。
從實用落地的角度來看,真正可行的 AI 大模型方案必須實現 多層次協同與功能模塊互補 ,降低計算成本,以推動大模型應用平權化,使其更廣泛地賦能終端設備與各行業。ArcMuse 2025 正是基于這一理念讓視覺 AI 在真實應用場景中 實現性能、效果與成本的三重突破 。
從 DeepSeek 到 ArcMuse 2025:構建大模型新范式
AI 計算的高效降本是大模型商業可行化落地的關鍵,其核心在于 降低計算資源消耗 、 減少存儲需求與數據依賴 ,以更低的成本提供可接受甚至卓越的AI性能,使先進AI技術(包括大模型)能夠更廣泛地惠及各行業與終端設備。要實現這一目標,僅依賴單一大模型或傳統Transformer架構的頂級云計算平臺遠遠不夠,而必須借助 多AI范式的深度耦合 ,并具備 動態多層次的自適應能力的AI計算架構 ,以應對不同計算環境的需求。
在這點上, DeepSeek 在文本和規則性較強的AI任務(如數學、代碼等) 上的策略,提供了一個典型的成功案例。其通過 DS-MOE(動態路由稀疏專家網絡)、MLA(KV矩陣緩存壓縮)、MTP(多Token預測)、FP8(混合精度量化訓練)、GRPO (強化學習采用群組相對策略優化)、DualPipe(調度算法) 等優化策略,極大提升了大模型的計算效率,并降低了硬件成本,為大模型高效降本提供了新的思路。然而,DeepSeek 在推理計算與存儲占用上仍然存在一定的優化空間,特別是對于圖像、視頻等視覺任務而言,如何借鑒這些優化思想,并結合視覺AI的獨特需求,是一個關鍵課題。
在這一背景下, 虹軟對 DeepSeek 的優化策略進行了深入分析 ,并結合自身在視覺 AI領域的多年研發經驗,取長補短、深度融合,同時針對視覺 AI 的特性進行了 定制化優化 。實踐證明,這一耦合總體上帶來了 顯著的增益 ,不僅全面提升了ArcMuse的性能,尤其在 多模態數據理解、圖像與視頻推理增強方面效果突出 ;同時, 計算成本大幅降低 ,例如,在提示詞工程推理方面, 顯卡租賃成本減少了一半以上 ,使大模型的 AI計算更高效且可控 。
為直觀展現 ArcMuse 2025 在視覺生成、影像修復及視頻生成方面的能力,我們以非剛體拓撲難以保持的柔性衣物為背景,呈現其在復雜視覺任務中的卓越表現。
生成圖像示例1:
弱紋理、細節提升
生成圖像示例2:
細節、影調的提升
困難場景(Hard Case)示例:半透物(薄紗)、柔性物(裙裝)、復雜版型(塞腰、束腕)、弱紋理細節(紋理花紋、花邊領、暗條紋)
生成圖像示例4 :
AI模特圖大角度、模特表現力更新
生成圖像示例5 :
AI生成圖的光影效果、模特表現力更新
生成視頻示例6:
AI模特復雜動作的穩定性、表現力更新
生成圖像示例7:半透裝、碎花裙
生成視頻示例8:
讓示例7生成圖像再動起來
ArcMuse 2025 為垂直行業提供定制化解決方案
ArcMuse 2025 的架構是一種系統性優化方案,通過整合多個 AI 引擎,實現高效協同,即使在有限資源下仍能發揮最大效能,并為各類垂直行業提供定制化解決方案。這一架構理念使 ArcMuse 成為 虹軟視覺 AI 賦能引擎 ,可廣泛應用于移動智能終端 AI 影像處理、智能汽車、AI 眼鏡、XR 3D 空間計算頭顯、服裝智造和智能商拍以及智能機器人等垂直場景,推動行業創新升級。
在AI影像處理方面,ArcMuse 2025對AI影像模型進行了優化,特別是在圖像增強與影像細節恢復過程中,顯著減少了生成不真實效果的風險。升級后的模型在處理復雜紋理和高對比度場景時,展現出較為穩定的增強效果,降低了圖像生成中的不確定性。另外,在語義分割與識別方面,ArcMuse 2025進一步增強了ArcMuse 2024對圖像內容的理解精度,尤其是在文字紋理處理上,表現出比以往更強的模型細節還原能力。
在智能汽車方向,ArcMuse 2025的推理能力和場景理解能力得到提升,尤其在低能見度和復雜路況環境下,其優化后的推理方法能夠結合不同的駕駛環境進行分析,為駕駛員提供更為合理的安全輔助建議。例如,在大霧天氣和濕滑路況下,系統能夠根據前方車輛的燈光信號、車速以及路面狀態,提出合理的駕駛策略與建議,減少潛在的駕駛或行車風險。
在 AI 眼鏡與 XR 3D 空間計算頭顯方向,ArcMuse 2025明顯提升了對復雜環境下物體識別的精度,尤其是在圖像語義分割和物體關系的理解上。在應用中,ArcMuse 2025能夠更加精確地區分復雜環境中的物體和背景,減少誤識別的情況。例如,在對圖像中的窗戶與畫作進行區分時,ArcMuse 2025 通過優化圖像分析流程,有效避免了誤識別,提高了識別的準確度。
在智能商拍方向,ArcMuse 2025利用內部新迭代的蒸餾框架優化了文本與圖像生成的控制精度,使得在提示詞響應的準確性和圖像生成的可靠性方面有更高的提升。升級后的ArcMuse有更強的文本與圖像的匹配能力,能夠更好地生成符合商業需求的圖像。
在智能機器人方向,ArcMuse 2025通過優化多模態數據處理、實時目標識別、復雜場景理解等可顯著提升機器人在動態環境中的適應性和自主性。同時,針對端側部署深度優化,可使其在有限算力下依然高效運行 AI 任務,助力其在工業自動化、智能服務、家庭陪護、教育娛樂等應用落地。
視覺大模型實用化:多AI協同,驅動創新落地
虹軟的視覺AI技術研發經歷了20多年的歷練,絕大多數技術都實現了產品化應用和實際落地,達到了100億級端側設備的實際應用。虹軟的AI研發經歷了從CV&CG到淺層學習,從端側深度學習到復雜模型,從底座模型強化到領域大模型;效果和性能、功耗3指標并舉的多階段扎實迭代向前演進。
在當下的AI技術快速發展浪潮中,大模型成為行業關注的焦點,近來DeepSeek又帶來一波強化劑。虹軟認為真正高效的智能計算體系不是單一的通識大模型,每個AI引擎有各自的效果和性能優缺點,須深度耦合、效果性能權衡,這樣才能幫助視覺大模型真正快速落地實用化。
另外,一個非常有意義的目標是:“大模型普及與可商業化”。其核心是算力要求要盡可能低,存儲資源要盡可能少,數據要求要盡可能少,成本盡可能省,但效果盡可能好。這樣的話,多AI范式的高度耦合,且是動態多層次的AI計算架構,才是邏輯合理的選擇,僅靠目前單一的視覺大模型還不夠、走不通,這就是ArcMuse的架構思路和定位。
-
視覺
+關注
關注
1文章
157瀏覽量
24308 -
虹軟
+關注
關注
1文章
59瀏覽量
4595 -
大模型
+關注
關注
2文章
3062瀏覽量
3915
原文標題:虹軟新一代視覺大模型ArcMuse 2025 V1.1正式發布,全面賦能手機、汽車、眼鏡、機器人、服裝智造和智能商拍行業
文章出處:【微信號:ArcSoft_World_Wide,微信公眾號:虹軟】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺
展會回顧 | 賦能新一代工業網絡!虹科2025華南工博會圓滿落幕

虹軟助力路虎全新一代Defender衛士系列上市
SEGGER推出新一代Flasher ATE在線編程器
虹軟科技亮相2025上海車展
東軟聯合推出新一代全語言交互式人社服務機器人“南小寧”
睿創微納推出新一代目標檢測算法
虹軟AI視覺賦能雷鳥V3 AI拍攝眼鏡發布
Garmin佳明和天馬推出新一代數字座艙解決方案
Garmin佳明和高通推出新一代數字座艙解決方案
虹軟ArcMuse計算技術引擎全面升級
比亞迪2025年將推出新一代刀片電池
DeepL推出新一代翻譯編輯大型語言模型
Nullmax正式推出新一代自動駕駛技術Nullmax Intelligence

評論