近日,在福州舉行的第八屆數字中國建設峰會上,中星微宣布其最新一代AI芯片“星光智能五號”在“數字感知芯片技術全國重點實驗室”成功運行Deepseek 7B/8B/16B大模型,成為首款全自主可控的能夠單芯片實現通用語言大模型和視覺大模型同時運行的嵌入式AI芯片。
據了解,該芯片采用中星微自研的通用多核異構GP-XPU架構,比CPU+GPU架構在運行效率、實時性、性價比和安全性等方面大幅提升。
據介紹,該芯片基于國產工藝制程,完全自主可控。基于“星光智能五號”,可構建具有“萬物識別”能力和自然語言處理能力的“本地化智能體”,為千行百業的智能化升級提供更優解決方案,可廣泛應用于國家戰略重要領域以及城市感知、智能制造、智慧農業、智能交通等行業,更好服務于數字中國建設和新質生產力發展。
首款運行通用大模型單芯片,突破邊緣算力極限
據介紹,“星光智能五號”通過采用GP-XPU架構,集成高性能的RISC-V CPU、GP-GPU、NPU,以及面向智能感知領域的圖像信號處理器(ISP)、視頻編解碼器(VPU)、加解密處理器(ECU)等多核心模塊,通過專用的HCP(異構計算池)任務調度單元和安全內存管理系統,實現多異構內核之間的算力與存儲資源的實時調度與動態共享,大幅提升了算力利用效率和數據吞吐率,從而首次實現了在單芯片上部署運行DeepSeek 1.5B、7B、8B、16B等通用大模型及視覺大模型的能力。
在僅約一張名片大小的處理板中,單顆“星光智能五號”既滿足復雜場景下的視頻實時檢測、識別與跟蹤需求,又能實現自然語言處理、任務規劃、知識管理、自動控制等智能體功能;通過8顆芯片聯合部署,能夠支持“滿血版”671B參數DeepSeek大模型和視覺大模型運行,徹底打破邊緣端算力瓶頸。
“六邊形戰士”全能領跑AI芯片賽道
作為AI芯片領域的全能型選手,“星光智能五號”以六大核心優勢樹立行業標桿:
高效率:通過算子級MoE架構與HCP實時調度機制,算力利用效率提升約40%,數據吞吐率提升約50%;
低能耗:通過異構計算資源按需分配,該芯片能耗降低至少30%;
低成本:通過“端-邊閉環架構”減少云端資源依賴,綜合部署成本約為服務器架構同性能部署的1/3;
體積小:嵌入該芯片的處理板最小僅需要約一張名片大小,可滿足多種小型化智能設備的空間需求;
強安全性:采用存儲器分區安全隔離技術,支持高性能國密算法計算,實現信源級密碼保護,具備原生數據安全特性;
高適應性:支持開放生態與主流AI框架,無縫對接千行百業的各種應用場景;在工作環境適應性方面,“星光智能五號”擺脫了云端大算力設備對機房恒溫恒濕環境的依賴,可以在各種生產生活現實環境中完成高性能智能化工作。
賦能“本地化智能體”,重構AI部署范式
中星微技術CEO張韻東介紹,“星光智能五號”將推動端側、邊緣側智能化升級,大幅減少對云端算力資源的依賴,節省系統建設成本,探索了一條符合中國國情的人工智能技術路線。
據了解,傳統依賴云端的AI推理流程常面臨響應延遲大、成本高、受制于網絡環境等問題,而該芯片通過本地化算力與內生安全機制,使大模型推理可直接在邊端側內完成閉環,既節省了云端傳輸與存儲成本,同時極大提升了響應速度,可實現毫秒級響應,同時以信源級密碼機制保障數據全生命周期安全。
這一技術突破為城市感知、智能制造、智慧交通等場景提供了效率、能耗、成本、體積、安全性、適應性綜合優化的實踐路徑,真正賦能千行百業打造自主可控的智能終端。
張韻東表示:“中星微面向我國傳統行業數字化轉型的實際需求,發展端、邊、云分布式人工智能計算技術,在不依賴于最先進的半導體工藝制程的情況下,堅持原始創新和自主可控,探索了一條符合中國國情的人工智能技術路線。”
“星光中國芯工程”總指揮、中國工程院院士鄧中翰(前排右4),工程副總指揮、中星微技術CEO張韻東博士(前排左4)及研發團隊慶祝“星光智能五號”單芯片運行DeepSeek大模型成功。
關注中星微技術
在數字感知領域擁有國際領先的AI芯片設計技術和新一代AI視覺技術的高科技企業,面向公共安全、數字信創、智慧能源、智慧交通、智慧金融、工業物聯網、車聯網及家庭等領域提供數智化行業應用及解決方案。
-
中星微
+關注
關注
0文章
38瀏覽量
11393 -
AI芯片
+關注
關注
17文章
1959瀏覽量
35619 -
DeepSeek
+關注
關注
1文章
757瀏覽量
1093
原文標題:首創AI芯片新架構 中星微發布可單芯片運行DeepSeek大模型新一代AI芯片
文章出處:【微信號:中星微技術,微信公眾號:中星微技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論