數字信號處理技術無處不在。如今的設備常常配備數十個傳感器,這些傳感器采集的數據要經過篩選與聚合處理后,才能為人工智能(AI)模型所用。隨著人工智能工作負載在各行各業中日益普及,嵌入式系統對強大且高效的信號處理能力的需求也與日俱增。這些計算密集型人工智能算法通常控制代碼量有限,主要在數據流上運行,并且要求具備硬實時性能,同時滿足低延遲的嚴格限制。
因此,數字信號處理器(DSP)成為了解決方案中不可或缺的關鍵部分。與通用處理器不同,DSP能夠并行執行矢量化計算,從而最大限度地減少計算周期數和延遲。然而,增加矢量大小會占用更多的芯片面積,因此需要在性能與效率之間找到恰當的平衡。
這正是行業需要更多選擇的原因所在。開發者在挑選DSP時,不僅要確保其能滿足特定應用的性能要求,還要使其符合給定的芯片面積和功耗預算限制。幸運的是,新思科技的ARC VPX產品系列最近進行了擴展,正好滿足了這一需求。
新型ARC VPX6處理器為該產品系列引入了1024位矢量處理功能,進一步豐富了現有的VPX系列,該系列還包括VPX5(512位)、VPX3(256位)和VPX2(128位)等不同版本。VPX6在將峰值性能提升至原來兩倍的同時,還能與VPX系列的其他成員保持完全的軟件兼容性。開發者只需對硬件進行升級,而無需重新編寫代碼,就能從一開始便實現性能的顯著提升。
ARC VPX DSP系列
ARC VPX DSP系列是專為低功耗、高吞吐量計算而設計的高性能矢量DSP。這些處理器廣泛應用于汽車傳感、人工智能視覺系統、雷達/激光雷達和工業自動化領域,在這些領域,對海量數據流進行實時處理至關重要。
早期的VPX處理器支持128位、256位和512位的矢量長度,這使得開發者能夠根據工作負載選擇最高效的處理配置。這些處理器具有魯棒的多核可擴展性,但隨著更高分辨率攝像頭、更密集傳感器陣列以及更復雜人工智能模型的出現導致數據量持續增長,許多應用對并行處理效率提出了更高的要求。
新型ARC VPX6通過引入1024位矢量處理功能,進一步擴充了VPX系列,其數據吞吐量相較于VPX5提升了一倍。VPX6在與之前VPX處理器保持向后兼容性的基礎上,提供了一種可擴展的高效解決方案,以滿足新一代人工智能和嵌入式系統的需求。
VPX6的突出優勢
ARC VPX6的核心改進在于其引入了1024位矢量單指令多數據(SIMD)處理技術,該技術顯著提高了計算效率。借助SIMD架構,VPX6能夠同時對多個數據點執行單一操作,從而減少了所需的計算周期。與VPX5的512位處理能力(每周期可執行64次單精度浮點運算)相比,VPX6的運算能力達到了其兩倍,每周期可執行128次運算。這使得VPX6在圖像濾波、雷達批量快速傅里葉變換(FFT)、人工智能預處理以及傳感器融合等工作負載中表現出色,性能得到了顯著增強。
除了強大的原始計算能力外,ARC VPX6還配備了先進的直接內存訪問(DMA)引擎,該引擎能夠確保數據持續不斷地流向處理器,避免出現空閑周期,從而最大限度地提高數據吞吐量。VPX6支持雙緩沖技術,能夠有效地隱藏內存延遲,從而最大限度地提高了計算效率。
值得注意的是,矢量處理受阿姆達爾定律的約束。那么,并行化的程度能夠達到多高,以及在哪個階段將任務分配給多個并行工作的內核更為合適呢?這些問題的答案取決于具體的應用工作負載。而VPX6的出現為開發者提供了更多的選擇。
▲新思科技 ARC VPX 數字信號處理器 IP
可擴展性、可配置性與易用性
ARC VPX6完全向后兼容VPX2、VPX3和VPX5,能輕松集成到新設計或現有設計中。例如,新思科技提供了與矢量長度無關的庫,確保之前為VPX處理器編寫的遺留軟件無需修改,就能在VPX6上運行。這種兼容性縮短了開發周期,開發者不用修改現有代碼庫,就能輕松升級解決方案。與矢量長度無關的設計方法,使得基于相同的軟件基礎架構,能夠開發出滿足不同性能需求(從低端到高端)的完整產品系列。
與VPX系列的其他成員一樣,VPX6具有高度可配置性。例如,開發者可以輕松定義寄存器數量、L1和L2內存大小等參數,或者決定是否在架構中集成數學和FFT加速器。這種靈活性使工程師能夠根據具體的應用需求定制架構,有效地避免了芯片面積和功耗的不必要開銷。
為了進一步提高可擴展性,VPX6提供了多種配置選項:單核(VPX6)、雙核(VPX6x2)和四核(VPX6x4)。這些完全集成的多核解決方案配備了共享的DMA引擎、內存一致性機制、同步支持以及運行時庫。這使得開發者能夠根據特定的工作負載需求,對性能和能效進行優化。
VPX系列的所有成員均采用ARC處理器擴展(APEX)專利技術,允許開發者創建用戶自定義的標量和矢量指令。同時,它還支持集成定制的硬件加速器,在提升特定應用性能的同時,降低了功耗和內存需求。VPX處理器還有豐富的預優化庫,涵蓋DSP、線性代數和視覺處理領域,其中包括專為OpenCV風格操作定制的視覺內核。這些庫提供了現成的軟件功能,如顏色轉換、解算器、邊緣檢測、物體跟蹤、矩陣變換和FFT等。
為VPX6設計的新功能,包括能夠處理長內存延遲的增強型DMA,以及對人工智能應用緊湊型數據存儲新行業標準OCP-MX的支持,也將推廣到整個VPX系列。
VPX6具有重大影響力的應用領域
ARC VPX6為開發者帶來了諸多優勢,非常適合用于眾多實時、高性能信號處理應用:
汽車傳感器處理:VPX6為高級駕駛輔助系統(ADAS)提供了有力支持。其高吞吐量的矢量化計算和優化的SIMD處理功能,能夠高效地處理來自多個傳感器的攝像頭數據,實時識別物體、車道標線和行人。同樣,在自動駕駛汽車的雷達和激光雷達數據處理方面,VPX6能夠加速物體檢測和距離估算,從而提升基于人工智能的決策能力。
工業和智能攝像頭:VPX6能夠實現高速圖像濾波、降噪和特征增強。這些功能為先進的視覺處理提供了有力支持,減少甚至消除了對專用外部處理器的依賴。
人工智能和機器學習工作負載:VPX6可作為高速預處理器,在將數據傳遞給神經處理單元(NPU)(如新思科技ARC NPX)之前對數據進行優化處理。通過處理計算密集型濾波和特征提取任務,VPX6能夠顯著提高推理效率,減少人工智能工作負載中的瓶頸問題。借助集成SDK(內含基于ONNX的神經網絡編譯器),人工智能任務能在VPX和NPX之間自動分配。由VPX和NPX組成的人工智能子系統,結合了人工智能加速器的強勁性能以及強大DSP的前瞻性和靈活性。
安全實現:上述許多應用都對信息安全和軟件安全有著嚴格的認證要求。因此,VPX系列的所有成員都提供了功能安全(FS)版本,該版本不僅通過了ISO 26262 ASIL信息安全認證,還符合ISO/SAE 21434網絡安全標準。經過安全認證的硬件,搭配經過安全認證的編譯器、運行時環境和計算庫,確保了系統安全穩定。
將數字信號處理提升到新高度
新思科技的ARC VPX6將數字信號處理技術提升至全新的水平。它在將VPX5的性能提升一倍的同時,減少了計算周期和功耗并且保持了軟件的完全兼容性,便于開發者采用。VPX6具有更高的可擴展性和效率,為開發者提供了更大的靈活性,使他們能夠根據特定的工作負載優化功耗、性能和面積(PPA)。
展望未來,新思科技將繼續推進ARC VPX處理器系列的發展,以滿足人工智能和嵌入式系統不斷變化的需求。通過提供行業領先的工具、優化的庫以及便捷的集成選項,新思科技將助力開發者突破高性能信號處理的界限,實現更多的創新。
-
處理器
+關注
關注
68文章
19851瀏覽量
234129 -
數字信號
+關注
關注
2文章
996瀏覽量
48236 -
新思科技
+關注
關注
5文章
862瀏覽量
51366
原文標題:實時響應“快人一步”,高效低耗“省出境界”: 新思科技ARC VPX6 1024位矢量處理器登場
文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
新思科技攜手上海大學助力嵌入式人才培養
HXS320F28027數字信號處理器(32位RISC-V DSP)
Cadence推出Tensilica NeuroEdge 130 AI協處理器
新思科技推出基于Arm服務器原生運行的Virtualizer虛擬仿真技術
英特爾至強6處理器助力數據中心整合升級
聆思科技獲得Ceva-Waves Wi-Fi 6 IP授權
Andes晶心科技推出D45-SE RISC-V處理器
基于DSP TMS320C6678+FPGA XC7V690T的6U VPX信號處理卡

L-com諾通推出新型6類/超6類Keystone IDC插座
高通驍龍6 Gen 3處理器發布

意法半導體推出工業級64位微處理器STM32MP2系列
LM98519 10位65 MSPS 6通道成像信號處理器數據表

評論