自主研發的多核智能計算架構研究解析

1 引言

人工智能算法需要強大的計算能力支撐，對算力的需求更是以超摩爾（Moore）定律增長，特別是深度學習算法大規模使用，對計算能力提出更高要求。智能算法并行性高、數據重用性強，而且不斷演進、新算法層出不窮、計算模型不斷變化，為處理器體系結構設計帶來巨大的設計空間。人工智能處理器體系結構設計目前存在著兩種類型設計：以TPU 為代表的專用架構和以GPU 為代表的通用架構。前者性能功耗比高、使用簡單，但缺乏一定的靈活性和通用性; 后者具有較好的靈活性和通用性，但是增加了功耗，編程和算法設計更加復雜。

國產眾核處理器具有融合異構體系結構、多維并行數據通信、柔性優化的存儲，以及高效平衡的運算核心等特性，為人工智能應用提供了有效支撐。深度融合異構核心架構集成通用處理核心和領域通用計算核心，滿足通用計算和智能計算領域通用的智能計算能力。多維并行數據通信體系采用基于輕量級寄存器通信和運算核心快速同步技術，實現運算核心間的低延遲高帶寬的數據交換和靈活高效同步，提升人工智能應用的核心運算效率。柔性優化存儲體系采用軟硬件結合的方法，使片上存儲管理柔性靈活，解決智能計算存儲帶寬受限和延遲增加的難題。高效平衡的運算核心在保證智能計算類應用處理效率的同時，通過集成更多的核心獲得更高的并行處理性能，可同時滿足人工智能計算需求。

2 眾核處理器的發展

眾核處理器是當前支持人工智能計算的關鍵核心器件，發展過程中涌現眾多類型的技術和架構，大量研究者和公司為推動其發展貢獻了智慧和力量。

粗粒度可重構體系結構是眾核處理器形成的先導技術。在2000年前后出現了一大批基于交叉開關、線性陣列、MESH等3大類體系結構的粗粒度可重構處理器。基于全交叉開關的體系結構具有很強的通信能力，通常采用簡化的交叉開關來應對由于處理單元數量的增加而導致實現代價的指數增長，如用于DSP數據通道的快速原型PADDI ，PADDI-2 ; 基于一個或者多個線性陣列的體系結構，可提供可重構的流水線Stage，實現部分快速動態流水線重構和運行時對配置流和數據流的調度，如PIPERENCH ; 基于Mesh的體系結構，將PE按照二維陣列進行排列，相鄰PE可以通信，一般也支持行或者列內PE之間直接通信，可支持編譯時確定的靜態網絡和運行時確定的動態網絡，如RAW 。粗粒度可重構體系結構的研究成果除部分轉化為工業產品（如TILE系列 2））外，其更多是集中于學術領域。

工業界眾核處理器開始于GPU. 2002年GPGPU （通用圖形計算）的概念逐漸明確，實現浮點矩陣乘矩陣算法 3）并開始應用于傳統的科學工程計算領域; 2005年， GPU實現了浮點矩陣的LU分解計算。這一階段， GPU面臨的最主要的問題是編程困難，必須把科學工程算法映射成傳統的圖像處理流程。同一時期的2002年， IBM開展了面向P級超級計算機的C64研發，其核心是Cyclops-64眾核處理器。 Cyclops-64包含80顆核心，通過交叉開關互連，峰值性能達80 GFlops. 2005年， IBM發布CELL處理器，集成了不同功能的兩類核心：主控制核心（PPE）和協處理器核心（SPE），核心之間通過總線互連，峰值性能可達102 GFlops. 2008年， IBM基于CELL構建了Roadrunner超級計算機， Linpack持續性能首次超過1 PFlops，并在TOP500排行榜中名列第一，對業界產生了巨大的影響。

隨著眾核處理器體系結構的持續改進，其適應性和好用性得到不斷提高。高性能GPU逐漸增加雙精度浮點運算單元、內存控制器增加ECC校驗，計算方式更加通用。特別是2007年CUDA軟件開發套件的發布，為GPU的廣泛應用鋪平道路。 2010年6月，曙光公司的銀河超級計算機使用NVIDIA的Tesla，測試峰值性能1.27 PFlops; 2010年11月，天河– 1A使用Tesla測試性能達到2.56 PFlops; GPU在高性能計算領域得到了越來越廣泛的使用，成為了眾核處理器的事實標準。 Intel作為HPC領域的重要廠商，在眾核處理器領域不斷加大投入， 2006年開始研究Larrabee體系結構， 2010年發布了MIC體系結構，推出Xeon PHI高性能眾核處理器，包含57～～ 72顆X86核心。 2013年，國防科技大學研制了基于PHI的“天河二號”超級計算機，性能居當時世界第一。

根據計算核心的結構復雜度和組織方式，可以將眾核處理器分為基于通用處理核心和基于計算簇的眾核處理器兩大類。

基于通用處理核心眾核處理器可以看作是多核結構處理器的進一步延伸，通過片上互連網絡（NoC）集成眾多的通用處理器核心。計算核心一般由通用核心簡化而來，所有核心功能齊全、計算能力強。但通常會簡化指令調度、推測執行等結構，計算核心內的運算部件一般支持SIMD，單核心內通常會保留通用處理器中傳統的多級Cache存儲結構，典型代表包括Intel的Larrabee/MIC架構處理器、SCC架構處理器， Tilera的TILE-GX系列處理器。

基于計算簇的眾核處理器片上集成了大量簡單的計算核心，旨在通過簡單運算部件的聚合提供超高計算性能。這類眾核處理器計算核心為簡單計算部件，多個核心以組或簇的形式進行組織，可通過單指令多線程流（SIMT）等數據流并行的方式提供強大的并行計算能力。片上通常還集成有面向領域的專用加速處理部件，計算簇內所有計算核心共用指令發射單元，并共享寄存器文件、一級Cache等存儲資源。計算簇間則共享二級Cache和主存等。典型代表主要包括NVIDIA的GPGPU系列處理器，如Fermi， Kepler ; AMD/ATI的GPU系列，如RV架構處理器、GCN架構處理器 5）等。

國際上眾核處理器發展的同時，國內研究也在同步開展，包括Godson-T眾核處理器、YHFT64-2流處理器，以及申威眾核處理器等。 Godson-T采用了2D MESH結構， 8××8陣列結構共64個處理器核，兼容MIPS指令集。 YHFT64-2處理器采用異構多核架構，包含64核心處理器，具有傳統通用體系結構的靈活性，又擁有大量的計算資源，峰值計算能力強大。申威眾核處理器應用于“神威? ? 太湖之光”超級計算機系統中，采用片上融合異構的體系結構，并采用統一的指令集系統，兼顧應用的好用性和性能，實現較優的性能功耗比和計算密度。

以深度學習為代表的人工智能領域已開啟體系結構的新時代。當前人工智能應用對算力的需求更是以超摩爾定律的速度增長，從2012年到2017年計算需求增加30萬倍，即每3.5個月翻一倍。人工智能算法的核心計算為低精度線性代數，一方面具有足夠的適應性，可以推廣到眾多領域; 另一方面具有足夠的特殊性，可以受益于領域專用體系結構設計。

眾核處理器體系結構不僅對科學工程計算具有較高的效能和較好的適應性，其對雙精度、單精度矩陣計算的支持同樣能夠在一定程度上滿足人工智能關鍵計算需求。因此，眾核處理器體系結構對人工智能計算具有天然的優勢。同時，眾核處理器又根據人工智能計算特殊的需求，不斷進行改進完善，例如增加其他計算核心加速的支持、增加混合精度計算的支持等。 NVIDIA在V100， Turing眾核處理器中增加顯著提升性能的TensorCore，使其人工智能計算峰值性能是雙精度浮點的約17倍。 AMD的VEGA架構同樣顯著提升人工智能計算性能。 Intel推出的Knights Mill眾核處理器，增加了支持人工智能計算的特殊指令。

3 面向智能計算的國產眾核架構關鍵技術

卷積和矩陣乘是智能計算最核心的操作，具有高度的并行性和數據重用性等特點，當前人工智能領域的處理器都圍繞如何對加速這兩種操作進行體系結構設計。國產眾核處理器要良好地適應智能計算需求，就必須有效支持大規模的卷積和矩陣乘計算。國產眾核處理器的運算核心需要具備靈活的控制能力，可實現卷積和矩陣乘計算復雜循環過程的高效控制和數據調度; 通過高效的片上通信支持卷積權重用和輸入特征值的全局共享; 通過指令重排精確控制權重和輸入特征值，從局部片上存儲到計算流水線的讀取與計算重疊，進一步提升計算性能; 通過靈活的數據移動和片上布局實現卷積和輸入特征值的靈活轉換，減少數據重整開銷; 片上多層次并行機制，支持高效的片上數據并行策略，提升數據交換性能和權值更新性能。

從總整體上看，國產眾核處理器架構需要具有多項創新的關鍵技術以有效支持人工智能計算，包括：融合異構的體系結構、輕量級片上通信機制、柔性優化的存儲體系、高效平衡的運算核心架構等。

3.1 融合異構的體系結構

眾核處理器在同一芯片內同時集成充分挖掘TLP的“重”核心和結構簡單用于ILP的“輕”核心，可高效支持復雜的人工智能應用和算法實現，兼顧好用性和性能，實現較優的性能功耗比和高的計算密度。

運算核心（“輕”核心）與控制核心（“重”核心）協同支持人工智能應用中不同類型任務。運算核心支持多種寬度SIMD，為人工智能應用提供其所需的主要計算能力; 運算核心支持軟件管理片上局部存儲，并通過高效片上網絡結構，實現數據級和線程級并行，支持更加靈活、豐富的人工智能算法實現機制，例如算法層次化、數據片上共享、MPMD模式等。控制核心負責人工智能任務中難以并行化部分的計算，實現指令級并行，通過多級Cache重用應用的空間和時間局部性，支持復雜的超參數調優、訓練迭代、數據拆分等。

為有效解決人工智能異構任務管理困難、片上數據共享復雜、數據一致性難以處理、執行模型兼容難等挑戰，眾核架構的不同核心之間需要采用統一指令系統、統一執行模型，支持多種存儲空間管理模式等技術，實現片上異構核心的深度融合。

3.2 輕量級片上通信機制

眾核處理器核心數多，每個核心的局部存儲空間受限，每個核心能夠獨立處理的工作集較小，對主存訪問帶寬和延遲需求大，而人工智能應用多為“存算密集型應用”。眾核處理器必須具有高效的核心間片上數據重用機制擴大工作集，減少應用的訪存需求，最大限度保證處理器計算能力發揮。采用輕量級片上通信機制，實現運算核心間的低延遲高帶寬的數據交換，提升運算核心密切協同的執行效率，顯著提高片上數據的重用效率，有效緩解眾核處理器面臨的“存儲墻”問題。

輕量級片上通信機制使用雙邊協議，實現輕量級的阻塞和非阻塞通信。源核心將數據送入發送部件，發送指令即執行完成，流水線可繼續執行; 目標核心使用接收指令，從接收緩沖中獲取有效數據。為實現通信的高效和物理實現的精簡，通信協議需要避免為了建立通信進行復雜的握手或同步協議，并簡化簇通信網絡的設計復雜度和開銷。與傳統的片上網絡通信機制相比，輕量級通信機制實現運算核心需要盡量避免經過多層次片上存儲層的搬移。

運算核心間輕量級通信機制從提高片上數據重用率的角度，需要實現核心間數據細粒度、低延遲交換/移動，并支持多播等集合通信功能。例如，對人工智能應用的核心運算（矩陣乘矩陣運算），輕量級通信可提升超過10個百分點的效率。

3.3 柔性優化的存儲體系

針對智能計算過程中計算密度大這一特性，眾核處理器需要實現靈活的數據移動和片上布局、可重構局部數據存儲器技術的片上存儲體系。采用軟硬件結合的方法，使片上存儲管理柔性靈活，數據傳輸性能優化，有效解決了智能計算存儲帶寬受限和延遲增加的難題，提高了眾核架構的效率和適應面。

（1）靈活的數據移動和片上布局。運算核心在能夠直接訪問主存空間時，為支持片上存儲的高效使用和數據在運算核心中的靈活分配，需要支持靈活的數據移動和片上布局，支持數據在核心存儲和主存間的高效異步數據傳輸，實現計算與訪存的并行。根據人工智能算法的訪存特征，存儲接口實現了基于滑動窗口平行的調度策略和多種映射性能優化算法，有效提高了存儲帶寬的使用效率。

眾核架構支持多種數據布局。支持單運算核心模式、多播模式、行模式、廣播行模式和矩陣模式。多播模式將主存中每個核心都需要的數據提供給多個運算核心; 行模式和廣播行模式實現行維度循環分布數據塊的傳輸; 矩陣模式實現整個運算核心簇內二維格柵上循環分布數據塊的傳輸。單核心模式、行模式和矩陣模式同時支持主存到局部數據存儲器和局部數據存儲器到主存的傳輸，其他模式只支持主存到局部數據存儲器方向的傳輸。

眾核處理器的多模式數據流傳輸技術，可以有效提高智能計算數據重用率，進而提升人工智能算法性能。

（2）可重構數據存儲技術。面向智能計算的運算核心設計力求簡潔高效，采用可重構局部數據存儲器技術。運算核心的數據存儲可由軟件配置成軟硬協同Cache或片上存儲器，以完成不同特征數據的緩存管理。這兩種數據存儲管理方式可同時存在并支持容量動態劃分，充分結合了硬件的高效性和軟件的靈活性，降低設計開銷并滿足人工智能應用對存儲的需要。

軟硬件協同Cache中Cache行的數據和Cache行tag信息均保存在局部數據存儲器中，設置一個固定寄存器保存整個Cache的信息。軟件管理Cache的裝入與淘汰，硬件提供指令加速命中查詢和地址轉換的性能，軟硬件協同完成數據的緩存管理，充分結合硬件的高效性和軟件的靈活性，以較小的硬件開銷實現高效的訪存優化。在軟硬件協同Cache中，硬件負責命中查詢及不命中時的自動跳轉，降低軟件實現的開銷（例如代碼膨脹、條件分支判斷等）。軟件負責管理Cache的裝入與淘汰。程序在運行時可對應多個Cache，軟件負責不同Cache的數據訪問在局部數據存儲器中的有效隔離，避免互相沖突。

3.4 高效平衡的運算核心架構

根據人工智能應用的分析，眾核架構可采用弱亂序流水線結構，其主要特點是確定性執行基礎上的有限程度亂序。確定性執行的主要目的是減少推測執行帶來的額外功率開銷，同時可減少為緩存未退出的推測執行指令而設置的重定序緩沖等部件的面積開銷; 有限程度的亂序是指基于指令塊的指令調度發射策略，可以有效隱藏一些長延遲事件（比如離散訪問主存）帶來的性能損失。弱亂序流水線結構在改善順序流水線性能的同時有效控制結構復雜度。

采用弱亂序流水線結構的運算核心雖然降低了硬件復雜度，仍可高效處理智能計算類應用，主要表現在：運算核心采用的面向精簡運算核心的高效轉移預測機制，通過編譯指導的靜態轉移預測、轉移提示和分支回跳預取等策略，以較小的代價實現了較高的IPC. 對于運算規整的智能計算應用，在保證指令流水性能的同時，省去了傳統轉移預測機制依賴的大容量轉移歷史表，減少面積開銷; 智能計算類應用是數據密集型應用，具有批量數據處理需求，運算核心實現的單指令多數據流技術可以高效地處理批量數據，降低流水線指令控制開銷，節省功耗; 運算核心采用的局部數據存儲器結構結合批量數據傳輸技術，對數據訪問規律和確定的智能計算可以有效地隱藏數據訪問延遲，并極大地提高數據局部性訪問效率，降低了傳統數據Cache存在的容量失效導致數據訪問延遲不能隱藏的風險。

高效平衡的運算核心結構使得單芯片可以集成更多的運算核心，在保證智能計算類應用處理效率的同時，通過集成更多的核心獲得更高的并行處理性能。

4 基于國產眾核處理器的智能計算應用性能分析

當前國產眾核處理器已經支持相對完整的軟件生態（例如線性代數基礎庫swBLAS、深度學習庫swDNN、支持深度學習框架swCaffe等），支持許多典型的人工智能應用（例如醫學影像、圍棋、語音識別等），取得較好的測試性能。

卷積計算是深度學習的典型算法， swDNN 重點對其進行優化加速：利用雙緩沖機制，為卷積計算的每一部分數據分配雙倍的LDM空間，保證計算和訪存相對獨立，實現計算訪存重疊; 利用靈活的片上網絡和多種DMA機制，保證不同卷積計算到運算核心陣列的高效映射; 利用運算核心雙流水線特征，通過最大化訪存指令和計算指令重疊，減少計算單元的等待時間，提升卷積性能。眾核處理器利用swDNN執行卷積計算，與同一時期的商用眾核處理器NVIDIA的K40m （使用cuDNN庫）相比，性能提升2～～ 9倍。

swCaffe 是Caffe深度學習框架在眾核處理器上的移植，集成swDNN和swBLAS，實現功能和性能上的定制和優化，同時采用參數服務器進行全局參數更新，支持計算通信重疊的同步更新策略。基于swCaffe的卷積計算在單個運算核心陣列上的性能是單顆Intel Xeon處理器的3.5倍; 在單顆眾核處理器上的性能是K40m的1.5倍; 并行訓練可獲得較好的強可擴展性和弱可擴展性。

利用256個眾核處理器運行圍棋訓練程序，其深度學習模型包括39層CNN網絡，使用了2.4億個訓練樣本。利用128個眾核處理器，訓練醫療圖像處理器模型，模型基于AlexNet， VGG等多種網絡，訓練數據達1 TB 。利用眾核處理器完成了超過10 TB數據的遙感圖像分類模型訓練。

5 總結

在人工智能（特別是深度學習）的推動下，眾核處理器體系結構已經向著智能計算的方向發展。人工智能計算的復雜性、靈活性和領域專用性推動國產眾核處理器體系結構未來的發展。隨著智能算法不斷演進，新算法層出不窮，算法模型也在不斷變化，需要構建一種動態可變的眾核處理器架構并保證可編程性，以應對算法的變換和迭代; 設計新的多層次多粒度片上訪存和通信管理機制，充分適應人工智能應用片上數據共享和移動特征，提升計算能力的同時，有效降低訪存需求; 面向人工智能核心算法，構建可定制的加速核心，快速應對算法的變化，采用高能效結構和設計方法，實現綠色節能目標.

閱讀全文

計算機(83935) 計算機(83935)
智能(116904) 智能(116904)

中國自主研發ARM計算機芯片完成

近日，中國電子旗下中國軟件與技術服務股份有限公司高級副總裁王定健介紹，完全由中國自主研發的安全可靠的計算機芯片及系統已經研制完成，今年9月將參加中國黨政機關計算機系統的工程招標。

2015-08-07 07:50:36

1434

華為ARM架構“泰山”服務器真是自主芯片嗎？

那么，為何一款購買ARM公版架構的產品能夠成為“自主研發”，能夠成為“除存儲單元外均有完整知識產權”，甚至成為核高基1號專項項目？這就要從國內就自主研發的標準和話語權之爭說起了。

2016-06-14 01:14:00

16050

研發自主架構的CPU，展訊將成為全球第三家！

展訊自主架構的CPU 實現 ARM 架構和軟件的全兼容，完全 pin to pin 的替換。真正掌握了自主架構，未來展訊可以在優化功耗、提升產品性能方面有更多的發揮空間。

2017-08-16 08:23:09

5892

AUTOSAR架構下的多核通信介紹

隨著汽車ECU迅速的往域控制器方向發展，ECU要處理的任務越來越多，單核CPU的負載越來越大，多核ECU勢在必行。AUTOSAR架構下OS支持多核處理，本系列文章將詳細介紹AUTOSAR架構下的多核機制。本文介紹AUTOSAR架構下的多核通信。

2023-11-13 09:24:11

654

光電智能計算架構和芯片研究

無處不在的持續增長的需求。這些硅計算硬件平臺的進步催生了更大規模的訓練和更復雜的模型，極大地促進了人工智能(AI)的復興。我們見證了各種神經計算架構，例如卷積神經網絡(CNN)、遞歸神經網絡(RNN)、脈沖神經網絡(SNN)等，在諸多領域的廣泛應用。

2024-01-08 09:13:29

349

自主指令架構取代Arm和x86，LoongArch的未來“野心”

在4月19日結束的第四屆關鍵信息基礎設施自主安全創新論壇上，龍芯中科董事長胡偉武對對龍芯的蜘蛛指令系統架構LoongArch進行了深度解析，介紹了LoongArch的發展過程、自主與兼容性以及未來

2021-04-21 09:00:00

6399

安謀科技重磅發布！以超域架構定義全新XPU，為智能計算提供“核芯動力”

安謀科技重磅發布“雙輪驅動”戰略以及新業務品牌“核芯動力”。將依托“核芯動力”向市場提供高性能、可定制化的自主架構XPU IP產品和服務，用CPU+XPU引領雙輪驅動。安謀科技推動計算架構升級，貼合智能計算產業發展趨勢，積極打造合作共贏的產業生態，為產業發展賦能。

2021-08-28 08:00:00

3708

3A開關型充電管理ZCC6688（自主研發）

本帖最后由四維電子科技于 2019-7-30 16:12 編輯 3A開關型充電管理ZCC6688（自主研發）

2019-07-30 14:59:06

多核智能移動平臺電源架構詳解

縮小，對于對空間要求極為苛刻的移動設備，節省下來的空間可以讓給電池這類的重要部件，無疑為廠商的設計提供了便利。　　多核系統電源架構　　正是因為智能手機和平板電腦能夠滿足消費者越來越高的要求，比如更大

2018-09-25 10:33:38

多核處理器的優點

的功耗更低、計算功耗產生的熱量更少。多核架構能夠使目前的軟件更出色地運行，并創建一個促進未來的軟件編寫更趨完善的架構。盡管認真的軟件廠商還在探索全新的軟件并發處理模式，隨著向多核處理器的移植，現有軟件

2019-06-20 06:47:01

多核嵌入式系統存在的局限性？怎么解決這些問題？

本文列舉了多核嵌入式系統存在的一些主要局限，并對解決這些局限的可行方案進行了探討。將以一些嵌入式系統為例，指出利用現有架構改進系統節能效果的機遇。多核處理器與新興的嵌入式平臺的結合能夠滿足現代嵌入式

2021-03-09 06:36:52

多核片上系統架構的嵌入式DSP軟件設計資料分享

多核片上系統（SoC）架構的嵌入式DSP軟件設計Multicore a System-on-a-Chip (SoC) ArchitectureSoCs的軟件開發涉及到基于最強大的計算模型在各種處理

2021-12-14 08:18:07

多核系統設計平臺

;Execute — 使用模塊化的框架工具進行編譯執行，為緊耦合分布式計算系統（單片多核或單板多處理器架構）提供標準化的通訊方式。MCAPI和Polycore軟件聯合應用，提供經驗證的消息傳遞編程模板

2016-10-11 10:35:03

多核設備中的Linux實時性能怎么提高？

上個世紀，研發人員投入了大量精力提高 Linux 實時性能和行為，最著名的是 PREEMPT_RT Linux 實時擴展。最近，研發人員致力于研究適用于多核設備的 Linux 用戶空間解決方案，該

2020-04-06 08:17:17

智能產品研發總監招聘

，加我好友聊，或者直接電話02089000666。招聘要求：職位名稱：智能產品研發總監年薪20萬以上，可享受期權激勵1、本科以上學歷，電子技術、信息類專業、自動化控制、通信電子計算機及其相關專業；2、有

2015-02-06 15:22:07

智能電網中的三個互操作架構遠景是什么？

2021-05-21 06:10:25

智能電網的網絡通信架構及關鍵技術解析

的網絡通信架構進行研究，明確不同應用領域的關鍵網絡技術。2 智能電網的框架與概念參考模型中國的智能電網建設提出了以特高壓電網為骨干網架，以堅強智能電網為基礎，以通信信息平臺為支撐，以智能控制為手段，包含

2013-10-09 11:42:53

智能車主動安全技術-智能汽車自主循跡控制研究

智能汽車自主循跡橫向控制是通過調整汽車的轉向盤轉角使汽車與期望軌跡之間的橫向循跡誤差最小，同時使汽車運動方向與期望軌跡切線方向之間的角度誤差最小，在保證控制精度的前提下又要兼顧汽車的平順性和舒適性。

2016-05-09 16:45:03

智能輪椅導航定位的研究現狀及趨勢

電動輪椅,融合多種領域的研究,包括機器視覺,機器人導航和定位.模式識別,多傳感器融合及用戶接口等。目前美國、德國.日本、及中國等多個國家都在進行這方面的研究。輪椅的安全導航,是智能輪椅要解決的中心

2023-09-25 07:13:35

自主導航小車AGV定位方法的研究[1]

2016-08-29 11:07:35

ACAP的主要架構創新解析

2019年“FPGA國際研討會”上，賽靈思發表了兩篇長論文，詳細介紹了賽靈思“自適應計算加速平臺”ACAP的系統架構和技術細節。本文將對ACAP的主要架構創新進行深入解讀，讓各位先睹為快。

2020-11-27 07:30:17

AUTOSAR架構深度解析精選資料分享

AUTOSAR架構深度解析本文轉載于：AUTOSAR架構深度解析AUTOSAR的分層式設計，用于支持完整的軟件和硬件模塊的獨立性(Independence)，中間RTE(Runtime Environment)作為虛擬功能...

2021-07-28 07:02:13

AUTOSAR架構深度解析精選資料推薦

AUTOSAR架構深度解析本文轉載于：AUTOSAR架構深度解析目錄AUTOSAR架構深度解析AUTOSAR分層結構及應用軟件層功能應用軟件層虛擬功能總線VFB及運行環境RTE基礎軟件層(BSW)層

2021-07-28 07:40:15

FPGA研發之道(2)FPGA和他那些小伙伴們(一)系統架構組

基礎設施的迅速研發和部署。　　沒有完美的架構，只有合適的組合，各種芯片和架構都是為應用服務，互相的滲透是趨勢，也是必然。FPGA相對處理器的可編程領域，仍然屬于小眾(雖然人數也不少)。但是正像一則笑話

2018-08-06 11:45:27

RISC-V架構能否讓國產IC真正自主研發？

RISC-V架構能否讓國產IC真正“自主研發”？

2020-06-09 16:31:04

XIMEA公司研發智能相機助力自主式機器人

CURRERA-R系列相機是德國XIMEA公司推出的一款智能相機，其體型巧，擁有完整的視覺系統。用戶可以連接所有PC標準外圍：如顯示器、鍵盤和鼠標、外部存儲器等，可在單機模式下使用，也可通過網絡遠程

2014-04-10 15:37:48

[活動] 智能設計（智能家居的研發實戰實操）專項技能培訓通知

需求分析等業務知識如何影響實際需求開發和產品規劃？7月26日~7月30日，機智云人工智能實驗室負責人黃明（原Intel WPRD MC1系統高級工程師，主導完成Intel基帶芯片算法的研發）、泰迪高級

2017-06-19 14:55:28

“網絡物理系統（CPS） - 面向安全關鍵應用的未來異構多核E / E架構”

嵌入式電子系統領域，現在也被稱為網絡物理系統，正在成為新興技術的挑戰。網絡物理系統（CPS）是一種緊密組合和增加協作計算和物理元素的單片集成xit。如今，智能按需自動化環境中可以找到前期生成的網絡

2018-09-26 01:27:47

【AD新聞】蘋果秘密自主研發顯示屏：要和三星分手了？

，實現共贏，雙方度過了一段不短的蜜月期，但近期，雙方卻傳出了要“分手”的征兆...... 蘋果秘密研發顯示屏：要和三星分手了？作為iPhone系列的旗艦手機，iPhoneX使用的是三星自主研發

2018-03-23 15:31:33

【STM32MP157A-DK1開發板試用連載】基于stm32mp1的異構多核研究

項目名稱：基于stm32mp1的異構多核研究試用計劃：申請理由：本人從事嵌入式研究多年，一直在工控領域開發工業產品。目前單位準備采用STM32MP1完成新產品的開發，剛好論壇的活動，因此積極參與本次

2020-03-25 16:50:11

一種對多核處理器架構上程序時間測量的全新技術介紹

概述盡管多核處理器比單核處理器提供更強大的處理能力，當時多核處理器存在難以檢測和并發相關的錯誤。本文介紹了一種對多核處理器架構上程序時間測量的全新技術，這種技術通過在目標系統上運行，實現覆蓋率的實時

2021-12-14 07:07:22

中國自主研發兩款無線傳感網SoC芯片

自主知識產權的無線傳感網SoC芯片。　　無錫物聯網產業研究院邢博士介紹，兩款芯片中，VW628為國內首款符合IEEE802.15.4c和CWPAN(中國無線個域網標準項目組)標準的無線傳感網收發SoC芯片，該

2018-11-01 15:00:03

中國航天晨信公司招聘 DSP相關人才

研發并具有一定的自主權；2)負責DSP架構選型、硬件電路設計、相關驅動軟件開發及維護；3)負責相關文檔的編寫和維護；4)負責系統聯調、測試排故及試驗驗證。職位要求：1)電子、計算機等相關專業，本科

2014-05-08 14:10:42

以全新的多核SoC架構進行LTE開發

對于MIMO計算一般，TI全新架構中不可或缺的浮點支持可大幅簡化及加速必要的處理，因為原生浮點支持十分有助于矩陣求逆。多核共享內存控制器另一項重要多核功能改進之處是TI全新的多核共享內存控制器。由于多核需要

2011-07-14 14:40:08

典型的支持多核處理器的RTOS功能解析

1、基于同步原語擴展的實時操作系統在多核處理器的每一個處理器核上都運行一個完全相同的RTOS，然后提供擴展的組件庫，這種組件庫提供相應的同步原語以支持處理器核間的通信。Eg：VxWorks

2019-06-29 08:30:00

功能安全---AUTOSAR架構深度解析精選資料分享

AUTOSAR架構深度解析本文轉載于：AUTOSAR架構深度解析AUTOSAR的分層式設計，用于支持完整的軟件和硬件模塊的獨立性(Independence)，中間RTE(Runtime

2021-07-23 08:34:18

北極雄芯開發的首款基于Chiplet異構集成的智能處理芯片“啟明930”

近日，北極雄芯分別在西安秦創原人工智能前沿科技成果發布會及北京韋豪創芯孵化器啟用儀式上同步發布了首個基于Chiplet架構的“啟明930”AI芯片。據介紹，該芯片中央控制芯粒采用RISC-V CPU

2023-02-21 13:58:08

如何計算放大器架構的噪聲系數？

本文簡要介紹了兩種放大器架構的噪聲系數計算，包括inverting，non-inverting架構的噪聲系數計算，并提供計算小工具。

2021-04-07 06:38:47

如何利用射頻前端電路研究和設計智能天線？

隨著移動通信事業在全球范圍內的迅猛發展，我國的移動通信總用戶已經躍居世界第一。作為通信強國，國內許多大學和公司致力于通信事業的研究和發展，并與九十年代初，提出了我國第一個具有自主知識產權的通信

2019-07-31 08:25:51

嵌入式實時系統多核負載均衡調度架構的相關資料推薦

背景介紹目前嵌入式開發為了追求穩定性、可靠性，多核處理器多使用靜態任務調度架構，靜態分配CPU、進程(APP)、線程(Task)、任務(runnable)的多層調用關系樹。系統在低負載場景十分穩定

2021-12-14 07:25:29

怎么實現Linux和S3C2410的PROFIBUSDP主站平臺設計？

針對標準PROFIBUSDP主站在國內研究較少，自主研發產品的功能有限、智能化不足的現狀，進行了基于Linux操作系統的PROFIBUSDP主站的設計和研究，實現了PROFIBUSDP 1類主站的主從通信功能。

2021-05-31 06:09:27

招聘高性能計算硬件設計師（基于多核DSP） 1人 (51job網站...

DSP（含ARM+DSP）等架構相關硬件平臺的分析、規劃、研發及系列發展，具有一定的自主權；2)負責硬件方案設計、原理圖設計、PCB圖設計、生產調試、測試試驗等工作；3)負責硬件平臺相關CPLD/FPGA

2014-05-08 14:05:48

招聘高性能計算驅動軟件設計師（多核DSP，含ARM+DSP） 1人 ...

)負責基于多核DSP（含ARM+DSP）的系統研發并具有一定的自主權；2)負責基于多核DSP架構的底層驅動軟件開發、測試及維護；3)負責相關文檔的編寫和維護；4)協助團隊成員進行聯調、測試排故及試驗驗證

2014-05-08 14:07:29

探討采用C6000系列多核DSP的并行計算（OpenCL、OpenMP）實現大規模電磁系統的暫態仿真及其控制系統

探討采用C6000系列多核DSP的并行計算（OpenCL、OpenMP）實現大規模電磁系統的暫態仿真及其控制系統大規模電磁系統在能源發電、輸變電、配網用電，以及電力電子電路中大量存在，其復雜的系統

2016-12-03 20:42:42

數字信號處理器重新采納多核架構

多核方式。DSP正在開始重新采納多核架構，不過主要是針對那些處理任務可以得到妥善劃分的特殊應用。DSP應用通常只包含少量高度復雜的任務，系統性能的提升依賴于加快任務執行速度，而不是簡單地運行更多的任務

2009-04-09 23:14:41

機器人想要實現智能移動，必須具備超強的自主定位導航能力

圖像信息、視頻數據及各傳感器信息回傳至智能安防綜合管理平臺，經過信息融合與智能分析，可為特定區域提供安全預警、巡邏等服務，及時采取安防措施。愛好者研究利用SLAMWARE自主定位導航方案幫助機器人自由

2018-01-03 11:41:55

構建一種低功耗小基站和適變型邊緣計算MEC網絡平臺

能力，完整的驗證和展示了佰才邦基于ARM的5G產品的高效穩定的性能。佰才邦自主研發芯片、基站、核心網軟件、CPE終端和邊緣計算平臺等端到端產品，作為5G基站創新開放架構領軍企業，突破4G/5G重大核心技術。原作者：佰才邦

2022-09-08 14:12:16

深入解析傳感器網絡中實時通信的研究

2021-05-26 06:00:09

電機功率計算公式最全解析，如何計算才最合理？

2020-04-11 20:11:28

視頻監控系統圖像處理技術應用解析

視頻監控系統圖像處理技術應用解析隨著物聯網和移動互聯網技術的迅速發展，傳統的IT架構逐漸云端化，計算資源和承載業務將進一步深度整合，在物聯網和云計算匯聚的潮流中，視頻監控技術將發生徹底的變革：視頻

2013-09-23 15:00:02

記憶/憶聯研發體系最新*** 20180108

平臺代碼研發、項目導入、配合產品整體調試參與平臺架構設計、概要設計、詳細設計和技術攻關；精通C，了解基本算法，精通嵌入式和內存受限系統設計；熟悉多核ARM SOC架構，掌握常見的外設及其設備驅動：8

2018-01-08 15:24:44

請問多核架構在微波鏈路上如何實現千兆位傳輸？

2021-04-19 06:57:52

請問自主可控CPU架構系列有哪幾種？

2021-10-13 06:31:03

讀書分享會 | 玄鐵RISC-V處理器入門與實戰電子書免費下載！

開發的一種開放、免費且可定制的指令集架構，其目標是為各種應用提供高效、靈活的計算能力。玄鐵處理器是由平頭哥開發的一種高性能、低功耗的處理器，其基于RISC-V架構，并采用了自主研發的多核

2023-04-12 11:16:58

談一談RISC-V架構的優勢和特點

RISC-V是基于精簡指令集計算(RISC)原理建立的開放指令集架構，是一種與X86，ARM并列的一種計算指令集架構。RISC是一個開放的芯片架構，可以免費授權。客戶可以添加自己的擴展，并為包括

2023-05-14 09:05:11

邊緣計算主板選型要素，附研發樣品

場景里，完全依賴云計算的人工智能越來越不適應，業界提出的解決方案便是邊緣智能。當然，邊緣智能和傳統的云端智能絕不是替代關系，而是更好的補充。通過下方邊緣計算產業聯盟（ECC）發布的邊緣計算參考架構能夠

2022-12-12 11:46:20

基于多核分離架構的千兆QoS模型研究

隨著多核架構處理器迅速普及，如何充分利用其強大的并行處理優勢已成為當今計算機技術亟待解決的難題。同時，網絡帶寬的迅速提升也對網絡安全設備性能提出了更高的要求。

2009-09-17 11:28:06

嵌入式異構多核的片上通信架構設計

為了克服目前嵌入式異構多核處理器的片上通信架構無法提供高效的異構多核協作架構的問題，本文分析了嵌入式異構多核體系中片上處理核在核間通信以及存儲層次上的不同需求

2009-12-04 11:30:30

我國全力打造首顆多核龍芯Godson-3

我國全力打造首顆多核龍芯Godson-3 中國的研究人員正在全力打造Godson（龍芯）的第一個多核版本，它將成為中國首個自行研發的多核微處理器，具有四到八個核，預計在未

2008-09-01 08:38:40

418

NSF資助高校多核研究計劃

NSF資助高校多核研究計劃美國國家科學基金會（NSF）與半導體高校研究聯盟半導體研究組織(SRC) 近日宣布將連手開展一項關注多核芯片設計和架構、為期三年的技術創新計

2008-09-05 10:55:53

569

TI推出多核片上系統架構實現5倍性能提升

TI推出多核片上系統架構實現5倍性能提升日前，德州儀器 (TI) 宣布推出一款基于 TI 多核數字信號處理器 (DSP) 的新型片上系統 (SoC) 架構，該架構在業界性能最高的 CPU

2010-02-24 09:41:14

863

TI推出最新多核SoC架構，實現5倍性能提升

TI推出最新多核SoC架構，實現5倍性能提升日前，德州儀器(TI)宣布推出一款基于 TI 多核數字信號處理器(DSP)的新型片上系統(SoC)架構，該架構在業界性能最高的CPU中同時

2010-02-26 08:38:16

562

聯芯科技為何推自主研發TD芯片

聯芯科技為何推自主研發TD芯片 4月26日消息，許久未露面的TD芯片核心企業、聯芯科技總裁孫玉望首次透露，聯芯已經推出自主研發的TD系列芯片，從而彌補了以往聯發科平

2010-04-26 08:47:28

780

多核處理器架構及調試

　　認識多核基本架構　　多核處理器在同一個芯片中植入了多個處理器引擎，這就可以提供更高的CPU性能、功能特性和分區能力。一般說來，多核有兩種實現形式。

2010-08-26 18:08:00

1242

多核處理器片上存儲系統研究

針對多核處理器計算能力和訪存速度間差異不斷增大對多核系統性能提升的制約問題，分析幾款典型多核處理器存儲系統的設計特點，探討多核處理器片上存儲系統發展的關鍵技術，

2011-07-27 15:49:57

英飛凌推出汽車應用微控制器多核架構

英飛凌科技股份公司（FSE: IFX / OTCQX: IFNNY）近日推出其32位微控制器（MCU）多核架構。這種全新架構是英飛凌可滿足未來汽車動力總成和安全應用需求的新一代微控制器的基礎。這種多核

2011-10-26 08:56:42

620

Tilera推用于云計算的多核處理器Meshed

多核處理器的新貴Tilera在幾年前才開始嶄露頭角,該公司多核架構的關鍵優勢是協調具備基本CPU功能的高度可擴展的核心數量，單獨的緩存，非阻塞的路由用于核心之間的通信，還包括快

2012-02-02 09:33:14

957

芯片解密促進自主研發實現智能設備升級

智能設備的升級改進離不開芯片的突破，芯片解密是其中的一把好手，不僅能快速推進國產芯片的技術研發水平，還能實現智能設備的自主升級與維護。

2016-05-24 10:37:01

629

深入解析ARM Cortex-A12架構

2017-01-14 12:31:49

MANGO:基于FPGA的重可編程高性能計算架構探索

MANGO是一項具備創新性研究型高科技工程，它的資金來源主要是靠歐盟“視野2020” （Horizon 2020）研究與創新項目的資助。目的主要是對多核處理器架構的功耗、性能和可預測性展開研究，強調

2017-02-08 09:00:11

272

ARM新銳Cortex_A7核心架構解析

2017-09-28 10:10:02

基于云計算的架構模型研究

為了構建有效、穩定的云計算平臺環境并對其應用性能進行研究，采用理論分析和實踐設計的方法，研究了云計算的關鍵技術，包括云數據中心串聯、云數據存儲管理技術和云編程模型，提出了- 一個通用的云計算架構

2017-10-11 16:25:42

計算高度密集型應用在異構多核DSP上的運行方法研究

2017-10-19 11:00:44

基于TI最新多核DSP SoC架構的解析

。 TI多核及媒體基礎架構DSP業務部全球業務經理Ramesh Kumar表示，TI的多核SoC產品正是針對市場對上述能力的不斷需求而推出的。TI了解市場正在變化，因此推出了這一多核SoC結構，期待能為設備供應商提供更快、更便利的解決方案。 TI 最近為這一系

2017-10-24 11:41:32

模板計算性能優化研究

模板計算是一類重要的計算核心，廣泛存在于圖像和視頻處理以及大規模科學和工程計算領域。但是，針對ARM64高性能處理器的模板計算性能的優化研究還很少。為了實現典型模板計算核心在ARM64架構多核

2017-11-21 14:50:59

基于FPGA的NoC多核處理器的設計

為了能夠靈活地驗證和實現自主設計的基于NoC的多核處理器，縮短NoC多核處理器的設計周期，提出了設計集成4片Virtex-6—550T FPGA的NoC多核處理器原型芯片設計／驗證平臺。分析和評估

2017-11-22 09:15:01

4137

基于共享內存多核數據結構研究

隨著計算機硬件技術的發展，如今我們已經邁入了多核CPU時代．然而，作為軟件核心的數據結構仍然是按照單核CPU和順序型準則來設計的．在基于共享內存的多核時代，大量并發運行的線程會交替地修改數據，產生

2018-01-15 11:34:12

Mentor嵌入式多核架構的展示

Mentor嵌入式多核架構允許在Zynq UltraScale + MPSoC上的兩個ARM Cortex-R5內核上同步4個ARM Cortex-A53內核上的Linux和Mentor Nucleus RTOS

2018-11-27 06:44:00

2982

華為自主研發的1300萬億次高性能計算平臺落戶沈陽

近日，記者獲悉，由華為公司自主研發的1300萬億次高性能計算平臺在沈陽落地，在航空工業氣動院（以下簡稱“氣動院”）投入使用。此次引入華為公司自主研發的1300萬億次高性能計算平臺，將用于氣動院計算流體力學研究領域的各項設計、研發和驗證，有望大大提升我國現有航空系統的自主創新能力。

2019-10-12 16:17:56

2675

天翼云借鑒互聯網分布式架構及開源技術，自主研發了 PaaS云平臺

為推進全面上云進程，天翼云借鑒互聯網分布式架構及開源技術，結合中國電信業務及管理需求，自主研發了 PaaS云平臺，推進中國電信IT架構互聯網化。該平臺緊貼企業關鍵業務場景，聚焦在線交易、密集計算、大數據等關鍵技術，支持統一平臺，集中管理，分布式部署和使用。

2020-08-07 08:49:41

5711

我國自主研發6比特超導量子計算云平臺上線

我國企業自主研發的6比特超導量子計算云平臺日前正式上線，全球用戶可以在線體驗來自中國的量子計算服務。

2020-09-16 09:46:45

1330

華為自主研發編程語言事件分析

據微博博主@IT工程師稱，華為正在研發新的自主編程語言倉頡，領頭人是南京大學的計算機科學與技術系博士生導師，馮新宇。

2020-09-26 09:31:58

3114

Imagination宣布推出首款多核架構GPU

此次發布的B系列都給出了4核架構設計。Kristof Beets解釋說這是與用戶溝通后的結果，能夠在性能和能效之間取得平衡，未來還會持續提升單核性能和拓展多核架構。

2020-10-20 16:14:32

2326

蔚來正在規劃自主研發自動駕駛計算芯片

10月21日，有報道稱蔚來正在規劃自主研發自動駕駛計算芯片，該計劃尚處于早期，主要由蔚來汽車董事長兼CEO李斌推動。

2020-10-21 16:45:28

1033

蔚來汽車正加強智能駕駛領域的自主研發

據了解，自主研發自動駕駛計算芯片將由李斌親自帶隊，早在幾個月前，李斌就開始尋找具有硅谷背景的技術負責人，為自研芯片計劃做準備。

2020-10-22 16:55:32

2113

車用EE架構對CAN有何影響?

代表性的是Bosch的說法（引自佐思汽研發布《2019-2020 智能汽車計算平臺與系統架構研究報告》智能汽車E/E架構研究：特斯拉遙遙領先，傳統車企發力猛追）：從現在的分散的以信息Domain的系統過渡到強ECU的中心化域，再到跨Domain的Zone ECU。再下一步是計算中心與云。

2021-01-01 09:04:00

2310

歐拉(openEuler)Summit 2021:RISC—V64多核異構的系統架構

openEuler Summit 2021-邊緣&嵌入式分論壇上，介紹了RISC—V64多核異構的系統架構。

2021-11-10 15:08:29

1671

朗駿智能旋鎖式自主光控器/開關介紹

朗駿智能基于NEMA標準接口生產研發得JL-2系列旋鎖式自主光控器、光控開關，自適應智聯型光控器以及光控器插座。

2022-09-30 09:03:32

866

ASPICE 和26262中的軟件架構解析

ASPICE 和26262中ASPICE 和26262中的軟件架構解析的軟件架構解析

2022-10-25 11:53:34

703

Spresense多核質數計算器開源

電子發燒友網站提供《Spresense多核質數計算器開源.zip》資料免費下載

2023-06-13 11:48:25

華為麒麟9000s芯片架構解析

華為麒麟9000s芯片架構解析華為麒麟9000s芯片是華為公司自主研發的一款高端移動芯片，可以為消費者提供出色的性能和良好的節能效果。是目前市場上最頂尖的處理器之一。麒麟9000s芯片的設計架構不僅體現了華為公司在技術研發上的強大實力，更體現了華為公司深厚的技術積淀和自主創新能力。

2023-08-30 17:49:41

16091

升騰910是幾納米？什么架構？

升騰910是幾納米？什么架構？華為昇騰910是一款專門為人工智能應用設計的芯片，它采用了華為自主研發的達芬奇架構。該架構采用了全新的并行計算的方式，可以實現更高效、更快速的人工智能計算，進而滿足

2023-08-31 17:13:47

6619

基于Tricore架構的RTThread多核實現

在《基于Hightec+TC375TP的RT-Thread移植詳解》一文中，基于Tricore實現了單核RTThread的移植。最近，花了些時間完成遺留的任務：基于Tricore的多核移植。目前

2023-09-12 18:40:02

421

景嘉微與北京大學長沙計算與數字經濟研究院共建“先進計算”聯合實驗室

國產替代浪潮來臨，面對我國產業國產化、數字化“兩化”轉型的市場需求，此次景嘉微與研究院攜手共建“先進計算”聯合實驗室，將致力于高性能基礎計算庫等高效基礎軟件研發，研究新一代國產GPU計算體系架構設計，促進國產自主可控計算生態建設和發展創新。

2023-09-28 17:05:12

949

基于Tricore芯片的AUTOSAR架構下的多核啟動

隨著汽車ECU迅速的往域控制器方向發展，ECU要出來任務越來越多，單核CPU的負載越來越大，多核ECU勢在必行。AUTOSAR架構下OS支持多核處理，本系列文章將詳細介紹AUTOSAR架構下的多核機制。本文介紹基于Tricore芯片的AUTOSAR架構下的多核啟動。

2023-10-23 10:15:22

899

已全部加載完成

搜索歷史

自主研發的多核智能計算架構研究 解析

評論

自主研發的多核智能計算架構研究解析