在過去幾年中,我們目睹了數據生成、處理和進一步利用以獲取額外價值和智能的方式發生了巨大變化,所有這些都受到基于深度學習和神經網絡應用的新計算模型出現的影響。這種深刻的變化始于數據中心,深度學習技術被用于提供對海量數據的洞察,主要用于分類和/或識別圖像,啟用自然語言或語音處理,或者理解、生成或成功學習如何玩復雜的游戲。策略游戲。這一變化還帶來了一波更節能的計算設備(基于 GP-GPU 和 FPGA),專門針對這類問題創建,后來包括完全定制的 ASIC,
大數據和快速數據
大數據應用程序使用專業的 GP-GPU、FPGA 和 ASIC 處理器通過深度學習技術分析大型數據集,并揭示趨勢、模式和關聯,從而實現圖像識別、語音識別等。因此,大數據主要基于過去的信息,或通常駐留在云中的剩余數據。大數據分析的一個常見結果是“訓練有素”的神經網絡能夠執行特定任務,例如識別和標記圖像或視頻序列中的所有面部。語音識別也展示了神經網絡的力量。
該任務最好由專門的引擎(或推理引擎)執行,這些引擎直接駐留在邊緣設備上并由快速數據應用程序領導(圖 1)。通過處理在邊緣本地捕獲的數據,Fast Data 利用源自大數據的算法來提供實時決策和結果。由于大數據提供了從“發生了什么”到“可能發生什么”(預測分析)得出的見解,Fast Data 提供了可以改進業務決策、運營和減少低效率的實時行動,這些行動總是會影響底線結果。這些方法可能適用于各種邊緣和存儲設備,例如相機、智能手機和 SSD。
計算數據
新的工作負載基于兩個場景:(1)在特定工作負載上訓練大型神經網絡,例如圖像或語音識別;(2) 在邊緣設備上應用經過訓練(或“擬合”)的神經網絡。這兩種工作負載都需要大量并行數據處理,包括大型矩陣的乘法和卷積。這些計算函數的最佳實現需要對大型向量或數據數組進行操作的向量指令。RISC-V是一個非常適合此類應用程序的架構和生態系統,因為它提供了一個由開源軟件支持的標準化流程,使開發人員能夠完全自由地采用、修改甚至添加專有矢量指令。圖 1 概述了突出的 RISC-V 計算架構機會。
移動數據
邊緣快速數據和計算的出現產生了一個事實結果,即將所有數據來回移動到云端進行計算分析效率不高。首先,它涉及通過移動網絡和以太網長距離傳輸相對較大的數據延遲,這對于必須實時運行的圖像或語音識別應用程序來說并不是最佳選擇。其次,邊緣計算允許更多可擴展的架構,其中圖像和語音處理或 SSD 上的內存計算操作可以以可擴展的方式執行。因此,每個添加的邊緣設備都會帶來所需計算能力的增量增加。數據移動方式和時間的優化是新架構可擴展性的關鍵因素。
【圖1 | 大數據、快速數據和 RISC-V 機會]
在圖 1a 中,云數據中心服務器使用深度學習神經網絡對大型大數據集進行訓練來執行機器學習。在圖 1b 中,邊緣的安全攝像頭使用經過大數據訓練的推理引擎,并實時識別圖像(快速數據)。在圖 1c 中,智能 SSD 設備使用推理引擎進行數據識別和分類,有效利用了設備的帶寬。由于圖 1 顯示了 RISC-V 內核的潛在機會,它可以自由添加專有和未來標準化矢量指令,這些指令有助于處理深度學習和推理技術。
數據移動和訪問方式的另一個類似且重要的趨勢存在于大數據端和云中(圖 2)。傳統的計算機架構(圖 2a)利用連接到許多其他設備(例如專用機器學習加速器、顯卡、快速 SSD、智能網絡控制器等)的慢速外圍總線。慢速總線通過限制它們自身、主 CPU 和主要的、潛在的持久內存之間的通信能力來影響設備利用率。這類新的計算設備也不可能在它們之間或與主 CPU 共享內存,這會導致通過慢速總線的浪費和有限的數據移動。
關于如何改善不同計算設備(例如 CPU 和計算和網絡加速器)之間的數據移動,以及如何在內存或快速存儲中訪問數據,出現了幾個重要的行業趨勢。這些新趨勢專注于開放標準化工作,以提供更快、更低延遲的串行結構和更智能的邏輯協議,從而實現對共享內存的一致訪問。
下一代以數據為中心的計算
未來的架構將需要為連接到計算加速器的持久內存和支持緩存一致性的快速總線(例如TileLink、RapidIO、OpenCAPI和Gen-Z)部署開放接口,不僅可以顯著提高性能,還可以使所有設備能夠共享內存并減少不必要的數據移動。
【圖2 | 計算架構中的數據移動和訪問]
在圖 2a 中,由于用于快速存儲和計算加速設備的外圍總線速度較慢,傳統計算架構已達到其極限。在圖 2b 中,未來的計算架構部署開放接口,提供平臺中所有計算資源對共享持久內存的統一緩存一致訪問(稱為以數據為中心的架構)。在圖 2c 中,部署的設備能夠利用相同的共享內存,從而減少不必要的數據復制。
CPU 非核心和網絡接口控制器的作用將成為移動數據的關鍵推動力。CPU 非核心組件必須支持關鍵內存和持久內存接口(例如 NVDIMM-P),以及靠近 CPU 的內存。還需要實施用于計算加速器、智能網絡和遠程持久內存的智能和快速總線。總線上的任何設備(例如 CPU、通用或專用計算加速器、網絡適配器、存儲或內存)都可以包含自己的計算資源,并能夠訪問共享內存(圖 2b 和 2c)。
為了優化數據移動,RISC-V 技術可以成為關鍵推動因素,因為它將在所有計算加速器設備上為新的機器學習工作負載實施矢量指令。它啟用了支持開放內存和智能總線接口的開源 CPU 技術,并實現了具有連貫共享內存的新的以數據為中心的架構。
用 RISC-V 解決挑戰
大數據和快速數據帶來了未來的數據移動挑戰,為 RISC-V 指令集架構 (ISA) 及其開放的模塊化方法鋪平了道路,非常適合作為以數據為中心的計算架構的基礎。它提供了以下能力:
擴展邊緣計算設備的計算資源
添加新指令,例如用于關鍵機器學習工作負載的向量指令
將小型計算核心定位在非常靠近存儲和內存介質的位置
啟用新的計算范式和模塊化芯片設計
啟用以數據為中心的新架構,其中所有處理元素都可以連貫地訪問共享持久內存,優化數據移動
RISC-V由超過一百個組織的成員開發,包括一個軟件和硬件創新者的協作社區,他們可以使 ISA 適應特定目的或項目。加入該組織的任何人都可以根據伯克利軟件分發 (BSD) 許可設計、制造和/或銷售 RISC-V 芯片和軟件。
最后的想法
為了實現其價值和可能性,需要捕獲、保存、訪問和轉換數據以充分發揮其潛力。具有大數據和快速數據應用程序的環境已經超過了通用計算架構的處理能力。未來以數據為中心的極端應用程序需要專門構建的處理,以開放的方式支持數據資源的獨立擴展。
擁有一個以存儲在持久內存中的數據為中心的通用開放計算機架構,同時允許所有設備發揮計算作用,是這些新的可擴展架構的關鍵推動因素,這些架構由一類新的機器學習計算工作負載驅動。跨所有云和邊緣部分的下一代應用程序將需要這種新型的低能耗處理,因為專業計算加速處理器專注于手頭的任務,減少移動數據的浪費時間,或執行與數據。人、社區和我們的星球通過數據的力量、潛力和可能性而蓬勃發展。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19824瀏覽量
233719 -
芯片
+關注
關注
459文章
52252瀏覽量
436913 -
機器學習
+關注
關注
66文章
8493瀏覽量
134162
發布評論請先 登錄
評論