RISC-V 不再滿足于顛覆 CPU 行業。它正在對集成到 SoC 或高級封裝中的每種類型的處理器發動戰爭,這是一項雄心勃勃的計劃,將面臨來自擁有雄厚研發業務和構建良好生態系統的老牌廠商的激烈競爭。
當 RISC-V International 首席執行官 Calista Redmond 在去年的峰會上表示 RISC-V 將無處不在時,大多數人可能認為她在談論 CPU。很明顯,該組織打算在服務器和深度嵌入式設備中使用 RISC-V 內核。但該組織的目標遠不止于此。Redmond暗示,每個處理核心、GPU、GPGPU、AI 處理器以及尚未構思的所有其他類型的處理器都將基于 RISC-V。加州大學伯克利分校教授兼 RISC-V 國際主席 Krste Asanovi? 在他的國情咨文中展示了下面的幻燈片,這一點變得更加清晰。
如今,隨著最近完成的安全和加密工作,這一愿景開始成形。正在組建小組并審查捐款,以增加對矩陣乘法的支持,矩陣乘法是 GPU 和 AI 處理器的基本功能。
這些大膽聲明的背后是數據和計算架構的根本性轉變。這不再是哪家公司擁有最快的CPU的問題,因為無論設計得多么好,所有的CPU都有局限性。“在一些垂直市場,例如 5/6G、推理和視頻處理,它們的計算工作負載不再適合在傳統 CPU 上處理,”西門子 EDA 的 Catapult HLS 團隊項目總監 Russell Klein表示。“這就是我們看到新計算方法被采用的地方。”
幾乎每個應用程序都有某種形式的控制結構。“從內存訪問的角度來看,圖形是一種非常特殊的野獸,具有非常特殊的要求,”Arteris 解決方案和業務開發副總裁 Frank Schirrmeister說道。“如果你看一下最近發布的一些 AI 和 RISC-V 公告,你會發現有些公司宣布的處理元素顯然包含 ISA。”
在某些情況下,這些只需要正確的說明。Bluespec 首席執行官 Charlie Hauck 表示:“RISC-V 有一種叫做向量擴展的東西。” “根據您如何實現這一點,您可以獲得一些看起來非常像 GPU 的東西,其中有許多并行運行的小型單元,或者以 SIMD 類型的方式運行。”
然而,這條路并不容易。“通過指令擴展將GPU功能添加到RISC-V架構中很有吸引力,因為GPU在AI領域發揮著重要作用,”Stream Computing研發總監Fujie Fan表示。“然而,我們已經意識到架構和生態系統中不可避免的問題。”
懷疑論者比比皆是。處理器的歷史上充斥著失敗的初創公司,它們宣稱他們將用新的計算架構粉碎競爭。許多人沒有考慮到競爭并沒有停滯不前,計算領域正在經歷持續且加速的變化,而轉向新方法和工具以及培訓/再培訓工程師的痛苦和費用絕非微不足道。
“RISC-V 為采用者帶來的價值在于控制處理領域,它擁有現成的開源工具、現成的操作系統(Linux 或實時)以及提供的長期軟件兼容性/可移植性的承諾通過 ISA 通用性,” Quadric工程副總裁 Dhanendra Jani 說道。“圖形處理是一個非常不同的挑戰——特定領域的處理挑戰。要將基本 RISC-V 指令集調整為一種非常適合 GPU 任務的指令集,需要大量投資來定義自定義 ISA 擴展、構建高度復雜的微架構更改,并對開源工具進行重大手術,使它們與原來不同。這樣做時,使用 RISC-V 的幾乎所有固有價值都因廣泛的定制而消失了,您將失去大部分優勢,同時可能會受到核心 ISA 功能的束縛,這些功能限制了特定領域 GPU 環境中的有用性。簡而言之,從 RISC-V 開始而不是從頭開始有什么意義呢?”
那么RISC-V的計劃是什么?“矢量是 SIMD 操作,使您能夠同時對多條數據進行操作,并讓芯片找出從內存中取出數據的最佳方式,處理單個指令,然后將數據放回內存,或者將它們轉移到下一個操作,”RISC-V International 首席技術官 Mark Himelstein 說道。“缺少的基本內容是矩陣乘法。我們收到了多個提案,其中之一類似于適合 32 位指令的向量擴展。這非常困難并且需要設置說明。您設置了stride和masks等內容,然后扣動扳機并執行操作。但如果您想與其他架構上更大的矩陣實現競爭,則必須采用更寬的 64 位指令。這是很多人都在談論的話題。”
問題是有多少復雜性被暴露,有多少仍然隱藏。“ISA 是一個關鍵組件,” Arm客戶端業務線產品管理高級總監 Anand Patel 說道。“然而,GPU 的復雜性通常由 Vulkan 或 OpenCL 等標準 API 抽象出來。這使得開發人員可以更輕松地跨多個供應商進行定位,同時將較低級別的優化留給 GPU 供應商。即使在 GPGPU 類型的應用中,GPU 的架構也在快速發展,以跟上人工智能處理等新興用例的步伐,因此開發人員能夠訪問成熟的軟件生態系統來跟上這些變化至關重要。標準 API 確保開發人員不必擔心 ISA 更改,而是透明地看到這些底層改進的好處。”
宏觀架構和微架構
區分這兩個問題很重要,因為 RISC-V 僅定義了宏觀架構,而將所有微架構決策留給了實現者。當超越 CPU 時,這將成為一個更大的問題。“馮·諾依曼在某些方面有限制性,但特定實現如何與內存交互并不是由 RISC-V 決定的,”RISC-V 的 Himelstein 說。“大多數 GPU 實現都通過多級管道中的內存來優化這一點。當一些操作正在進行時,一些東西來自內存。當您開始研究 GPU 時,您會談論暴露內存交互。我們確實對事情發生的順序有一些限制,因為你想確保操作被明確定義。”
看待問題的方法有很多種。“最先進的 GPU 產品可以按照傳統圖形處理和現代人工智能加速來劃分,”Stream 的 Fan 說道。“前者更像是可編程ASIC,而不是通用處理器,其核心能力來自于流處理器的實現,而不是ISA。指令集通常對程序員來說是不可見的,并且總是處于次要位置。圖形處理器的設計與微架構密切相關,適合用定制指令來實現。對于我們大多數人來說,人工智能和多媒體功能的標準化更具吸引力。要實現這樣的能力,復制GPU并不是唯一的方法。對于RISC-V來說,多媒體功能可以通過矢量架構來實現,AI能力可以通過更高效的異構架構和矩陣加速器來實現。”
如果您希望外部程序員為您的設備編寫軟件,則某些方面會發生變化。“數據流處理可以通過多種方式完成,”西門子的Klein說。“一種是使用小型通用處理器甚至專用處理器的管道,每個處理器都處理問題的一個階段。這比單個大型 CPU 更快、更高效。使用可編程處理器作為計算元件保留了很大的靈活性,但確實放棄了一些性能和效率。這種方法確實可以在任何有能力的多核處理器上構建。問題是這種方法已被軟件開發社區徹底拒絕,他們不愿意放棄單線程編程模型。”
這對于很多企業來說都是一個大問題。“如果您正在尋找通用處理器,根據應用要求,它可以是從單級、兩級或三級微控制器一直到運行多級的多級超標量設計。Bluespec 的 Hauck 說道。“或者,你會看到人們擁有 4096 個 RISC-V 處理器,每個處理器都是小型、簡化的 RV32I 類型的東西,它們被組合在特定的系統架構和互連中,使這些東西能夠按照 GPU 的精神運行。它們由許多較小的整數單元組成,這些單元共同協作完成一項艱巨的任務。挑戰在于如何為此開發軟件?”
有了更大的靈活性,可能需要新的方法。“在大型 HPC 中,如果您運行的工作負載更加面向數據中心,則它具有一組特定的特征。但如果您的應用程序是科學應用程序,也許有一些關于加載和存儲以及多種數學類型運算的功能可以擴展,”西門子 EDA 首席產品營銷經理 Andy Meyer 說道。“如果人們選擇這條路線,生態系統就會面臨一些挑戰。最大的增長領域是超大規模應用。如果你看看風險投資的金額,你就會發現他們顯然正在解決一個獨特的問題。”
軟件和生態系統
硬件/軟件協同設計一直是幾十年來的目標,而 RISC-V 是少數幾個取得進展的領域之一。“傳統的數據處理設計不遺余力地將硬件和軟件分開,”Klein說。“硬件被創建出來,然后軟件人員就可以在上面自由發揮。假設是,如果硬件足夠通用,那么軟件將能夠完成提供系統功能所需的任何操作。如果您的計算能力和功耗有足夠的余量,那么這是可行的。我不會說它效果很好,但它確實有效,盡管相當浪費。”
特定領域的計算開始改變這一點。“要真正發揮數據流處理器的潛力就意味著針對特定應用程序進行定制,”Klein 補充道。“這意味著硬件和軟件團隊需要共同努力才能取得成功。這讓很多組織和設計團隊感到非常不舒服。”
有時協同設計是唯一的方法。“假設您需要在邊緣進行一些處理,”Bluespec 的 Hauck 說。“總會存在外形尺寸、尺寸或功率限制。再多的軟件創新也無濟于事。如果您有一個軟件堆棧,那么該堆棧就是它的本質。您將無法對任何具有這些類型的約束的特定解決方案進行軟件優化。你必須進入硬件領域。”
創建嵌入式系統時,處理器接觸到廣泛編程受眾的可能性較小,并且可以進行更多優化。“考慮一下已經完成的矢量加密工作,”Himelstein說。“沒有人會在他們的程序中編寫矢量加密。這不是他們所做的。他們所做的是使用庫,例如 libSSL 或其他一些加密庫,并且使用這些指令。有時他們通過匯編語言來使用它們,然后提供 C、C++ 或 Java 接口,以便程序、應用程序可以利用它們。”
當需要通用編程時,它就會變得更加困難。“如果你看看 GPU 的生態系統,就會發現工具鏈是由 NVIDIA 控制的,”Fan 說。“包括AMD在內的其他競爭對手曾試圖打破壟斷,但失敗了。通過擴展RISC-V的標準指令集來兼容不斷更新的NVIDIA生態系統幾乎是不可能的。另一方面,重新開始也很難,因為 NVIDIA 具有先發優勢。”
成功的時刻
盡管如此,RISC-V 的核心在于實現創新。“我們所看到的關于為什么遺留解決方案是目前最佳解決方案的許多觀點都是歷史性的,”Hauck 說。“智能架構師和智能軟件開發人員真正發揮其專業知識的地方將是 RISC-V 類型的環境。”
它始于公共需求。“如果有需要,人們就會聚集在一起進行協作,而 RISC-V 就是協作,”西門子的 Meyer 說道。“你會看到一個又一個的例子,世界各地正在發生各種不同的倡議和聯盟。生態系統將會發展,但商業方面和支持社區之間需要保持平衡。”
這可能會帶來一些業務挑戰,尤其是在收回投資回報時。“RISC-V 還需要一段時間才能趕上并與成熟的產品和生態系統競爭,”Hauck 說。“但你會開始發現,對于某些應用程序,只要有合適的公司支持,RISC-V 處理器就沒有理由不能成功。那里有很多優秀的軟件開發人員。最終他們會到達那里,因為社區擁有他們創新所需的所有工具。”
那么我們還要多久才能看到 RISC-V GPU 和 AI 處理器呢?Himelstein 表示:“如果您想要為非 GPU 類型的世界提供合理的 AI 功能補充,那么今天您已經擁有了。” “但是,經過批準的矩陣以及這些團體一直要求的所有其他內容的完整補充可能會在大約一年半的時間內出現,其中基本內容可能會出現,然后高級內容可能會在三到四年內出現”。
增量方法可以使部件的使用速度更快。Fan 表示:“分別標準化每個 GPU 功能比標準化整個 GPU 產品要好得多。” “至于人工智能功能,我們認為正在進行的 RISC-V 矩陣擴展對于 IC 設計人員來說是更好的選擇。”
審核編輯:劉清
-
處理器
+關注
關注
68文章
19661瀏覽量
232503 -
SoC芯片
+關注
關注
1文章
622瀏覽量
35493 -
人工智能
+關注
關注
1803文章
48350瀏覽量
244120 -
RISC-V
+關注
關注
46文章
2442瀏覽量
47850 -
GPU芯片
+關注
關注
1文章
304瀏覽量
6065
原文標題:RISC-V,要顛覆GPU?
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
FPGA與RISC-V淺談

RISC-V可能顛覆半導體行業格局的5種方式

什么是RISC-V?以及RISC-V和ARM、X86的區別
ISA ARM 對比 RISC-V
加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !

RISC-V Summit China 2024 青稞RISC-V+接口PHY,賦能RISC-V高效落地

RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,賦能RISC-V高效落地
2024 RISC-V 中國峰會:華秋電子助力RISC-V生態!

2024 RISC-V 中國峰會:華秋電子助力RISC-V生態!
risc-v的發展歷史
rIsc-v的缺的是什么?
淺析RISC-V領先ARM的優勢
【RISC-V信息速遞】反X86和ARM壟斷?很多人低估了RISC-V的顛覆性

評論