在數據暴增的時代背景下,企業開啟了“數據搶灘戰”。當世界的一切都將以數據為中心,鐵打的算力和功耗就是在這場爭奪戰之中的一把好武器。
通用處理器雖說“什么都能算”,但在人工智能和深度學習等算法逐漸復雜化,可組合性的異構計算正成為主流。得益于FPGA的低時延、高性能、靈活性和極佳的總擁有成本,FPGA成為數據時代不可或缺的一名大將。
英特爾曾在2019年發布介紹其新旗艦產品Agilex FPGA,不同于以往,該系列產品將作為英特爾的全新品牌,而非Stratix的延續。
近期,Agilex FPGA已于2021年1月進行大規模量產出貨,在今年4月份,作為Ice Lake發布的一部分,相關細節也被逐一披露,其業界領先的能效和性能勢必能夠掀起新的浪潮。
性能遠超賽靈思Versal
Agilex FPGA是自英特爾收購Altera后推出的第一個全新高端FPGA系列,作為英特爾的“親兒子”,利用所有最好的技術堆料是必然的。從Agile(敏捷)+Flexible(靈活)的命名中,也不難看出這款產品將巔峰性地釋放FPGA器件自身獨特的敏捷性和靈活性。
這款性能到底有多強?實際上,Agilex FPGA的表現都已超出了英特爾自己的預估。英特爾數據平臺事業部副總裁可編程解決方案事業部(PSG)產品營銷和Enpirion電源產品事業部總經理Deepali Trehan為記者介紹,此前英特爾對于這款產品的預期是比上一代14nm的Stratix 10高出40%的數據中心、網絡和邊緣應用的性能,但最新的數據顯示這款產品相比上一代高出了45%的性能。
除了和自己產品對比,這款產品也與7nm的賽靈思Versal進行了對比。根據英特爾的測試,Agilex FPGA比賽靈思Versal的邏輯結構性能功耗比高約2倍,換言之在每瓦性能上Agilex FPGA遠遠甩開了友商。Agilex FPGA也代表著全行業最佳的收發速率,達到了每秒116Gbps。我們現在的測試芯片還可以達到每秒224Gbps。
而在算力方面,Agilex FPGA相比賽靈思Versal有超過50%的視頻IP性能提升。(英特爾? Agilex? FPGA Fmax/Versal Fmax的幾何平均值= 1.5)
不止如此,Agilex還通過應用5個由Omnitek所開發的視頻IP塊與賽靈思Versal“同臺競技”。
Omnitek是一家主打視頻加速與推理的初創企業,被英特爾所收購。Omnitek團隊基于Agilex FPGA的架構,僅僅改變了內存和DSP實例。通過與賽靈思Versal同臺對比同樣的視頻IP,更能凸顯Agilex FPGA的實力,而這5個視頻IP塊性能上Agilex FPGA均更勝一籌:
Warp圖像轉換器快32%;
OSVP 1X可擴展視頻處理器快48%;
OSVP 8X可擴展視頻處理器快33%;
Combiner視頻流合并快73%。
“堆料狂魔”英特爾
“所有人都認同,隨著數據中心迅速發展,需要提升性能來對抗顯著增多的數據,但性能的提升并不意味著功耗的下降”,Deepali強調,數據中心客戶非常看重性能功耗比這一指標,越高的每瓦性能意味著能有更好的計算力和更少的能源消耗。
嵌入式、云計算、邊緣計算、5G正在驅動數據激增,但與此同時也可預見的是能耗不斷地增加,同時導致總擁有成本(TCO)的巨大攀升。這是缺乏可持續性的,也會對環境產生巨大影響。
“FPGA是一種非常好的能夠提升能源效率的架構,其應用跨越整個數據中心”,Deepali表示,FPGA最大的價值在于靈活性,靈活的加速特性使其可服務于云、網、邊緣的各種應用之中。
Agilex是專門為以數據為中心的世界設計的,目的是在數據的處理、存儲以及移動過程當中提供行業的領導力。
實際上,Agilex FPGA之所以能取得超過預期的性能和性能功耗比的背后是英特爾的瘋狂“堆料”,幾乎從頭到尾都是全新設計和優化的。
第一,在設計上,Agilex FPGA是第一款端到端在英特爾全方位開發的FPGA,包括概念到設計、實施、驗證、生產制造全過程。
產品采用了能夠完美媲美制程節點轉換的技術10nm SuperFin技術;搭載第二代Hyperflex架構,該架構基于原14nm架構重新設計,并在資源布置上也進行了優化,從而降低功耗和提高性能;重構的互連和平面布局可以減少負載并提高可預測性。以上這些最終都反映在性能和功耗的優化上。
第二,在收發器設計上,采取了基于Chiplet的異構設計,因此可以針對具體應用需求,適用于任何代工廠、制程節點以及任何IP開發商。Chiplet賦予了產品高度的自由,使得英特爾可以根據應用需求具體開發行業領先的功能,比如:可以實現每秒116Gbps收發器速率、CXL、PCIe Gen5等,包括最高可以支持224Gbps收發器速率的產品也在研究當中。
第三,在軟件上,英特爾對Quartus Prime軟件進行了極大的優化提升,和AGILEX同步開發。英特爾開發了多個編譯流程來符合客戶不同的開發需求,比如設計之初,一些客戶需要非常密集的編譯流程,以便提升生產效率,還有一些客戶需要快速的故障排除,這些都通過多編譯流程的設計來實現。通過這樣的方式為客戶提供了多種選擇,以滿足提升運行時間以及快速故障排除方面的需求。
通過這些在軟件方面所付出的努力,將編譯時間下降了45%,同時又進行多達135種的Design Assistant規則,以便在規則方面實現好的控制。通過這些努力可以實現快速的編譯以及減少在FPGA方面的迭代的需求。所有這一切,有助于客戶提升他們的生產率。
英特爾的靈活優勢遠不止此
如此頗具優勢的產品,針對的將會是視頻與視覺的邊緣計算、5G網絡、數據中心三大數據激增的領域。Deepali為記者介紹,基于英特爾Agilex FPGA的解決方案具有巨大優勢,這是因為它完全滿足硬件的靈活性以及對于硬件可擴展性的要求。
“其實跨越這三個領域,Agilex FPGA有一個非常大的共同優勢,那就是極低的功耗。除了極低的功耗可以降低TCO之外,還有很多其他的方式降低客戶降低TCO。比如5G應用方面,它為運營商提供了硬件升級方面的多種選項,使其能夠優化成本,同時在數據中心領域可以去為它提升和不斷變化的工作負載來進行適配”,Deepali這樣為記者介紹。
根據之前英特爾的介紹,Agilex Fpga包含F、I、M三個系列,在配置和性能依次提升。具體來說,F系列適用于廣泛應用,I系列適用于高性能處理器接口和帶寬密集型應用,M適用于計算密集型應用,主要是提供面向英特爾至強處理器的一致性連接、HBM 集成、增強型 DDR5 控制器和英特爾傲騰DC 持久內存支持。這種劃分之下,客戶擁有更多更靈活的選擇。
針對于這三個不同系列,Deepali表示,現在Agilex F系列已在量產當中;I系列在實驗室當中,且實驗結果非常好,預計將會在本季度向客戶發貨;M系列還在開發當中,目前并沒有公布量產時間。
除了在型號上擁有靈活的選擇性,眾所周知英特爾目前在開發Xe獨立顯卡,而Xe的目標市場和Agilex FPGA也有一定的重合性。對此,Deepali為記者解釋,“英特爾是全行業當中唯一一家可以全方位覆蓋所有的加速器架構的半導體公司,包括CPU、FPGA、GPU、Movidius和Habana。我們的全方位架構可以為客戶提供最廣泛的選擇,使他們可以得到最適合他們用例的加速器,所以這完全是基于應用的。有些應用可能更適合CPU+GPU,有些應用可能更適合CPU+FPGA,而在對系統靈活性需求非常高時FPGA會擁有最大的價值。”
因此英特爾的方案將是全方位覆蓋的,而這一切都將在英特爾的一體化平臺oneAPI上可以統一進行開發,使得開發者可根據自己的應用選擇CPU+GPU或CPU+FPGA,因為英特爾無法完全判斷未來市場會向著哪些方面發展,所以會提供統一的軟件流,由開發者自由選擇,是GPU還是FPGA還是哪一種加速器最符合他的需要。
實際上,記者也注意到英特爾除了FPGA產品,還擁有eASIC和ASIC產品。此前英特爾為記者介紹,現階段,FPGA和ASIC是“分工明確”的,可編程FPGA主要針對實施與加速要求最苛刻的算法階段,直到算法已經非常成熟、并且最終確立下來之后,ASIC便可大面積實施在硬件之中。而eASIC又名為結構化ASIC,簡言之eASIC就是FPGA和ASIC的中間體,屬于更加偏向過渡態的產品,兼具靈活性和性能功耗。
因此,在如此強大的硬件加速器和一體化軟件平臺加持之下,英特爾的Agilex FPGA的優勢更加凸顯,在此加持之下用戶的選擇面更寬,靈活性更強。加上此前英特爾推出的第三代至強(Xeon)可擴展處理器,配合旗下傲騰SSD、傲騰持久內存等,能夠釋放Agilex FPGA的最佳性能。
回歸Agilex FPGA本身,其強大的性能和功耗也勢必能夠徹底顛覆FPGA市場,這也是英特爾自身長期制程和封裝、架構、內存和存儲、互連、安全、軟件六大技術積累的結晶。
發布評論請先 登錄
相關推薦
評論