有声小说,大主宰,灵域

越來越多的數據中心和其他高性能計算環境開始使用GPU，因為GPU能夠快速處理深度學習和機器學習應用中生成的大量數據。不過，就像許多可提高應用性能的新型數據中心創新一樣，這項創新也暴露出新的系統瓶頸。在這些應用中，用于提高系統性能的新興架構涉及通過一個PCIe?結構在多個主機之間共享系統資源。

PCIe標準（特別是其基于樹的傳統層級）會限制資源共享的實現方式（和實現程度）。不過，可以實現一種低延時的高速結構方法，這種方法允許在多個主機之間共享大量GPU和NVMe SSD，同時仍支持標準系統驅動程序。

PCIe結構方法采用動態分區和多主機單根I/O虛擬化（SR-IOV）共享。各PCIe結構之間可直接路由點對點傳輸。這樣便可為點對點傳輸提供最佳路由，減少根端口擁塞，并且更有效地平衡CPU資源的負載。

傳統上，GPU傳輸必須訪問CPU的系統存儲器，這會導致端點之間發生存儲器共享爭用。當GPU使用其共享的存儲器映射資源而不是CPU存儲器時，它可以在本地提取數據，無需先通過CPU傳遞數據。這消除了跳線和鏈路以及由此產生的延時，從而使GPU能夠更高效地處理數據。

PCIe的固有限制

PCIe主層級是一個樹形結構，其中的每個域都有一個根聯合體，從該點可擴展到“葉子”，這些“葉子”通過交換網和橋接器到達端點。鏈路的嚴格層級和方向性給多主機、多交換網系統帶來了成本高昂的設計要求。

圖1——多主機拓撲

以圖1所示的系統為例。要符合PCIe的層級，主機1必須在交換網1中有一個專用的下行端口，該端口連接到交換網2中的專用上行端口。它還需要在交換網2中有一個專用的下行端口，該端口連接到交換網3中的專用上行端口，依此類推。主機2和主機3也有類似的要求，如圖2所示。

圖2——每個主機的層級要求

即使是基于PCIe樹形結構的最基本系統，也需要各交換網之間有三個鏈路專用于每個主機的PCIe拓撲。而且，由于主機之間無法共享這些鏈路，因此系統會很快變得極為低效。

此外，符合PCIe的典型層級只有一個根端口，而且盡管“多根I/O虛擬化和共享”規范中支持多個根，但它會使設計更復雜，并且當前不受主流CPU支持。結果會造成未使用的PCIe設備（即端點）滯留在其分配到的主機中。不難想象，這在采用多個GPU、存儲設備及其控制器以及交換網的大型系統中會變得多么低效。

例如，如果第一個主機（主機1）已經消耗了所有計算資源，而主機2和3未充分利用資源，則顯然希望主機1訪問這些資源。但主機1無法這樣做，因為這些資源在它的層級域之外，因此會發生滯留。非透明橋接（NTB）是這種問題的一個潛在解決方案，但由于每種類型的共享PCIe設備都需要非標準驅動程序和軟件，因此這同樣會使系統變得復雜。更好的方法是使用PCIe結構，這種結構允許標準PCIe拓撲容納多個可訪問每個端點的主機。

實施方法

系統使用一個PCIe結構交換網（本例中為Microchip Switchtec? PAX系列的成員）在兩個獨立但可透明互操作的域中實現：即包含所有端點和結構鏈路的結構域以及每個主機專用的主機域（圖3）。主機通過在嵌入式CPU上運行的PAX交換網固件保留在單獨的虛擬域中，因此，交換網將始終顯示為具有直連端點的標準單層PCIe設備，而與這些端點出現在結構中的位置無關。

圖3——每個結構的獨立域

來自主機域的事務會在結構域中轉換為ID和地址，反之，結構域中通信的非分層路由也是如此。這樣，系統中的所有主機便可共享連接交換網和端點的結構鏈路。交換網固件會攔截來自主機的所有配置平面通信（包括PCIe枚舉過程），并使用數量可配置的下行端口虛擬化一個符合PCIe規范的簡單交換網。

當所有控制平面通信都路由到交換網固件進行處理時，數據平面通信直接路由到端點。其他主機域中未使用的GPU不再滯留，因為它們可以根據每個主機的需求動態分配。結構內支持點對點通信，這使其能夠適應機器學習應用。當以符合PCIe規范的方式向每個主機提供功能時，可以使用標準驅動程序。

操作方法

為了解這種方法的工作原理，我們以圖4中的系統為例，該系統由兩個主機（主機1采用Windows?系統，主機2采用Linux?系統）、四個PAX PCIe結構交換網、四個Nvidia M40 GPGPU和一個支持SR-IOV的Samsung NVMe SSD組成。在本實驗中，主機運行代表實際機器學習工作負載的通信，包括Nvidia的CUDA點對點通信基準測試實用程序和訓練cifar10圖像分類的TensorFlow模型。嵌入式交換網固件處理交換網的低級配置和管理，系統由Microchip的ChipLink調試和診斷實用程序管理。

圖4：雙主機PCIe結構引擎

四個GPU最初分配給主機1，PAX結構管理器顯示在結構中發現的所有設備，其中GPU綁定到Windows主機。但是，主機上的結構不再復雜，所有GPU就像直接連接到虛擬交換網一樣。隨后，結構管理器將綁定所有設備，Windows設備管理器將顯示GPU。主機將交換網視為下行端口數量可配置的簡單物理PCIe交換網。

一旦CUDA發現了四個GPU，點對點帶寬測試就會顯示單向傳輸速率為12.8 GBps，雙向傳輸速率為24.9 GBps。這些傳輸直接跨過PCIe結構，而無需通過主機。如果運行用于訓練Cifar10圖像分類算法的TensorFlow模型并使工作負載分布在全部四個GPU上，則可以將兩個GPU釋放回結構池中，將它們與主機解除綁定。這樣可以釋放其余兩個GPU來執行其他工作負載。與Windows主機一樣，Linux主機也將交換網視為簡單的PCIe交換網，無需自定義驅動程序，而CUDA也可以發現GPU，并在Linux主機上運行P2P傳輸。性能類似于使用Windows主機實現的性能，如表1所示。

表1：GPU點對點傳輸帶寬

下一步是將SR-IOV虛擬功能連接到Windows主機，PAX將此類功能以標準物理NVM設備的形式提供，以便主機可以使用標準NVMe驅動程序。此后，虛擬功能將與Linux主機結合，并且新的NVMe設備將出現在模塊設備列表中。本實驗的結果是，兩個主機現在都可以獨立使用其虛擬功能。

務必注意的是，虛擬PCIe交換網和所有動態分配操作都以完全符合PCIe規范的方式呈現給主機，以便主機能夠使用標準驅動程序。嵌入式交換網固件提供了一個簡單的管理接口，這樣便可通過成本低廉的外部處理器來配置和管理PCIe結構。設備點對點事務默認情況下處于使能狀態，不需要外部結構管理器進行額外配置或管理。

總結

PCIe交換網結構是一種能夠充分利用CPU巨大性能的絕佳方法，但PCIe標準本身存在一些障礙。不過，可以通過使用動態分區和多主機單根I/O虛擬化共享技術來解決這些難題，以便可以將GPU和NVMe資源實時動態分配給多主機系統中的任何主機，從而滿足機器學習工作負載不斷變化的需求。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4880

瀏覽量
130349
PCIe

PCIe

+關注

關注
16

文章
1299

瀏覽量
84343
管理器

管理器

+關注

關注
0

文章
250

瀏覽量
18850

PoE交換機如何助力智慧城市基礎設施建設？

）交換機在構建這些網絡中發揮著至關重要的作用。本文將探討PoE交換機如何助力智慧城市發展，以及它們在構建強大城市網絡中的重要性。智慧城

發表于 03-25 10:20

PoE交換機在安防監控系統中的關鍵作用

交換機在安防監控系統中的關鍵作用。什么是PoE交換機？ PoE交換機是一種通過單根以太網

發表于 03-24 16:41

VirtualLab Fusion應用：光波導系統中光柵幾何結構的優化

快速物理光學軟件VirtualLab Fusion具有分析光波導系統性能。這次我們在設計工作流程中處理一個密切相關的步驟: 在系統的耦合和擴

發表于 02-07 09:41

Microchip發布全新Switchtec? PCIe 4.0交換機系列

? PCIe 4.0交換機樣品。在現代高性能計算(HPC)系統中，處理高要求工作負載離不開可擴展性、高可靠性和低延遲連接的支持，而

發表于 01-22 13:57 ?508次閱讀

Microchip推出全新PCI100x系列Switchtec PCIe 4.0交換機

在汽車、工業和數據中心應用中，高效管理高帶寬數據傳輸以及多個器件或子系統之間無縫通信至關重要，PCIe交換機因而成為不可或缺的解決方案。它們

發表于 01-20 16:00 ?475次閱讀

DHCP在企業網的部署及安全防范

以下是關于 DHCP 在企業網的部署及安全防范的介紹：部署步驟規劃網絡與 IP 地址：根據企業網絡規模、部門劃分等因素，合理規劃網絡拓撲結構

發表于 01-16 11:27

反射光柵的光學系統結構中光柵系統的配置與優化

和光柵周期自動調整光柵的方向和探測器的方向和位置，來確保Littrow條件滿足。在第二個例子中，我們討論了在Littrow配置下使用光柵的優化，目標是設計光柵

發表于 01-11 13:19

Littrow結構中光柵系統的配置與優化

和光柵周期自動調整光柵的方向和探測器的方向和位置，來確保Littrow條件滿足。在第二個例子中，我們討論了在Littrow配置下使用光柵的優化，目標是設計光柵

發表于 12-25 15:35

光波導系統中光柵幾何結構的優化

| | 次我們強調了快速物理光學軟件VirtualLab Fusion分析光波導系統性能。這次我們在設計工作流程中處理一個密切相關的步驟: 在系統

發表于 12-20 10:27

光波導系統中光柵幾何結構的優化

快速物理光學軟件VirtualLab Fusion擁有分析光波導系統性能。這次我們在設計工作流程中處理一個密切相關的步驟: 在系統的耦合和擴

發表于 12-16 10:39

PCIe交換機與路由器的區別

在現代網絡技術中，PCIe交換機和路由器是兩種常見的設備，它們在數據傳輸和網絡管理中發揮著重要作用。盡管它們都與數據傳輸有關，但它們的設計、功能和應用場景有著顯著的差異。

發表于 11-26 16:08 ?762次閱讀

pcie在深度學習中的應用

與主機系統連接，提供必要的計算支持。 2. PCIe技術概述 PCIe是一種點對點串行連接，用于計算機內部硬件組件之間的連接。它以其高速數據傳輸能力和低延遲特性而聞名，是連接高性能硬件

發表于 11-13 10:39 ?1141次閱讀

在主板上優化PCIe通道設置

在主板上優化PCIe通道設置是提升系統性能的重要步驟，以下是具體的優化建議：一、了解主板和PCIe

發表于 11-06 09:30 ?7669次閱讀

如何簡化PCIe 6.0交換機的設計

由于全球數據流量呈指數級增長，PCIe 6.0 交換機的市場需求也出現了激增。PCIe 6.0 交換機在高性能計算（HPC）

發表于 07-05 09:45 ?857次閱讀

FPGA的PCIE接口應用需要注意哪些問題

，并進行了充分的測試和優化。主機系統性能：主機系統的處理能力和總線架構也會對PCIe設備

發表于 05-27 16:17

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

如何使用PCIe交換網結構在多主機系統中優化資源部署

評論

PoE交換機如何助力智慧城市基礎設施建設？

PoE交換機在安防監控系統中的關鍵作用

VirtualLab Fusion應用：光波導系統中光柵幾何結構的優化

Microchip發布全新Switchtec? PCIe 4.0交換機系列

Microchip推出全新PCI100x系列Switchtec PCIe 4.0交換機

DHCP在企業網的部署及安全防范

反射光柵的光學系統結構中光柵系統的配置與優化

Littrow結構中光柵系統的配置與優化

光波導系統中光柵幾何結構的優化

光波導系統中光柵幾何結構的優化

PCIe交換機與路由器的區別

pcie在深度學習中的應用

在主板上優化PCIe通道設置

如何簡化PCIe 6.0交換機的設計

FPGA的PCIE接口應用需要注意哪些問題