隨著網(wǎng)絡(luò)速度的提高,向現(xiàn)代分布式工作負(fù)載的轉(zhuǎn)變?cè)黾恿嘶A(chǔ)設(shè)施服務(wù)的開銷,從而減少了為業(yè)務(wù)提供動(dòng)力的應(yīng)用程序可用的 CPU 資源。通過部署 DPU(數(shù)據(jù)處理器)來卸載和加速這些基礎(chǔ)設(shè)施服務(wù),可以提供更高的性能、更低的 CPU 利用率和更高的能效。
許多現(xiàn)代工作負(fù)載都是分布式的,這意味著它們不再只適用于一臺(tái)服務(wù)器。相反,它們?cè)诙嗯_(tái)服務(wù)器上同時(shí)運(yùn)行,以實(shí)現(xiàn)更高的可擴(kuò)展性和可用性。此類工作負(fù)載包括 Web 和電子商務(wù)應(yīng)用程序,如 NoSQL 數(shù)據(jù)庫(kù)、分析、人工智能和鍵值存儲(chǔ),如 Redis。
許多公司都在 vSphere Enterprise Workload Platform(企業(yè)工作負(fù)載平臺(tái))上運(yùn)行這些分布式工作負(fù)載。隨著應(yīng)用程序的不同部分在虛擬機(jī)(VM)和主機(jī)之間進(jìn)行通信,vSphere 必須將越來越多的 CPU 資源用于管理數(shù)據(jù)移動(dòng)和基礎(chǔ)架構(gòu)工作負(fù)載,如網(wǎng)絡(luò)。
在 CPU 以外的 DPU 上運(yùn)行網(wǎng)絡(luò)和安全基礎(chǔ)設(shè)施服務(wù),可釋放 CPU 核心用于業(yè)務(wù)應(yīng)用程序,并顯著減少 CPU 緩存污染和上下文切換等問題,從而打造一個(gè)高效的系統(tǒng)。
vSphere 軟件
基于 DPU 的 vSphere(以前稱為 Project Monterey)已隨 vSphere 8 一同發(fā)布。它與 NVIDIA BlueField DPU 一起,使應(yīng)用程序工作負(fù)載流量能夠通過虛擬機(jī)監(jiān)控程序(Hypervisor)實(shí)現(xiàn)網(wǎng)絡(luò)快速路徑。在直通模式下運(yùn)行 BlueField DPU 可以將網(wǎng)絡(luò)處理卸載并隔離到 DPU。這將顯著提高應(yīng)用程序的性能。
圖 1:vSphere 分布式服務(wù)引擎(Distributed Services Engine)架構(gòu)
為了測(cè)試這一理論,NVIDIA 和 VMware 聯(lián)合展示了在 DPU 上運(yùn)行的 vSphere 8 是如何提高可擴(kuò)展性、效率和性能的。
Redis 鍵值存儲(chǔ)數(shù)據(jù)庫(kù)
由于 Redis 作為多模型 NoSQL 數(shù)據(jù)庫(kù)服務(wù)器和緩存引擎而廣受歡迎,兩家公司的工程專家選擇在 NVIDIA 實(shí)驗(yàn)室中使用 BlueField DPU 在 vSphere 8 上測(cè)試 Redis。
Redis 是 Remote Dictionary Server(遠(yuǎn)程字典服務(wù)器)的縮寫,是一種快速、開源、內(nèi)存中的鍵值數(shù)據(jù)存儲(chǔ)。Redis 超越了其他 NoSQL 數(shù)據(jù)庫(kù),可提供現(xiàn)代應(yīng)用程序所需的高級(jí)功能,包括內(nèi)置復(fù)制的各種數(shù)據(jù)結(jié)構(gòu),通過 Redis Sentinel 提供高可用性的能力,以及使用 Redis 集群(Cluster)進(jìn)行自動(dòng)分區(qū)。
測(cè)試的指標(biāo)包括以下內(nèi)容:
-
每秒處理事務(wù)量(TPS)
-
平均應(yīng)用程序延遲
-
網(wǎng)絡(luò)吞吐量
-
用于網(wǎng)絡(luò)的服務(wù)器 CPU 利用率
-
能效
Redis 基準(zhǔn)測(cè)試
測(cè)試包括運(yùn)行多個(gè)工作負(fù)載,網(wǎng)絡(luò)設(shè)置使用 Geneve 疊加網(wǎng)絡(luò)(Overlay Networking)以及 VMware NSX 和 NSX 分布式防火墻。測(cè)試比較了三種網(wǎng)絡(luò)選項(xiàng):
-
增強(qiáng)型數(shù)據(jù)路徑(Enhanced datapath- EDP)標(biāo)準(zhǔn),具有常規(guī)網(wǎng)卡,而無 DPU 卸載
-
具有部分 DPU 卸載的 EDP 標(biāo)準(zhǔn)(默認(rèn)模式)
-
EDP 標(biāo)準(zhǔn),具有完全 DPU 卸載和加速
圖 2:在 vSphere 上測(cè)試 Redis 的服務(wù)器和網(wǎng)絡(luò)設(shè)置
DPU 卸載并隔離網(wǎng)絡(luò)處理,通過使用 DPU 上的加速器和緩存實(shí)現(xiàn)網(wǎng)絡(luò)處理。這可以釋放主機(jī)上的緩存以用于應(yīng)用程序邏輯,從而在吞吐量和延遲方面顯著提升了應(yīng)用程序性能。有兩種使用 DPU 的方法:
-
加速模式(Accelerated mode):在不丟失 vSphere 所支持的工作負(fù)載移動(dòng)服務(wù)的情況下,通過實(shí)現(xiàn)類似 SR-IOV 的高網(wǎng)絡(luò)性能來獲得最佳結(jié)果。
-
默認(rèn)模式(Default mode):為網(wǎng)絡(luò)處理提供基于 DPU 的卸載和加速,但也會(huì)在主機(jī)上產(chǎn)生一些 CPU 開銷。它不會(huì)釋放如 UPTv2 模式那么多的核心。
基準(zhǔn)測(cè)試結(jié)果
針對(duì)白皮書進(jìn)行的測(cè)試在 NSX 上使用了網(wǎng)絡(luò)加速,并使用了四層分布式防火墻的重疊網(wǎng)絡(luò)。在 80 個(gè) Redis 實(shí)例中使用完全 DPU 加速(具有 UPTv2 的 EDP 標(biāo)準(zhǔn))實(shí)現(xiàn)了近 2000 萬的 TPS。
在默認(rèn) DPU 卸載模式下,我們也實(shí)現(xiàn)了其中的很大一部分(1774 萬 TPS)。使用標(biāo)準(zhǔn)的 ConnectX-5 網(wǎng)卡,在沒有任何 DPU 卸載或加速的情況下,我們?cè)趦H運(yùn)行 30 個(gè) Redis 實(shí)例的情況下達(dá)到了 1275 萬 TPS 左右的峰值。
圖 3:DPU 卸載并加速以提高 TPS
我們還觀察到,與使用普通網(wǎng)卡相比,使用 DPU 卸載和 DPU 完全加速時(shí),應(yīng)用程序延遲顯著降低。與使用普通網(wǎng)卡相比,使用 DPU 卸載和加速 VMware ESXi 網(wǎng)絡(luò)可實(shí)現(xiàn)更低的延遲。隨著 Redis 實(shí)例數(shù)量的增加,DPU 的延遲優(yōu)勢(shì)更加顯著。
圖 4:與使用普通網(wǎng)卡相比,將 DPU 與 VMware ESXi 結(jié)合使用可降低延遲
在吞吐量和帶寬方面,我們發(fā)現(xiàn)使用 DPU 卸載時(shí),吞吐量高于標(biāo)準(zhǔn)網(wǎng)卡。DPU 完全加速顯示了最高吞吐量。由于 CPU 核心無法再處理任何額外的網(wǎng)絡(luò)任務(wù),標(biāo)準(zhǔn)網(wǎng)卡的吞吐量穩(wěn)定在 30 個(gè)實(shí)例。隨著 Redis 實(shí)例數(shù)量的增加,DPU 卸載和完全加速模式繼續(xù)提高吞吐量。
DPU 的功耗對(duì)于 10 至 30 個(gè)實(shí)例略低,對(duì)于 40 至 80 個(gè)實(shí)例略高。然而,服務(wù)器使用 DPU 完成了相當(dāng)多的工作,從而提高了能效。
使用 DPU 卸載仍然會(huì)消耗一些 x86 處理周期,但消耗得要小得多,因?yàn)椴糠志W(wǎng)絡(luò)處理已從 CPU 轉(zhuǎn)移到了 DPU。這樣可以大幅提高能效。當(dāng)使用重疊網(wǎng)絡(luò)和 EDP 標(biāo)準(zhǔn)時(shí),與普通網(wǎng)卡相比,完全 DPU 加速在每百萬 TPS 使用的功耗減少了 6% - 40% 。
通過減少 ESXi 網(wǎng)絡(luò)所需的 CPU 核心數(shù)量,DPU 可以釋放這些核心以運(yùn)行更多的虛擬機(jī)和應(yīng)用程序。這使得更多的工作負(fù)載可以在相同數(shù)量的服務(wù)器上運(yùn)行。您還可以使用更少的服務(wù)器來支持相同工作負(fù)載,而這些工作負(fù)載以前是在沒有 DPU 卸載的情況下運(yùn)行的。
價(jià)值主張
基準(zhǔn)測(cè)試結(jié)果表明,與未啟用 DPU 的主機(jī)相比,啟用 BlueField DPU 的主機(jī)可以實(shí)現(xiàn)更好的事務(wù)延遲,同時(shí)使用的 CPU 核心數(shù)量也減少了 20% 。啟用 DPU 的主機(jī)將吞吐量提高了 30% 以上,事務(wù)延遲減少了 25% 以上。
DPU 完全加速還提高了能效,使每次事務(wù)的功耗減少了 35%,每瓦特的性能提高了 50%。該基準(zhǔn)測(cè)試證明,在 BlueField DPU 上運(yùn)行 vSphere 分布式服務(wù)引擎可以使數(shù)據(jù)中心將 Redis 服務(wù)器的數(shù)量減少 14 - 18%。
最大限度地提高投資回報(bào)率
由于在 DPU 加速(UPTv2)模式下保存了 CPU 核心,而在 DPU 卸載(默認(rèn))模式下保存了較少的 CPU 核心,因此您可以減少 4 - 15 個(gè) CPU 核心來支持相同的 Redis 工作負(fù)載。假設(shè)每個(gè) ESX 主機(jī)的工作負(fù)載為 30 – 80 個(gè) Redis 實(shí)例,這能夠?qū)⒎?wù)器數(shù)量減少 14 – 18%。購(gòu)買更少的服務(wù)器和支付更少的數(shù)據(jù)中心基礎(chǔ)設(shè)施可以節(jié)省資本性支出。此外,還可節(jié)省了運(yùn)營(yíng)性支出,因?yàn)榉?wù)器數(shù)量的減少會(huì)消耗更少的電力,以及相關(guān)的配電和冷卻電力也會(huì)減少。
對(duì)于最初需要 1 萬臺(tái)服務(wù)器的基于 vSphere 的 Redis 部署,一個(gè)簡(jiǎn)單的 TCO 分析可以看出,如果 BlueField DPU 完全加速模式將所需的服務(wù)器數(shù)量減少 14 - 18% ,則將在 3 年內(nèi)節(jié)省 830 萬至 1060 萬美元。其中大約一半來自于節(jié)省的資本性支出(減少服務(wù)器),一半來自于節(jié)省運(yùn)營(yíng)性支出(減少電力消耗以及相關(guān)的冷卻和配電成本降低)。
如果您僅部署少量 ESX 主機(jī),Redis 服務(wù)器仍然可以從提高的應(yīng)用程序性能中獲益。隨著應(yīng)用程序需求的增長(zhǎng),加速的服務(wù)器可能會(huì)推遲購(gòu)買或升級(jí)服務(wù)器,從而避免未來的成本。
這些特定的結(jié)果和成本節(jié)省僅適用于使用 25G DPU 的情況,因?yàn)槲覀兪艿皆诖颂帨y(cè)試的最大規(guī)模下加速模式下 DPU 的線速限制。
使用 VMware VSphere 8 和
NVIDIA BlueField DPU 加速 Redis 性能
Accelerating Redis performance using VMware vSphere 8 and NVIDIA BlueField DPU(使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能)白皮書記錄了測(cè)試和結(jié)果。該白皮書揭示了如何使用 vSphere 與 BlueField DPU 的硬件加速網(wǎng)絡(luò)卸載來顯著提高應(yīng)用程序性能,提供更高的吞吐量,并實(shí)現(xiàn)更快的響應(yīng)時(shí)間。
它還展示了卸載到 DPU 如何釋放服務(wù)器 CPU 核心來運(yùn)行應(yīng)用程序并提高運(yùn)營(yíng)效率。DPU 卸載和加速還降低了每個(gè)應(yīng)用程序事務(wù)的耗電量,從而提高數(shù)據(jù)中心的效率,并通過降低耗電量顯著節(jié)省成本。
圖 5:提高主機(jī)服務(wù)器的能效
通過 NVIDIA LaunchPad
在 BlueField DPU 上體驗(yàn) VMware
為了體驗(yàn) BlueField DPU 的優(yōu)勢(shì),NVIDIA 提供了 LaunchPad,這是一個(gè)非常適合展示優(yōu)勢(shì)的演示區(qū)。您可以申請(qǐng)測(cè)試在 vSphere 和 BlueField 上運(yùn)行的各種應(yīng)用程序和庫(kù),而無需在數(shù)據(jù)中心購(gòu)買和部署硬件。
LaunchPad 包括多個(gè)精心策劃的實(shí)驗(yàn),可以引導(dǎo)您完成在多個(gè)用例中運(yùn)行的部署和性能基準(zhǔn)測(cè)試,包括使用 BlueField DPU 的 vSphere 上的 Redis。
本實(shí)驗(yàn)將指導(dǎo)您逐步完成在 vSphere 8 環(huán)境中安裝、配置和部署 Redis 的過程。您可以通過本實(shí)驗(yàn)比較有 BlueField DPU 加速和沒有 BlueField DPU 加速的 Redis 測(cè)試,以驗(yàn)證性能提升。
LaunchPad 為開發(fā)者、設(shè)計(jì)師和 IT 專業(yè)人員提供了快速訪問所需硬件和工具的機(jī)會(huì),以熟悉新技術(shù)并確定他們?nèi)绾螐?DPU 加速中受益。企業(yè)團(tuán)隊(duì)可以使用 LaunchPad 加速創(chuàng)建和部署現(xiàn)代數(shù)據(jù)密集型應(yīng)用程序。在 LaunchPad 上進(jìn)行快速測(cè)試和原型設(shè)計(jì)后,可以為其生產(chǎn)工作流部署相同的完整堆棧。
總結(jié)
DPU 已經(jīng)廣泛部署在超大規(guī)模數(shù)據(jù)中心中,以處理基礎(chǔ)設(shè)施功能,并為創(chuàng)收工作負(fù)載釋放 CPU 資源。每個(gè)安裝了 vSphere 分布式服務(wù)引擎和 BlueField DPU 的節(jié)點(diǎn)都可以使用 DPU 卸載來提高性能。它為企業(yè)提供了一個(gè)有效的解決方案,以解決新工作負(fù)載給服務(wù)器帶來的壓力。
NVIDIA 與 VMware 及 NVIDIA LaunchPad 實(shí)驗(yàn)室的測(cè)試結(jié)果顯示,在 VMware 服務(wù)器中添加 DPU 可以降低 TCO,同時(shí)改善整體工作負(fù)載處理。將基礎(chǔ)設(shè)施進(jìn)程卸載到 DPU,可在 CPU 和基礎(chǔ)設(shè)施之間增加隔離,從而提高整體安全性。
觀看下方視頻
了解更多關(guān)于 NVIDIA BlueField DPU 的信息!
掃描下方二維碼,或點(diǎn)擊 “閱讀原文” 嘗試LaunchPad,測(cè)試在 vSphere 和 BlueField 上運(yùn)行的各種應(yīng)用程序和庫(kù)。

NVIDIA BlueField DPU 往期內(nèi)容 借助 NVIDIA DPU 和 NVIDIA DOCA 為人工智能時(shí)代的數(shù)據(jù)中心帶來變革
GTC23 | Oracle 云基礎(chǔ)設(shè)施 (OCI) 選擇 NVIDIA BlueField 數(shù)據(jù)中心加速平臺(tái)
NVIDIA 人工智能開講 | BlueField DPU 如何幫助企業(yè)提升數(shù)據(jù)中心能效
白皮書發(fā)布 | 看 NVIDIA BlueField DPU 如何讓數(shù)據(jù)中心變得更加環(huán)保
原文標(biāo)題:使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3926瀏覽量
93250
原文標(biāo)題:使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【經(jīng)驗(yàn)分享】在Omni3576上編譯Redis-8.0.2源碼,并安裝及性能測(cè)試

【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】Redis最新8.0.2版本源碼安裝及性能測(cè)試
第三屆NVIDIA DPU黑客松開啟報(bào)名
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

Redis實(shí)戰(zhàn)筆記

利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來

華為云 Flexus X 加速 Redis 案例實(shí)踐與詳解

在NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢(shì)

華為云Flexus X實(shí)例,Redis性能加速評(píng)測(cè)及對(duì)比

Redis緩存與Memcached的比較
日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新
NVIDIA DOCA-OFED的主要特性
利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

評(píng)論