在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVMe-oF的優(yōu)勢及未來

SSDFans ? 來源:ssdfans ? 作者:ssdfans ? 2021-01-05 17:42 ? 次閱讀

NVMe over Fabric(又名NVMe- oF)是一種新興技術(shù),它支持對數(shù)據(jù)中心的計(jì)算和存儲進(jìn)行分解。美光科技正通過與Marvell、Foxconn-Ingrasys和英偉達(dá)(NVIDIA)等關(guān)鍵技術(shù)合作伙伴的合作,共同解鎖NVMe-oF技術(shù)可以帶來的優(yōu)勢。我們還在開發(fā)創(chuàng)新技術(shù),如異構(gòu)存儲器存儲引擎(HSE),這將有助于使用NVMe-oF優(yōu)化對閃存的大規(guī)模訪問。

NVMe-oF是什么?

NVMe- oF從字面上來看是網(wǎng)絡(luò)上的NVMe協(xié)議的擴(kuò)展,其擴(kuò)展范圍遠(yuǎn)遠(yuǎn)超出了目前搭載SSD的服務(wù)器。NVMe早在2011年就出現(xiàn)了,而fabrics擴(kuò)展則在2016年首次標(biāo)準(zhǔn)化。NVMe-oF繼承了NVMe的所有優(yōu)點(diǎn),包括輕量級和高效的命令集、多核感知和協(xié)議并行性。NVMe-oF是真正的網(wǎng)絡(luò)無關(guān)的,因?yàn)樗С炙谐R姷膄abrics,包括光纖通道、InfiniBand和以太網(wǎng)。圖1比較了NVMe和NVMe- of模型,并標(biāo)注出了用戶可用的各種網(wǎng)絡(luò)和網(wǎng)絡(luò)傳輸選項(xiàng)。

33d85f06-4f39-11eb-8b86-12bb97331649.png

圖1 NVMe和NVMe-oF模型對比

從圖1可以看出,有兩種以太網(wǎng)傳輸選項(xiàng),RoCE v2和NVMe-TCP,每一種都各有優(yōu)缺點(diǎn)。RoCE v2延遲較低,但需要專用的支持RDMA的NIC (RNIC);NVMe-TCP不需要專用的RNIC,但是其傳輸延遲和CPU使用率都更高,它使用的是標(biāo)準(zhǔn)NIC。相比之下,RoCE v2目前在市場上更為流行。

NVMe over Fabrics的優(yōu)勢是什么?

使用NVMe就意味著只能使用基于PCIe交換機(jī)的服務(wù)器機(jī)架。雖然這是一種完全有效的存儲擴(kuò)展方法,但它的范圍是非常有限的。NVMe-oF則允許在數(shù)據(jù)中心范圍內(nèi)連接無數(shù)的存儲空間。

如今,NVMe-oF已經(jīng)很成熟了,許多用戶接受了將全閃存陣列(AFA)連接到服務(wù)器的技術(shù)。然而,NVMe-oF的優(yōu)勢只有在計(jì)算和存儲完全分開時才能完全發(fā)揮出來。也就是說,通過網(wǎng)絡(luò)將一個NVMe SSD池提供給一個服務(wù)器池,這種方式允許按需提供計(jì)算和存儲。計(jì)算和存儲的分解提升了存儲的可伸縮性和可共享性,并支持可組合性,如圖2所示。

34193f1c-4f39-11eb-8b86-12bb97331649.jpg

圖2 計(jì)算和存儲分解圖

分類存儲的另一個維度是存儲服務(wù)(即數(shù)據(jù)保護(hù)、復(fù)制、壓縮等)。存儲服務(wù)可以由服務(wù)器(onload模型)管理,也可以卸載到接近實(shí)際存儲的數(shù)據(jù)處理單元(DPU)。onload模型需要消耗額外的CPU周期和網(wǎng)絡(luò)帶寬,可以實(shí)現(xiàn)成本最小化,而卸載模型的成本較高,并且根據(jù)供應(yīng)情況,可能產(chǎn)生瓶頸。由于onload模型的TCO(總成本)優(yōu)勢,大規(guī)模追求低成本存儲使其附加了存儲策略。

什么是EBOF、JBOF和JBOD ?

全閃存陣列有兩種接入方式: 通過網(wǎng)絡(luò)接入(EBOF)和直接連接 (JBOF)。不要混淆JBOF和JBOD(只是一堆磁盤)。JBOD通常用于在PCIe上使用NVMe擴(kuò)展機(jī)架中的存儲。EBOF或JBOF可以使用NVMe-oF在數(shù)據(jù)中心之間擴(kuò)展存儲。如圖3所示,JBOF使用PCIe交換機(jī)向SSD擴(kuò)展,而EBOF使用以太網(wǎng)交換機(jī)向SSD擴(kuò)展。JBOF和EBOF都使用NVMe-oF連接回服務(wù)器。

348b85a4-4f39-11eb-8b86-12bb97331649.png

圖3 EBOF 和 JBOF對比圖

除了以太網(wǎng)和PCIe交換之外,這兩種方法的主要區(qū)別在于從NVMe到NVMe-oF的轉(zhuǎn)換發(fā)生在哪里。在JBOF上,轉(zhuǎn)換或橋接是在外圍使用一個或多個DPU (x DPU到y(tǒng) SSD, x:y比率)。在EBOF上,橋接在SSD載體完成(x橋接到x SSD, 1:1的比例)。雖然JBOF有使用DPU的處理能力來運(yùn)行存儲服務(wù)的優(yōu)勢,但它確實(shí)存在一個潛在的瓶頸,并且和EBOF模型相比,帶來了額外的成本,具有一些新功能。當(dāng)橋與固態(tài)硬盤的比例不是1:1時,成本權(quán)衡和瓶頸問題就開始顯現(xiàn)出來了。

使用Marvell 88SN2400和Foxconn-Ingrasys EBOF測試系統(tǒng)

通過與Marvell和Foxconn-Ingrasys的合作,我們一直在NVMe- oF環(huán)境中測試Micron 7300主流NVMe SSD,并在各種不同的應(yīng)用程序和工作負(fù)載下進(jìn)行測試。

在介紹測試結(jié)果之前,讓我們先看一下Foxconn-Ingrasys EBOF和Marvell的88SN2400轉(zhuǎn)換器控制器和PresteraCX 8500交換機(jī)。

Marvell的88SN2400是一款用于云和企業(yè)數(shù)據(jù)中心的SSD轉(zhuǎn)換器的NVMe控制器。這與Marvell交換機(jī)相結(jié)合,本質(zhì)上允許用戶在NVMe和NVMe- oF之間進(jìn)行轉(zhuǎn)換或“橋接”。88SN2400轉(zhuǎn)換器控制器是Foxconn-Ingrasys EBOF的一個關(guān)鍵組件,與Micron 7300 SSD一起,使高性能2U存儲器達(dá)到高達(dá)73.1 GB/s的帶寬和高達(dá)2000萬IOPs。圖4顯示了Foxconn-Ingrasys EBOF,在2U機(jī)箱中有24 U.2插槽。

Foxconn-Ingrasys U.2 Carrier采用標(biāo)準(zhǔn)的U.2 SSD格式。U.2載波支持雙以太網(wǎng)端口,以解決需要路徑冗余的應(yīng)用程序,它在驅(qū)動器側(cè)有一個PCIe Gen3 x4用于NVMe SSD。

Marvell的88SN2400轉(zhuǎn)換器控制器支持RoCE v2和NVMe-TCP傳輸。然而,在我們的測試中,我們關(guān)注的是RoCE v2。

如何使用NVIDIAGPUDirect存儲(GDS)進(jìn)行擴(kuò)展?

我們一直在使用NVIDIAGPUDirect存儲(GDS)在人工智能機(jī)器學(xué)習(xí)工作負(fù)載方面進(jìn)行大量工作。我們想通過將Foxconn-Ingrasys EBOF與Marvell的88SN2400轉(zhuǎn)換器控制器連接到NVIDIA DGXA100系統(tǒng),來了解在fabrics環(huán)境中事物是如何伸縮的。這是一個簡單的gdsio (GPUDirect Storage I/O)工具測試,可以比較在NVMe-oF環(huán)境中使用和不使用GDS的帶寬和延遲。

3552fc9c-4f39-11eb-8b86-12bb97331649.png

圖6 DGX A100 with EBOF

在圖6中,有一個裝載了Micron 7300 SSD的EBOF,它使用8個計(jì)算網(wǎng)絡(luò)端口中的6個直接連接到NVIDIA DGXA100,提供600gb /s的可用網(wǎng)絡(luò)帶寬。GDS可以讓數(shù)據(jù)在對等點(diǎn)之間直接傳輸,跳過了在GDS未啟用時使用的高延遲反彈緩沖區(qū)。在這個測試中,我們將SSD的全部能力(約61 GB/s)用于工作負(fù)載。未來的測試將添加一個以太網(wǎng)交換機(jī),并進(jìn)一步擴(kuò)大EBOF的數(shù)量。

NVMe-oF如何與HSE形成規(guī)模?

Micron一直在研究一些驚人的技術(shù),其中之一是異構(gòu)內(nèi)存存儲引擎(HSE)。HSE是一個閃存感知的存儲引擎,它提高了存儲類內(nèi)存(SCM)和SSD的性能。它還通過減少寫放大增加了SSD的有效壽命,所有這些都在大規(guī)模部署的情況下進(jìn)行。NVMe-oF是進(jìn)一步擴(kuò)大HSE規(guī)模的理想途徑。為了驗(yàn)證HSE在Fabric附加存儲環(huán)境下的有效性,我們使用MongoDB和YCSB (Yahoo!云服務(wù)基準(zhǔn))。在圖7中,我們比較了使用本地Micron 7300 SSD的默認(rèn)內(nèi)置MongoDB存儲引擎(WiredTiger)和使用Micron 7300 SSD的Micron HSE在EBOF中的性能。

3599fd5e-4f39-11eb-8b86-12bb97331649.png

圖7 WiredTiger和HSE對比圖

與MongoDB中使用的帶有本地SSD的傳統(tǒng)WiredTiger存儲引擎相比,HSE在fabric環(huán)境中的有效性是非常顯著的。可以實(shí)現(xiàn)每秒5倍的YCSB操作改進(jìn),降低42%的延遲,同時增加了存儲的可伸縮性。

NVMe-oF的未來是什么?

NVMe-oF是一種創(chuàng)新技術(shù),它最終將使數(shù)據(jù)中心完全分解,在這些中心中,可以組合應(yīng)用程序,然后以一種經(jīng)濟(jì)有效的方式動態(tài)地提供適量的計(jì)算和存儲。

如今,人們使用低成本橋接器或基于處理器的平臺來連接NVMe SSD,并將其橋接到EBOF或JBOF。在未來,我們可能會看到SSD的本地NVMe進(jìn)一步降低TCO并提高性能。

美光科技正在設(shè)計(jì)下一代數(shù)據(jù)中心SSD,其功能和特性針對NVMe應(yīng)用進(jìn)行了優(yōu)化。

責(zé)任編輯:xj

原文標(biāo)題:再見,Intel!GPU直連NVMe SSD!

文章出處:【微信公眾號:ssdfans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4904

    瀏覽量

    130592
  • intel
    +關(guān)注

    關(guān)注

    19

    文章

    3493

    瀏覽量

    187869
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2944

    瀏覽量

    119064
  • nvme
    +關(guān)注

    關(guān)注

    0

    文章

    243

    瀏覽量

    23101

原文標(biāo)題:再見,Intel!GPU直連NVMe SSD!

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVMe協(xié)議分析之提交隊(duì)列

    NVMe指令提交與完成機(jī)制是NVMe協(xié)議的核心,該機(jī)制制定了NVMe指令的交互流程和處理步驟。
    的頭像 發(fā)表于 05-15 23:25 ?61次閱讀
    <b class='flag-5'>NVMe</b>協(xié)議分析之提交隊(duì)列

    NVMe協(xié)議簡介2

    NVMe指令提交與完成機(jī)制 NVMe指令提交與完成機(jī)制是NVMe協(xié)議的核心,該機(jī)制制定了NVMe指令的交互流程和處理步驟。在基于PCIe的NVMe
    發(fā)表于 05-15 23:15

    NVMe協(xié)議簡要分析

    NVM Express(NVMe)是一種高性能、可擴(kuò)展的接口協(xié)議,用于通過PCI express(PCIe)總線,實(shí)現(xiàn)主機(jī)軟件與NVM設(shè)備之間的通信。目前,由于NVMe SSD相比于SATA SSD
    發(fā)表于 05-15 00:34

    NVMe協(xié)議分析

    NVM Express(NVMe)是一種高性能、可擴(kuò)展的接口協(xié)議,用于通過PCI express(PCIe)總線,實(shí)現(xiàn)主機(jī)軟件與NVM設(shè)備之間的通信。目前,由于NVMe SSD相比于SATA SSD具有更高的吞吐量、更快的訪問速度和更低的功耗,已經(jīng)被廣泛應(yīng)用于各種計(jì)算領(lǐng)域
    的頭像 發(fā)表于 05-15 00:29 ?129次閱讀
    <b class='flag-5'>NVMe</b>協(xié)議分析

    NVMe控制器IP設(shè)計(jì)之接口轉(zhuǎn)換

    這是NVMe控制器IP設(shè)計(jì)系列博客之一,其他的見本博客或csdn搜用戶名:tiantianuser。相關(guān)視頻見B站用戶名:專注與守望。 接口轉(zhuǎn)換模塊負(fù)責(zé)完成AXI4接口與控制器內(nèi)部的自定義接口之間
    發(fā)表于 05-10 14:33

    NVME控制器之隊(duì)列管理模塊

    隊(duì)列管理模塊是整個NVMe Host控制器的核心模塊,該模塊實(shí)現(xiàn)了提交隊(duì)列與完成隊(duì)列的管理,多隊(duì)列請求的仲裁判決等功能。隊(duì)列管理模塊中含有數(shù)據(jù)選擇單元、SQ、CQ、和仲裁器等模塊。其中Admin
    發(fā)表于 05-03 20:19

    NVMe控制器之完成信息解析模塊

    完成信息解析模塊用于解析NVMe命令執(zhí)行完成后返回的信息。該模塊首先提取完成信息中的Status Field字段和ID號。通過檢查Status Field字段,判斷NVMe命令是否成功執(zhí)行。
    的頭像 發(fā)表于 05-03 15:58 ?117次閱讀

    NVMe控制器設(shè)計(jì)1

    NVMe 控制模塊負(fù)責(zé)實(shí)現(xiàn)用戶請求事務(wù)與 NVMe 事務(wù)的轉(zhuǎn)換、 NVMe 命令提交 與完成機(jī)制、 PRP 尋址機(jī)制。這里簡介其組成,后續(xù)分享其他模塊設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 09:51 ?115次閱讀
    <b class='flag-5'>NVMe</b>控制器設(shè)計(jì)1

    NVME控制器設(shè)計(jì)1

    硬件實(shí)現(xiàn)降低了命令交互的延遲和 PRP 尋址機(jī)制的過程延遲, 另一方面通過結(jié)構(gòu)的設(shè)計(jì)繼承了軟件協(xié)議棧的靈活性, 這使得系統(tǒng)即使在不同的應(yīng)用場景下也能充分發(fā)揮性能優(yōu)勢。 如圖1所示 NVMe 控制模塊按照
    發(fā)表于 04-24 09:45

    ALINX NVME SPCle IP 特性詳解

    NVMe SPCle IP 正是為這樣的場景量身定制。通過結(jié)合 PCIe 軟核 IP 與 NVMe 主機(jī)控制器,讓開發(fā)人員 在無硬核的情況下,也能輕松接入 NVMe SSD ,突破了傳統(tǒng)存儲方案的硬件限制。 簡單來說,
    的頭像 發(fā)表于 02-20 15:35 ?403次閱讀
    ALINX <b class='flag-5'>NVME</b> SPCle IP 特性詳解

    存儲技術(shù)未來演進(jìn):NVMe over Fabrics (NVMeoF)

    眾所周知,NVMe 是一個邏輯設(shè)備接口規(guī)范,NVM代表非易失性存儲器(Non-Volatile Memory)的首字母縮略字,是固態(tài)硬盤(SSD)的常見的閃存形式。SSD 通常分為兩類接口:SATA
    的頭像 發(fā)表于 11-16 10:44 ?1592次閱讀
    存儲技術(shù)<b class='flag-5'>未來</b>演進(jìn):<b class='flag-5'>NVMe</b> over Fabrics (NVMeoF)

    一文詳解 ALINX NVMe IP 特性

    - ALINX NVMe?IP - 在當(dāng)下數(shù)據(jù)驅(qū)動的時代,企業(yè)對高性能存儲解決方案的需求不斷增加。NVMe AXI IP 憑借其支持大數(shù)據(jù)量、高速傳輸、低延遲等存儲性能優(yōu)勢,成為眾多開發(fā)者和企業(yè)
    的頭像 發(fā)表于 11-14 13:59 ?572次閱讀
    一文詳解 ALINX <b class='flag-5'>NVMe</b> IP 特性

    淺談ALINX NVMe IP產(chǎn)品特性

    在當(dāng)下數(shù)據(jù)驅(qū)動的時代,企業(yè)對高性能存儲解決方案的需求不斷增加。NVMe AXI IP 憑借其支持大數(shù)據(jù)量、高速傳輸、低延遲等存儲性能優(yōu)勢,成為眾多開發(fā)者和企業(yè)的理想選擇。
    的頭像 發(fā)表于 11-14 11:27 ?550次閱讀
    淺談ALINX <b class='flag-5'>NVMe</b> IP產(chǎn)品特性

    Synology如何使用Nvme固態(tài)做存儲空間

    Synology 如何使用Nvme固態(tài)做存儲空間
    發(fā)表于 10-09 10:55 ?0次下載

    基于RDMA技術(shù)的Mayastor解決方案

    : 基于NVMe-oF: Mayastor利用NVMe-oF協(xié)議,這是一種基于網(wǎng)絡(luò)的NVMe訪問方法,允許NVMe設(shè)備通過以太網(wǎng)或其他網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行遠(yuǎn)
    的頭像 發(fā)表于 08-20 18:47 ?1622次閱讀
    基于RDMA技術(shù)的Mayastor解決方案
    主站蜘蛛池模板: 久久久蜜桃 | 天天操夜夜爱 | 色草视频 | 在线观看网站国产 | brazzersvideosexhd欧美高清 | 国产精品免费久久 | 在线免费国产视频 | 一级特黄aaa大片免色 | 亚洲狠狠色丁香婷婷综合 | se色成人亚洲综合 | 色偷偷免费视频 | 狠狠色噜狠狠狠狠色综合久 | 奇米影视四色首页手机在线 | 快乐你懂的在线视频免费观看 | 亚洲va欧美va国产综合久久 | 激情综合网五月婷婷 | 拍拍拍拍拍拍拍无挡大全免费 | 五月天狠狠操 | 在线免费观看色片 | 国产一二三区在线观看 | 精品视频一二三区 | 精品久久天干天天天按摩 | 69xxxxx日本护士| 四虎永久在线精品免费观看地址 | 天天综合久久 | 在线视频这里只有精品 | 日韩久久精品视频 | 亚洲欧美啪啪 | 综合爱爱 | 亚洲操操操| 国产亚洲一区二区在线观看 | 天天靠天天擦天天摸 | 午夜免费免费啪视频观看 | 四虎一影院区永久精品 | 日本黄色三级视频 | 在线免费日韩 | 欧美黑人性色黄在线视频 | 婷婷丁香五 | 欧美性色综合网 | 一级特黄性色生活片一区二区 | 色噜噜狠狠狠狠色综合久一 |