在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)GPU Direct不可或缺的RMDA技術(shù)到底有多厲害?

SSDFans ? 來(lái)源:楊湘祁 ? 作者:電子發(fā)燒友 ? 2019-03-01 13:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

和娛樂(lè)圈的明星八卦一樣,IT行業(yè)里面的各種并購(gòu)也是非常有市場(chǎng)的。畢竟,像EMC,Cisco,Broadcom 這樣的公司都是一路并購(gòu)成長(zhǎng)起來(lái)的。最近比較熱門(mén)的應(yīng)該是Mellanox說(shuō)自己準(zhǔn)備賣(mài)自己了。在25G/50G/100G市場(chǎng)上占據(jù)了69%的市場(chǎng)份額,2018年前三個(gè)季度,出貨了2.1M的網(wǎng)絡(luò)端口。[1] 這么好的標(biāo)的,一時(shí)各種傳聞都出來(lái)了。Xilinx[2],Microsoft[3],Intel[4],估計(jì)還有Broadcom[5]都在準(zhǔn)備,以色列人的確有水平,已經(jīng)從5.5B到了6B。陳福陽(yáng)在華爾街籌錢(qián)的能力,估計(jì)還有大招。

Mellanox是個(gè)什么公司,一句話,就是目前RDMA技術(shù)的事實(shí)的技術(shù)定義者。雖然海有很多公司也有RDMA技術(shù),但是在IB和Ethernet兩個(gè)市場(chǎng)都能夠呼風(fēng)喚雨,只有它了。

Remote DMA技術(shù)在Ethernet上的應(yīng)用不能不提微軟,目前微軟是目前在數(shù)據(jù)中心大規(guī)模部署RDMA的第一家HyperScale公司。微軟在2015/6/7/8年的Sigcomm [6]有大量的論文來(lái)講RDMA在數(shù)據(jù)中心的部署,很多人講微軟的風(fēng)格是自己做了100分,但是對(duì)外只講1分。因此可以想象Microsoft對(duì)于Mellanox準(zhǔn)備賣(mài)身的關(guān)注,自己的技術(shù)投入不能打水漂,不僅自己下手,而且鼓勵(lì)合作伙伴一起團(tuán)購(gòu)。

RDMA的技術(shù)是在一個(gè)有Mellanox主導(dǎo)的行業(yè)組織OFA[7]主導(dǎo)的。目前的成員如下圖,可以看到還是集中在HPC的專(zhuān)業(yè)領(lǐng)域。

英偉達(dá)GPU Direct必不可少的RMDA技術(shù)到底有多厲害?

OFA是2004年成立的工業(yè)組織,在整個(gè)HPC行業(yè)從Myrinet[8]轉(zhuǎn)換到IB的時(shí)候成立的。在2005年, Myrinet在TOP500的市場(chǎng)份額占到了28%,之后就一路下降,被IB替換掉了。對(duì)于誕生于HPC專(zhuān)業(yè)的領(lǐng)域,可用性一直是個(gè)大問(wèn)題,HPC一切為了性能,不要虛擬化,不要通用操作系統(tǒng)和架構(gòu),每臺(tái)超算恨不得自成一臺(tái)體系。大家看看Mellanox的Linux 驅(qū)動(dòng)的家族就知道這個(gè)有多復(fù)雜了。[7]

這路吐一個(gè)槽,作為Mellanox卡的資深用戶(hù),我很早就自己畫(huà)了一份他們的OFED驅(qū)動(dòng)的加載流程,作為Mellanox,這么基本的文檔在2018年12月才發(fā)布,而且很多模塊沒(méi)有upstream,讓人無(wú)奈的是,到現(xiàn)在為止我還沒(méi)有找到卸載rdma_cm ( connection mangament ) 的有效方法。每次都需要重啟

因此看到AWS說(shuō)要發(fā)布他們的EFA的時(shí)候,覺(jué)得他們還是真有勇氣,但是仔細(xì)一看,原來(lái)和AWS的HPC業(yè)務(wù)緊密結(jié)合,而且利用了libfabric 的生態(tài)[8]

很明顯,libfabric在網(wǎng)路傳輸層和流行的HPC編程框架之間做了一個(gè)統(tǒng)一。更重要的是,對(duì)于原來(lái)OFA的功能定義做了一個(gè)大大減法。俺曾經(jīng)自己研究總結(jié)了Mellanox CX系列網(wǎng)卡的功能。大家可以自己看看這個(gè)復(fù)雜度。

對(duì)于像AWS這樣的Hyperscale公司也要部署RDMA,這個(gè)做法和之前的微軟有很大的不同。對(duì)于微軟,他們從40G開(kāi)始規(guī)模部署RDMA,就是為了Azure的云環(huán)境的低延時(shí)網(wǎng)絡(luò),目前微軟的網(wǎng)絡(luò)還是天下第一。[9]當(dāng)然微軟為了大規(guī)模部署RoCEv2的所作的各種流控算法以及應(yīng)用的優(yōu)化對(duì)于整個(gè)業(yè)界都是非常有用的,但是他們主要停留在傳統(tǒng)的網(wǎng)絡(luò)上面。

AWS則不同,對(duì)于低延時(shí)網(wǎng)絡(luò)來(lái)講,在2014年之前,大部分的場(chǎng)景就是SDS,太多的存儲(chǔ)startup公司,使用PCIE Flash和RDMA 網(wǎng)卡來(lái)構(gòu)建自己的分布式存儲(chǔ)系統(tǒng),比較典型就是EMC收購(gòu)的ScaleI/O了。[10]

2014年之后,由于ALexnet的出色表現(xiàn),RMDA和Nvidia有了深度合作,利用GPU Direct,在GPU集群中快速傳遞數(shù)據(jù)成了RDMA的另一個(gè)

大眾應(yīng)用。[11]

GPU+RDMA也是目前在TOP500部署量最大的應(yīng)用,因此可以很明確地看出AWS使用Nitro做EFA的目的了。

貌似只有一款機(jī)型部署了EFA。[12] 對(duì)于這個(gè)機(jī)型,定位很清楚,HPC和分布式機(jī)器學(xué)習(xí)的訓(xùn)練,因此功能實(shí)現(xiàn)也非常有目的,不要指望EFA會(huì)和Mellanox一樣功能強(qiáng)大。

因此,可以看出,傳統(tǒng)的Nitro芯片在升級(jí)了25G的Serdes之后,利用libfabric的生態(tài)實(shí)現(xiàn)了部分的RDMA的功能,可以滿足AWS上的HPC和ML的業(yè)務(wù)需求。這個(gè)和國(guó)內(nèi)的大廠的想法類(lèi)似。

因此,對(duì)于未來(lái)RDMA在數(shù)據(jù)中心的使用場(chǎng)景,存儲(chǔ)和HPC是兩個(gè)比較明確的方向。對(duì)于存儲(chǔ),如何和NVMe這樣的存儲(chǔ)介質(zhì),以及NVMeoF和Cephover RDMA這樣的存儲(chǔ)后端結(jié)合是一個(gè)方向,在這個(gè)方向上,是不是要支持IB的編程框架并不重要。對(duì)于HPC的方向,則是如何和GPU這樣的計(jì)算引擎結(jié)合,簡(jiǎn)單數(shù)據(jù)傳輸?shù)难訒r(shí),和上層的ML的框架緊密結(jié)合。

廣告時(shí)間: Xilinx在2018.1 中就推出了自己的RDMA的實(shí)現(xiàn),目前主要關(guān)注在存儲(chǔ)應(yīng)用這個(gè)方向。[13]實(shí)現(xiàn)了對(duì)10G/25G/40G/100G的網(wǎng)絡(luò)速率的支持,在Vivado 2019.1中會(huì)在延時(shí)上有進(jìn)一步的提升,在512Byte上和標(biāo)準(zhǔn)的Mellanox類(lèi)似,當(dāng)然我們也是兼容Mellanox。歡迎大家垂詢(xún)。

[1]https://www.businesswire.com/news/home/20181025005197/en/Mellanox-Ships-2.1-Million-Ethernet-Adapters-Quarters

[2]https://www.cnbc.com/2018/11/07/xilinx-working-with-barclays-to-buy-mellanox-possible-december-deal.html

[3]https://www.cbronline.com/news/microsoft-mellanox

[4]https://www.hpcwire.com/2019/01/30/intel-reportedly-in-6b-bid-for-mellanox/

[5]https://en.globes.co.il/en/article-mellanox-acquisition-fits-broadcom-like-a-glove-1001258241

[6]http://www.sigcomm.org/

[7]https://community.mellanox.com/s/article/mellanox-linux-driver-modules-relationship--mlnx-ofed-x

[8]https://ofiwg.github.io/libfabric/

[9]https://mspoweruser.com/report-microsoft-azure-beats-google-cloud-and-amazon-aws-in-network-performance/

[10]https://en.wikipedia.org/wiki/Dell_EMC_ScaleIO

[11]https://devblogs.nvidia.com/benchmarking-gpudirect-rdma-on-modern-server-platforms/

[12]https://aws.amazon.com/cn/ec2/instance-types/

[13]https://www.xilinx.com/products/intellectual-property/etrnic.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3933

    瀏覽量

    93361

原文標(biāo)題:深度好文:RDMA,到底有多厲害?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)擬再推中國(guó)特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 近年來(lái),美國(guó)政府對(duì)華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。為保持在中國(guó)市場(chǎng)的競(jìng)爭(zhēng)力,英偉達(dá)推出了多款特供版
    發(fā)表于 05-27 00:03 ?4346次閱讀

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見(jiàn)故障哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計(jì)算領(lǐng)域的核心硬件。然而,隨著使用場(chǎng)景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀升,輕則影響業(yè)務(wù)進(jìn)度,重
    的頭像 發(fā)表于 05-05 09:03 ?683次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>GPU</b> H100 常見(jiàn)故障<b class='flag-5'>有</b>哪些?

    實(shí)測(cè) PTR54LS05低功耗到底有

    實(shí)測(cè) PTR54LS05低功耗到底有低?
    發(fā)表于 04-27 10:57

    為何原理圖比對(duì)是電子設(shè)計(jì)中不可或缺的功能?

    為何原理圖比對(duì)是電子設(shè)計(jì)中不可或缺的功能?原理圖比對(duì)功能是現(xiàn)代電子設(shè)計(jì)流程中不可或缺的一部分,能夠提高設(shè)計(jì)的準(zhǔn)確性、效率和協(xié)作能力。它不僅能夠幫助團(tuán)隊(duì)在設(shè)計(jì)階段減少錯(cuò)誤,還能在后期的維護(hù)和版本管理中
    的頭像 發(fā)表于 03-10 11:02 ?484次閱讀
    為何原理圖比對(duì)是電子設(shè)計(jì)中<b class='flag-5'>不可或缺</b>的功能?

    BGA芯片封裝:現(xiàn)代電子產(chǎn)業(yè)不可或缺技術(shù)瑰寶

    不可或缺的一部分。本文將深入探討B(tài)GA芯片的定義、特點(diǎn)以及BGA封裝工藝的詳細(xì)流程,為讀者揭開(kāi)這一先進(jìn)封裝技術(shù)的神秘面紗。
    的頭像 發(fā)表于 12-13 11:13 ?3487次閱讀
    BGA芯片封裝:現(xiàn)代電子產(chǎn)業(yè)<b class='flag-5'>不可或缺</b>的<b class='flag-5'>技術(shù)</b>瑰寶

    高鐵站網(wǎng)約車(chē)數(shù)智出行到底有智能?

    在當(dāng)今這個(gè)科技飛速發(fā)展的時(shí)代,智能出行已成為我們?nèi)粘I钪?b class='flag-5'>不可或缺的一部分,而高鐵站網(wǎng)約車(chē)數(shù)智出行更是將這一理念推向了新的高度。那么,這種數(shù)智出行方式到底有智能呢? 首先,從預(yù)約叫車(chē)開(kāi)始,高鐵站網(wǎng)
    的頭像 發(fā)表于 11-14 14:48 ?566次閱讀

    軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU

    軟銀公司宣布,其正在擴(kuò)展的日本頂級(jí)人工智能計(jì)算平臺(tái)已安裝了約4000顆英偉達(dá)Hopper GPU。這一舉措顯著提升了平臺(tái)的計(jì)算能力。據(jù)悉,該平臺(tái)自2023年9月開(kāi)始運(yùn)行,最初配備了大約2000顆
    的頭像 發(fā)表于 11-04 16:18 ?807次閱讀

    RTOS與Linux到底有什么區(qū)別

    很多做嵌入式開(kāi)發(fā)的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區(qū)別?
    的頭像 發(fā)表于 10-29 09:53 ?1195次閱讀

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉達(dá)GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項(xiàng)重要決策,其最新的企業(yè)平臺(tái)將放棄采用英偉達(dá)(Nvidia)的GPU,轉(zhuǎn)而選擇英特爾的Gaudi 3加速器。
    的頭像 發(fā)表于 10-10 17:21 ?740次閱讀

    英偉達(dá)Blackwell GPU量產(chǎn)加速,Q4營(yíng)收沖刺百億美元大關(guān)

    近日,全球領(lǐng)先的圖形處理單元(GPU)及人工智能芯片制造商英偉達(dá)傳來(lái)重大利好消息。據(jù)摩根士丹利最新發(fā)布的行業(yè)分析報(bào)告指出,英偉達(dá)基于Blac
    的頭像 發(fā)表于 09-26 15:58 ?607次閱讀

    挑戰(zhàn)英偉達(dá):聚焦本土GPU領(lǐng)軍企業(yè)崛起

    達(dá)在全球圖形處理單元(GPU)市場(chǎng)的霸主地位,特別是其關(guān)鍵硬件對(duì)訓(xùn)練大型AI模型(如ChatGPT背后的OpenAI模型)的不可或缺性,中國(guó)正積極尋求突破。盡管英偉
    的頭像 發(fā)表于 09-18 15:24 ?1051次閱讀

    ARM進(jìn)軍GPU領(lǐng)域,挑戰(zhàn)英偉達(dá)與英特爾

    英國(guó)芯片設(shè)計(jì)巨頭ARM正悄然在以色列拉阿納納的研發(fā)中心布局其GPU(圖形處理器)戰(zhàn)略,意圖在全球圖形處理市場(chǎng)與英偉達(dá)和英特爾等業(yè)界巨頭一較高下。據(jù)悉,ARM已在該開(kāi)發(fā)中心組建了一支由約100名精英芯片與軟件工程師構(gòu)成的全球圖形處
    的頭像 發(fā)表于 08-21 10:19 ?816次閱讀

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉達(dá)將全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

    英偉達(dá)公司近期宣布了一項(xiàng)重大決策,即全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊,并計(jì)劃最終以此取代閉源驅(qū)動(dòng)程序。這一戰(zhàn)略轉(zhuǎn)變標(biāo)志著英偉達(dá)在開(kāi)源領(lǐng)域邁出了重要
    的頭像 發(fā)表于 07-19 15:26 ?834次閱讀
    主站蜘蛛池模板: 亚色最新网址 | 天堂网2021天堂手机版 | 午夜嘿咻| www.色视频| 亚洲第一永久在线观看 | 日本不卡高清免费v日本 | 黄色大片免费观看 | 男人午夜免费视频 | 中文字幕一区二区在线观看 | 欧美成人性色区 | 日本三级香港三级人妇99 | 天天干夜啪 | 久久国产福利 | 韩国最新三级网站在线播放 | 韩国三级hd中文字幕 | 色综合888 | 狠狠色噜狠狠狠狠 | 日韩亚洲欧美日本精品va | 天天看天天爽天天摸天天添 | 久久久久久久性潮 | 夜夜爱夜夜爽夜夜做夜夜欢 | 色多多福利网站 | 亚洲jizzjizz在线播放久 | 国产亚洲人成网站观看 | 国产精品看片 | 日剧天堂 | 亚欧美综合 | 亚洲成a人片7777 | 好爽~~~~嗯~~~再快点明星 | 天天干天天操天天爽 | 轻点太大了好深好爽h文 | 久久久久国产免费 | 欧美黄色一级片视频 | 久久香蕉国产精品一区二区三 | 欧美一区视频 | 色婷婷综合激情 | 免费在线一区二区三区 | 亚洲综合日韩欧美一区二区三 | 99久久99久久精品免费看子伦 | 在线免费亚洲 | 操片免费|