在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

硅光芯片如何連接到GPU?

旺材芯片 ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2022-08-19 10:31 ? 次閱讀

在過(guò)去幾面,我們一直在談?wù)摴韫庾訉W(xué),以至于我們可能和你們中的許多人一樣,對(duì)它還沒(méi)有普及感到沮喪。但好消息是隨著電信號(hào)的進(jìn)步,我們可能現(xiàn)在不得不轉(zhuǎn)向光芯片尋找?guī)椭?/p>

由于組件之間的電氣互連成本要低得多,這對(duì)價(jià)格/性能等式的價(jià)格分子部分來(lái)說(shuō)是一個(gè)福音,盡管硅光子學(xué)在該等式的分母性能部分具有優(yōu)勢(shì)。隨著時(shí)間的推移,隨著帶寬的增加,電信號(hào)變得越來(lái)越短,而且噪音也越來(lái)越大。這一天將不可避免地到來(lái),我們將從電子轉(zhuǎn)向光子作為電磁信號(hào)方法,從銅轉(zhuǎn)向光纖玻璃作為信號(hào)介質(zhì)。

這條曲線來(lái)自 Nvidia 首席科學(xué)家 Bill Dally 在 3 月份的光纖通信會(huì)議上發(fā)表的演講,很好地說(shuō)明了這一點(diǎn):

832917ee-1eea-11ed-ba43-dac502259ad0.jpg

這些曲線沒(méi)有爭(zhēng)議,盡管你可以用材料科學(xué)魔法稍微彎曲它們。

幾周前,英偉達(dá)與 Ayar Labs 簽署了研發(fā)合作協(xié)議,我們坐下來(lái)與這家硅光子初創(chuàng)公司的首席執(zhí)行官 Charlie Wuischpard 進(jìn)行了交談,討論了兩人將開展的工作。Nvidia 參與了 Ayar Labs 今年早些時(shí)候進(jìn)行的 C 輪融資,當(dāng)時(shí)它籌集了 1.3 億美元來(lái)開發(fā)其帶外激光器和硅光子互連。Hewlett Packard Enterprise也在今年 2 月與 Ayar Labs 簽署了一項(xiàng)協(xié)議。為了弄清楚如何將硅光子學(xué)引入 Slingshot 互連,他也是今年 4 月那輪融資的投資者。Ayar Labs 也得到了英特爾的早期支持,盡管英特爾希望將激光器嵌入芯片內(nèi)部,而不是像 Ayar Labs 那樣從芯片外部泵入激光信號(hào)。(如果現(xiàn)在有什么是真的,那就是英特爾現(xiàn)在不能做錯(cuò)任何事。所以英特爾用硅光子對(duì)沖它的賭注是件好事。)

在 4 月份的融資時(shí),我們與 Wuischpard 詳細(xì)討論了硅光子學(xué)適合現(xiàn)代系統(tǒng)的地方——以及它尚不適合的地方,最近,我們得到了一些關(guān)于 Nvidia 可能專門開發(fā)的東西的提示。

我們隨后了解到 Dally 在 OFC 2022 上所做的上述演示,該演示非常具體地概述了使用密集波分復(fù)用 (DWDM:dense wave division multiplexing) 的共同封裝光學(xué)器件的目標(biāo),以及如何將硅光子學(xué)用作交叉連接機(jī)架的傳輸和機(jī)架的 GPU 計(jì)算引擎。

該演示文稿展示了一個(gè)未命名的概念機(jī)器,例如Dally 的團(tuán)隊(duì)早在 2010 年開發(fā)的“Echelon”概念百億億次系統(tǒng),我們?cè)?2012 年就聽說(shuō)了。該機(jī)器有特殊的數(shù)學(xué)引擎——不是 GPU——它們之間具有高基數(shù)電氣切換和 Cray “Aries” 機(jī)器機(jī)架之間的光學(xué)互連。而且那臺(tái) Echelon 機(jī)器顯然從未商業(yè)化,而 Nvidia 取而代之的是 Dally 在 Nvidia Research 研究的 NVSwitch 內(nèi)存互連,并提早將其投入生產(chǎn),以制造本質(zhì)上由fat多端口 InfiniBand 互連的大型iron NUMA GPU 處理器復(fù)合體代替pipes。

在最初的基于 NVSwitch 的 DGX 系統(tǒng)中,Nvidia 只能使用“Volta”V100 GPU 加速器在單個(gè)圖像中擴(kuò)展到 16 個(gè) GPU,而使用“Ampere”A100 GPU 加速器時(shí),Nvidia 不得不將每個(gè) GPU 的帶寬加倍,因此必須將 NVSwitch 的基數(shù)減少兩倍,因此只能將八個(gè) GPU 組合成一個(gè)圖像。借助今年早些時(shí)候宣布的 NVSwitches 的leaf/spine 網(wǎng)絡(luò)以及將于今年晚些時(shí)候發(fā)貨的“Hopper”H100 GPU 加速器,Nvidia 可以將 256 個(gè) GPU 組合成一個(gè)內(nèi)存結(jié)構(gòu),這是一個(gè)巨大的改進(jìn)因素。

但歸根結(jié)底,作為 DGX H100 SuperPOD 核心的 NVSwitch 結(jié)構(gòu)本質(zhì)上仍然是一種創(chuàng)建放大 NUMA 機(jī)器的方法,而且它絕對(duì)受到電纜布線的限制。而且 NVSwitch 的規(guī)模,即使是 Hopper 一代,也比不上超大規(guī)模生產(chǎn)商為運(yùn)行最大的 AI 工作負(fù)載而捆綁在一起的數(shù)萬(wàn)個(gè) GPU。

“我不能談太多細(xì)節(jié),”Wuischpard 笑著告訴The Next Platform。“你知道,我們是一個(gè)物理層解決方案,在軟件和 GPU、內(nèi)存和 CPU 之間的編排方面,還有很多東西要超越它。我們不參與任何這些事情。因此,我想你可以將我們視為未來(lái)的物理支持。這是一種多階段的方法。這不僅僅是一個(gè)踢輪胎的練習(xí)。但我們必須在一些參數(shù)范圍內(nèi)證明自己,我們必須達(dá)到一些里程碑。”

我們希望這能澄清這一點(diǎn)。

無(wú)論如何,現(xiàn)在讓我們轉(zhuǎn)向 Dally 在 OFC 2022 上的演講,該演講跳到了未來(lái)的 GPU 加速系統(tǒng)與硅光子互連的樣子。在我們開始討論之前,讓我們看看 GPU 或交換機(jī)之間的帶寬和功率限制、它們連接的印刷電路板以及它們可能被匯集到的機(jī)柜,這為硅光子互連奠定了基礎(chǔ):

8332e6ac-1eea-11ed-ba43-dac502259ad0.jpg

規(guī)則很簡(jiǎn)單,鏈路越短,帶寬就越高,移位所消耗的功耗就越低。下表列出了中介層、印刷電路板、共封裝光學(xué)器件、電纜和有源光纜的相對(duì)功率、成本、密度和每一個(gè),所有這些都是構(gòu)成現(xiàn)代系統(tǒng)不同層次的電線。

83418fea-1eea-11ed-ba43-dac502259ad0.jpg

使用 DWDM 的共同封裝光學(xué)器件的目標(biāo)是具有比電纜更低的功耗,但成本相似,具有與有源電纜相當(dāng)?shù)姆秶⑻峁┡c印刷電路板相當(dāng)?shù)男盘?hào)密度。

以下是 Dally 對(duì) DWDM 信號(hào)的示意圖:

834ea57c-1eea-11ed-ba43-dac502259ad0.jpg

下面是 GPU 和 NVSwitch 如何使用光學(xué)引擎將電信號(hào)轉(zhuǎn)換為光學(xué)信號(hào)以創(chuàng)建 GPU 的 NVSwitch 網(wǎng)絡(luò)的框圖:

835df874-1eea-11ed-ba43-dac502259ad0.jpg

每個(gè)光學(xué)引擎有 24 根光纖,它們最初將以 200 Gb/秒的信號(hào)速率運(yùn)行,總帶寬為 4.8 Tb/秒。每個(gè) GPU 都有一對(duì)這樣的設(shè)備,可以為其提供進(jìn)出 NVSwitch 結(jié)構(gòu)的雙向帶寬。因此,具有六個(gè)光學(xué)引擎的 NVSwitch 的原始速率為 28.8 Tb/秒,去除編碼開銷后為 25.6 Tb/秒。

以下是 Nvidia 硅光子概念機(jī)中設(shè)備組件之間各種障礙的能耗如何計(jì)算:

8367c5ca-1eea-11ed-ba43-dac502259ad0.jpg

在 GPU 和交換機(jī)之間移入和移出數(shù)據(jù)的每比特 3.5 皮焦耳與 Dally 在上表中設(shè)定的目標(biāo)完全一致。我們懷疑成本仍然必須降低才能使計(jì)算引擎可以接受共同封裝的光學(xué)器件,但是這里正在進(jìn)行大量工作,每個(gè)人都非常積極。

當(dāng)前 DGX-A100 系統(tǒng)上的嵌入式 NVSwitch 結(jié)構(gòu)上使用的電信號(hào)傳輸范圍約為 300 厘米,并以每比特 8 皮焦耳的速度傳輸數(shù)據(jù)。目標(biāo)是硅光子學(xué)以一半的能量做到這一點(diǎn),并將設(shè)備之間的距離提高到 100 米。

發(fā)生這種情況時(shí),您可以分解架構(gòu)中的 GPU 和交換機(jī)——雖然 Nvidia 的概念機(jī)沒(méi)有顯示這一點(diǎn),但 CPU 也可以具有光學(xué)引擎,并且它們也可以分解。

以下是帶有共同封裝光學(xué)器件的 GPU 和交換機(jī)的外觀:

8378005c-1eea-11ed-ba43-dac502259ad0.jpg

以下是具有 CPO 鏈接的 GPU 和 NVSwitch 的聚合方式:

83844628-1eea-11ed-ba43-dac502259ad0.png

外部激光源占用了大量空間,但這也意味著機(jī)架的密度可以大大降低,因?yàn)樵O(shè)備之間的連接可以更長(zhǎng)。這將使冷卻更容易,并且激光器也可以更換。如果所有這些東西都運(yùn)行得更冷,激光也會(huì)更好地工作。密度被高估了,并且在許多情況下,例如 DGX 系統(tǒng),機(jī)器最終會(huì)變得非常熱,以至于您無(wú)論如何只能安裝一半的機(jī)架,因?yàn)楣β拭芏群屠鋮s需求超出了大多數(shù)數(shù)據(jù)中心的處理能力。

您會(huì)注意到,上面的 GPU 和開關(guān)行是垂直放置的,這有助于冷卻。而且它們也沒(méi)有安裝在帶有 sockets的巨型印刷電路板上,這將有助于降低整體系統(tǒng)成本,以幫助支付使用光學(xué)互連的費(fèi)用。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4788

    瀏覽量

    129422
  • 光學(xué)
    +關(guān)注

    關(guān)注

    4

    文章

    761

    瀏覽量

    36462
  • 硅光芯片
    +關(guān)注

    關(guān)注

    5

    文章

    48

    瀏覽量

    6125

原文標(biāo)題:硅光芯片如何連接到GPU?英偉達(dá)是這樣看的!

文章出處:【微信號(hào):wc_ysj,微信公眾號(hào):旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    芯片的優(yōu)勢(shì)/市場(chǎng)定位及行業(yè)痛點(diǎn)

    近幾年,芯片被廣為提及,從概念到產(chǎn)品,它的發(fā)展速度讓人驚嘆。芯片作為
    發(fā)表于 11-04 07:49

    高速數(shù)據(jù)傳輸中的高度集成引擎

    和驅(qū)動(dòng)器放置在重新設(shè)計(jì)的光子芯片上,并使用標(biāo)準(zhǔn)SMT工藝在260°C的回流爐中進(jìn)行連接。圖3:電子器件被“撞上”,而光子被“鍍上”然后將CWDM波長(zhǎng)的DFB激光器以較高的溫度
    發(fā)表于 12-05 10:33

    上海布局互連芯片研發(fā)和生產(chǎn)

    去年,上海市政府將光子列入首批市級(jí)重大專項(xiàng),投入大量經(jīng)費(fèi),布局互連芯片研發(fā)和生產(chǎn)。而今,很多業(yè)內(nèi)人士感嘆,上海真是未雨綢繆,因?yàn)?b class='flag-5'>硅基
    的頭像 發(fā)表于 07-13 17:07 ?6436次閱讀

    芯片是將什么材料和器件通過(guò)特殊工藝制造的集成電路?

    芯片是將材料和器件通過(guò)特殊工藝制造的集成電路,主要由光源、調(diào)制器、探測(cè)器、無(wú)源波導(dǎo)器件等組成,將多種
    的頭像 發(fā)表于 06-11 09:02 ?1.8w次閱讀

    芯片是什么東西_芯片和傳統(tǒng)芯片區(qū)別

    芯片一般指光子芯片。研究人員將磷化銦的發(fā)光屬性和路由能力整合到單一混合芯片中。當(dāng)給磷化銦
    的頭像 發(fā)表于 08-20 15:26 ?8w次閱讀

    芯片的無(wú)源封裝技術(shù)

    電學(xué):芯片和兩個(gè)淺藍(lán)色的模擬電芯片的電信號(hào)連接內(nèi)容,需要3D堆疊封裝,與高頻信號(hào)損耗有關(guān)。
    的頭像 發(fā)表于 09-01 10:44 ?5765次閱讀
    <b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>的無(wú)源封裝技術(shù)

    Snap:bit:將Whistle芯片連接到Micro:bit

    電子發(fā)燒友網(wǎng)站提供《Snap:bit:將Whistle芯片連接到Micro:bit.zip》資料免費(fèi)下載
    發(fā)表于 06-19 10:16 ?0次下載
    Snap:bit:將Whistle<b class='flag-5'>芯片</b><b class='flag-5'>連接到</b>Micro:bit

    亞毫米級(jí)別分辨率的芯片“可視化”測(cè)試設(shè)備

    芯片是通過(guò)標(biāo)準(zhǔn)半導(dǎo)體工藝將材料和器件集成在一起的集成路,主要由光源、調(diào)制器、探測(cè)器、無(wú)
    的頭像 發(fā)表于 07-26 09:36 ?1282次閱讀
    亞毫米級(jí)別分辨率的<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>“可視化”測(cè)試設(shè)備

    國(guó)產(chǎn)廠商搶占芯片的風(fēng)口

    光子芯片根據(jù)基材的不同,大致可分為兩類:一種是在以InP為代表的“有源材料”上集成制作元件的芯片;另一種則是在以為代表的“無(wú)源材料”上制作的,即
    的頭像 發(fā)表于 07-20 18:27 ?1899次閱讀
    國(guó)產(chǎn)廠商搶占<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>的風(fēng)口

    昊衡科技-OLI測(cè)試芯片耦合質(zhì)量

    光纖微裂紋診斷儀(OLI)對(duì)芯片耦合質(zhì)量檢測(cè)非常有優(yōu)勢(shì),以亞毫米級(jí)別的空間分辨率精準(zhǔn)探測(cè)到鏈路中每個(gè)事件節(jié)點(diǎn),具有靈敏度高、定位精準(zhǔn)、穩(wěn)定性高、簡(jiǎn)單易用等特點(diǎn),是
    的頭像 發(fā)表于 08-04 16:30 ?1152次閱讀
    昊衡科技-OLI測(cè)試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質(zhì)量

    OLI測(cè)試芯片內(nèi)部裂紋

    光是以光子和電子為信息載體的基電子大規(guī)模集成技術(shù),能夠突破傳統(tǒng)電子芯片的極限性能,是5G通信、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等新型產(chǎn)業(yè)的基礎(chǔ)支撐。準(zhǔn)確測(cè)量
    的頭像 發(fā)表于 07-31 23:04 ?837次閱讀
    OLI測(cè)試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>內(nèi)部裂紋

    OLI測(cè)試芯片耦合質(zhì)量

    光是以光子和電子為信息載體的基電子大規(guī)模集成技術(shù)。光纖到基耦合是芯片設(shè)計(jì)十分重要的一環(huán),耦合質(zhì)量決定著集成
    的頭像 發(fā)表于 08-05 08:21 ?1130次閱讀
    OLI測(cè)試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質(zhì)量

    使用OLI進(jìn)行芯片耦合質(zhì)量檢測(cè)

    集成芯片上光信號(hào)和外部信號(hào)互聯(lián)質(zhì)量。耦合過(guò)程中最困難的地方在于兩者模式尺寸不匹配,
    的頭像 發(fā)表于 08-15 10:10 ?1060次閱讀
    使用OLI進(jìn)行<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質(zhì)量檢測(cè)

    集成芯片的用途有哪些

    集成芯片是一種基于基的光電子大規(guī)模集成技術(shù),以光子和電子為信息載體,具有許多獨(dú)特的優(yōu)勢(shì)和應(yīng)用領(lǐng)域。
    的頭像 發(fā)表于 03-18 15:21 ?1772次閱讀

    芯片與傳統(tǒng)芯片的區(qū)別

    材料差異: 芯片主要使用作為材料,而傳統(tǒng)芯片則使用晶體。
    的頭像 發(fā)表于 07-12 09:33 ?7940次閱讀
    主站蜘蛛池模板: 色视频在线看 | 国产资源网 | 一级欧美日韩 | 婷婷丁香色| 一本大道高清在线视频 视频 | 第四色成人网 | 四虎精品免费国产成人 | 国产 麻豆 | 啪啪免费小视频 | 免费看黄色片的软件 | 高颜值露脸极品在线播放 | 一区中文字幕 | 国产免费久久精品99 | 国产成人小视频 | 日日干夜夜操视频 | 欧美午夜视频一区二区 | 午夜手机福利 | 国产福利观看 | 婷婷色在线 | 偷窥自拍亚洲色图 | 亚洲激情四射 | 国产无遮挡床戏视频免费 | 精品黄色片 | 国产欧美精品一区二区色综合 | 激情免费视频 | 性 色 黄 一级 | 色视频在线观看在线播放 | 亚洲男人天堂手机版 | 高h污快穿文汁水四溅 | 五月天丁香色 | 三级黄a| 免费观看a毛片一区二区不卡 | 四虎影院精品在线观看 | 日韩一区二区三区在线 | 午夜丁香婷婷 | 一区二区三区四区在线视频 | 毛片视频免费网站 | 日韩毛片在线视频 | 97色在线视频 | 种子 在线播放 | 男女刺激性视频大片 |