深入解讀AMD最新GPU架構

AMD 長期以來一直在爭奪 GPU 計算市場份額。自從 Nvidia 憑借其 Tesla 架構搶占先機以來，AMD 就一直在追趕。Terascale 3 從 VLIW5 遷移到 VLIW4，以提高計算工作負載中執行單元的利用率。GCN 取代了 Terascale，并強調 GPGPU 和圖形應用程序的一致性能。然后，AMD 將其 GPU 架構開發分為單獨的 CDNA 和 RDNA 線路，分別專門用于計算和圖形。

CDNA 2 最終為 AMD 帶來了顯著的成功。MI250X 和 MI210 GPU 贏得了多個超級計算機合同，其中包括 ORNL 的 Frontier，該計算機在 2023 年 11 月的 TOP500 排行榜上排名第一。但是，雖然 CDNA2 提供了穩定且經濟高效的 FP64 計算，但 H100 擁有更好的 AI 性能并提供了更大的統一 GPU。

CDNA 3 希望通過提供 AMD 提供的所有功能來縮小這些差距。MI300X 配備了先進的小芯片設置，充分展示了該公司在先進封裝技術方面的經驗。與 Infinity Fabric 組件一起，先進的封裝使 MI300X 能夠進行擴展，以與 Nvidia 最大的 GPU 競爭。在內存方面，RDNA 系列的 Infinity Cache 被引入 CDNA 領域，以緩解帶寬問題。但這并不意味著 MI300X 的內存帶寬很輕。它仍然擁有龐大的 HBM 設置，使其兩全其美。最后，CDNA 3 的計算架構獲得了顯著的世代改進，以提高吞吐量和利用率。

01.?GPU布局

AMD 一直有使用小芯片來廉價擴展 Ryzen 和 Epyc CPU 核心數量的傳統。MI300X 在高級別上使用類似的策略，將計算拆分到加速器復合芯片 (XCD) 上。XCD 類似于 CDNA 2 或 RDNA 3 的圖形計算芯片 (GCD) 或 Ryzen 的核心復合芯片 (CCD)。AMD 可能會更改命名，因為 CDNA 產品缺乏 RDNA 系列中的專用圖形硬件。

每個 XCD 包含一組核心和一個共享緩存。具體來說，每個 XCD 物理上都有 40 個 CDNA 3 計算單元，其中 38 個在 MI300X 上的每個 XCD 上啟用。XCD 上也有一個 4 MB 二級緩存，為芯片的所有 CU 提供服務。MI300X 有 8 個 XCD，總共有 304 個計算單元。

這比 MI250X 的 220 個 CU 有了很大的增加。更好的是，MI300X 可以將所有這些 CU 作為單個 GPU 公開。在 MI250X 上，程序員必須手動在兩個 GPU 之間分配工作，因為每個 GPU 都有單獨的內存池。

Nvidia 的 H100 由 132 個流式多處理器 (SM) 組成，并將它們作為一個大型統一 GPU 呈現給程序員。H100 采用傳統方法，在大型單片芯片上實現所有計算。即使所有東西都在同一個芯片上，H100 也太大了，無法讓所有 SM 平等地訪問緩存。因此，H100 將 L2 拆分為兩個實例。單個 SM 可以使用全部 50 MB 的 L2，但訪問超過 25 MB 會導致性能損失。

盡管如此，Nvidia 的策略比 MI300X 的策略更有效地利用了緩存容量。MI300X XCD 不會使用其他 XCD 上的 L2 容量進行緩存，就像 Epyc/Ryzen 上的 CCD 不會分配到彼此的 L3 緩存中一樣。

英特爾的 Ponte Vecchio (PVC) 計算 GPU 進行了非常有趣的比較。PVC 將其基本計算構建塊放置在稱為“Compute Tiles”的芯片中，這大致類似于 CDNA 3 的 XCD。同樣，PVC 的 Base Tile 具有與 CDNA 3 的 IO 芯片類似的功能。兩者都包含大型末級緩存和 HBM 內存控制器。與 MI300X 一樣，Ponte Vecchio 卡可以作為具有統一內存池的單個 GPU 公開。

然而，也存在重要的差異。與 CDNA 3 XCD 上的 38 個計算單元相比，Ponte Vecchio 的計算塊更小，只有 8 個 Xe 核心。英特爾沒有使用計算塊寬緩存，而是使用更大的 L1 緩存來減少跨芯片流量需求。使用兩層 Ponte Vecchio 部件作為統一 GPU 也帶來了挑戰。兩個堆棧之間的 EMIB 橋僅提供 230 GB/s 的帶寬，如果訪問跨所有內存控制器進行條帶化，則不足以充分利用 HBM 帶寬。為了解決這個問題，英特爾提供了 API，可以讓程序在 NUMA 配置中與 GPU 配合使用。

在物理構造方面，PVC和CDNA 3的設計面臨著不同的挑戰。CDNA 3 提供具有 HBM 的統一內存池的能力需要 IO 芯片之間的高帶寬。PVC 使用帶寬相對較低的 EMIB 鏈路。但 PVC 的設計變得復雜，因為它使用四種具有不同工藝節點和鑄造廠的模具類型。AMD 在 MI300X 中僅使用兩種芯片類型，并且兩個節點（6 納米和 5 納米）均來自臺積電。

02.?解決帶寬問題

幾十年來，計算速度一直超過內存。與 CPU 一樣，GPU 也通過日益復雜的緩存策略來應對這一問題。CDNA 2 使用具有 8 MB L2 的傳統兩級緩存層次結構，依靠 HBM2e 來保持執行單元的運行。但即使使用 HBM2e，MI250X 的帶寬需求也比 Nvidia 的 H100 更嚴重。如果 AMD 只是增加更多的計算能力，帶寬匱乏可能會成為一個嚴重的問題。因此，AMD 借鑒了 RDNA(2) 的經驗，添加了“無限緩存”。

與消費級 RDNA GPU 非常相似，MI300 的無限緩存就是技術文檔中所稱的“附加最后一級內存”(MALL)，這是一種奇特的說法，表示最后一級緩存級別是內存端緩存。與更靠近計算單元的 L1 和 L2 緩存相比，Infinity Cache 連接到內存控制器。所有內存流量都會通過無限緩存，無論它來自哪個塊。其中包括 IO 流量，因此對等 GPU 之間的通信可以受益于無限緩存帶寬。由于無限高速緩存始終具有 DRAM 內容的最新視圖，因此它不必處理窺探或其他高速緩存維護操作。

但由于內存端緩存距離計算較遠，因此通常會出現較高的延遲。因此，AMD 在 CDNA 3 和 RDNA 2 上都配備了數兆字節的 L2 緩存，以將計算與內存端緩存的較低性能隔離開來。

與 RDNA 2 一樣，CDNA 3 的無限緩存是 16 路組相聯的。然而，CDNA 3 的實現針對帶寬比針對容量進行了更優化。它由 128 個片組成，每個片容量為 2 MB，每個周期讀取帶寬為 64 字節。所有切片每個周期總共可以傳輸 8192 字節，這對于 2.1 GHz 下的 17.2 TB/s 來說是不錯的。

相比之下，RDNA 2 的 128 MB 無限緩存可以在所有片上每個周期提供 1024 字節，從而在 2.5 GHz 下提供 2.5 TB/s 的理論帶寬。芯片截圖顯示每個 Infinity Cache 片有 4 MB 的容量，并提供 32B/周期。因此，RDNA 2 使用更大的slice、更少的slice，并且每個slice的帶寬也更少。

MI300X 對帶寬的關注意味著計算密度較低的工作負載如果能夠獲得足夠的無限緩存命中，仍然可以享受不錯的性能。這應該會讓 CDNA 3 的執行單元更容易運行，盡管主內存帶寬與計算的比率沒有太大變化并且仍然落后于 Nvidia。

如果我們使用 Infinity Cache 的理論帶寬構建 MI300X 的屋頂線模型，我們可以實現完整的 FP64 吞吐量，每字節加載 4.75 FLOP。與 DRAM 相比，這是一個巨大的改進，DRAM 每加載一個字節需要 14.6FLOP 到 15 次 FLOP。

03.?跨芯片帶寬可能面對的挑戰

MI300X 的 Infinity Fabric 跨越四個 IO 芯片，每個芯片連接到兩個 HBM 堆棧和關聯的緩存分區。然而，當 MI300X 作為具有統一內存池的單個邏輯 GPU 運行時，芯片到芯片連接的帶寬可能會限制實現完整的無限緩存帶寬。如果內存訪問在內存控制器（以及緩存分區）上均勻分布，就像大多數 GPU 設計的典型情況一樣，可用的芯片到芯片帶寬可能會阻止應用程序達到理論上的無限緩存帶寬。

首先，讓我們關注單個 IO die 分區。它沿著與其他 IO 芯片相鄰的兩個邊緣具有 2.7 TB/s 的入口帶寬。它的兩個 XCD 可以獲得 4.2 TB/s 的 Infinity 緩存帶寬。如果 L2 未命中請求在芯片上均勻分布，則該帶寬的 3/4 或 3.15 TB/s 必須來自對等芯片。由于 3.15 TB/s 大于 2.7 TB/s，跨芯片帶寬將限制可實現的緩存帶寬。

我們可以在對角添加芯片而不會產生任何差異，因為其所需的所有芯片間帶寬都在相反的方向上。MI300X 具有雙向芯片到芯片鏈接。

如果所有芯片都需要統一配置中的最大無限緩存帶寬，事情就會變得更加復雜。消耗額外的跨芯片帶寬，因為對角芯片之間的傳輸需要兩跳，這會減少每個芯片可用的入口帶寬。

雖然 MI300X 的設計就像一個大型 GPU，但將 MI300X 拆分為多個 NUMA 域可以提供更高的組合無限緩存帶寬。AMD 可能會有一個 API，可以在不同的 IO 芯片之間透明地分割程序。此外，高 L2 命中率(hit rates)將最大限度地減少帶寬問題的可能性，這將有助于避免這些瓶頸。在 Infinity Cache 命中率較低的情況下，MI300X 的芯片間鏈接足夠穩健，并提供充足的帶寬來順利處理 HBM 流量。

04.?跨XCD一致性

盡管無限緩存不必擔心一致性，但二級緩存卻需要擔心。普通 GPU 內存訪問遵循寬松的一致性模型，但程序員可以使用atomics來強制線程之間的排序。AMD GPU 上的內存訪問也可以用 GLC 位（全局級一致:Global Level Coherent）進行標記。如果 AMD 希望將 MI300X 作為單個大 GPU 而不是像 MI250X 那樣的多 GPU 配置，那么這些機制仍然必須發揮作用。

在之前的 AMD GPU 上，atomics和coherent 訪問是在 L2 處理的。設置 GLC 位的加載將繞過 L1 緩存，從而從 L2 獲取最新的數據副本。這不適用于 MI300X，因為緩存行的最新副本可能位于另一個 XCD 的 L2 緩存上。AMD 可以使相干訪問繞過 L2，但這會降低性能。這可能適用于游戲 GPU，因為游戲 GPU 的一致性訪問并不是太重要。但 AMD 希望 MI300X 在計算工作負載方面表現良好，并需要 MI300A（APU 變體）在 CPU 和 GPU 之間高效共享數據。這就是 Infinity Fabric 的用武之地。

與 Ryzen 上的 Infinity Fabric 一樣，CDNA 3 具有 XCD 連接到 IO 芯片的 Coherent Master（CM）。相干從屬設備 (CS：Coherent Slaves) 與無限高速緩存 (IC：Infinity Cache) 片一起位于每個內存控制器中。我們可以通過 Ryzen 文檔推斷它們是如何工作的，該文檔顯示 Coherent Slaves 有一個探針過濾器和用于處理原子事務的硬件。MI300X 可能有類似的 CS 實現。

如果 CS 上出現一致寫入，則必須確保任何執行一致讀取的線程都會觀察到該寫入，無論該線程在 GPU 上的何處運行。這意味著任何緩存了該行的 XCD 都必須從 Infinity Cache 重新加載它才能獲取最新數據。這一般會讓我們認為，CS 必須跨所有 XCD 探測 L2 緩存，因為其中任何一個都可以緩存相應的數據。探測過濾器通過跟蹤哪些 XCD 實際緩存了該行來幫助避免這種情況，從而避免不必要的探測流量。CDNA 3 的白皮書稱窺探過濾器（探針過濾器的另一個名稱）足夠大，可以覆蓋多個 XCD L2 緩存。我當然相信他們，因為 MI300X 在所有 8 個 XCD 上都有 32 MB 的 L2。即使是消費級 Ryzen 部件也可以擁有更多 CCD 專用緩存，供探針過濾器覆蓋。

得益于 CS 和 CM 等類似 CPU 的 Infinity Fabric 組件，XCD 可以擁有私有回寫式 L2 緩存，能夠處理芯片內一致訪問，而無需跨越 IO 芯片結構。AMD 本來可以采用一種簡單的解決方案，即連貫操作和atomics繞過 L2 直接進入無限緩存。這樣的解決方案將節省工程工作并創建更簡單的設計，但代價是降低一致性操作的性能。顯然，AMD 認為優化原子和相干訪問非常重要，因此需要付出更多努力。

然而，XCD 中的 CDNA 3 的工作方式仍然與之前的 GPU 非常相似。顯然，正常的內存寫入不會像 CPU 那樣自動使來自對等緩存的寫入行無效。相反，代碼必須顯式告訴 L2 write back dirty lines，并使對等 L2 緩存使非本地 L2 行無效。

05.?二級緩存

靠近計算單元，每個 MI300X XCD 都包含一個 4 MB 二級緩存。L2 是更傳統的 GPU 緩存，由 16 個slice構建。每個 256 KB slice可以提供每個周期 128 字節的帶寬。在 2.1 GHz 下，這對于 4.3 TB/s 來說是不錯的。作為與計算單元位于同一芯片上的最后一級緩存，L2 在充當 L1 未命中（misses）的后備裝置方面發揮著重要作用。

與H100和MI250X相比，MI300X具有更高的L2帶寬計算比。由于每個 XCD 都配有 L2，因此隨著 CDNA 3 產品配備更多 XCD，L2 帶寬自然會擴展。換句話說，MI300X 的 L2 布局避免了將單個緩存連接到大量計算單元并維持大量帶寬的問題。

PVC的L2則形成鮮明對比。隨著英特爾添加更多計算塊，基礎塊的共享 L2 的帶寬需求也不斷增加。從緩存設計的角度來看，PVC 的配置更簡單，因為 L2 充當單點一致性和 L1 未命中的后備。但它無法提供與 MI300X 的 L2 一樣多的帶寬。MI300X 還可能享有更好的 L2 延遲，使應用程序更容易利用緩存帶寬。

06.?一級緩存

CDNA 3 對高緩存帶寬的關注延續到了 L1。在與 RDNA 相匹配的舉措中，CDNA 3 的 L1 吞吐量從每周期 64 字節增加到 128 字節。與 GCN 中的 2048 位相比，CDNA 2 將每 CU 向量吞吐量提高到每周期 4096 位，因此 CDNA 3 翻倍的 L1 吞吐量有助于保持與 GCN 相同的計算與 L1 帶寬比率。

除了更高的帶寬外，CDNA 3 還將 L1 容量從 16 KB 增加到 32 KB。這一舉措再次反映了 RDNA 系列的發展，其中 RDNA 3 的一級緩存也獲得了類似的大小提升。較大緩存的較高命中率將降低平均內存訪問延遲，從而提高執行單元利用率。從 L2 及更高層傳輸數據會消耗電力，因此更高的命中率也有助于提高電力效率。

雖然 CDNA 3 改進了一級緩存，但 Ponte Vecchio 仍然是該類別的冠軍。PVC 中的每個 Xe 核心每個周期可傳輸 512 字節，為英特爾提供非常高的 L1 帶寬計算比。L1 也很大，為 512 KB。適合 L1 的內存綁定內核將在英特爾架構上表現良好。然而，Ponte Vecchio 缺乏計算塊級別的中級緩存，并且當數據溢出 L1 時可能會面臨嚴酷的性能懸崖。

07.?調度和執行單元

復雜的小芯片設置和修改后的緩存層次結構讓 AMD 將 MI300X 作為單個 GPU 呈現，從而解決了 MI250X 的最大弱點之一。但 AMD 并沒有就此解決。他們還對核心計算單元架構進行了迭代改進，解決了 CDNA 2 使用 FP32 單元的困難。

當 CDNA 2 轉向原生處理 FP64 時，AMD 通過打包執行提供了雙倍速率 FP32。編譯器必須將兩個 FP32 值打包到相鄰的寄存器中，并對這兩個值執行相同的指令。通常，除非程序員明確使用向量，否則編譯器很難實現這一點。

CDNA 3 通過更靈活的雙發行機制解決了這個問題。最有可能的是，這是 GCN 多問題功能的擴展，而不是 RDNA 3 的 VOPD/wave64 方法。每個周期，CU 調度程序都會選擇四個 SIMD 之一，并檢查其線程是否已準備好執行。如果多個線程準備就緒，GCN 可以選擇最多五個線程發送到執行單元。當然，GCN SIMD 只有一個 16 寬向量 ALU，因此 GCN 必須選擇具有不同指令類型的線程，準備好進行多發出。例如，標量 ALU 指令可以與矢量 ALU 指令一起發出。

另一種方法是利用 wave64 更寬的寬度，讓線程在四個周期內完成兩條向量指令。然而，這樣做會破壞 GCN 在 4 個時鐘周期的倍數內處理 VALU 指令的模型。CDNA 3 與 GCN 的關系仍然比 RDNA 更為密切，重用 GCN 的多發行策略是明智之舉。AMD 還可以使用 RDNA 3 的 VOPD 機制，其中特殊的指令格式可以包含兩個操作。雖然該方法可以提高每個線程的性能，但依靠編譯器來查找雙問題對可能會成功或失敗。

CDNA 3 的雙問題方法可能會將責任推給程序員，以通過更大的調度大小來公開更多線程級并行性，而不是依賴編譯器。如果 SIMD 有更多正在運行的線程，它將有更好的機會找到兩個帶有 FP32 指令準備執行的線程。至少，SIMD 需要兩個活動線程才能實現完整的 FP32 吞吐量。實際上，CDNA 3 需要更高的占用率才能實現良好的 FP32 利用率。GPU 使用按順序執行，因此各個線程通常會因內存或執行延遲而被阻塞。即使在滿員的情況下，保持一組執行單元的供電也可能很困難。

因此，AMD 將每個 CDNA 3 SIMD 可以跟蹤的線程數量從 8 個大幅增加到24 個。如果程序員可以利用這一點，CDNA 3 將更好地定位于多問題。但這可能很困難。AMD 沒有提到矢量寄存器文件容量的增加，這通常會限制 SIMD 可以運行的線程數量。如果每個線程使用較少的寄存器，向量寄存器文件可以保存更多線程的狀態，因此 CDNA 3 的多發出功能可能最適合具有很少活動變量的簡單內核。

寄存器文件帶寬對雙重發行提出了另一個挑戰。CDNA 2 的打包 FP32 執行不需要從向量寄存器文件中進行額外的讀取，因為它利用了傳遞 64 位值所需的更寬的寄存器文件端口。但單獨的指令可以引用不同的寄存器，并且需要從寄存器文件中進行更多讀取。添加更多寄存器文件端口的成本高昂，因此 CDNA 3“逐代改進了源緩存，以提供更好的重用和帶寬放大，以便每個向量寄存器讀取可以支持更多下游向量或矩陣操作” 。最有可能的是，AMD 正在使用更大的寄存器緩存來緩解端口沖突并保持執行單元的運行。

08.?矩陣運算

隨著機器學習的興起，矩陣乘法變得越來越重要。Nvidia 在這一領域投入了大量資金，多年前就在其 Volta 和 Turing 架構中添加了矩陣乘法單元（張量核心）。AMD 的 CDNA 架構增加了矩陣乘法支持，但當代 Nvidia 架構在矩陣乘法吞吐量方面投入了更多資金。這尤其適用于 AI 中常用的低精度數據類型，例如 FP16。

與前幾代 CDNA 相比，MI300X 通過將每 CU 矩陣吞吐量提高了一倍來迎頭趕上。最重要的是，MI300X 的小芯片設計允許大量的 CU。但 Nvidia 更高的每 SM 矩陣性能仍然使其成為一支不可忽視的力量。因此，CDNA 3延續了AMD從矢量FP64性能方面重擊Nvidia的趨勢，同時保持了孤立的強大AI性能。

09.?指令緩存

除了處理指令請求的內存訪問之外，計算單元還必須從內存中獲取指令本身。傳統上，GPU 的指令傳遞比較容易，因為 GPU 代碼往往很簡單并且不會占用大量內存。在DirectX 9時代，Shader Model 3.0甚至對代碼大小進行了限制。隨著 GPU 不斷發展以承擔計算任務，AMD 推出了具有 32 KB 指令緩存的 GCN 架構。如今，CDNA 2 和 RDNA GPU 繼續使用 32 KB 指令緩存。

CDNA 3 將指令緩存容量增加至 64 KB。關聯性也加倍，從 4 路變為 8 路。這意味著具有更大、更復雜內核的 CDNA 3 的指令緩存命中率更高。我懷疑 AMD 的目標是將 CPU 代碼天真地移植到 GPU。復雜的 CPU 代碼可能會對GPU 造成影響，因為它們無法通過長距離指令預取和準確的分支預測來隱藏指令緩存未命中延遲。更高的指令緩存容量有助于容納更大的內核，而增加的關聯性有助于避免沖突未命中。

與 CDNA 2 一樣，每個 CDNA 3 指令緩存實例為兩個計算單元提供服務。GPU 內核通常以足夠大的工作大小啟動，以填充許多計算單元，因此共享指令緩存是有效使用 SRAM 存儲的好方法。我懷疑 AMD 沒有在更多計算單元之間共享緩存，因為單個緩存實例可能難以滿足指令帶寬需求。

10.?寫在最后的話

CDNA 3 的白皮書稱“AMD CDNA 3 架構中最大的代際變化在于內存層次結構”，我不得不同意。與 CDNA 2 相比，雖然 AMD 改進了計算單元的低精度數學功能，但真正的改進是添加了無限緩存。

MI250X 的主要問題是它并不是真正的 GPU。它是兩個 GPU 共享同一個包，GCD 之間每個方向每秒只有 200 GB。根據 AMD 的評估，每個方向每秒 200 GB 不足以讓 MI250X 顯示為一個 GPU，這就是 AMD 顯著增加芯片到芯片帶寬的原因。

AMD 將東西向總帶寬提高到每個方向 2.4TB/秒，比 MI250X 增加了 12 倍。南北向總帶寬甚至更高，每個方向為 3.0TB/秒。隨著帶寬的大幅增加，AMD 能夠使 MI300 看起來像一個大型的統一加速器，而不是像 MI250X 那樣是 2 個獨立的加速器。

如果兩個 XCD 都需要所有可用內存帶寬，則一個芯片的 4.0 TB/s 總入口帶寬可能看起來不夠。然而，兩個 XCD 組合起來只能從 IO 芯片訪問高達 4.2TB/s 的帶寬，因此實際上 4.0TB/s 的入口帶寬不是問題。最大 4.0TB/s 的入口帶寬意味著單個 IO 芯片無法利用所有 5.3TB/s 的內存帶寬。

這與桌面 Ryzen 7000 部件類似，由于 Infinity Fabric 的限制，一個 CCD 無法充分利用 DDR5 帶寬。然而，這在 MI300X 上可能不是問題，因為所有芯片都在運行時，帶寬需求將最高。在這種情況下，每個芯片將消耗約 1.3 TB/s 的帶寬，通過跨芯片鏈路獲取其中的 3/4 不會有問題。

但MI300不只是GPGPU部分，它還有APU部分，在我看來這是這兩款MI300產品中更有趣的一個。AMD 首款 APU Llano 于 2011 年發布，它基于 AMD 的 K10.5 CPU 搭配 Terascale 3 GPU。快進到 2023 年，AMD 在其首款“big iron”APU MI300A 中將 6 個 CDNA3 XCD 與 24 個 Zen 4 核心配對，同時重復使用相同的基礎芯片。這允許 CPU 和 GPU 共享相同的內存地址空間，從而無需通過外部總線復制數據以保持 CPU 和 GPU 彼此一致。

審核編輯：黃飛

閱讀全文

處理器(221451) 處理器(221451)
amd(132527) amd(132527)
NVIDIA(101457) NVIDIA(101457)
gpu(126253) gpu(126253)
RDNA(1839) RDNA(1839)

AMD GPU翻車？三星Exynos 2200實測竟被驍龍8甩開30%！

同被定位為手機旗艦平臺，其最大的亮點可能就是與AMD合作，采用了RDNA2架構的GPU，型號為Samsung Xclipse 920。 ? 那么AMD的GPU在手機SoC上的首次亮相，會對

2022-02-18 09:32:59

3297

釜底抽薪，英特爾挖了AMD的GPU墻角

，也成為行業中的美談。 ? 而就在2月15日美國時間收盤后，AMD的市值歷史首次超過了英特爾。當然，英特爾也不甘示弱，近日據外媒報道，AMD GPU首席SoC架構師Rohit Verma于本周早些時候跳槽到英特爾。 ? 英特爾與 AMD的“恩怨情仇” ? 自從第一臺PC誕生之日

2022-02-22 09:05:11

4390

AMD揭露HSA運算架構技術hUMA，解決資料重覆拷貝問題

AMD發表新運算架構技術hUMA，可讓CPU與GPU共享同一存儲空間，解決過去的資料重覆拷貝問題.

2013-05-12 13:52:52

1343

APU與GPU共進 AMD搶攻嵌入式應用

AMD近年來對于APU（加速處理器）與嵌入式應用一直抱持相當高的期待，也因此當AMD向外界宣稱要更加投入嵌入式市場時，就是希望用APU打下一片江山。不過，由于AMD曾經并購繪圖晶片大廠ATI的關系，對于獨立提供GPU的作法，其實也是相當積極，這樣的作法同樣也延伸到了嵌入式應用領域。

2014-03-06 10:10:57

948

AMD明年初推出下一代GPU架構命名Vega10和Vega11

最近，AMD向投資者展示了一組幻燈片，AMD表示將會在2017年一季度推出Vega架構顯卡，和原計劃一樣。之前曾有傳言稱，AMD可能會在今年推出下一代GPU架構。明年，AMD將會發布兩款新的GPU：Vega 10和Vega 11。

2016-08-30 10:28:13

3015

AMD RDNA2 GPU架構擴展技術詳解

RDNA 2 建立在 RDNA 1 架構之上。AMD 進行了多項更改以提高效率并使硬件功能保持最新狀態，但基本的 WGP 架構仍然存在。

2023-02-23 09:29:09

2024

解讀AMD的“分布式幾何”新專利（GPU的完全小芯片方法）

AMD 的專利詳細介紹了一種方法，即放棄中央處理器，用多個小芯片取代單個硅塊，每個小芯片處理自己的任務。渲染指令以稱為命令列表的長序列發送到 GPU，其中所有內容都稱為繪制調用。

2023-12-06 10:44:54

181

深入分析AMD MI300A的規格和設計方案

MI300A 與 H100 SXM，同樣是 APU（CPU + GPU）與僅 GPU 的比較，AMD 認為其芯片處于大致水平，但包含 CPU。

2023-12-21 14:41:27

585

AMD首個RDNA 2 架構 GPU市場成為AI必爭地

一、AMD RDNA 2 光線追蹤效果演示，下一代顯卡將支持 3月20日消息根據外媒WCCFTECH的報道，AMD發布了首個RDNA 2 架構 GPU 在微軟DXR API下的光線追蹤演示視頻

2020-03-21 09:16:19

4428

intel 22年后重返高性能GPU市場

，剛一上來免不了要拼性價比。Intel的GPU項目進行了多年了，2018年挖來了前AMD RTG部門主管、首席GPU架構師Raja Koduri，打造了Xe架構，這一個架構能夠滿足從低功耗核顯到數據中心GPU在內的多個市場需求。

2020-04-26 09:54:57

4558

AMD將推ARM架構服務器處理器

10月30日上午消息，AMD公司今日正式宣布，除了原來的X86架構處MAX3232EUE+T理器之外，公司還將開始設計面對多個市場的ARM架構處理器，首先供應的將是云服務器和數據中心服務器市場

2012-10-30 16:39:33

AMD熱招 PhysicAL

AMD超威半導體上海研發中心招聘 Physical Design Engineer，請有意向者將簡歷發送到 Cherry.Zhang@amd.com 以及

2017-05-03 10:20:08

AMD熱招 Physical Design Engineer

AMD超威半導體上海研發中心招聘 Physical Design Engineer，請有意向者將簡歷發送到 Cherry.Zhang@amd.com 以及

2017-02-28 17:27:29

AMD迎頭猛追Intel 全球首發7nm GPU很威風！

`處理器大廠美商超微（AMD）日前發布全球首款7奈米制程資料中心繪圖處理器（GPU），為新世代人工智能（AI）、云端運算與高效能運算挹注動能。AMD Radeon Instinct MI60

2018-11-20 11:35:12

GPU architecture

上學的時候課本里都是CPU，沒有GPU的。現在當做一個業余愛好。有興趣的可以看看。GPU架構

2015-02-13 10:16:47

GPU爆炸式發展背后的深層原因？

Bifrost架構如何提高效率和性能？Mali-G71如何通過創新技術來提升GPU性能？GPU爆炸式發展背后的深層原因？

2021-03-11 06:48:49

深入linux內核架構

2017-08-31 19:54:32

解讀CPU的組成指令集架構

文章目錄腦圖視頻解讀CPU的組成指令集架構：復雜指令集（CISC） VS 精簡指令集（RISC）X86架構ARM架構X86架構 VS ARM架構制程工藝64位計算異構計算功耗MIPS架構

2021-07-30 06:20:15

ACAP的主要架構創新解析

2019年“FPGA國際研討會”上，賽靈思發表了兩篇長論文，詳細介紹了賽靈思“自適應計算加速平臺”ACAP的系統架構和技術細節。本文將對ACAP的主要架構創新進行深入解讀，讓各位先睹為快。

2020-11-27 07:30:17

ARM架構的GPU和臺式機的GPU有什么區別

1：移動GPU（指的是ARM處理器集成的GPU）和獨立的PC的GPU的區別？除了架構，就拿視頻解碼來說，為什么ARM的處理器的GPU可以實現硬件解碼4K分辨率的視頻，或者試吃4K的顯示分辨率。而英偉

2020-07-18 08:04:38

HSA----CPU+GPU異構系統架構詳解

解析HSA----CPU+GPU異構系統架構

2021-02-03 07:07:34

NVIDIA火熱招聘GPU高性能計算架構師

：hrallenlinGPU高性能計算架構師 (功能驗證)- 校招/社招工作職責： * 深入了解下一代GPU架構與GPU高性能計算領域的最新功能* 與GPU架構設計者深入溝通以制定架構驗證測試計劃* 基于測試計劃和隨機

2017-09-01 17:22:28

PowerVR Furian架構有什么功能？

PowerVR Furian架構是面向嵌入式GPU的一款全新架構，是業界領先的PowerVR Rogue架構的繼任者，新的架構引入了很多全新設計的組件，幫助進一步提升性能、功效、性能密度。其包含了Rogue架構整個生命周期中加入的所有重要提高，是PowerVR GPU架構的一次重要的升級和更新

2019-08-02 06:41:23

USB2.0協議深入解讀

2012-08-16 20:12:40

inter,amd,arm公司以及x86,arm,mips等架構的關系

芯片設計公司市場：微處理器（單片機等），手機移動市場處理器（cotex-a77等）和gpu mail，主要以出售芯片技術授權（高通，華為）2.amd: pc市場的cpu,和顯卡3.inter:電腦cpu注：arm總是分不清，記一下arm 公司arm公司設計的arm架構，類似x86架構基于arm

2021-07-01 06:01:26

【AMD】Design Verification Engineer

AMD超威半導體上海研發中心招聘 ASIC Design Verification Engineer；請有意向者將簡歷發送到 Maggie1.Zhang@amd.com 以及

2017-03-13 16:47:03

【AMD】Physical Design Engineer

AMD上海研發中心熱招Senior /MTS Engineer of Physical Design，請感興趣的候選人把簡歷以附件形式發送到Maggie1.Zhang@amd.com 以及

2017-03-13 16:45:36

【AMD】Physical Design Engineer

AMD超威半導體上海研發中心招聘 Physical Design Engineer，請有意向者將簡歷發送到 Cherry.Zhang@amd.com 以及

2017-02-28 17:24:31

【技術系列】淺談GPU虛擬化技術（第一章）

“。但是隨著云計算場景的普及，概念的深入人心，慢慢地大家都對云計算有一個較清晰的概念和實例化的理解。自然，隨著應用場景從單一依賴CPU的計算單元的應用擴展到多種體系架構，異構計算場景的應用上來后，對GPU

2018-04-16 10:51:32

【招聘】算法、圖像檢索、嵌入式、測試、架構、GPU優化等職位（bj&sh）

【招聘】算法、圖像檢索、嵌入式、測試、架構、GPU優化等職位（bj&sh）人臉識別算法工程師職責 1、負責人臉識別深度學習算法的調研和研究。 2、負責人臉識別模型的優化和移植

2018-02-28 14:23:12

基于磁貼的GPU架構優缺點

本指南介紹了基于磁貼的GPU架構的優缺點。它還將ARM馬里基于瓷磚的GPU架構設計與臺式PC或控制臺中常見的更傳統的即時模式GPU進行了比較。馬里GPU使用基于平鋪的渲染體系結構。這意味著GPU

2023-08-02 12:54:29

英偉達發布新一代 GPU 架構圖靈和 GPU 系列 Quadro RTX

在 8 月 14 日的 SIGGRAPH 2018 大會上，英偉達 CEO 黃仁勛正式發布了新一代 GPU 架構 Turing（圖靈），以及一系列基于圖靈架構的 GPU，包括全球首批支持即時光線追蹤

2018-08-15 10:59:45

AMD GPU缺貨導致多家PC廠商推遲發貨計劃

AMD GPU缺貨導致多家PC廠商推遲發貨計劃 11月6日晚間消息，據臺灣媒體報道，多名消息人士表示，AMD圖形處理芯片(GPU)的缺貨已導致多家PC廠商推遲發貨計劃，這些廠商將

2009-11-09 08:56:46

502

AMD明年推CPU與GPU融合產品或先用于筆記本

AMD明年推CPU與GPU融合產品或先用于筆記本 12月2日消息，AMD公司CEO梅德克今日對媒體透露，明年早些時候AMD將推出CPU與GPU的融合產品，新的芯片將被命名為APU（加速計算

2009-12-03 09:18:05

638

AMD發布嵌入式GPU E6760

AMD就發布了基于OpenCL和Eyefinity技術的“桌面級”嵌入式GPU E6760，它可以支持至少6屏幕輸出。

2011-05-04 10:18:36

1248

AMD嵌入式Radeon? E8860 GPU，帶來身臨其境的圖像效果

AMD嵌入式Radeon? E8860 GPU是業界首款基于次世代圖形架構的GPU，性能是上一代的兩倍，憑借業界最佳的7年超長服務壽命，推動視覺和GPGPU嵌入式系統新時代的發展。

2014-02-26 20:09:20

3961

AMD下代APU大爆發：四核Zen架構 1024單元GPU

明年初AMD就會推出全新的Zen架構，APU產品線也會迎來升級，繼任者是Raven Ridge（烏鴉嶺），而期待AMD新品的A飯坐穩了，下面的爆料非常勁爆，因為Raven Ridge不僅會升

2016-10-31 11:04:35

5701

amd ceo蘇姿豐：將與NVIDIA平分GPU市場份額

2016年推出14nm工藝的新一代Polaris顯卡之后，AMD在GPU市場上的路越走越順了，企業級市場獲得了谷歌、阿里巴巴及蘋果等大公司的青睞，消費級市場上AMD顯卡也開始恢復元氣，獨顯份額從去年

2016-12-06 14:28:07

660

深入解析ARM Cortex-A12架構

2017-01-14 12:31:49

NVIDIA領先AMD 將在GTC上大談下一代GPU架構Volta顯卡

前面剛說了AMD下周的會議上有可能公布新一代產品路線圖，透露下代GPU架構Navi的一些詳情，不過在新一代GPU上，老對手NVIDIA的進度可比AMD快得多，16nm Pascal架構GPU發布

2017-05-09 16:33:47

2166

英偉達的GPU銷量增長29.53%,遠超AMD和英特爾

AMD的桌面APU（加速處理器）的銷量較上個季度增長了7.1%。”上述報告稱，“AMD的筆記本電腦APU銷量環比增長了2.2%。臺式電腦GPU銷量較上個季度增長了16.1%，筆記本電腦GPU銷量環比增長了5.2%。整體而言，AMD的所有GPU銷量環比增長了7.6%。

2017-11-21 17:45:40

759

AMD GPU背后的男人

Su)匯報。王啟尚在加入AMD后將負責圖形工程，包括AMD圖形技術產品戰略、架構、硬件及軟件等方面。

2018-03-06 09:53:29

4208

銳龍Pro現已同時擁有Zen CPU、Vega GPU兩大新架構，并支持AMD GuardMI技術

而今天的銳龍Pro同時擁有Zen CPU、Vega GPU兩大新架構，并支持AMD GuardMI技術，從開機到關機都提供芯片級的超級安全性，而商用級質量和可靠性有助于確保平臺壽命，開放標準的可管理性有助于確保企業免受專利解決方案的局限。

2018-05-16 11:29:00

2001

AMD公開VEGA GPU架構使用7nm工藝

在日前舉行的Computex 2018發布會上，AMD有些出人意料地進行了高規格的產品發布，公開的產品包括下一代使用7nm工藝的VEGA GPU，以及使用7nm的Zen 2處理器。目前，7nm

2018-06-29 16:17:24

3902

AMD最新GPU和CPU產品優先推出7nm，年底前供貨

8月23日消息據外媒報道，AMD近日再次表示，AMD最新GPU和CPU產品優先推出7nm產品，相比于英特爾的速度，AMD可以說是在7nm制程這件事情上絲毫不敢怠慢。

2018-08-24 16:17:32

3100

AMD之前就公布Zen2架構的IPC性能變化比Zen架構提升29%之多

上周的New Horizon發布會上，AMD正式宣布了7nm工藝的CPU及GPU芯片，前者是Zen 2架構的羅馬EPYC處理器，最多64核128線程，后者是Vega 20，配備32GB HBM

2018-11-12 15:42:16

1567

intel新CPU架構詳細解讀

在近日舉辦的架構日活動上，英特爾罕見地公布了未來多年的CPU、GPU架構路線圖，以及一系列相關技術、戰略規劃，讓人大飽眼福，其中新的CPU架構是很多人非常關心的亮點。本文收集了一些資料，為大家盡量通俗地做一些簡單解讀。

2018-12-25 11:25:57

13256

AMD發布全球首款7納米GPU，高端游戲市場狙擊英偉達

這個消息看起來很有意思，其實從技術上講，AMD并沒有發布任何新的GPU，（新顯卡仍然沿用與上一代旗艦相同的GCN5架構）。但高端市場的情況已經表明，現在有一個窗口可以讓AMD將旗下最高端的Vega 20 GPU帶入消費市場，這正是AMD正在尋求充分利用的窗口。

2019-01-11 09:04:41

3546

AMD就侵犯GPU/APU專利起訴聯發科

Designs(集成電路設計廠商)的電視/智能設備等侵犯了自己的多項GPU/APU技術專利。當時AMD稱，這些公司在美銷售的智能手機、電視等 ... 2017年，AMD向美國國際貿易委員會(ITC

2019-01-15 16:58:01

100

AMD官方透露Navi顯卡將使用全新GPU架構

5月27日上午10點AMD將在臺北電腦展上舉行全球媒體活動，這次發布會宣布7nm工藝、Zen2架構的銳龍3000處理器是沒跑了。接下來在6月初的E3游戲展上，AMD還會舉行“Next Horizon Gaming”活動，這次發布會推7nm Navi顯卡也是板上釘釘了。

2019-05-16 10:47:10

871

AMD攜手三星入局手機GPU市場以挑戰高通地位

高通移動GPU的地位或將失去？AMD攜手三星入局手機GPU市場

2019-08-28 16:30:02

3035

AMD嵌入式技術將發力與邊緣計算領域

自2016年開始,一條沉睡的巨龍AMD開始慢慢蘇醒。也正是因為GPU時代的到來,讓AMD在過去一年半到兩年的時間里,不斷的推出圍繞高性能ZEN架構的新品,一時間ZEN架構便成了業界的新寵。

2019-10-24 11:17:23

537

采用全新的7nm架構，AMD RDNA架構的解析

隨著AMD的全新7nm制程工藝的RDNA架構推出，代表著AMD在未來的GPU市場上將有一番大作為，在過去的幾代中，AMD的GPU已經利用了很久的基于GCN架構的計算單元。

2019-12-10 17:06:40

2957

AMD宣布全新GPU架構“CDNA” 將專注于計算/張量操作性能

AMD CPU架構這幾年發展的順風順水，Zen、Zen+、Zen 2、Zen 3、Zen 4每一代都表現驚艷，GPU架構就相對暗淡一些了：GCN已經服役多年廉頗老矣，RDNA閃亮登場但依然無法和對手全面抗衡。

2020-03-06 15:35:13

2356

索尼PS5和微軟Xbox Series X都會搭載AMD GPU

AMD今天在財務分析師大會上暗示，索尼PS5和微軟Xbox Series X均會搭載基于RDNA2架構的GPU，從而實現硬件級的光追支持。

2020-03-07 09:07:23

2020

AMD Infinity Fabric升級后可支持CPU-GPU之間的連接

在AMD的財務分析日上，AMD 透露將會升級其Infinity Fabric總線，不僅支持CPU-CPU以及GPU-GPU之間的連接，而且還將支持CPU-GPU之間的連接。

2020-03-09 14:24:31

2387

AMD Infinity Fabric總線升級，最多支持8個GPU芯片的連接

在AMD的財務分析日上，AMD 透露將會升級其Infinity Fabric總線，不僅支持CPU-CPU以及GPU-GPU之間的連接，而且還將支持CPU-GPU之間的連接。

2020-03-09 15:02:30

3075

AMD模糊RDNA3架構顯卡工藝的說法

上周的財務分析師大會上，AMD干貨滿滿，宣布了5nm Zen4架構，同時還推出了新一代的RDNA2架構，能效比RDNA第一代提升了50%，堪稱AMD GPU十年來最大變革。

2020-03-11 08:53:07

2145

AMD下一代RDNA3架構或將采用5nm工藝，官方暫沒透露

2020-03-11 15:23:04

2762

微軟虛擬機采納AMD Radeon Instinct計算卡

微軟Xbox Series X、索尼PS5都采用了定制的AMD RDNA2 GPU架構，搭檔定制的AMD Zen2架構，成為AMD的又一個高光時刻，而在其他領域，AMD CPU/GPU也是頻頻獲得青睞。

2020-03-20 08:47:33

1628

解讀英特爾GPU架構

來源：半導體行業觀察在英特爾2020年度架構日中，英特爾將大量時間用于討論公司的GPU架構計劃。雖然這對英特爾來說并非罕見，但目前該公司仍然以CPU內核而聞名。因此，他們在圖形方面的市場關注度一直

2020-09-04 16:47:19

6156

AMD收購賽靈思談判已經進入“深入”階段

半導體行業將迎來最新一次的重大并購。知情人士稱，雙方談判已經進入到深入階段，這筆收購交易最快可能在下周達成，不過目前無法保證這項交易能夠達成。 Gartner有分析師表示，CPU+GPU+FPGA是芯片產業的未來，所以AMD收購具有強大FPGA能力的賽靈思是符合邏輯的，英

2020-10-12 17:01:38

1854

AMD發布首款CDNA架構GPU：7680流處理器

AMD 今天發布了 INSTINCT MI100 加速卡，首次搭載了 CDNA 架構，擁有 7680 流處理器，32GB HBM2 顯存。 IT之家了解到，MI100 采用全新的 GPU，擁有

2020-11-17 15:16:57

1309

AMD Zen顯卡這把火已經在CPU市場越燒越旺

AMD不止一次表示：Zen奠定了AMD未來幾年產品的路線圖，現如今，Zen這把火已經在CPU市場越燒越旺。對比CPU架構Zen，AMD的GPU 架構則顯得沒有那么亮眼，曾經的GCN已經慢慢退出

2020-11-18 18:27:32

1730

AMD欲推出Radeon RX 6000M移動GPU

AMD 內部似乎正在測試基于 RDNA2 的 Radeon RX 6000M 移動 GPU，針對于筆記本電腦市場的 Navi 23/24 早期信息已經被泄露。根據網友在 Twitter 上爆料

2020-12-10 14:48:24

1578

AMD旗艦APU產品的線路圖曝光！蘋果暴擊“intel帝國”，AMD能否成救星？

Navi2架構集成GPU。今年，AMD最新的Zen3架構已經幫助他們的“Renoir”系列APU和銳龍5000系列CPU取得了亮眼的表現，在傳統弱項游戲性能上全面趕超英特爾。并且Navi架構的第二代GPU

2020-12-21 17:51:28

2266

AMD 專利：全新模塊化 GPU 設計 GPU 將采用多核封裝

外媒 tweaktown 消息，AMD 于 2020 年 12 月 31 日向美國專利及商標局提交了一份專利申請，展現了全新的模塊化 GPU 設計方法。根據這項專利顯示，新的 GPU 將采用

2021-01-04 15:22:06

2460

三星下一代SoC或搭載AMD GPU

近日，三星表示正在與AMD合作，下一款旗艦處理器中將會搭載 “下一代移動 GPU”。早在2019年6月，三星和AMD就宣布，雙方將合作為三星Exynos芯片帶來移動GPU，三星系統LSI（三星電子的Exynos部門）將通過多年協議授權AMD的Radeon GPU IP。

2021-01-14 09:25:46

1845

曝AMD新GPU將采用雙芯設計

《奇點灰燼》數據庫中出現了AMD GPU的新代號“Nashira Summit”，但目前還沒有任何線索確定它的身份。

2021-01-27 10:55:37

964

AMD GPU第一次殺入手機：蘋果直接跪倒

三星SoC集成AMD GPU：性能超蘋果A14最多達90％ AMD RDNA系列GPU架構在性能、能效方面表現不俗，也得到了三星、特斯拉的青睞，轉戰進入手機、汽車行業。早在2019年，三星就與

2021-01-30 09:43:44

1644

AMD GPU首次殺入三星手機SoC

AMD RDNA系列GPU架構在性能、能效方面表現不俗，也得到了三星、特斯拉的青睞，轉戰進入手機、汽車行業。

2021-01-30 10:05:10

1580

集成AMD GPU的三星Exynos SoC將發布

AMD在官方文檔中使用了“Radeon宇宙”的說法，描述的是集成AMD GPU技術的產品，包括自家的PC、移動顯卡，新一代Xbox Series X/PS5主機、蘋果Mac、云游戲服務、超級計算機等。

2021-02-24 11:39:28

1186

AMD或將申請GPU小芯片設計專利

日前我們首次聽說了AMD下代加速計算卡Instinct MI200，是現有CDNA架構的Instinct MI100的繼任者，有望采用下一代CDNA架構，具體規格不詳，但有大概率會上MCM多芯封裝，類似處理器中的銳龍、霄龍。

2021-02-26 09:38:56

963

三星SoC在AMD加持下GPU性能暴漲2.5倍

2019年，三星宣布獲得AMD GPU圖形技術授權，將會集成于自家Exynos SoC，也第一次將AMD GPU帶入手機市場。

2021-03-03 09:42:13

1362

AMD或推RDNA架構礦卡以對抗NVIDIA

近期在AMD的GPU更新Linux驅動程序里，極大機會包含了基于RDNA架構的專用礦卡信息。據Phoronix報道，這次AMD的Linux驅動程序里有確切指出Navi 12核心，而且使用這款核心的顯卡是不帶視頻輸出功能的，通俗地說，就是從驅動程序層面就不支持視頻輸出功能。

2021-03-07 10:42:36

1772

全面概述ARM Mali GPU架構演進！

年初有機會調研了一下歷代ARM Mali GPU架構，目前一共四代【1】，分別是Utgard，Midgard，Bifrost和Valhall。有感于他的演進是大GPU架構發展的縮影，所以作文一篇記錄

2021-03-31 13:51:32

6130

兩項合作達成，AMD正在肆意成長

在近日的臺北電腦展上，AMD宣布了其最新的兩個合作。一是與特斯拉的合作，即特斯拉的新款旗艦轎車和SUV將采用AMD的RDNA 2 GPU架構。二是AMD公布了他們正在與三星合作開發

2021-06-18 11:48:00

3246

AMD突破性的RDNA 2架構

動力，帶來高幀率的游戲樂趣和先進的內容創建功能。突破性的RDNA 2架構 AMD Radeon RX 6000M系列移動顯卡建立在突破性的AMD RDNA 2游戲架構上，與AMD RDNA架構相比，可提供高達1.5倍的性能提升，或在相同的性能水平[1]上降低高達43%的功耗。專為發燒友而設計，無論

2021-09-07 15:51:48

3741

Imagination和騰訊WeTest開展深度合作，助力開發者獲取GPU關鍵報告

WeTest的PerfDog工具新增全平臺全架構80多種GPU Counter，為開發者詳盡解讀PowerVR GPU數據指標

2021-09-27 14:20:05

1775

CPU+GPU架構超算的未來發展趨勢分析

電子發燒友網報道(文/周凱揚)從去年11月公布的最新TOP500超算系統排名上，我們可以看出AMD已經開始蠶食原本屬于英特爾的份額，而且速度不容小覷。而英偉達則因為在GPU上的頭號交椅地位，成了堅持所有堅持CPU+GPU架構超算的首選。

2022-03-01 09:46:57

3177

AMD發布基于CDNA 2架構的Instinct MI210 GPU

基于AMD CDNA 2架構并由ROCm 5提供支持，AMD Instinct MI210 GPU幫助主流用戶加速洞察和發現。

2022-03-26 09:53:19

1526

高通擴展驍龍計算生態系統基于AMD RDNA 2架構的GPU推出

　　AMD（超威，納斯達克股票代碼：AMD）宣布推出基于最新AMD RDNA 2架構的AMD Radeon PRO V620 GPU，可為當今苛刻的云工作負載提供高性能的GPU加速，包括沉浸式AAA游戲體驗、密集型3D工作負載以及大規模云端現代辦公生產力應用程序。

2022-03-28 10:15:28

1066

由CPU和GPU小芯片組成的數據中心APU

讓我們先從AMD的服務器GPU架構路線圖開始。繼AMD公司目前的CDNA 2架構之后，MI200系列Instinct加速器將采用CDNA 3架構。與AMD的其他路線圖不同的是，該公司此次并沒有提供兩年的路線圖。同時，服務器GPU路線圖只推出到2023年，AMD的下一個服務器GPU架構將于明年推出。

2022-07-13 14:42:44

1088