電子發燒友網綜合報道,消息人士稱,英偉達計劃于 7 月推出第三代 “閹割芯片”。此次推出的 B20 和 B40/B30 芯片將替代 H20 芯片,試圖重新奪回市場份額。
B20 芯片基于 GB202 GPU,采用 GDDR7 內存,最大帶寬可達 800Gbps,適合小規模集群推理和小模型后訓練;B40/B30 芯片則保留了與 H20 相同的 NVLink 互聯功能,最大帶寬可達 900GB/s,但性能有所下滑。單卡售價預計在 6500 至 8000 美元之間,服務器價格預計在 8 萬至 10 萬美元之間。
英偉達此次產品的變動源自美國出口管制的升級。2024 年,美國將 HBM 內存(帶寬密度≥2GB/s?mm2)列為特殊管控對象,英偉達被迫采用 GDDR7 規避限制。此外,芯片的雙精度浮點計算(FP64)單元、張量核等關鍵模塊可能通過后道點斷工藝屏蔽,導致計算能力進一步受限。北京時間 4 月 16 日凌晨,英偉達向美國證券交易委員會(SEC)提交 8-k 文件,稱已接到美國政府通知(原文 “特朗普政府” 表述有誤,2024 年特朗普未執政 ),H20 芯片及達到 H20 內存帶寬、互連帶寬等的芯片向中國等國家和地區出口需要獲得許可證。
這一調整直接導致芯片支持的模型并發數減少,難以支撐大規模訓練任務。例如,B20 使用英偉達的 ConnectX-8 實現互連功能,通過以太網實現連接,最大互連帶寬為 800Gbps。每塊 B20 芯片通過 NVlink 總線連接到 ConnectX-8 芯片,形成一個相當于 PCIe 卡的離散模塊,支持 PCIe 卡格式的互連。而這種連接性能僅適合 8 - 16 卡小規模集群的推理和小模型后訓練,不過對于一些偏重網絡傳輸,且推理任務繁重但體量小的客戶而言,B20 還是有一定性價比的。
盡管芯片性能受限,英偉達仍憑借 CUDA 生態壟斷(統一編程模型、豐富代碼庫)維持市場地位。此前,英偉達 H20 芯片就在 2024 年被中國互聯網公司大批量采購。類似邏輯下,B40/B30 因保留 NVLink 互聯能力,可能被科技巨頭用于構建高密度集群(如 NVL72 機柜),滿足模型微調、推理等場景需求。
不過,美國的政策正在引發反向替代效應。在國內,已經有不少芯片能夠用于替代英偉達的芯片。比如,昇騰 910B 的 FP16 算力達 376TFLOPS,超越英偉達 A100 的 312TFLOPS;顯存帶寬 1600GB/s,支持全自研 HCCS 高速互聯。根據此前的報道,在全球 AI 算力競賽進入關鍵階段的背景下,硅基風暴(Siliconstorm)與華為昇騰云正式達成深度技術合作。本次合作基于昇騰 910B 芯片的算力底座,在大型模型推理加速領域取得突破性進展 —— 聯合研發的 DeepSeek-R1 架構實現推理效率提升 10 倍,推理成本較傳統方案降低 97%。這是國產算力體系首次在 AI 推理性能與性價比雙重指標上超越國際主流方案。
因此,美國的技術封鎖如同「鲇魚效應」,迫使中國半導體產業跳出「跟隨式創新」的路徑依賴,在技術路線、產業鏈布局、生態規則三大維度實現范式變革。短期內,國產芯片將在中低端推理、邊緣計算等場景全面替代英偉達閹割版產品,并通過算法優化(如模型壓縮、稀疏計算)部分彌補高端訓練場景的性能差距。中長期來看,隨著存算一體、光子芯片、量子計算等顛覆性技術突破,以及 RISC-V、開源框架等自主生態成熟,中國有望在特定領域建立全球標準,推動半導體產業從「單極壟斷」向「多元競合」轉型。
-
英偉達
+關注
關注
22文章
3927瀏覽量
93273
發布評論請先 登錄
電鏡技術在第三代半導體中的關鍵應用

第三代半導體的優勢和應用領域
瑞能半導體第三代超結MOSFET技術解析(1)

能量密度提升15%!TDK第三代電池量產在即
第三代半導體器件封裝:挑戰與機遇并存

第三代半導體廠商加速出海
第三代半導體對防震基座需求前景?

第三代半導體產業高速發展
第三代寬禁帶半導體:碳化硅和氮化鎵介紹

評論