電子發燒友網綜合報道 日前,英偉達首席執行官黃仁勛表示,美國對中國人工智能芯片的出口管制是 “失敗的”。他指出,這一管制不僅未能阻擋中國在芯片領域的自主發展腳步,反而讓美國公司承受了高達數十億美元的銷售損失。
?
黃仁勛所談及的法規,是美國的《人工智能擴散規則》,其全稱為《人工智能擴散出口管制框架》。這是美國商務部工業與安全局(BIS)于 2025 年 1 月 13 日發布的一項臨時最終規則,美國以國家安全為借口,意圖限制人工智能技術和芯片的出口,尤其將中國等 “受關注國家” 列為重點限制對象。該規則原計劃于 2025 年 5 月 15 日正式生效,不過,當地時間 5 月 13 日,美國商務部工業和安全局(BIS)宣布啟動撤銷這一規則,同時宣稱將采取額外措施加強全球半導體出口管制。
?
“總而言之,出口管制是失敗的?!?黃仁勛明確表示,“起初支撐《人工智能擴散規則》的基本假設,首先就被證明是完全錯誤的?!?
他進一步指出:“四年前,英偉達在中國的市場份額高達 95%,如今卻僅剩 50%。剩下的市場份額已被中國本土技術占據。即便沒有英偉達的產品,中國也會大量使用本土技術?!?
為了能夠繼續進入中國市場,英偉達曾推出多款特供芯片,其中包括 H800 系列、A800 系列、H20 系列、B20 系列以及 L20 系列等。A800 和 H800 是該公司早期針對中國市場推出的特供版本,與 A100 和 H100 相比,它們的主要差異體現在 Nvlink 最大總網絡帶寬方面。具體而言,A100 的 Nvlink 最大總網絡帶寬為 600GB/s,而 A800 的這一數值僅為 400GB/s;H100 的 Nvlink 最大總網絡帶寬為 900GB/s,H800 同樣只有 400GB/s 。隨著美國相關政策不斷收緊,英偉達不得不持續調整特供芯片的規格。以 H20 芯片為例,它是基于 Hopper 架構的訓練級芯片,其 FP16 算力為 148 TFLOPS(大約僅為 H100 的 15%),FP8 算力為 296 TFLOPS;配備 96GB HBM3 顯存,帶寬達 4.0TB/s,支持多卡并聯以彌補算力不足的短板。
?
然而,今年 4 月,特朗普政府宣布禁止英偉達向中國銷售 H20 芯片,這一舉措致使該公司資產減值減記了 55 億美元。
?
盡管面臨美國的封鎖,中國的 AI 產業和 AI 芯片發展并未停滯。阿里巴巴旗下螞蟻集團 Ling 團隊發表了一篇名為《每一個 FLOP 都至關重要:無需高級 GPU 即可擴展 3000 億參數混合專家 LING 大模型》的論文。論文結果顯示,其 3000 億參數的 MoE(混合專家)大模型能夠在使用國產 GPU 的低性能設備上高效完成訓練,其性能與完全使用英偉達芯片、同規模的稠密模型及 MoE 模型相當,而且訓練成本降低了 20%。隨后,彭博社報道稱,螞蟻集團采用了包括阿里巴巴和華為在內的中國科技廠商設計的國產 AI 芯片,運用混合專家模型(MoE,Mixture of experts)機器學習方法,訓練成果可與英偉達公司的 H800 芯片相媲美。
?
目前,國內已出現多起基于國產芯片構建萬卡集群的成功案例。例如,百度智能云成功點亮昆侖芯三代萬卡集群,這是國內首個正式點亮的自研萬卡集群。百度智能云指出,國產昆侖芯萬卡集群以及未來三萬卡集群的建設,從硬件到軟件,面臨著全方位的技術挑戰。而在 2024 年 9 月升級的百度百舸 AI 異構計算平臺 4.0,圍繞大模型落地全流程的算力需求,在集群創建、開發實驗、模型訓練、模型推理這四大關鍵環節,能夠為企業提供 “多、快、穩、省” 的 AI 基礎設施,在萬卡集群建設過程中發揮了極為關鍵的作用。?
-
英偉達
+關注
關注
22文章
3910瀏覽量
93024
發布評論請先 登錄
評論