電子發燒友網報道(文 / 吳子鵬)據路透社最新報道,六名知情人士共同透露,由于對 DeepSeek 低成本人工智能模型的需求激增,中國企業正在增加英偉達 H20 人工智能芯片的訂單,這或許有助于緩解人們對 DeepSeek 可能致使人工智能芯片需求下滑的擔憂。
此前,DeepSeek 爆火給英偉達帶來了不小的沖擊。2025 年 1 月,DeepSeek 發布 R1 模型的開源版本,英偉達股價在消息公布當天單日暴跌 16.9%,市值在短短三天內蒸發了 6000 億美元。市場之所以有如此大的反應,一個重要原因是 DeepSeek 展現出了顛覆式的成本下降。它僅使用 2000 余個芯片集群,花費 560 萬美元左右就能訓練出高性能的 V3 模型,遠低于其他國際 AI 大模型,為行業在低成本訓練方面提供了新的思路與范例,讓更多企業看到了以較低成本開發大模型的可能性。
然而,正如英偉達 CEO 黃仁勛所言,DeepSeek 對英偉達股票的沖擊,源于投資者的誤解。盡管 DeepSeek 在預訓練 AI 模型方面取得了進步,但后期訓練依舊重要,且需要大量資源。更為關鍵的是,部署 DeepSeek 推理應用同樣需要大量的英偉達芯片。隨著 AI 落地加速,英偉達作為全球最領先的計算芯片公司,仍然是最大的受益者。
DeepSeek 部署熱潮帶來大量芯片需求
此前,DeepSeek 發布 R1 模型時,投資者拋售英偉達股票,主要擔心的是 DeepSeek 的開源和低成本邏輯將終結?Scalling Law 的發展。所謂的?Scalling Law,是指在自然語言處理(NLP)和多模態模型領域中,隨著模型規模、數據量和計算資源的增加,模型的性能會相應提升,并且這種提升呈冪律關系。
在大模型領域,?Scalling Law 主要包括 Scale Out 和 Scale Up 兩個方向。其中,Scale Out 即橫向擴展、向外擴展,通過將多個低性能的機器組成一個分布式集群,來共同抵御高并發流量的沖擊;Scale Up 即縱向擴展、向上擴展,在一個計算節點內通過購買性能更好的硬件,提升系統的并發處理能力。顯然,DeepSeek 對 Scale Out 的沖擊更大,也就是說計算芯片的需求沒那么多了。然而,DeepSeek 部署量大幅提升之后,人們發現 DeepSeek 阻礙 Scale Out 發展的邏輯是錯誤的。
DeepSeek 帶來的算法效率的提升并未抑制算力需求,反而因更多用戶和場景的加入,推動大模型的普及與應用落地,帶動數據中心、邊緣及端側算力建設。這使得為了滿足不斷增長的算力需求,通過 scale out 來擴展計算能力變得更為重要。換句話說,企業若要在數據中心部署 DeepSeek 進行大規模的模型訓練和推理任務,對高算力、高內存帶寬的芯片需求巨大。
已經有多位業內人士表示,DeepSeek 服務器的瓶頸主要在于 GPU 推理資源。若應用像 DeepSeek 官網一樣經常宕機,會嚴重影響用戶體驗。
是誰在大規模購買英偉達 H20
六名知情人士中的兩位稱,自 DeepSeek 上個月進入全球公眾視野以來,騰訊、阿里巴巴和字節跳動對 H20 的訂單 “大幅增加”。目前,騰訊和阿里巴巴已全面擁抱 DeepSeek,字節跳動則扮演著 DeepSeek 挑戰者的角色,此前字節跳動的豆包大模型是國內排名第一的大模型。
目前,騰訊旗下的多個產品都已宣布接入 DeepSeek,包括騰訊元寶、騰訊文檔、QQ 瀏覽器、微信搜索、《和平精英》手游等。數據顯示,元寶自 2 月 13 日接入 DeepSeek-R1 模型后,一周內完成四次重大更新,新增圖片理解、深度思考等功能,并通過微信搜索導流實現單日安卓新增下載量 160 萬,iOS 排名從 200 名外躍升至第二。
阿里巴巴方面,1688、DataWorks 等平臺也都已接入 DeepSeek。DataWorks 作為阿里云大數據生態中的核心產品,內置了阿里巴巴歷經 16 年沉淀的大數據建設方法論,與數十種常見大數據引擎和 AI 計算服務深度適配,無論是數據湖、數據倉庫,還是當下熱門的湖倉一體解決方案都能適用。另外,阿里巴巴本身也是開源大模型重要的技術貢獻者,此前我們也提到過 DeepSeek 也是阿里巴巴開源模型的受益者。
對于字節跳動而言,該公司主要考慮的是如何再次超越 DeepSeek,重新成為國產 AI 大模型的代表。此前,字節跳動CEO梁汝波談到 DeepSeek 時表示,去年 9 月 OpenAI 發布長鏈思考模型、成為行業熱點后,字節意識到技術重大變化,但沒有特別覺得一定要馬上復現,覺得早 1 個月晚 1 個月差別不大。“如果一開始重大問題就爭先,我們有機會更早實現。”
無論是擁抱 DeepSeek 還是超越 DeepSeek,從現在 AI 大模型發展趨勢來看,部署大量計算芯片來提供優質的推理服務是重點之一,而英偉達 H20 芯片則是比較受廠商青睞的計算芯片。
H20 是英偉達專為中國市場開發的人工智能芯片,旨在符合美國出口管制政策要求,替代受限制的 H100 等高端產品。H20 采用英偉達 Hopper 架構,擁有先進的 CoWoS 封裝技術。?H20 的 FP8 算力為 296TFLOPS,FP16 算力為 148TFLOPS,配備 96GB 的 HBM3 顯存,GPU 顯存帶寬達 4.0TB/s,功率為 400W。在傳輸上,H20 支持 PCIe Gen5 x16,傳輸速率為 128GB/s;支持 NVLink 900GB/s 高速互聯功能。
此前有統計數據指出,2024 年英偉達大約出貨 100 萬顆 H20 芯片。受 DeepSeek 部署熱潮帶動,騰訊、阿里和字節跳動等企業對英偉達 H20 芯片的訂單大幅增加,預計 2025 年 H20 仍將會為英偉達帶來可觀的收入。
-
英偉達
+關注
關注
22文章
3863瀏覽量
92294
發布評論請先 登錄
相關推薦
英偉達Blackwell芯片機架出現故障 訂單下滑

評論