91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google推出第七代TPU芯片Ironwood

谷歌開發者 ? 來源:谷歌云服務 ? 2025-04-16 11:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于谷歌云服務,作者 Google Cloud

Amin Vahdat

Google Cloud ML、系統和 Cloud AI 副總裁暨總經理

在 Google Cloud Next 25 大會上,我們隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴展性最佳的定制 AI 加速器,更是第一款專為推理而設計的 TPU。

十多年來,TPU 一直為 Google 最嚴苛的 AI 訓練與執行工作負載提供支持,并助力我們的云端客戶實現相同目標。Ironwood 是我們至今最強大、功能最全面且能效最高的 TPU,專為大規模驅動思考型(thinking)、推理型(inferential)的 AI 模型而打造。

Ironwood 的問世,代表著 AI 發展及其底層基礎架構演進的重大轉變。從為人們提供實時信息以供解讀的響應式 AI (responsive AI)模型,轉向能夠主動生成洞察和解讀的模型。這就是我們所說的「推理時代」(age of inference),在這個時代,AI agent 將主動檢索和生成數據,以協同方式提供洞察與解答,而不僅僅是提供數據。

Ironwood 的構建旨在支持生成式 AI 的下一個發展階段及其龐大的計算和通信需求。Ironwood 可以擴展到高達 9,216 顆液冷芯片(liquid cooled chips),這些芯片通過突破性的芯片間互連 (Inter-Chip Interconnect, ICI) 網絡相連。它是 Google Cloud AI Hypercomputer 架構的多項新組件之一,該架構旨在整合優化硬件與軟件層面,以應對最嚴苛的 AI 工作負載。通過 Ironwood,開發者還能利用 Google 自家的 Pathways 軟件堆棧,可靠且輕松地利用數萬個 Ironwood TPU 的組合計算能力。

以下我們將深入探討這些創新如何協同運作,以無與倫比的性能、成本和能效來處理最嚴苛的訓練與執行工作負載。

以 Ironwood 驅動推理時代

Ironwood 的設計旨在從容應對「思考模型」的復雜計算和通信需求,這類模型涵蓋了大語言模型 (LLMs)、專家混和模型 (Mixture of Experts, MoEs) 和進階推理任務。這些模型需要大規模并行處理能力和高效的內存訪問。

特別的是,Ironwood 的設計著重于在執行大量的張量運算的同時,最大限度地降低芯片上的數據移動和延遲。在前沿應用方面,思考模型的計算需求遠遠超出任何單一芯片的處理容量。我們為 Ironwood TPU 設計了低延遲、高帶寬的 ICI 網絡,以支持在整個 TPU Pod 規模下進行協調且同步的通信。

針對 Google Cloud 客戶,Ironwood 根據 AI 工作負載的需求提供兩種規模配置:256 顆芯片配置和 9,216 顆芯片配置。

當擴展到每個 Pod 達 9,216 顆芯片時,總運算能力可達 42.5 百億億次浮點運算每秒(42.5 Exaflops),是世界上最大的超級計算機 El Capitan 的24 倍以上,后者每個 Pod 僅提供 1.7 百億億次浮點運算每秒 (1.7 Exaflops)。Ironwood 提供的大規模并行處理能力,能夠支持最嚴苛的 AI 工作負載,例如用于訓練和推理、具備思考能力的超大型密集 LLM 或 MoE 模型。每顆獨立芯片的峰值計算能力高達 4,614 萬億次浮點運算每秒(4,614 TFLOPs),代表著 AI 能力的巨大飛躍。此外,Ironwood 的內存和網絡架構確保了在如此龐大的規模下,始終能夠提供正確的數據可支持峰值性能。

Ironwood 還配備了增強版的 SparseCore,這是一種專門用于處理高級排名和推薦系統工作負載中常見的超大規模嵌入(embeddings)的加速器。Ironwood 對 SparseCore 的支持擴大,使其能加速更廣泛的工作負載,甚至跨越傳統 AI 領域,進入金融和科學等領域。

Google DeepMind 開發的機器學習運行時架構 Pathways,能在多個 TPU 芯片間實現高效的分布式計算。Google Cloud 上的 Pathways 讓使用者能輕易超越單個 Ironwood Pod 的限制,將數十萬顆 Ironwood 芯片組合在一起,以快速推進生成式 AI 計算的前沿發展。

196fe898-191d-11f0-9310-92fbcf53809c.png

圖一:相較于 Google 首款對外提供的 Cloud TPU v2, FP8 總峰值浮點運算性能提升幅度。

1998874e-191d-11f0-9310-92fbcf53809c.png

圖二:包括最新一代 Ironwood 在內的 Cloud TPU 產品 (3D 環形拓撲結構, 3D torus version) 技術規格并列比較。FP8 峰值 TFlops 在 v4 與 v5p 上為模擬值,Ironwood 則提供原生支持。

Ironwood 的主要功能

Google Cloud 是唯一一家擁有超過十年提供 AI 計算經驗的超大規模云提供商,不僅支持尖端研究,更將這些技術無縫整合到全球規模等級的服務中,每天為數十億使用者提供 Gmail、Google 搜索等服務。這些專業知識正是 Ironwood 性能的核心所在。主要功能包括:

在性能大幅提升的同時也注重能效,使 AI 工作負載能夠以更符合成本效益的方式運行。Ironwood 的性能功耗比是 2024 年推出的第 6 代 TPU Trillium 的 2 倍。在當前可用電力成為 AI 發展限制因素之一的時代,我們為客戶的工作負載提供了每瓦更多的計算能力。我們先進的液冷解決方案和優化的芯片設計,即使面對持續繁重的 AI 工作負載,也能可靠地維持高達標準風冷兩倍的性能。事實上,Ironwood 的能效較我們 2018 年推出的首款 Cloud TPU 提升近 30 倍。

大幅增加高帶寬內存 (HBM) 容量。Ironwood 每顆芯片提供 192 GB 容量,是 Trillium 的 6 倍,能處理更大的模型和數據集計算,減少頻繁的數據傳輸需求,進而提升整體性能。

HBM 帶寬大幅提升,單顆芯片可達 7.2 Tbps,是 Trillium 的 4.5 倍。這種高帶寬能確保數據快速訪問,這對于現代 AI 中常見的內存密集型工作負載至關重要。

增強芯片間互連 (ICI) 帶寬。雙向傳輸已提高到 1.2 Tbps,是 Trillium 的 1.5 倍,能加速芯片間的通信,有助于提升大規模分布式訓練和推理的效率。

19c70ed4-191d-11f0-9310-92fbcf53809c.png

圖三:相較于最早的 Cloud TPU v2,Google TPU 的能效有顯著提升。此數據是以每顆芯片封裝在熱設計功耗(TDP)下所能達到的 FP8 峰值運算性能(flops per watt)進行衡量。

Ironwood 滿足了未來 AI 的需求

Ironwood 憑借其全面提升的計算能力、內存容量、芯片互連技術進展與可靠性,代表推理時代的一項獨特關鍵突破。這些突破,加上近 2 倍的能效提升,意味著我們需求最高的客戶能以最高的性能與最低的延遲來處理訓練與推理執行工作負載,同時滿足暴增的計算需求。

當前尖端 AI 模型如 Gemini 2.5 和榮獲諾貝爾獎的 AlphaFold, 如今都在 TPU 上運行。我們迫不及待地想看到我們自己的開發人員和 Google Cloud 客戶在 Ironwood 今年晚些時候推出后,會激發出哪些 AI 領域的突破。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1789

    瀏覽量

    59076
  • 加速器
    +關注

    關注

    2

    文章

    827

    瀏覽量

    39140
  • AI
    AI
    +關注

    關注

    88

    文章

    35194

    瀏覽量

    280302
  • TPU
    TPU
    +關注

    關注

    0

    文章

    154

    瀏覽量

    21213

原文標題:Ironwood:首款適用于 AI 推理時代的 Google TPU

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    北汽極狐阿爾法T5 Robotaxi量產下線

    近日,極狐 阿爾法T5 Robotaxi正式量產下線,并已全面啟動在深圳的落地運營推進工作。這款搭載小馬智行第七代自動駕駛系統的車型即將來到千萬人身邊,這標志著4級高度自動駕駛技術正式走向普及,加速融入大眾生活。
    的頭像 發表于 07-21 10:49 ?189次閱讀

    小馬智行第七代自動駕駛Robotaxi開啟道路測試

    近日,小馬智行宣布搭載其第七代自動駕駛系統的北汽極狐阿爾法T5 Robotaxi在深圳開啟道路測試。繼廣汽埃安霸王龍Robotaxi獲得廣州和深圳的智能網聯汽車道路測試牌照后,小馬智行第七代
    的頭像 發表于 07-16 17:17 ?298次閱讀

    英偉達認證推遲,但三星HBM3E有了新進展

    明年。目前博通憑借自有半導體設計能力,正為谷歌代工第七代TPU"Ironwood"及Meta自研AI芯片"MTIA v3"。 ? 此外,三星電子也積極推進向亞馬遜云服務(AWS)供應H
    的頭像 發表于 07-12 00:16 ?2305次閱讀

    飛虹IGBT單管FHA75T65V1DL產品介紹

    國產IGBT單管新品,采用飛虹半導體第七代場截止(Trench Field Stop VII )技術工藝設計,能達到顯著降低導通損耗和開關損耗。使產品具有極低的VCE(sat)和極短的拖尾電流,為終端設計師在優化系統效率時提供有力的幫助。
    的頭像 發表于 07-08 16:09 ?937次閱讀
    飛虹IGBT單管FHA75T65V1DL產品介紹

    小馬智行亮相2025香港車博會

    6月12日-15日,2025國際汽車及供應鏈博覽會(下稱“香港車博會”)在香港亞洲國際博覽館舉辦。小馬智行攜第七代無人駕駛Robotaxi 豐田鉑智4X 強勢亮相,展示了最新的自動駕駛軟硬件系統和技術亮點。這也是小馬智行第七代Robotaxi車型在首次在香港亮相。
    的頭像 發表于 06-13 16:41 ?475次閱讀

    小馬智行第七代自動駕駛車輛廣深開跑

    近日,搭載小馬智行第七代自動駕駛系統的廣汽埃安霸王龍自動駕駛車輛,正式獲得智能網聯汽車道路測試牌照,在廣州和深圳開啟公開道路測試。這意味著小馬智行第七代自動駕駛車輛在完成實驗室與封閉場地的驗證后
    的頭像 發表于 06-11 10:54 ?1176次閱讀

    小馬智行第七代Robotaxi車型搭載禾賽AT128激光雷達

    近日,全球 L4 級自動駕駛領軍企業小馬智行于 2025 上海車展舉辦“向新而行”新聞發布會。全球首發第七代車規級自動駕駛軟硬件系統方案,三款第七代 Robotaxi 家族量產車型,均搭載 4 顆禾
    的頭像 發表于 04-27 16:18 ?444次閱讀

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發布了 Ironwood,這是其
    的頭像 發表于 04-12 11:10 ?1852次閱讀
    谷歌<b class='flag-5'>第七代</b><b class='flag-5'>TPU</b> <b class='flag-5'>Ironwood</b>深度解讀:AI推理時代的硬件革命

    谷歌新一 TPU 芯片 Ironwood:助力大規模思考與推理的 AI 模型新引擎?

    電子發燒友網報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一 TPU AI 加速芯片 ——Ironwood
    的頭像 發表于 04-12 00:57 ?2463次閱讀

    新大陸掃碼器測評:1秒識別破損碼,一維二維條碼也能高效識別

    破損碼、一維/二維條碼的高效表現。一、核心性能:第七代解碼技術突破極限新大陸掃碼器搭載自主研發的第七代核心解碼技術,采用百萬像素高分辨率傳感器,可快速識讀低對比度
    的頭像 發表于 04-11 10:11 ?419次閱讀
    新大陸掃碼器測評:1秒識別破損碼,一維二維條碼也能高效識別

    全場景紅外光柵-智能紅外入侵探測器

    全場景紅外光柵(第七代電子柵欄),簡稱:智能紅外光柵或智能紅外柵欄,是廣州市艾禮富電子科技有限公司研發團隊在二十多年主動紅外探測器和激光入侵探測器研發生產的基礎上,推出第七代超級穩定型主動式紅外
    的頭像 發表于 11-20 09:28 ?770次閱讀
    全場景紅外光柵-智能紅外入侵探測器

    蘋果推出新一代iPad mini,售價3999元起

    10月16日外媒報道,蘋果公司于當地時間周二正式在官網上發布了新一的iPad mini。這款第七代iPad mini采用了100%再生鋁材質,起售價為3999元,將于周四上午9點開放預訂,并于下周
    的頭像 發表于 10-16 14:46 ?1237次閱讀

    英飛凌推出低功耗CIPOS Maxi智能功率模塊(IPM)系列

    英飛凌科技股份有限公司近期宣布,其電機驅動解決方案再添新成員——低功耗CIPOS? Maxi智能功率模塊(IPM)系列,該系列作為第七代TRENCHSTOP? IGBT7產品家族的擴展,專為高效能電機控制而生。
    的頭像 發表于 08-14 11:27 ?1279次閱讀

    英飛凌推出高性能 CIPOS? Maxi 智能功率模塊,適用于功率高達 4 千瓦的工業電機驅動器

    英飛凌科技推出用于電機驅動的低功耗CIPOSMaxi智能功率模塊(IPM)系列,進一步擴展了其第七代TRENCHSTOPIGBT7產品系列。新型IM12BxxxC1系列
    的頭像 發表于 08-14 08:14 ?727次閱讀
    英飛凌<b class='flag-5'>推出</b>高性能 CIPOS? Maxi 智能功率模塊,適用于功率高達 4 千瓦的工業電機驅動器

    利用SLC技術改善熱導率,增強IGBT模塊功率密度

    第七代工業IGBT模塊已成功開發用于650V和1200V級,以滿足高效率、高功率密度和高可靠性等重要電力電子系統要求。與低損耗第七代芯片組結合的SLC技術在熱循環能力、無“泵出故障”封裝和低熱阻
    的頭像 發表于 08-01 10:58 ?1028次閱讀
    利用SLC技術改善熱導率,增強IGBT模塊功率密度
    主站蜘蛛池模板: 国产三级日产三级日本三级 | 深爱开心激情 | 美女扒开腿让男生桶爽网站 | 4438x成人全国最大 | 手机看片国产高清 | 国产香港三级理论在线 | 美女免费视频一区二区三区 | 国产性猛交xx乱 | 久久亚洲精品国产亚洲老地址 | 欧美3区| 永久黄网站色视频免费观看 | 免费的黄色毛片 | 日本在线www | 国模鲍鱼 | 天堂bt在线网bt | 男人天堂资源网 | 色视网站| 扒开双腿爽爽爽视频www | 26uuu影院亚洲欧美综合 | 一级大片视频 | 久久天天丁香婷婷中文字幕 | 一级片在线观看免费 | 欧美不在线 | 色香蕉在线| 天天爽天天爽 | 永久免费在线观看 | 年轻的护士3在线观看 | 国产综合成色在线视频 | 国产一卡二卡≡卡四卡无人 | 97久久人人| 爱爱456高清国语在线456 | 啪啪网站免费观看 | 四虎影院久久 | 欧美精品videosex极品 | 免费一看一级毛片全播放 | 新版天堂中文资源官网 | 高清毛片aaaaaaaaa片 | 一区二区网站 | 亚洲一级毛片中文字幕 | 久久综合免费 | 五月综合激情视频在线观看 |