在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AWS推出由AWS設計的AWS Trainium2芯片系列

旺材芯片 ? 來源:旺材芯片 ? 2023-11-29 17:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一年多來,我們一直期待Amazon Web Services在今年的re:Invent大會上為其本土服務器推出 Graviton4 處理器。正如預期,AWS首席執行官Adam Selipsky推出了第四代 Graviton CPU系列,包括去年針對HPC工作負載的超頻Graviton3E處理器。

Selipsky在主題演講期間沒有強制舉起Graviton4 芯片,這很奇怪。

Graviton4 提高了各種工作負載的性價比和能效標準

正如我們所預料的那樣,Graviton4 也基于 Arm Ltd 的“Demeter”Neoverse V2 內核,該內核與 Nvidia 的“Grace”CG100 CPU 一樣基于 Armv9 架構。(Nvidia 官方并沒有給 Grace 一個與其 GPU 命名方案一致的產品名稱,所以我們就暫且這樣命名。C代表CPU,G代表Grace。)我們在2017年對Demeter V2核心進行了深入研究。9月份,Arm發布了“Genesis”計算子系統,與之前由AWS部署在Graviton3和Graviton3E處理器中使用的“Zeus”V1 內核相比,V2 內核的每時鐘指令數提高了13%。

顯然,這在 IPC中并不是一個大的跳躍,因為核心數量也在跳躍,這就是為什么我們還假設 AWS已經放棄了代工合作伙伴臺積電用于蝕刻 Graviton3 和 Graviton3E 芯片的5納米工藝,而是更密集且有些成熟的4納米工藝。同樣的4N工藝還用于制造 Nvidia 的 Grace CPU 及其“Hopper”GH100 GPU——這兩款產品都席卷了生成式 AI 世界。

Graviton4 封裝上有 96 個 V2 核心,比 Graviton3 和 Graviton3E 提升了 50%,而且與 8 個 DDR5 內存控制器相比,Graviton4 上有 12 個 DDR5 控制器,并且Graviton4使用的 DDR5內存速度頻率提升了16.7%,達到5.6 GHz。通過數學計算,Graviton4 每個插槽的內存帶寬為536.7 GB/秒,比之前的Graviton3和Graviton3E處理器提供的307.2 GB/秒高出 75%。

在 Selipsky 的演示以及 AWS 發布的有關 Graviton4 的有限規格中,該公司表示通用 Web 應用程序在 Graviton4 上的運行速度比在 Graviton3 上快 30%(不是 Graviton3E,它超頻且很熱),但數據庫的運行速度將提高 40%,大型 Java 應用程序的運行速度將提高 45%。現在,這可能意味著AWS已經在V2核心中實現了同步多線程 (SMT),為每個核心提供兩個線程,就像英特爾AMD 的 X86 處理器以及一些 Arm 芯片過去所做的那樣。

我們不這么認為,下面的比較顯著特征表顯示每個套接字有 96 個線程,而不是 192 個線程。我們認為每個套接字有 96 個線程,并且每個核心的二級緩存加倍至2MB對Java和數據庫應用程序的性能產生了巨大的影響。您可以通過添加雙向SMT獲得3倍的vCPU,但這不會為您提供3倍的內存。與 Graviton3 芯片相比,它的內存仍然只有 1.5 倍。

AWS 在其博客中提到的有關使用 Graviton4 芯片的新 R8g 實例的其他內容也讓我們猶豫不決:“R8g 實例提供了更大的實例大小,比當前一代 R7g 實例多出 3 倍的 vCPU 和 3 倍的內存。”

R8g 擁有 96 個核心和十幾個內存控制器(均比 Graviton3 提升了 1.5 倍),您只會期望 R8g 的 vCPU 數量是使用 Graviton3 芯片的 R7g 實例的 1.5 倍,而內存容量僅是使用 Graviton3 芯片的 R7g 實例的 1.5 倍。因此,我們認為這是 Graviton 系列的第一個雙插槽實現。這也是我們認為 Graviton4 芯片擁有大約 9500 萬到 1 億個晶體管的原因之一,而不是您預期的 8250 萬個晶體管(如果 AWS 只是在 Graviton3 設計中添加 50% 的核心并保持不變)。我們認為,L2 緩存加倍、增加四個 DDR5 內存控制器以及一對現在也進行線速加密的 I/O 控制器也增加了晶體管預算。

Graviton4在另一個方面也值得注意。過去,Neoverse模塊以32核或64核模塊完成,Arm建議使用具有UCI-Express或CCIX互連的小芯片來構建更大的處理器復合體。制作自己的 Arm CPU設計的公司總是可以實現單片芯片,出于延遲和功耗的原因,您會這樣做。這些互連不是免費的,尤其是具有 96 個內核的芯片,其產量會比 32 個內核或 64 核心低得多。這也是有代價的。

因此,從上面的芯片照片來看,我們認為 Graviton4 是一個雙小芯片封裝,其中一個小芯片與另一個小芯片旋轉了 180 度。這可能就是為什么封裝上中央核心復合體左側和右側的存儲控制器小芯片彼此偏移的原因。

我們認為 Graviton4 與前幾代芯片的比較如下:

4bb344a4-8e99-11ee-939d-92fbcf53809c.jpg

誠然猜測,我們認為 Graviton4 的性能比 Graviton3E 稍差,但達到該目標所需的功耗卻低了近一半,并且內存容量高出 50%,帶寬高出 75%,功耗大約為 130 瓦。功率包絡具有更低且更理想的 2.7 GHz 時鐘速度。

根據我們估計的這些數字(粗體紅色斜體顯示),Graviton4 芯片的每瓦性能(按 ECU 性能單位測量)與 Graviton3 大致相同,這幾乎是您在工藝適度縮減的情況下所希望的一切。

隨著更多細節的出現,我們將更新這個故事。

還有一件事:AWS 在其公告中表示(但 Selipsky 并沒有在他的主題演講中吹噓),迄今為止,它已在其機群中部署了超過 200 萬個 Graviton 處理器,并擁有超過 50,000 個客戶使用過它們。

這是一個非常可觀的 CPU 數量,如果 AWS 沒有開始內部生產 Graviton,這些芯片將全部來自 Intel、AMD,甚至可能來自 Ampere Computing。但他們沒有。這就是為什么將您的業務計劃固定給超大規模提供商和云構建商是一個冒險的提議。

Trainum2旨在云中提供最高性能、最節能的AI模型訓練基礎設施

此外,AWS還在大會上推出了由 AWS 設計的AWS Trainium2 芯片系列。

Graviton4 和 Trainium2 標志著 AWS 芯片設計的最新創新。隨著每一代芯片的推出,AWS 都提供了更好的性價比和能效,除了采用 AMD、Intel 和 NVIDIA 等第三方最新芯片的芯片/實例組合之外,還為客戶提供了更多選擇,以運行幾乎任何應用程序或Amazon Elastic Compute Cloud (Amazon EC2) 上的工作負載。

據了解,Trainium2 的設計速度比第一代 Trainium 芯片快 4 倍,并且能夠部署在多達 100,000 個芯片的 EC2 UltraCluster 中,從而可以在一個簡單的環境中訓練基礎模型 (FM) 和大型語言模型 (LLM)。時間的一小部分,同時將能源效率提高了 2 倍。

AWS 計算和網絡副總裁 David Brown 表示:“硅支撐著每個客戶工作負載,使其成為 AWS 創新的關鍵領域。”“通過將我們的芯片設計重點放在對客戶重要的實際工作負載上,我們能夠為他們提供最先進的云基礎設施。Graviton4 標志著我們在短短五年內推出的第四代芯片,是我們為各種工作負載打造的最強大、最節能的芯片。隨著人們對生成式 AI 興趣的高漲,Tranium2 將幫助客戶以更低的成本和更高的能源效率更快地訓練他們的 ML 模型。”

當今新興的生成式人工智能應用背后的 FM 和 LLM 接受過海量數據集的培訓。這些模型使客戶能夠通過創建各種新內容(包括文本、音頻、圖像、視頻甚至軟件代碼)來完全重新想象用戶體驗。當今最先進的 FM 和 LLM 的參數范圍從數千億到數萬億不等,需要可靠的高性能計算能力,能夠擴展到數萬個機器學習芯片。AWS 已經提供了最廣泛、最深入的采用 ML 芯片的 Amazon EC2 實例選擇,包括最新的 NVIDIA GPU、Trainium 和 Inferentia2。如今,包括 Databricks、Helixon、Money Forward 和 Amazon Search 團隊在內的客戶使用 Trainium 來訓練大規模深度學習模型,充分利用 Trainium 的高性能、規模、可靠性和低成本。但即使擁有當今最快的加速實例,客戶也希望獲得更高的性能和規模,以便以更低的成本更快地訓練這些日益復雜的模型,同時減少他們使用的能源量。

Trainium2 芯片專為 FM 和 LLM 的高性能訓練而設計,參數高達數萬億個。與第一代 Trainium 芯片相比,Trainium2 的訓練性能提高了 4 倍,內存容量提高了 3 倍,同時能效(性能/瓦特)提高了 2 倍。Trainium2 將在 Amazon EC2 Trn2 實例中提供,單個實例中包含 16 個 Trainium 芯片。Trn2 實例旨在使客戶能夠在下一代 EC2 UltraCluster 中擴展多達 100,000 個 Trainium2 芯片,與 AWS Elastic Fabric Adapter (EFA) 拍級網絡互連,提供高達 65 exaflops 的計算能力,并為客戶提供對超級計算機的按需訪問一流的性能。憑借這種規模,客戶可以在數周而不是數月內培訓 3000 億個參數的 LLM。通過以顯著降低的成本提供最高的橫向擴展 ML 訓練性能,Trn2 實例可以幫助客戶解鎖并加速生成 AI 的下一波進步。

一家人工智能安全和研究公司Anthropic表示,“我們正在與 AWS 密切合作,使用 Trainium 芯片開發未來的基礎模型。Trainium2 將幫助我們大規模構建和訓練模型,對于我們的一些關鍵工作負載,我們預計它的速度至少比第一代 Trainium 芯片快 4 倍。我們與 AWS 的合作將幫助各種規模的組織釋放新的可能性,因為他們將 Anthropic 最先進的人工智能系統與 AWS 安全、可靠的云技術結合使用。”

來源:EETOP







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 控制器
    +關注

    關注

    114

    文章

    17088

    瀏覽量

    184057
  • smt
    smt
    +關注

    關注

    43

    文章

    3037

    瀏覽量

    71930
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134536
  • AWS
    AWS
    +關注

    關注

    0

    文章

    435

    瀏覽量

    25247
  • DDR5
    +關注

    關注

    1

    文章

    444

    瀏覽量

    24872

原文標題:AWS推出下一代自研芯片

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    請問55912是否支持WLAN卸載和AnyCloud(AWS+MQTT) 功能嗎?

    我可以知道 55912 是否支持 WLAN 卸載和 AnyCloud(AWS+MQTT) 功能嗎? 如果是的話,我可以知道什么時候計劃在 ModusToolbox 系統上線嗎?
    發表于 07-09 06:42

    Arm+AWS實現AI定義汽車 基于Arm KleidiAI優化并由AWS提供支持

    文中介紹的車載生成式 AI 應用演示 Arm KleidiAI 進行優化并由 AWS 所提供的服務進行支持,展示了新興技術如何幫助解決汽車行業的實際挑戰。該解決方案可實現 1 至 3 秒的響應時間并將開發時間縮短數周,證明更高效且離線可用的生成式 AI 應用不僅能夠實現
    的頭像 發表于 04-03 19:24 ?1310次閱讀
    Arm+<b class='flag-5'>AWS</b>實現AI定義汽車  基于Arm KleidiAI優化并由<b class='flag-5'>AWS</b>提供支持

    AWS Graviton4處理器上運行大語言模型的性能評估

    亞馬遜云科技 (AWS) 新一代基于 Arm 架構的定制 CPU —— AWS Graviton4 處理器已于 2024 年 7 月正式上線。這款先進的處理器基于 64 位 Arm 指令集架構的 Arm Neoverse V2
    的頭像 發表于 02-24 10:28 ?602次閱讀
    在<b class='flag-5'>AWS</b> Graviton4處理器上運行大語言模型的性能評估

    偉創力珠海B11工廠榮獲AWS Core Level認證

    近日,偉創力珠海B11工廠在國際可持續水管理領域取得了重大突破,成功獲得國際可持續水管理聯盟(Alliance for Water Stewardship,簡稱AWS)Core Level認證。這一
    的頭像 發表于 01-21 14:42 ?708次閱讀

    亞馬遜云科技發布Amazon Trainium2實例

    近期,亞馬遜云科技宣布了一項重要更新:基于Amazon Trainium2的全新Amazon Elastic Compute Cloud(Amazon EC2)Trn2實例現已正式推出
    的頭像 發表于 12-27 14:57 ?611次閱讀

    Arm Neoverse 驅動 AWS Graviton4,加速云計算新時代

    滿足性能提升、成本降低以及符合監管和可持續發展目標的新能效基準。 近日,Arm與亞馬遜云科技(AWS)的長期合作,正致力于通過專用芯片和計算技術,推動云計算向更高性能、更高效和更可持續的方向發展。在AWS re:Invent 2
    的頭像 發表于 12-23 17:38 ?692次閱讀

    Arm與AWS合作深化,AWS Graviton4展現顯著進展

    Arm與亞馬遜云科技(AWS)的長期合作關系,一直致力于為云計算領域帶來性能更強勁、更高效和可持續的解決方案。雙方通過專用芯片和計算技術的結合,不斷推動云計算的發展。 在近期舉行的AWS re
    的頭像 發表于 12-18 14:17 ?538次閱讀

    亞馬遜轉向Trainium芯片,全力投入AI模型訓練

    ,亞馬遜AWS推出了兩款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于
    的頭像 發表于 12-13 14:14 ?636次閱讀

    亞馬遜云科技宣布Amazon Trainium2實例正式可用

    亞馬遜云科技推出新一代AI訓練芯片Amazon Trainium3 全新Amazon EC2 Trn2實例采用亞馬遜云科技最新的
    的頭像 發表于 12-06 09:15 ?568次閱讀
    亞馬遜云科技宣布Amazon <b class='flag-5'>Trainium2</b>實例正式可用

    蘋果利用AWS定制AI芯片提升服務

    近日,蘋果公司在AWS Reinvent大會上透露,正借助亞馬遜云計算部門AWS的定制人工智能(AI)芯片來強化其搜索等服務。此舉顯示了蘋果在AI技術領域的深入布局和對提升服務質量的持續追求
    的頭像 發表于 12-05 14:14 ?554次閱讀

    Cognizant與AWS簽署戰略合作協議

    近日,全球領先的IT解決方案提供商Cognizant宣布,已與亞馬遜網絡服務(AWS)簽署了一項戰略合作協議。雙方計劃共同提供先進的技術解決方案和云計算服務,旨在提升全球各行業企業的智能制造能力。
    的頭像 發表于 10-30 17:00 ?647次閱讀

    Commvault在AWS推出Commvault Cloud網絡彈性平臺

    混合云網絡彈性和數據保護解決方案的領先提供商Commvault(納斯達克代碼:CVLT)宣布將在Amazon Web Services(AWS)上推出Commvault Cloud網絡彈性平臺。
    的頭像 發表于 10-15 09:19 ?715次閱讀

    數字王國與AWS達成合作,推動自主虛擬人技術云端發展

    近日,數字王國與Amazon Web Services(AWS)達成了一項重要合作,雙方將攜手推動自主虛擬人及其技術向云端遷移。
    的頭像 發表于 10-09 16:38 ?670次閱讀

    英特爾和AWS共同投資定制芯片

    英特爾與全球云計算巨頭亞馬遜AWS達成了一項重大合作,標志著英特爾制造業務迎來了一位重量級客戶——AWS。此次合作不僅可能為英特爾正在美國興建的芯片工廠注入新的活力,更有望助力這家老牌芯片
    的頭像 發表于 09-19 16:53 ?681次閱讀

    亞馬遜AWS自研AI芯片崛起,挑戰英偉達

    知道,該服務器搭載了亞馬遜AWS自主研發的先進人工智能芯片。雖然亞馬遜依然守口如瓶,沒有向外界透露更多關于這款神秘芯片的詳細細節,然而AWS
    的頭像 發表于 07-27 14:33 ?1498次閱讀
    主站蜘蛛池模板: 国模最新私拍视频在线观看 | 中文字幕色 | 二级特黄绝大片免费视频大片 | 深夜动态福利gif动态进 | 一级特黄特色的免费大片视频 | 91破处视频 | 国产吧在线 | 热99re久久精品2久久久 | 一区二区三区视频网站 | a色网站| 8050网午夜一级毛片免费不卡 | 爱爱小视频免费 | 免费一级毛片在线播放不收费 | 亚洲免费视频一区 | 最新久久精品 | dvd碟片色爱 | 亚洲伊人天堂 | 夜夜操狠狠干 | 性生交酡 | 亚洲jizzjizz中国妇女 | 激情婷婷丁香 | 国产亚洲精品久久久久久久软件 | 亚洲成a人片777777久久 | 五月天婷婷网亚洲综合在线 | 色偷偷尼玛图亚洲综合 | 午夜福利国产一级毛片 | 91成人免费在线视频 | 欧美a欧美 | 天天射天天操天天色 | bt天堂在线最新版在线 | 大黄一级片 | 色一情一乱一乱91av | 特黄视频| 九九视频只有精品 | 国产亚洲精品在天天在线麻豆 | 亚洲高清一区二区三区四区 | www.夜夜操.com | 图片区网友自拍另类图区 | 99久久免费午夜国产精品 | 四虎最新在线 | 女同国产|