91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最強AI芯片發布,Cerebras推出性能翻倍的WSE-3 AI芯片

AI芯天下 ? 來源:AI芯天下 ? 2024-03-19 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言: 近日,芯片行業的領軍企業Cerebras Systems宣布推出其革命性的產品——Wafer Scale Engine 3,該產品成功將現有最快AI芯片的世界紀錄提升了一倍。

WSE-3 AI芯片比英偉達H100大56倍

WSE-3芯片采用了臺積電先進的5納米工藝技術,集成了超過4萬億個晶體管與90萬個核心,展現出驚人的125 petaflops計算性能。

此芯片不僅是臺積電目前能制造的最大方形芯片,其獨特的44GB片上SRAM設計。

摒棄了傳統的片外HBM3E或DDR5內存方式,使內存與核心緊密結合,極大縮短了數據處理與計算的距離,提升了整體運算效率。

另一方面,Cerebras的CS-3系統代表了Wafer Scale技術的第三代成就。

其頂部配置有先進的MTP/MPO光纖連接,以及完備的冷卻系統包括電源、風扇和冗余泵,確保了系統在高負荷運行時的穩定與可靠。

相較于前代產品,CS-3系統及其新型芯片在保持相同功耗和成本的同時,實現了近兩倍的性能提升。

值得注意的是,WSE-3芯片的核心數量高達英偉達H100 Tensor Core的52倍。

37a9e31c-e52b-11ee-a297-92fbcf53809c.png

由WSE-3驅動的Cerebras CS-3系統在訓練速度上比英偉達的DGX H100系統快了8倍,內存擴大了1900倍。

更令人震驚的是,CS-3系統能夠支持高達24萬億個參數的AI模型訓練,這一數字是DGX H100的600倍。Cerebras公司高管表示,CS-3系統的能力已全面超越DGX H100。

舉例來說,原本在GPU上需要30天才能完成的Llama 700億參數模型訓練,現在通過CS-3集群僅需一天即可完成。

37c1b8b6-e52b-11ee-a297-92fbcf53809c.png

第三代產品成功破圈

WSE-3在保持與前代產品Cerebras WSE-2相同功耗和價格的同時,其性能卻實現了翻番,這無疑是對市場的一次重大突破。

WSE-3是Cerebras第三代產品,展現了其在晶圓級芯片設計和制造方面的技術積累。

第一代WSE于2019年推出,采用臺積電16nm工藝;第二代WSE-2于2021年發布,采用7nm工藝;WSE-3則使用5nm技術。

相比第一代,WSE-3的晶體管數量增加了兩倍以上,達到了4萬億的規模。根據其官方介紹,與晶體管數量的增長相比,芯片上的計算單元、內存和帶寬的增長速度有所放緩。

這反映出Cerebras在追求整體性能提升的同時,也在芯片面積、功耗和成本之間進行權衡。

通過多代產品的迭代,Cerebras掌握了晶圓級芯片設計和制造的核心技術,為未來的創新奠定了基礎。

37d0da08-e52b-11ee-a297-92fbcf53809c.png

專為AI打造的計算能力

以往,在傳統的GPU集群環境下,研究團隊在分配模型時不僅需要科學嚴謹,還需應對一系列復雜的挑戰,如處理器單元的內存容量限制、互聯帶寬的瓶頸以及同步機制的協調等。

此外,團隊還需持續調整超參數并開展優化實驗,以確保模型的性能達到最佳狀態。

然而,這些努力常常因微小的變動而受到影響,導致解決問題所需的總時間進一步延長,增加了研究的復雜性和不確定性。

相比之下,WSE-3的每一個核心均具備獨立編程的能力,并且針對神經網絡訓練和深度學習推理中所需的基于張量的稀疏線性代數運算進行了專門的優化。

這一特點使得研究團隊能夠在WSE-3的支持下,以前所未有的速度和規模高效地訓練和運行AI模型,同時避免了復雜分布式編程技巧的需求。

WSE-3配備的44GB片上SRAM內存均勻分布在芯片表面,使得每個核心都能在單個時鐘周期內以極高的帶寬(21 PB/s)訪問到快速內存,是當今地表最強GPU英偉達H100的7000倍。

而WSE-3的片上互連技術,更是實現了核心間驚人的214 Pb/s互連帶寬,是H100系統的3715倍。

CS-3可以配置為多達2048個系統的集群,可實現高達256 exaFLOPs的AI計算,專為快速訓練GPT-5規模的模型而設計。

37e38ebe-e52b-11ee-a297-92fbcf53809c.png

大幅簡化并行編程復雜度

傳統的集群建設方式,通常需要數以萬計的GPU或AI加速器來協同解決某一問題。

在英偉達所構建的GPU集群中,這些集群通過Infiniband、以太網、PCIe和NVLink交換機等設備進行連接,其中大部分功率和成本均投入到芯片間的重新連接上。

此外,為了管理這些芯片間的互連、通信和同步,還需編寫大量的代碼,這無疑增加了并行編程的復雜性。

然而,Cerebras采用了一種與英偉達截然不同的方法。他們選擇保留整個晶圓,因此所需的芯片數量減少了50倍以上,從而顯著降低了互連和網絡的復雜性和成本。

在軟件層面,Cerebras提供了一套優化的軟件棧,其中包括內置的通信機制和自動化的內存管理。

這使得開發人員能夠使用更少的代碼實現復雜的模型,從而大幅降低了編程負擔。

這種軟硬件協同優化的策略,不僅簡化了開發過程,也加速了AI應用的開發和部署。

業務模式與傳統廠商存在顯著差異

傳統上,英偉達、AMD英特爾等公司傾向于采用大型臺積電晶圓,并將其切割成更小的部分以生產芯片。

然而,Cerebras卻選擇了一種截然不同的路徑,它保留了晶圓的完整性。

在當前高度互聯的計算集群中,數以萬計的GPU或AI加速器協同工作以處理復雜問題。

Cerebras的策略將芯片數量減少50倍以上,從而顯著降低了互連和網絡成本,同時減少了功耗。

在英偉達GPU集群中,這些集群配備了Infiniband、以太網、PCIe和NVLink交換機,大量的電力和成本消耗在重新鏈接芯片上。

通過維持整個芯片的完整性,Cerebras有效地解決了這一問題。

憑借WSE-3,Cerebras繼續鞏固其作為全球最大單芯片生產者的地位。

這款芯片呈正方形,邊長達到21.5厘米,幾乎占據了整個300毫米硅片的面積。

將Cerebras的設計理念與拼圖游戲進行類比,可以清晰地揭示其創新之處。

傳統的芯片制造過程類似于將拼圖切成小塊并逐一拼接,而Cerebras的方法則更像是保持拼圖的完整性,使得各部件之間的連接更加緊密,從而提升了整體效率和性能。

這種前瞻性的設計理念為WSE-3芯片的成功提供了堅實的基石。

結尾:

綜合評估,WSE-3標志著人工智能芯片設計領域的新趨勢,它以單片規模之巨實現了性能與效率的顯著提升。

對于其他公司而言,若要復制此類產品,必須在晶圓制造、封裝互連、系統集成及軟件棧等多個領域投入長期的研發努力,并克服眾多技術難關。

Cerebras之所以能夠在市場中脫穎而出,其關鍵在于這些領域中所展現的持續創新能力及突破。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19896

    瀏覽量

    235343
  • 晶圓
    +關注

    關注

    53

    文章

    5165

    瀏覽量

    129820
  • 晶體管
    +關注

    關注

    77

    文章

    10020

    瀏覽量

    141748
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35925
  • DDR5
    +關注

    關注

    1

    文章

    447

    瀏覽量

    24896

原文標題:熱點丨最強AI芯片發布,Cerebras推出性能翻倍的WSE-3 AI芯片

文章出處:【微信號:World_2078,微信公眾號:AI芯天下】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AMD最強AI芯片性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

    電子發燒友網報道(文/吳子鵬)當地時間本周四,AMD在AMD Advancing AI 2024上發布了一系列新品,包括全新旗艦AI芯片、服務器CPU、
    的頭像 發表于 10-14 01:32 ?4317次閱讀
    AMD<b class='flag-5'>最強</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>強過英偉達H200,但市場仍不買賬,生態是最大短板?

    AI芯片電感具備哪些電氣特性?

    滿足AI服務器、智能機器人、智能控制無人機等行業對芯片電感的性能要求,科達嘉自主研發推出AI用一體成型電感CSHN系列。產品采用科達嘉自主
    的頭像 發表于 06-12 17:50 ?280次閱讀
    <b class='flag-5'>AI</b>用<b class='flag-5'>芯片</b>電感具備哪些電氣特性?

    Nordic nRF54 系列芯片:開啟 AI 與物聯網新時代?

    在科技飛速發展的今天,芯片技術的創新始終是推動行業進步的關鍵力量。Nordic 公司的 nRF54 系列芯片,正以其卓越的性能和獨特的設計,為 AI 機器學習和物聯網應用帶來前所未有的
    發表于 04-01 00:18

    科通技術推出DeepSeek+AI芯片全場景方案

    份有限公司(以下簡稱“科通技術”)作為AI算力供應鏈的核心供應商,憑借深厚的技術積累與產業資源,推出了DeepSeek大模型與AI芯片相結合的全場景應用方案,在
    的頭像 發表于 03-24 10:33 ?686次閱讀

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    []() 2025年3月19日——Banana Pi 今日正式發布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步
    發表于 03-19 17:54

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ASIC、GPU)與FPGA的協同工作模式,例如通過芯片合封或系統集成,實現高性能AI推理。 3.利用FPGA的獨特優勢? 實時性與低延遲:在需要高實時性和低延遲的應用中(如自動駕駛
    發表于 03-03 11:21

    晶科鑫SJK晶振在不同領域的應用

    在科技時代,高性能芯片的需求日益增長。據《財富》雜志報道,Cerebras Systems推出WSE-3
    的頭像 發表于 02-07 18:03 ?662次閱讀

    天璣 9400拿下AI性能榜冠軍,最強NPU引領手機AI應用變革

    近兩年, AI手機端側AI應用和AI體驗開始進入“超級加速”的時期,層出不窮的技術創新背后其實更離不開手機芯片的核心支持。在這股浪潮中,聯發科天璣 9400旗艦
    的頭像 發表于 12-30 20:09 ?724次閱讀
    天璣 9400拿下<b class='flag-5'>AI</b><b class='flag-5'>性能</b>榜冠軍,<b class='flag-5'>最強</b>NPU引領手機<b class='flag-5'>AI</b>應用變革

    賽昉聯合國芯推出性能AI MCU芯片,實現RISC-V+AI新應用

    近日,賽昉科技與蘇州國芯科技有限公司(以下簡稱“國芯科技”)合作研發的高性能AIMCU芯片產品CCR7002已成功通過了內部性能和功能測試,實現了RISC-V+AI技術的新應用。賽昉科
    的頭像 發表于 11-27 11:46 ?1089次閱讀
    賽昉聯合國芯<b class='flag-5'>推出</b>高<b class='flag-5'>性能</b><b class='flag-5'>AI</b> MCU<b class='flag-5'>芯片</b>,實現RISC-V+<b class='flag-5'>AI</b>新應用

    Untether發布人工智能(AI)芯片

    初創企業Untether發布了一款專為汽車、農業裝備及極端環境AI應用設計的人工智能(AI芯片。   相較于英偉達和AMD的旗艦AI
    的頭像 發表于 10-29 13:59 ?833次閱讀

    天璣9400權威測試AI性能跑分第一,領跑行業

    聯發科近日隆重推出其最新旗艦芯片——天璣9400,這款芯片是天璣家族的第二代全大核SoC,并且成為首款集成智能體AI的5G旗艦芯片。在繼天璣
    的頭像 發表于 10-14 14:57 ?932次閱讀
    天璣9400權威測試<b class='flag-5'>AI</b><b class='flag-5'>性能</b>跑分第一,領跑行業

    天璣9400生成式AI技術太牛了!打造最強AI體驗

    聯發科技再度突破技術前沿,推出全新天璣9400旗艦芯片,這是業界首款集成智能體AI的5G SoC。繼天璣9300首次將生成式AI應用引入手機后,天璣
    的頭像 發表于 10-14 14:06 ?689次閱讀
    天璣9400生成式<b class='flag-5'>AI</b>技術太牛了!打造<b class='flag-5'>最強</b><b class='flag-5'>AI</b>體驗

    最強服務器CPU來了!AI性能直接翻倍

    以及AI服務器及AI數據中心場景的CPU產品。它不僅能支持廣泛的第三方GPU及AI加速器,與它們組合形成強大的異構計算平臺,還能在其中補足GPU或專用加速器覆蓋不到或不足的地方,為更多樣和復雜的場景提供靈活的算力選擇,并增強整個
    的頭像 發表于 09-29 11:00 ?1032次閱讀
    <b class='flag-5'>最強</b>服務器CPU來了!<b class='flag-5'>AI</b><b class='flag-5'>性能</b>直接<b class='flag-5'>翻倍</b>

    NEO推出3D X-AI芯片AI性能飆升百倍

    近日,半導體行業的創新先鋒NEO Semiconductor震撼發布了一項革命性技術——3D X-AI芯片,這項技術旨在徹底顛覆人工智能處理領域的能效與
    的頭像 發表于 08-21 15:45 ?959次閱讀

    3D DRAM內嵌AI芯片AI計算性能暴增

    電子發燒友網報道(文/黃晶晶)盡管當前AI訓練主要采用GPU+HBM的方案,不過一些新的技術仍然希望進一步打破存儲數據傳輸帶來的瓶頸問題。最近,NEO半導體宣布開發其3D X-AI芯片
    的頭像 發表于 08-16 00:08 ?3833次閱讀
    <b class='flag-5'>3</b>D DRAM內嵌<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>AI</b>計算<b class='flag-5'>性能</b>暴增
    主站蜘蛛池模板: 欧美一级视频精品观看 | 免费观看视频在线观看 | 91大神在线视频观看 | 久久久精品2021免费观看 | a级黑粗大硬长爽猛视频毛片 | 依人成人| 大尺度视频在线 | 激情五月婷婷基地 | 国产一级毛片午夜 | 国产精品1区2区3区 国产精品1区2区3区在线播放 | 欧美爱爱网址 | 能可以直接看的av网址 | 嘿嘿嘿视频在线观看网站 | 91免费网站在线看入口黄 | 嘿嘿嘿视频在线观看网站 | 亚洲国产人久久久成人精品网站 | 大量喷潮free| 亚洲一区二区欧美 | 欧美精品成人久久网站 | 日韩在线一区视频 | 亚洲伊人成人网 | 成人免费看黄网站无遮挡 | 四虎884tt紧急大通知 | 欧美生活性色 | 伊人网综合视频 | 欧美在线色视频 | 成人在线视频网 | 三级视频网 | 天堂a免费视频在线观看 | 欧美激情伊人 | 午夜小视频在线观看 | 朱元璋传奇1998王耿豪版 | 天天曰夜夜操 | 爱爱帝国亚洲一区二区三区 | 亚洲情a成黄在线观看 | 一区二区三区伦理 | 免费网站黄成人影院 | 激情五月婷婷色 | 九九51精品国产免费看 | 国产成人三级 | 日本一区二区高清免费不卡 |