在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最強AI芯片發布,Cerebras推出性能翻倍的WSE-3 AI芯片

AI芯天下 ? 來源:AI芯天下 ? 2024-03-19 09:31 ? 次閱讀

前言: 近日,芯片行業的領軍企業Cerebras Systems宣布推出其革命性的產品——Wafer Scale Engine 3,該產品成功將現有最快AI芯片的世界紀錄提升了一倍。

WSE-3 AI芯片比英偉達H100大56倍

WSE-3芯片采用了臺積電先進的5納米工藝技術,集成了超過4萬億個晶體管與90萬個核心,展現出驚人的125 petaflops計算性能。

此芯片不僅是臺積電目前能制造的最大方形芯片,其獨特的44GB片上SRAM設計。

摒棄了傳統的片外HBM3E或DDR5內存方式,使內存與核心緊密結合,極大縮短了數據處理與計算的距離,提升了整體運算效率。

另一方面,Cerebras的CS-3系統代表了Wafer Scale技術的第三代成就。

其頂部配置有先進的MTP/MPO光纖連接,以及完備的冷卻系統包括電源、風扇和冗余泵,確保了系統在高負荷運行時的穩定與可靠。

相較于前代產品,CS-3系統及其新型芯片在保持相同功耗和成本的同時,實現了近兩倍的性能提升。

值得注意的是,WSE-3芯片的核心數量高達英偉達H100 Tensor Core的52倍。

37a9e31c-e52b-11ee-a297-92fbcf53809c.png

由WSE-3驅動的Cerebras CS-3系統在訓練速度上比英偉達的DGX H100系統快了8倍,內存擴大了1900倍。

更令人震驚的是,CS-3系統能夠支持高達24萬億個參數的AI模型訓練,這一數字是DGX H100的600倍。Cerebras公司高管表示,CS-3系統的能力已全面超越DGX H100。

舉例來說,原本在GPU上需要30天才能完成的Llama 700億參數模型訓練,現在通過CS-3集群僅需一天即可完成。

37c1b8b6-e52b-11ee-a297-92fbcf53809c.png

第三代產品成功破圈

WSE-3在保持與前代產品Cerebras WSE-2相同功耗和價格的同時,其性能卻實現了翻番,這無疑是對市場的一次重大突破。

WSE-3是Cerebras第三代產品,展現了其在晶圓級芯片設計和制造方面的技術積累。

第一代WSE于2019年推出,采用臺積電16nm工藝;第二代WSE-2于2021年發布,采用7nm工藝;WSE-3則使用5nm技術。

相比第一代,WSE-3的晶體管數量增加了兩倍以上,達到了4萬億的規模。根據其官方介紹,與晶體管數量的增長相比,芯片上的計算單元、內存和帶寬的增長速度有所放緩。

這反映出Cerebras在追求整體性能提升的同時,也在芯片面積、功耗和成本之間進行權衡。

通過多代產品的迭代,Cerebras掌握了晶圓級芯片設計和制造的核心技術,為未來的創新奠定了基礎。

37d0da08-e52b-11ee-a297-92fbcf53809c.png

專為AI打造的計算能力

以往,在傳統的GPU集群環境下,研究團隊在分配模型時不僅需要科學嚴謹,還需應對一系列復雜的挑戰,如處理器單元的內存容量限制、互聯帶寬的瓶頸以及同步機制的協調等。

此外,團隊還需持續調整超參數并開展優化實驗,以確保模型的性能達到最佳狀態。

然而,這些努力常常因微小的變動而受到影響,導致解決問題所需的總時間進一步延長,增加了研究的復雜性和不確定性。

相比之下,WSE-3的每一個核心均具備獨立編程的能力,并且針對神經網絡訓練和深度學習推理中所需的基于張量的稀疏線性代數運算進行了專門的優化。

這一特點使得研究團隊能夠在WSE-3的支持下,以前所未有的速度和規模高效地訓練和運行AI模型,同時避免了復雜分布式編程技巧的需求。

WSE-3配備的44GB片上SRAM內存均勻分布在芯片表面,使得每個核心都能在單個時鐘周期內以極高的帶寬(21 PB/s)訪問到快速內存,是當今地表最強GPU英偉達H100的7000倍。

而WSE-3的片上互連技術,更是實現了核心間驚人的214 Pb/s互連帶寬,是H100系統的3715倍。

CS-3可以配置為多達2048個系統的集群,可實現高達256 exaFLOPs的AI計算,專為快速訓練GPT-5規模的模型而設計。

37e38ebe-e52b-11ee-a297-92fbcf53809c.png

大幅簡化并行編程復雜度

傳統的集群建設方式,通常需要數以萬計的GPU或AI加速器來協同解決某一問題。

在英偉達所構建的GPU集群中,這些集群通過Infiniband、以太網、PCIe和NVLink交換機等設備進行連接,其中大部分功率和成本均投入到芯片間的重新連接上。

此外,為了管理這些芯片間的互連、通信和同步,還需編寫大量的代碼,這無疑增加了并行編程的復雜性。

然而,Cerebras采用了一種與英偉達截然不同的方法。他們選擇保留整個晶圓,因此所需的芯片數量減少了50倍以上,從而顯著降低了互連和網絡的復雜性和成本。

在軟件層面,Cerebras提供了一套優化的軟件棧,其中包括內置的通信機制和自動化的內存管理。

這使得開發人員能夠使用更少的代碼實現復雜的模型,從而大幅降低了編程負擔。

這種軟硬件協同優化的策略,不僅簡化了開發過程,也加速了AI應用的開發和部署。

業務模式與傳統廠商存在顯著差異

傳統上,英偉達、AMD英特爾等公司傾向于采用大型臺積電晶圓,并將其切割成更小的部分以生產芯片。

然而,Cerebras卻選擇了一種截然不同的路徑,它保留了晶圓的完整性。

在當前高度互聯的計算集群中,數以萬計的GPU或AI加速器協同工作以處理復雜問題。

Cerebras的策略將芯片數量減少50倍以上,從而顯著降低了互連和網絡成本,同時減少了功耗。

在英偉達GPU集群中,這些集群配備了Infiniband、以太網、PCIe和NVLink交換機,大量的電力和成本消耗在重新鏈接芯片上。

通過維持整個芯片的完整性,Cerebras有效地解決了這一問題。

憑借WSE-3,Cerebras繼續鞏固其作為全球最大單芯片生產者的地位。

這款芯片呈正方形,邊長達到21.5厘米,幾乎占據了整個300毫米硅片的面積。

將Cerebras的設計理念與拼圖游戲進行類比,可以清晰地揭示其創新之處。

傳統的芯片制造過程類似于將拼圖切成小塊并逐一拼接,而Cerebras的方法則更像是保持拼圖的完整性,使得各部件之間的連接更加緊密,從而提升了整體效率和性能。

這種前瞻性的設計理念為WSE-3芯片的成功提供了堅實的基石。

結尾:

綜合評估,WSE-3標志著人工智能芯片設計領域的新趨勢,它以單片規模之巨實現了性能與效率的顯著提升。

對于其他公司而言,若要復制此類產品,必須在晶圓制造、封裝互連、系統集成及軟件棧等多個領域投入長期的研發努力,并克服眾多技術難關。

Cerebras之所以能夠在市場中脫穎而出,其關鍵在于這些領域中所展現的持續創新能力及突破。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19745

    瀏覽量

    232941
  • 晶圓
    +關注

    關注

    52

    文章

    5078

    瀏覽量

    129023
  • 晶體管
    +關注

    關注

    77

    文章

    9910

    瀏覽量

    140218
  • AI芯片
    +關注

    關注

    17

    文章

    1958

    瀏覽量

    35617
  • DDR5
    +關注

    關注

    1

    文章

    438

    瀏覽量

    24626

原文標題:熱點丨最強AI芯片發布,Cerebras推出性能翻倍的WSE-3 AI芯片

文章出處:【微信號:World_2078,微信公眾號:AI芯天下】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMD最強AI芯片性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

    電子發燒友網報道(文/吳子鵬)當地時間本周四,AMD在AMD Advancing AI 2024上發布了一系列新品,包括全新旗艦AI芯片、服務器CPU、
    的頭像 發表于 10-14 01:32 ?3918次閱讀
    AMD<b class='flag-5'>最強</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>強過英偉達H200,但市場仍不買賬,生態是最大短板?

    科通技術推出DeepSeek+AI芯片全場景方案

    份有限公司(以下簡稱“科通技術”)作為AI算力供應鏈的核心供應商,憑借深厚的技術積累與產業資源,推出了DeepSeek大模型與AI芯片相結合的全場景應用方案,在
    的頭像 發表于 03-24 10:33 ?498次閱讀

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    []() 2025年3月19日——Banana Pi 今日正式發布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步
    發表于 03-19 17:54

    晶科鑫SJK晶振在不同領域的應用

    在科技時代,高性能芯片的需求日益增長。據《財富》雜志報道,Cerebras Systems推出WSE-3
    的頭像 發表于 02-07 18:03 ?505次閱讀

    賽昉聯合國芯推出性能AI MCU芯片,實現RISC-V+AI新應用

    近日,賽昉科技與蘇州國芯科技有限公司(以下簡稱“國芯科技”)合作研發的高性能AIMCU芯片產品CCR7002已成功通過了內部性能和功能測試,實現了RISC-V+AI技術的新應用。賽昉科
    的頭像 發表于 11-27 11:46 ?849次閱讀
    賽昉聯合國芯<b class='flag-5'>推出</b>高<b class='flag-5'>性能</b><b class='flag-5'>AI</b> MCU<b class='flag-5'>芯片</b>,實現RISC-V+<b class='flag-5'>AI</b>新應用

    天璣9400生成式AI技術太牛了!打造最強AI體驗

    聯發科技再度突破技術前沿,推出全新天璣9400旗艦芯片,這是業界首款集成智能體AI的5G SoC。繼天璣9300首次將生成式AI應用引入手機后,天璣
    的頭像 發表于 10-14 14:06 ?547次閱讀
    天璣9400生成式<b class='flag-5'>AI</b>技術太牛了!打造<b class='flag-5'>最強</b><b class='flag-5'>AI</b>體驗

    NEO推出3D X-AI芯片AI性能飆升百倍

    近日,半導體行業的創新先鋒NEO Semiconductor震撼發布了一項革命性技術——3D X-AI芯片,這項技術旨在徹底顛覆人工智能處理領域的能效與
    的頭像 發表于 08-21 15:45 ?843次閱讀

    3D DRAM內嵌AI芯片AI計算性能暴增

    電子發燒友網報道(文/黃晶晶)盡管當前AI訓練主要采用GPU+HBM的方案,不過一些新的技術仍然希望進一步打破存儲數據傳輸帶來的瓶頸問題。最近,NEO半導體宣布開發其3D X-AI芯片
    的頭像 發表于 08-16 00:08 ?3607次閱讀
    <b class='flag-5'>3</b>D DRAM內嵌<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>AI</b>計算<b class='flag-5'>性能</b>暴增

    后摩智能引領AI芯片革命,推出邊端大模型AI芯片M30

    在人工智能(AI)技術飛速發展的今天,AI大模型的部署需求正迅速從云端向端側和邊緣側設備遷移。這一轉變對AI芯片性能、功耗和響應速度提出了
    的頭像 發表于 06-28 15:13 ?952次閱讀

    AI初創公司Cerebras秘密申請IPO

    近日,全球科技圈再次掀起波瀾。據外媒最新報道,被譽為明星AI芯片獨角獸的Cerebras Systems,已經悄然向證券監管機構遞交了首次公開募股(IPO)的秘密申請。這一動作無疑為當前火爆的
    的頭像 發表于 06-27 17:44 ?920次閱讀

    AI初出企業Cerebras已申請IPO!稱發布AI芯片比GPU更適合大模型訓練

    美國加州,專注于研發比GPU更適用于訓練AI模型的晶圓級芯片,為復雜的AI應用構建計算機系統,并與阿布扎比科技集團G42等機構合作構建超級計算機。基于其最新旗艦芯片構建的服務器可輕松高
    的頭像 發表于 06-26 00:09 ?3209次閱讀
    <b class='flag-5'>AI</b>初出企業<b class='flag-5'>Cerebras</b>已申請IPO!稱<b class='flag-5'>發布</b>的<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>比GPU更適合大模型訓練

    AI芯片會導元件中間商消失嗎?

    元件AI芯片
    芯廣場
    發布于 :2024年06月19日 18:10:01

    AMD發布全新AI芯片Instinct MI325X

    在近日舉行的COMPUTEX臺北國際電腦展上,AMD董事長兼CEO蘇姿豐發表了精彩演講,并正式發布了一款備受矚目的AI芯片——Instinct MI325X。這款芯片預計將于2024年
    的頭像 發表于 06-04 14:49 ?1297次閱讀

    英偉達加速AI芯片迭代,推出Rubin架構計劃

    在近日舉辦的COMPUTEX 2024展會上,英偉達CEO黃仁勛再次展現了公司在人工智能(AI芯片領域的雄心壯志。他公布了下一代AI芯片架構“Rubin”,這是繼今年
    的頭像 發表于 06-03 11:36 ?1033次閱讀

    AI芯片哪里買?

    AI芯片
    芯廣場
    發布于 :2024年05月31日 16:58:19
    主站蜘蛛池模板: 手机看片中文字幕 | 天天狠狠弄夜夜狠狠躁·太爽了 | 亚洲黄色三级 | 精品午夜视频 | 国产综合成色在线视频 | 三级第一页 | 黑色丝袜美美女被躁视频 | 一区二区三区福利 | 亚洲偷图色综合色就色 | 亚洲一二三区在线观看 | 天天摸日日添狠狠添婷婷 | 天天干天天在线 | 久久这里只精品热在线8 | 黄色的视频在线免费观看 | 色播在线 | 成人国产在线24小时播放视频 | 久久美女精品国产精品亚洲 | 天堂社区在线视频 | 亚洲一级毛片免观看 | 在线成人免费观看国产精品 | 男女交性拍拍拍高清视频 | yy6080理aa级伦大片一级 | 一级特黄aaa大片免费看 | 日韩黄色成人 | 天天透天天干 | 欧美精品 在线播放 | 国产精品午夜剧场 | 第三级视频在线观看 | 亚洲第一成人影院 | 国产精品一区二区三区四区 | 宅男午夜 | 亚洲成a人不卡在线观看 | 成人精品视频一区二区三区 | 日本国产视频 | 夜夜嘿视频免费看 | 201天天爱天天做 | 女同性进行性行为视频 | 深夜视频在线免费 | 日本拍拍拍 | 亚洲一区二区影视 | 欧洲mv日韩mv国产mv |