在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Achronix新推出一款用于AI/ML計算或者大模型的B200芯片

Achronix ? 來源:Achronix ? 2024-03-28 15:48 ? 次閱讀

近日舉辦的GTC大會把人工智能/機器學習AI/ML)領域中的算力比拼又帶到了一個新的高度,這不只是說明了通用圖形處理器(GPGPU)時代的來臨,而是包括GPU、FPGA和NPU等一眾數據處理加速器時代的來臨,就像GPU以更高的計算密度和能效勝出CPU一樣,各種加速器件在不同的AI/ML應用或者細分市場中將各具優勢,未來并不是只要貴的而是更需要對的。

此次GTC上新推出的用于AI/ML計算或者大模型的B200芯片有一個顯著的特點,它與傳統的圖形渲染GPU大相徑庭并與上一代用于AI/ML計算的GPU很不一樣。在其他算力器件品種中也是如此,AI/ML計算尤其是推理應用需要一種專為高帶寬工作負載優化的新型FPGA,下面我們以Achronix的Speedster7t FPGA芯片為例來看看技術的演進方向,以及在實際推理應用中展現出來的在性價比和能效比等方面優于先進GPU的特性。

先來快速看看Speedster7t的產品亮點:該器件集成了800K到1500K等效邏輯單元以及326K到692K 6輸入查找表(LUT),高達120T算力的機器學習處理單元(MLP),同時還配備了高性能存儲和I/O接口,以及最高可達190Mb的嵌入式存儲容量。在外部連接接口部署上,Speedster7t包含16個GDDR6通道,可提供高達4 Tbps的高速存儲帶寬;32對SerDes通道,支持1-112Gbps的數據速率;4個400G以太網端口(4× 400G或16× 100G)和2個PCIe Gen5端口,支持16通道(×16)和8通道(×8)配置。

Achronix的Speedster7t FPGA芯片被用戶認為非常適合AI/ML推理原因是:足夠的算力,靈活可配的計算精度;高帶寬大容量低成本的GDDR6(4Tbps帶寬, 32GB容量);革命性的全新二維片上網絡(2D NoC)路由架構;靈活通用的芯片間互聯;支持用戶基于該芯片開發自定義的推理系統,比如單板多片FPGA甚至多板互聯以組成更高性能(如1TBbps/64GB,2TBbps/128GB, 4TBbps/256GB…等更高帶寬和更大容量的計算存儲)以支持更大或超大模型推理部署。

簡而言之,相比傳統的推理算力平臺,Speedster7t FPGA可以提供更高性價比和能耗比的大模型推理能力;另外,在傳統的FPGA處理功能中,越來越多的用戶在該系統中加入機器學習的能力, Speedster7t FPGA能很好勝任傳統FPGA功能和高性能機器學習融合在一起。

一類創新性的高性能FPGA系列產品

Achronix Speedster7t系列FPGA基于革命性的FPGA架構,該架構經過了高度優化提供了高速、高帶寬內外連接,可以滿足日益增長的人工智能/機器學習、網絡密集型和數據加速應用的需求。Speedster7t系列FPGA芯片具有一個革命性的全新二維片上網絡,以及一個針對人工智能/機器學習進行優化的高密度的機器學習處理單元陣列。通過將FPGA的可編程性與類似ASIC路由架構和計算引擎相結合,Speedster7t系列提高了高性能FPGA的標準。

全新的二維片上網絡(2D NoC)提供ASIC級別的性能

Speedster7t系列FPGA芯片具有革命性的2D NoC,可在整個FPGA邏輯陣列中傳輸數據,并將數據傳輸到高性能I/O和內存子系統,同時可提供高達20 Tbps的總帶寬。憑借2D NoC,在Speedster7t FPGA芯片不需要消耗任何可編程邏輯資源的情況下來進行數據傳輸。在該芯片上的2D NoC提供了20 Tbps的二維片上網絡總帶寬;該2D NoC不僅覆蓋了芯片全域,而且還連接到各類高速接口和總帶寬高達4 Tbps的高速存儲接口。

高速接口

無論是支持輸入和輸出的數據流,還是存儲緩沖這些數據,對于高性能計算、機器學習和硬件加速解決方案而言,都需要在片內和片外傳輸數據。Speedster7t系列FPGA芯片的架構可支持前所未有的帶寬。包括:

400G以太網:Speedster7t系列FPGA芯片支持多達4個400GbE端口或16個100GbE端口,通過2D NoC連接到FPGA邏輯。

PCI Express Gen5:Speedster7t系列FPGA芯片配備了多個PCle Gen5接口,支持速率達32GT/s。

存儲接口:GDDR6 + DDR4/5

Speedster7t器件是唯一在片上支持GDDR6存儲器的FPGA,以最低的DRAM成本(每存儲位)提供最快的SDRAM訪問速度。Speedster7t系列FPGA芯片具有高達4 Tbps的GDDR6帶寬,以很低的成本就可提供相當于基于HBM的FPGA存儲器帶寬。Speedster7t系列FPGA芯片包括了DDR4/5存儲器接口,以支持更深入的緩沖需求。PHY和控制器支持由JEDEC規范定義的所有標準功能。

機器學習處理單元

每個Speedster7t FPGA器件都具有可編程的數學計算單元,這些單元被集成至全新的機器學習處理單元(MLP)模塊中。每個MLP都是一個高度可配置的計算密集型模塊,具有多達32個乘法器/累加器(MAC),支持4到24位整數格式和各種浮點模式,包括Tensorflow的bfloat16格式以及高效的塊浮點格式,大大提高了性能。

MLP模塊包括緊密集成的嵌入式存儲器模塊,以確保機器學習算法將以750 MHz的最高性能運行。這種高密度計算和高性能數據傳輸的結合造就了高性能機器學習處理結構,該結構可提供市場上基于FPGA的極高TOPS級別運算能力(TOPS即Tera-Operations Per Second,每秒萬億次運算)。

479833b0-ecd7-11ee-a297-92fbcf53809c.png

圖中文字說明:Register File - 寄存器文件,Fracturable Adder/Accumulator - 可拆分的加法器/累加器,Float MAC - 浮點乘累加單元(MAC),Memory Cascade in - 存儲器級聯,Operand Cascade in - 操作數級聯。 設計工具支持

Achronix Tool Suite工具套件是一個支持所有Achronix硬件產品的工具鏈。它可與行業標準的邏輯綜合和仿真工具結合使用,從而使FPGA設計人員能夠輕松地將其設計映射到Speedster7t FPGA器件中。Achronix Tool Suite工具套件包括Synopsys的Synplify Pro的優化版本和Achronix Snapshot調試器。Achronix仿真庫由Siemens EDA的ModelSim、Synopsys的VCS和Aldec的Riviera-PRO提供支持。

展望:在推理等領域幫助開發者打造綜合性能優于先進GPU的應用

隨著AI/ML技術在各個領域開始廣泛走進應用,Achronix根據Speedster7t FPGA器件的高性能和高帶寬特性,選擇了推理這一個應用面非常廣的技術市場方向,與合作伙伴加大了在Speedster7t FPGA器件上的推理算法和IP的研發,以期幫助更多的創新者實現突破。

該芯片提供了足夠的算力,并利用其片上搭載的二維片上網絡(2D NoC)和機器學習處理單元(MLP),各種高速接口和GDDR6高帶寬存儲接口,提供了用于大規模推理應用需要的計算器件內外連接、硬件加速和存儲調用等新技術,從而可以支持開發者快速去實現創新。

這個策略取得了顯著的成果,其中一個領域是加速自動語言識別(ASR)解決方案,它由搭載Speedster7t FPGA器件的VectorPath加速卡提供支持,運行Myrtle.ai提供的基于Achronix FPGA的ASR IP,從而提供業界領先的、實時的、超低延遲的語音轉文本功能。運行在服務器中的單張VectorPath加速卡可替代多達20臺僅基于CPU的服務器或10張GPU加速卡。

Speedster7t FPGA的技術創新為人工智能推理帶來了更高性價比和更高能效比以及可以讓用戶開發自定義的推理硬件平臺和系統。 在ASR實際性能方面,其出色的超低單詞錯誤率和僅有最先進GPU解決方案八分之一以下的端到端延遲(包括了預處理和后處理以及與CPU做數據交互的時間)顛覆了ASR領域。該解決方案可以在標準的機器學習框架中使用垂直應用特定的或自定義的數據集進行定制或重新訓練。

對于越來越多的其他的推理應用,Speedster7t FPGA的獨創高帶寬架構也可以為這些應用提供有力的支撐。Achronix正在通過不斷研發,以完善其工具鏈和應用生態,將在2024年推出更好的工具來幫助各種推理應用的開發,使眾多的用戶更加便捷地使用Speedster7t FPGA器件或者VectorPath加速卡來實現性價比和能效提升,而不用去爭搶緊俏的高性能GPU加速卡。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47681

    瀏覽量

    240298
  • 圖形處理器
    +關注

    關注

    0

    文章

    201

    瀏覽量

    25669
  • 機器學習
    +關注

    關注

    66

    文章

    8439

    瀏覽量

    133087
  • FPGA器件
    +關注

    關注

    1

    文章

    22

    瀏覽量

    11646
  • GDDR6
    +關注

    關注

    0

    文章

    52

    瀏覽量

    11332

原文標題:新型的FPGA器件將支持多樣化AI/ML創新進程

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    亞馬遜轉向Trainium芯片,全力投入AI模型訓練

    ,亞馬遜AWS推出了兩芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于
    的頭像 發表于 12-13 14:14 ?355次閱讀

    NVIDIA DGX B200首次面向零售市場:配備8塊B200 GPU

    10月13日最新消息,NVIDIA的DGX B200 AI服務器近期已在Broadberry上架,標價515,410美元(相當于約364.2萬元人民幣)。   自發布以來,Blackwell架構就備受業界矚目,NVIDIA首席執行官黃仁勛對其贊譽有加,微軟、Meta
    的頭像 發表于 10-14 14:34 ?818次閱讀

    基于Achronix Speedster7t FPGA器件的AI基準測試

    Achronix半導體公司推出了為AI優化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負載的強化
    的頭像 發表于 09-18 16:10 ?625次閱讀
    基于<b class='flag-5'>Achronix</b> Speedster7t FPGA器件的<b class='flag-5'>AI</b>基準測試

    Mistral AI與NVIDIA推出全新語言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同發布了一款全新的領先語言模型Mistral NeMo 12B。開發者可以輕松定制和部署該模型
    的頭像 發表于 07-27 11:04 ?722次閱讀

    特斯拉加碼AI布局:xAI將采購30萬塊英偉達B200芯片

    特斯拉CEO埃隆·馬斯克近日在社交平臺上公布了項重要消息,旗下的人工智能初創公司xAI計劃采購30萬塊英偉達B200 AI芯片。這大規模
    的頭像 發表于 06-05 09:21 ?728次閱讀

    步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    NVIDIA NVLink,支持 FP4 AI 精度。 GB200 NVL72是一款性能卓越的計算平臺,采用更快的第二代Transformer引擎和FP8精度,可將大型語言
    發表于 05-13 17:16

    人工智能模型公司Anthropic近日推出一款Claude移動端App

    制造Claude 3人工智能模型公司Anthropic近日推出一款iOS應用程序,并為群組共享模型訪問添加第二個付費層。
    的頭像 發表于 05-08 09:55 ?769次閱讀

    日本Sakura網絡公司斥資200億日元購買英偉達B200 AI芯片

    Sakura公司,總部設在大阪,計劃于明年3月在北海道工廠部署大量AI芯片,為有需求的企業提供強大的AI算法訓練計算能力。預計至2031年3月,該公司將在
    的頭像 發表于 04-22 09:56 ?652次閱讀

    日本Sakura互聯網投資英偉達B200芯片 助力AI計算及數據中心發展

    位于大阪的Sakura公司預計將在明年3月起使用這些新購置的AI芯片,并在其位于北海道的工廠內為有需求的企業提供強大的計算能力。此外,該公司還計劃在未來十年內,在AI
    的頭像 發表于 04-19 15:13 ?716次閱讀

    新型的FPGA器件將支持多樣化AI/ML創新進程

    的來臨,而是包括GPU、FPGA和NPU等眾數據處理加速器時代的來臨,就像GPU以更高的計算密度和能效勝出CPU樣,各種加速器件在不同的AI/M
    的頭像 發表于 04-02 15:25 ?380次閱讀
    新型的FPGA器件將支持多樣化<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>創新進程

    英偉達H200性能顯著提升,年內將推出B200AI半導體

    天,NVIDIA發布了H200的性能評估報告,表明在與美國Meta公司的大型語言模型——LLM“Llama 2”的對比中,H200使AI
    的頭像 發表于 04-01 09:36 ?1491次閱讀

    英偉達發布新AI芯片B200

    在美國加州圣何塞舉辦的英偉達GTC生態大會上,英偉達CEO黃仁勛以場震撼人心的演講,正式推出了公司的新代GPU——Blackwell。作為Blackwell家族的首
    的頭像 發表于 03-20 10:07 ?1051次閱讀

    英偉達發布性能大幅提升的新款B200 AI GPU

    英偉達宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上代,運算能力飛躍性提升,甚至能使大語言模型的訓練速度翻番。
    的頭像 發表于 03-20 09:37 ?871次閱讀

    戴爾發布英偉達B200 AI GPU:高功耗達1000W,創新性冷卻工程設計必要

    市場傳言,這款B200雖然運算性能更強,卻又面臨著驚人的能耗,最高或可至1000W,同比H100增長超過40%。由于搭載Hopper架構及HBM3e高帶寬內存,英偉達B200被行業視為運行速度最高的AI
    的頭像 發表于 03-05 09:30 ?2032次閱讀

    字節跳動推出一款顛覆性視頻模型—Boximator

    在 Sora 引爆文生視頻賽道之前,國內的字節跳動也推出一款顛覆性視頻模型——Boximator。
    的頭像 發表于 02-20 13:44 ?1188次閱讀
    字節跳動<b class='flag-5'>推出</b><b class='flag-5'>一款</b>顛覆性視頻<b class='flag-5'>模型</b>—Boximator
    主站蜘蛛池模板: 国产精品久久久久影院色老大 | 国产免费高清视频在线观看不卡 | 天天射天天干天天操 | 人与牲动交xxxbbb | 国产亚洲人成网站天堂岛 | 免费色视频 | 免费黄色三级网站 | 日本在线视频www色 日本在线视频精品 | 狠狠色噜噜狠狠色综合久 | 欧美黑人性xxx猛交 欧美黑人性受xxxx精品 | 免费又爽又黄的禁片1000部 | 最新版天堂资源中文官网 | 日韩高清在线日韩大片观看网址 | 69pao强力打造免费高速 | 鸥美毛片 | 亚洲第一综合 | 经典三级四虎在线观看 | 色五月激情小说 | 在线网站你懂得 | bt天堂在线www种子搜索 | 日韩免费看 | 黄色特级录像 | 看毛片的网站 | 美国色网站 | 国产h视频在线观看高清 | 深夜偷偷看视频在线观看 | 成人亚洲视频 | 免费又黄又爽1000禁片 | 伊人网亚洲 | 亚洲成人午夜影院 | 国产69精品久久久久9牛牛 | 亚洲一区中文字幕在线 | 天天操天天操天天操天天操 | 三级网站国产 | 在线观看视频h | 激情综合色综合久久综合 | 手机在线看片你懂得 | 天天插天天射天天操 | 视频在线播放免费 | 天天干天天操天天舔 | 四虎永久网址 |