91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最新MLPerf v3.1測試結果認證,Gaudi2在GPT-J模型上推理性能驚人

looger123 ? 來源:looger123 ? 作者:looger123 ? 2023-09-12 17:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英特爾產品在全新MLCommons AI推理性能測試中盡顯優勢

今日,MLCommons公布針對 60 億參數大語言模型及計算機視覺與自然語言處理模型GPT-J的 MLPerf推理v3.1 性能基準測試結果,其中包括英特爾所提交的基于Habana?Gaudi?2 加速器、第四代英特爾?至強?可擴展處理器,以及英特爾?至強?CPU Max 系列的測試結果。該結果顯示了英特爾在AI推理方面極具競爭力的表現,并進一步加強了其對加速從云到網絡到邊緣再到端的工作負載中大規模部署AI的承諾。

英特爾執行副總裁兼數據中心人工智能事業部總經理Sandra Rivera表示:“正如最新的 MLCommons結果顯示,我們擁有強大的、具有競爭力的人工智能產品組合以滿足客戶對高性能、高效率的深度學習推理及訓練的需求,同時,針對各種規模的人工智能模型,英特爾產品組合均具有領先的性價比優勢?!?/p>

根據6月披露的MLCommonsAI訓練結果和Hugging Face性能基準測試驗證,Gaudi2 在先進的視覺語言模型上,性能可以超越英偉達的H100處理器,而今天的結果進一步證明了英特爾能夠提供滿足AI計算需求的、英偉達H100和A100的唯一可行的替代方案。

考慮到客戶的個性化需求,英特爾正在通過能夠幫助解決AI工作負載中推理與訓練問題的產品,讓AI無處不在。英特爾的AI產品為客戶提供了可根據各自性能、效率及目標成本進行靈活匹配以獲取最佳AI解決方案的理想選擇,同時亦幫助客戶開放生態系統。

關于Habana Gaudi2的測試結果:

Habana Gaudi2在GPT-J模型上的推理結果強有力地驗證了其具有競爭力的性能。

·Gaudi2 在GPT-J-99 和GPT-J-99.9 上的服務器查詢和離線樣本的推理性能分別為78.58 次/秒和84.08 次/秒。

·與英偉達H100相比,Gaudi2提供了令人信服的卓越性能,H100相對于Gaudi2僅表現出 1.09 倍(服務器)和 1.28 倍(離線)的輕微性能優勢。

·Gaudi2 擁有高于英偉達A100 2.4 倍(服務器)、 2 倍(離線)的性能。

·Gaudi2 提交的結果采用 FP8數據類型,并在這種新數據類型上達到了 99.9% 的準確率。

隨著每6-8周公布的 Gaudi2 軟件更新,英特爾將繼續在 MLPerf 基準測試中展現其產品的性能提升,以及持續擴大的模型覆蓋范圍。

wKgZomUANVWAY6S7AAJVP79DRaA450.png

Habana Gaudi2 在GPT-J模型上的推理結果驗證了其具有競爭力的性能

關于第四代至強可擴展處理器的測試結果:

英特爾提交了基于第四代英特爾至強可擴展處理器的7個推理基準測試,其中包括GPT-J模型。結果顯示,包括視覺、語言處理、語音和音頻翻譯模型,以及更大的 DLRM v2 深度學習推薦模型及ChatGPT-J 模型在內,第四代至強處理器對于通用 AI 工作負載擁有出色的性能。此外,截至目前,英特爾仍是唯一一家使用行業標準的深度學習生態系統軟件提交公開 CPU 結果的廠商。

·第四代英特爾至強可擴展處理器是通過流行的AI框架與庫構建及部署通用AI工作負載的理想選擇。對于GPT-J對約 1000-1500 字新聞稿進行100 字總結的任務,第四代至強可擴展處理器可在離線模式下完成每秒兩段的總結提要,在實時服務器模式下完成每秒一段的總結提要。

·英特爾首次提交了英特爾至強CPU Max 系列的MLPerf 結果,該系列可提供高達64 GB的高帶寬內存。對于 GPT-J而言,它是僅有的能夠達到 99.9% 準確度的 CPU,這對于對精度要求極高的應用來說至關重要。

·英特爾與OEM廠商合作提交了測試結果,進一步展示了其AI性能的可擴展性,以及基于英特爾至強處理器的通用服務器的可獲取性,充分滿足客戶服務水平協議 (SLA)。

wKgZomUANVeAKtKpAAF_ItEkqC0102.png

第四代至強可擴展處理器是構建及部署通用AI工作負載的理想選擇

MLPerf 是業內享有盛名的 AI 性能基準測試,旨在實現公平、可重復的產品性能比較。英特爾計劃為下一個 MLPerf測試提交新的AI訓練性能結果。持續的性能更新彰顯了英特爾致力于幫助客戶、助力AI技術演進所邁出的每一步,無論是低成本的AI處理器,還是面向網絡、云和企業用戶的高性能AI硬件加速器或是 GPU。

更多內容:基于MLPerf v.31 推理的性能指標(基準結果)|MLCommons公告

說明:相關配置說明,請查看MLCommons網頁。 結果可能不同。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19896

    瀏覽量

    235357
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16103
  • MLPerf
    +關注

    關注

    0

    文章

    36

    瀏覽量

    824
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模型推理顯存和計算量估計方法研究

    、顯存估計方法 基于模型結構的顯存估計 根據深度學習模型的層次結構和參數數量,可以估算模型推理過程中所需的顯存大小。具體方法如下: (1)
    發表于 07-03 19:43

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進行推理時出現“從 __Int64 轉換為無符號 int 的錯誤”,怎么解決?

    推理量化的 Llama 3.1 8B 模型時遇到錯誤: Runtime error: Bad cast from __int64 to unsigned int
    發表于 06-25 07:20

    1.9倍性能提升!英特爾至強6MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準
    的頭像 發表于 04-07 10:58 ?281次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本; NVIDIA Blackwell
    的頭像 發表于 03-20 15:03 ?652次閱讀

    探討DeepSeek-R1滿血版的推理部署與優化策略

    DeepSeek的原廠方案. 1. 前情回顧2. 推理性能指標概述3. 推理系統性能約束3.1 用戶SLA的約束3.2 內存
    的頭像 發表于 02-14 10:19 ?1482次閱讀
    探討DeepSeek-R1滿血版的<b class='flag-5'>推理</b>部署與優化策略

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    Pro模型進行了深度優化。 這一優化舉措使得AI開發者能夠以更低的成本和更高的效率實現復雜任務的部署與優化。英特爾Gaudi 2D AI加速器通過其卓越的計算能力和高度優化的軟件棧,為Janus Pro
    的頭像 發表于 02-10 11:10 ?628次閱讀

    DeepSeek發布Janus Pro模型,英特爾Gaudi 2D AI加速器優化支持

    Gaudi 2D AI加速器現已針對該模型進行了全面優化。這一優化舉措使得AI開發者能夠更輕松地實現復雜任務的部署與優化,從而有效滿足行業應用對于推理算力的迫切需求。 英特爾
    的頭像 發表于 02-08 14:35 ?625次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?725次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理性能</b>

    助力AIoT應用:米爾FPGA開發板實現Tiny YOLO V4

    受限的設備運行,尤其低功耗、實時檢測的邊緣計算設備中表現出色。相比傳統 GPU,FPGA 能在小面積和低功耗下實現類似的推理性能,非常契合 AIoT 應用。像米爾 ZU3EG 這樣的 FPGA
    發表于 12-06 17:18

    Arm KleidiAI助力提升PyTorchLLM推理性能

    熱門的深度學習框架尤為突出,許多企業均會選擇其作為開發 AI 應用的庫。通過部署 Arm Kleidi 技術,Arm 正在努力優化 PyTorch,以加速基于 Arm 架構的處理器運行 LLM 的性能。Arm 通過將 Kle
    的頭像 發表于 12-03 17:05 ?1492次閱讀
    Arm KleidiAI助力提升PyTorch<b class='flag-5'>上</b>LLM<b class='flag-5'>推理性能</b>

    澎峰科技高性能模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領先的智能計算服務提供商,
    的頭像 發表于 09-29 10:14 ?1480次閱讀
    澎峰科技高<b class='flag-5'>性能</b>大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    眾,3D-UNet和CosmoFlow兩個模型共計八項測試中,斬獲五項冠軍。 MLPerf? Storage v1.0 AI存儲基準
    的頭像 發表于 09-28 16:46 ?413次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準<b class='flag-5'>測試</b>五項<b class='flag-5'>性能</b>全球第一

    英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型

    模型單個H100 GPU的表現非常優秀,推理過程中可以單個 GPU
    的頭像 發表于 09-26 17:30 ?930次閱讀

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    。 中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》(征求意見稿)相關要求,使用AISBench?2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI大模型
    的頭像 發表于 09-06 15:33 ?828次閱讀
    開箱即用,AISBench<b class='flag-5'>測試</b>展示英特爾至強處理器的卓越<b class='flag-5'>推理性能</b>

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型推理性能,方便了
    的頭像 發表于 08-23 15:48 ?1142次閱讀
    主站蜘蛛池模板: 丁香五月情 | 激情婷婷综合久久久久 | 国产又黄又爽又猛的免费视频播放 | 亚洲午夜久久久精品影院 | 综合五月婷婷 | 夜夜天天干 | 欧美性极品xxxxx | 神马午夜51| 欧美丝妇 | 天天色官网| 日韩一级片在线免费观看 | 久久国产午夜精品理论篇小说 | 国产精品主播在线观看 | 亚洲国产一区二区三区在线观看 | 久久精品免视看国产成人2021 | 黄色hd| 日本三级hd高清电影 | 国产视频精品久久 | 女人色视频 | 亚洲最大黄色网址 | 人人澡 人人澡 人人看 | 天天天干干干 | www性| 婷婷国产成人久久精品激情 | 一本大道加勒比久久综合 | 夜色资源站www国产在线观看 | 日本在线不卡免费 | 免费h视频在线观看 | 免费视频在线播放 | 色狠狠成人综合网 | 亚洲国产精品久久久久婷婷软件 | 白嫩美女在线啪视频观看 | 国产免费啪啪 | 狠狠色噜噜狠狠狠狠 | 国产成人啪午夜精品网站男同 | 天天操夜夜操夜夜操 | 天天噜日日噜夜夜噜 | 伊人久久影视 | 欧美视频一区二区三区四区 | 免费大秀视频在线播放 | 在线网址你懂的 |