在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基準分數突出了廣泛的機器學習推理性能

張艷 ? 來源:Lucia_nie ? 作者:Lucia_nie ? 2022-07-21 10:23 ? 次閱讀

繼今年早些時候發布的訓練基準分數之后,MLPerf 發布了其推理基準的第一組基準分數。

與目前有 5 家公司的 63 份參賽作品的訓練輪相比,更多的公司提交了基于 MobileNet、ResNet、Yolo 等神經網絡架構的推理結果??偣灿衼碜?14 個組織的 500 多個分數進行了驗證。這包括來自幾家初創公司的數據,而一些知名初創公司仍然明顯缺席。

在封閉的部門,其嚴格的條件可以直接比較系統,結果顯示性能差異為 5 個數量級,并且在估計的功耗方面跨越三個數量級。在開放部門中,提交可以使用一系列模型,包括低精度實現。

Nvidia 在封閉部門的所有類別中都獲得了商用設備的第一名。其他領先者包括數據中心類別的 Habana Labs、谷歌和英特爾,而 Nvidia 在邊緣類別中與英特爾和高通競爭。

pYYBAGLXT8uAc4TSAAEshK1KHAk991.jpg

英偉達用于數據中心推理的 EGX 平臺(圖片:英偉達)

Moor Insights and Strategy 分析師 Karl Freund 表示:“Nvidia 是唯一一家擁有生產芯片、軟件、可編程性和人才的公司,可以發布跨 MLPerf 范圍內的基準測試,并在幾乎所有類別中獲勝?!?“GPU 的可編程性為未來的 MLPerf 版本提供了獨特的優勢……我認為這展示了 [Nvidia] 實力的廣度,以及挑戰者的利基性質。但隨著時間的推移,許多挑戰者會變得成熟,因此英偉達需要繼續在硬件和軟件方面進行創新?!?/p>

Nvidia 發布的圖表顯示了其對結果的解釋,在商用設備的封閉部門的所有四個場景中,它都位居第一。

這些場景代表不同的用例。離線和服務器場景用于數據中心的推理。離線場景可能代表大量圖片的離線照片標記并測量純吞吐量。服務器場景代表一個用例,其中包含來自不同用戶的多個請求,在不可預測的時間提交請求,并在固定時間測量吞吐量。邊緣場景是單流,它對單個圖像進行推理,例如在手機應用程序中,以及多流,它測量可以同時推理多少個圖像流,用于多攝像頭系統。

公司可以為選定的機器學習模型提交結果,這些模型在四種場景中的每一種中執行圖像分類、對象檢測和語言翻譯。

數據中心結果

“從數據中心的結果來看,Nvidia 在服務器和離線類別的所有五個基準測試中均名列前茅,”Nvidia 加速計產品管理總監 Paresh Kharya 說?!霸谏逃媒鉀Q方案中,我們的 Turing GPU 的性能優于其他所有人。”

Kharya 強調了這樣一個事實,即英偉達是唯一一家在數據中心類別的所有五個基準模型中提交結果的公司,而對于服務器類別(這是更困難的情況),英偉達的性能相對于其競爭對手有所提高。

pYYBAGLXT9CAY9DfAADuOqQxTLg534.jpg

選定的數據中心基準測試結果來自封閉部門,在商用設備類別中處于領先地位。結果顯示相對于每個加速器的 Nvidia 分數。X 代表“未提交結果”(圖片:Nvidia)

英偉達在數據中心領域最接近的競爭對手是擁有Goya 推理芯片的以色列初創公司 Habana Labs 。

分析師 Karl Freund 表示:“Habana 是唯一一個全面生產高性能芯片的挑戰者,當下一個 MLPerf 套件有望包含功耗數據時,它應該會做得很好?!?/p>

Habana Labs 在接受 EETimes 采訪時指出,基準分數純粹基于性能——功耗不是衡量標準,實用性也不是(例如考慮解決方案是被動冷卻還是水冷),成本也不是。

poYBAGLXT9mAV4bIAAD-pxpLakQ911.jpg

Habana Labs PCIe 卡采用 Goya 推理芯片(圖片:Habana Labs)

Habana 還使用開放分區來展示其低延遲能力,比封閉分區進一步限制延遲,并為多流場景提交結果。

邊緣計算結果

在邊緣基準測試中,Nvidia 贏得了所有四個在封閉部門提交商用解決方案的類別。高通的 Snapdragon 855 SoC 和英特爾的 Xeon CPU 在單流類別中落后于英偉達,高通和英特爾都沒有提交更困難的多流場景的結果。

poYBAGLXT9-AeURxAADPVeR-l4A989.jpg

選定的邊緣基準測試結果來自封閉部門,在商用設備類別中處于領先地位。結果顯示相對于每個加速器的 Nvidia 分數。X 代表“未提交結果”(圖片:Nvidia)

“預覽”系統(尚未商業化)的結果將阿里巴巴 T-Head 的含光芯片與英特爾的 Nervana NNP-I、Hailo-8和 Centaur Technologies 的參考設計進行了對比。與此同時,研發類別的特色是一家隱秘的韓國初創公司 Furiosa AI,對此我們知之甚少。

MLPerf 網站上提供了最近的推理分數以及早期的訓練分數。



審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 基準測試
    +關注

    關注

    0

    文章

    21

    瀏覽量

    7620
  • 機器學習
    +關注

    關注

    66

    文章

    8453

    瀏覽量

    133143
收藏 人收藏

    評論

    相關推薦

    探討DeepSeek-R1滿血版的推理部署與優化策略

    DeepSeek的原廠方案. 1. 前情回顧2. 推理性能指標概述3. 推理系統性能約束3.1 用戶SLA的約束3.2 內存
    的頭像 發表于 02-14 10:19 ?30次閱讀
    探討DeepSeek-R1滿血版的<b class='flag-5'>推理</b>部署與優化策略

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?236次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理性能</b>

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    共同挑戰:如何從高維噪聲數據中提取有效特征?如何平衡模型復雜度和計算效率?如何保證系統在真實環境中的穩定性?書中提出的技術方案對我的工作很有啟發。多模態融合策略可用于處理異構數據源,元學習思想可指導增量學習系統設計,而模型優化方法則有助于提升
    發表于 12-24 15:03

    NVIDIA Jetson Orin Nano開發者套件的新功能

    生成式 AI 領域正在迅速發展,每天都有新的大語言模型(LLM)、視覺語言模型(VLM)和視覺語言動作模型(VLA)出現。為了在這一充滿變革的時代保持領先,開發者需要一個足夠強大的平臺將云端的最新模型無縫部署到邊緣,從而獲得基于 CUDA 的優化推理性能和開放式機器
    的頭像 發表于 12-23 12:54 ?362次閱讀
    NVIDIA Jetson Orin Nano開發者套件的新功能

    利用Arm Kleidi技術實現PyTorch優化

    PyTorch 是一個廣泛應用的開源機器學習 (ML) 庫。近年來,Arm 與合作伙伴通力協作,持續改進 PyTorch 的推理性能。本文將詳細介紹如何利用 Arm Kleidi 技術
    的頭像 發表于 12-23 09:19 ?421次閱讀
    利用Arm Kleidi技術實現PyTorch優化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    Batching、Paged KV Caching、量化技術 (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能,確保您的 NVIDIA GPU 能發揮出卓越的推理性能。
    的頭像 發表于 12-17 17:47 ?315次閱讀

    Arm KleidiAI助力提升PyTorch上LLM推理性能

    熱門的深度學習框架尤為突出,許多企業均會選擇其作為開發 AI 應用的庫。通過部署 Arm Kleidi 技術,Arm 正在努力優化 PyTorch,以加速在基于 Arm 架構的處理器上運行 LLM 的性能。Arm 通過將 Kle
    的頭像 發表于 12-03 17:05 ?961次閱讀
    Arm KleidiAI助力提升PyTorch上LLM<b class='flag-5'>推理性能</b>

    Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機器學習框架

    KleidiAI 技術融入騰訊混元自研的 Angel 機器學習框架。這一合作旨在提高移動端人工智能 (AI) 服務的推理性能和效率,為用戶提供卓越
    的頭像 發表于 11-24 15:33 ?791次閱讀

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    近期,第五代英特爾?至強?可擴展處理器通過了中國電子技術標準化研究院組織的人工智能服務器系統性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業
    的頭像 發表于 09-06 15:33 ?442次閱讀
    開箱即用,AISBench測試展示英特爾至強處理器的卓越<b class='flag-5'>推理性能</b>

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,提高了大模型產業應用效率,更大規模地釋放大模型的應用價值?!?/div>
    的頭像 發表于 08-23 15:48 ?545次閱讀

    學習筆記|如何移植NCNN

    隊的步伐,揭秘他們如何進行NCNN的交叉編譯,并在ELF1開發板上演繹實踐,以此驗證模型推理性能。1、從GitHub下載NCNN源碼:https://github.c
    的頭像 發表于 05-29 10:06 ?1176次閱讀
    <b class='flag-5'>學習</b>筆記|如何移植NCNN

    自然語言處理應用LLM推理優化綜述

    當前,業界在將傳統優化技術引入 LLM 推理的同時,同時也在探索從大模型自回歸解碼特點出發,通過調整推理過程和引入新的模型結構來進一步提升推理性能
    發表于 04-10 11:48 ?697次閱讀
    自然語言處理應用LLM<b class='flag-5'>推理</b>優化綜述

    UL Procyon AI 發布圖像生成基準測試,基于Stable Diffusion

    UL去年發布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載,用以保證各支持硬件間公平、可比的
    的頭像 發表于 03-25 16:16 ?983次閱讀

    深度探討VLMs距離視覺演繹推理還有多遠?

    通用大型語言模型(LLM)推理基準:研究者們介紹了多種基于文本的推理任務和基準,用于評估LLMs在不同領域(如常識、數學推理、常識
    發表于 03-19 14:32 ?391次閱讀
    深度探討VLMs距離視覺演繹<b class='flag-5'>推理</b>還有多遠?

    瑞薩電子宣布推出一款面向高性能機器人應用的新產品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速器無需冷卻風扇即可提供高達80TOPS的AI推理性能
    的頭像 發表于 03-01 10:41 ?912次閱讀
    瑞薩電子宣布推出一款面向高<b class='flag-5'>性能</b><b class='flag-5'>機器</b>人應用的新產品—RZ/V2H
    主站蜘蛛池模板: 国产老师的丝袜在线看 | 男女视频在线观看 | 四虎影院新地址 | 明日花绮罗在线观看 | 国产成人精品高清免费 | 3344免费播放观看视频 | 久久婷婷色综合老司机 | 激情免费视频 | 迅雷www天堂在线资源 | 欧美性猛交xxxx黑人喷水 | 久久久久毛片成人精品 | 亚洲最大毛片 | 午夜在线影视 | 狠狠做久久深爱婷婷97动漫 | 特级黄色淫片 | 啪啪网站免费观看 | 月夜免费观看完整视频 | 4虎影视国产在线观看精品 4虎影院永久地址www | 亚洲国产网址 | 日韩免费一区 | 欧美成人免费高清网站 | 国产成人一区二区在线不卡 | www.天天射.com| 一级视频片 | 可以免费看黄的网址 | 欧美日韩一区二区三区视视频 | 日本大片在线看 | 日本高清不卡视频 | 色噜噜狠狠狠狠色综合久 | 永久黄网站色视频免费 | 521色香蕉网在线观看免费 | 一区二区在线看 | 特黄特色三级在线观看 | 视频一区二区免费 | 国产精品伦子一区二区三区 | 日本一区视频在线播放 | 天天干夜夜操视频 | 日本三级成人中文字幕乱码 | 中国一级特黄真人毛片 | 亚洲色图25p | 五月婷婷色 |