在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-11-28 10:43 ? 次閱讀

感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!

TensorRT-LLM

持續助力用戶優化推理性能

TensorRT-LLM 可在 NVIDIA GPU 上加速和優化最新的大語言模型(Large Language Models)的推理性能。該開源程序庫在 /NVIDIA/TensorRT-LLM GitHub 資源庫中免費提供。

近期,我們收到了許多用戶的積極反饋,并表示,TensorRT-LLM 不僅顯著提升了性能表現,還成功地將其應用集成到各自的業務中。TensorRT-LLM 強大的性能和與時俱進的新特性,為客戶帶來了更多可能性。

Roadmap 現已公開發布

過往,許多用戶在將 TensorRT-LLM 集成到自身軟件棧的過程中,總是希望能更好地了解 TensorRT-LLM 的 Roadmap。即日起,NVIDIA 正式對外公開 TensorRT-LLM 的 Roadmap ,旨在幫助用戶更好地規劃產品開發方向。

我們非常高興地能與用戶分享,TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布。您可以通過以下鏈接隨時查閱:

https://github.com/NVIDIA/TensorRT-LLM

d88235d6-acaa-11ef-93f3-92fbcf53809c.png

圖 1. NVIDIA/TensorRT-LLM GitHub 網頁截屏

這份 Roadmap 將為您提供關于未來支持的功能、模型等重要信息,助力您提前部署和開發。

同時,在 Roadmap 頁面的底部,您可通過反饋鏈接提交問題。無論是問題報告還是新功能建議,我們都期待收到您的寶貴意見。

d8915bb0-acaa-11ef-93f3-92fbcf53809c.png

圖 2.Roadmap 整體框架介紹

利用 TensorRT-LLM

優化大語言模型推理

TensorRT-LLM 是一個用于優化大語言模型(LLM)推理的庫。它提供最先進的優化功能,包括自定義 Attention Kernel、Inflight Batching、Paged KV Caching、量化技術(FP8、INT4 AWQ、INT8 SmoothQuant 等)以及更多功能,以讓你手中的 NVIDIA GPU 能跑出極致推理性能。

TensorRT-LLM 已適配大量的流行模型。通過類似 PyTorch 的 Python API,可以輕松修改和擴展這些模型以滿足自定義需求。以下是已支持的模型列表。

d89b7758-acaa-11ef-93f3-92fbcf53809c.png

我們鼓勵所有用戶定期查閱 TensorRT-LLM Roadmap。這不僅有助于您及時了解 TensorRT-LLM 的最新動態,還能讓您的產品開發與 NVIDIA 的技術創新保持同步。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5258

    瀏覽量

    105852
  • GitHub
    +關注

    關注

    3

    文章

    481

    瀏覽量

    17480
  • LLM
    LLM
    +關注

    關注

    1

    文章

    321

    瀏覽量

    697

原文標題:NVIDIA TensorRT-LLM Roadmap 現已在 GitHub 上公開發布!

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Love
    的頭像 發表于 06-12 15:37 ?286次閱讀
    使用<b class='flag-5'>NVIDIA</b> Triton和<b class='flag-5'>TensorRT-LLM</b>部署TTS應用的最佳實踐

    LM Studio使用NVIDIA技術加速LLM性能

    隨著 AI 使用場景不斷擴展(從文檔摘要到定制化軟件代理),開發者和技術愛好者正在尋求以更 快、更靈活的方式來運行大語言模型(LLM)。
    的頭像 發表于 06-06 15:14 ?112次閱讀
    LM Studio使用<b class='flag-5'>NVIDIA</b>技術加速<b class='flag-5'>LLM</b>性能

    小白學大模型:從零實現 LLM語言模型

    在當今人工智能領域,大型語言模型(LLM)的開發已經成為一個熱門話題。這些模型通過學習大量的文本數據,能夠生成自然語言文本,完成各種復雜的任務,如寫作、翻譯、問答等。https
    的頭像 發表于 04-30 18:34 ?358次閱讀
    小白學大模型:從零實現 <b class='flag-5'>LLM</b>語言模型

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發

    NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的
    的頭像 發表于 03-28 09:59 ?528次閱讀

    無法在OVMS運行來自Meta的大型語言模型 (LLM),為什么?

    無法在 OVMS 運行來自 Meta 的大型語言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時遇到錯誤。
    發表于 03-05 08:07

    京東廣告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速實踐

    、個性化召回、深度召回等),以召回大量候選商品。隨后,系統通過相對簡單的粗排模型對候選集進行初步篩選,縮小候選范圍,最后通過精排和重排模型,確定最終返回給用戶的推薦結果。 隨著大語言模型(LLM)在推薦系統中的應用,生成
    的頭像 發表于 01-14 15:17 ?476次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-L
    的頭像 發表于 12-25 17:31 ?645次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?734次閱讀

    如何在 OrangePi 5 Pro?的?NPU?運行?LLM

    在OrangePi5Pro上訪問NPU需要安裝最新版Ubuntu的定制版本,還需要安裝特殊軟件,讓你能在NPU而不是CPU運行專門轉換的LLM。整個過程肯定要比運行Ollama復雜得多,但如果你
    的頭像 發表于 11-28 14:55 ?1142次閱讀
    如何在 OrangePi 5 Pro?的?NPU?<b class='flag-5'>上</b>運行?<b class='flag-5'>LLM</b>

    TensorRT-LLM低精度推理優化

    本文將分享 TensorRT-LLM 中低精度量化內容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發表于 11-19 14:29 ?1113次閱讀
    <b class='flag-5'>TensorRT-LLM</b>低精度推理優化

    Arm推出GitHub平臺AI工具,簡化開發者AI應用開發部署流程

    專為 GitHub Copilot 設計的 Arm 擴展程序,可加速從云到邊緣側基于 Arm 平臺的開發。 Arm 原生運行器為部署云原生、Windows on Arm 以及云到邊緣側的 AI
    的頭像 發表于 10-31 18:51 ?3252次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI 訓練的數據集。
    的頭像 發表于 09-06 14:59 ?653次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助<b class='flag-5'>開發</b>者生成合成訓練數據

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,提高了大模型產業應用效率,更大規模地釋放大模型的
    的頭像 發表于 08-23 15:48 ?1013次閱讀

    新款Nvidia Titan GPU正在開發中?或將擊敗未發布的RTX 5090

    ABSTRACT摘要最近有消息透露,NVIDIA正在開發一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發布其RTX40系列
    的頭像 發表于 07-26 08:26 ?744次閱讀
    新款<b class='flag-5'>Nvidia</b> Titan GPU正在<b class='flag-5'>開發</b>中?或將擊敗未<b class='flag-5'>發布</b>的RTX 5090

    Mistral Large 2現已在Amazon Bedrock中正式可用

    北京2024年7月25日 /美通社/ -- 亞馬遜云科技宣布,Mistral AI的Mistral Large 2(24.07)基礎模型(FM)現已在Amazon Bedrock中正式可用
    的頭像 發表于 07-26 08:07 ?487次閱讀
    主站蜘蛛池模板: 手机视频在线播放 | 99久久综合 | 成人国内精品久久久久影院 | 欧美天堂视频 | 一本到卡二卡三卡免费高 | 黄色免费网站视频 | 伊人最新网址 | 午夜神马福利 | 一二三区电影 | 香蕉成人国产精品免费看网站 | 蕾丝视频在线播放 | 天天干天天噜 | 狠狠色96视频| 99久久精品免费观看国产 | 新版天堂资源在线官网8 | 三级网站在线 | 精品久久看 | 特级aaa片毛片免费观看 | 亚洲色图欧美激情 | 亚色影视 | 69国产| 天堂中文资源网 | 亚洲天堂bt | 狠狠操欧美 | 美女免费视频一区二区三区 | 久久国产精品岛国搬运工 | 国产美女视频一区二区三区 | 美剧免费在线观看 | 午夜色综合 | 亚洲一区免费在线观看 | 天天射天天干天天舔 | 一级a爱片久久毛片 | 日本丶国产丶欧美色综合 | 男女爱爱免费视频 | 202z国产高清日本在线播放 | 久久人人视频 | 亚洲三级成人 | 手机在线观看国产精选免费 | 51午夜 | 亚洲国产精品嫩草影院 | 国内亚州视频在线观看 |