在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2023-11-16 21:15 ? 次閱讀

微軟 Ignite 2023 技術大會發布的新工具和資源包括 OpenAIChatAPI 的 TensorRT-LLM 封裝接口、RTX 驅動的性能改進 DirectMLforLlama2、其他熱門 LLM

Windows PC 上的 AI 標志著科技史上的關鍵時刻,它將徹底改變玩家、創作者、主播、上班族、學生乃至普通 PC 用戶的體驗。

AI 為 1 億多臺采用 RTX GPU 的 Windows PC 和工作站提高生產力帶來前所未有的機會。NVIDIA RTX 技術使開發者更輕松地創建 AI 應用,從而改變人們使用計算機的方式。

在微軟 Ignite 2023 技術大會上發布的全新優化、模型和資源將更快地幫助開發者提供新的終端用戶體驗。

TensorRT-LLM 是一款提升 AI 推理性能的開源軟件,它即將發布的更新將支持更多大語言模型,在 RTX GPU 8GB 及以上顯存的 PC 和筆記本電腦上使要求嚴苛的 AI 工作負載更容易完成。

Tensor RT-LLM for Windows 即將通過全新封裝接口與 OpenAI 廣受歡迎的聊天 API 兼容。這將使數以百計的開發者項目和應用能在 RTX PC 的本地運行,而非云端運行,因此用戶可以在 PC 上保留私人和專有數據。

定制的生成式 AI 需要時間和精力來維護項目。特別是跨多個環境和平臺進行協作和部署時,該過程可能會異常復雜和耗時。

AI Workbench 是一個統一、易用的工具包,允許開發者在 PC 或工作站上快速創建、測試和定制預訓練生成式 AI 模型和 LLM。它為開發者提供一個單一平臺,用于組織他們的 AI 項目,并根據特定用戶需求來調整模型。

這使開發者能夠進行無縫協作和部署,快速創建具有成本效益、可擴展的生成式 AI 模型。加入搶先體驗名單,成為首批用戶以率先了解不斷更新的功能,并接收更新信息。

為支持 AI 開發者,NVIDIA 與微軟發布 DirectML 增強功能以加速最熱門的基礎 AI 模型之一的 Llama 2。除了全新性能標準,開發者現在有更多跨供應商部署可選。

便攜式 AI

2023 年 10 月,NVIDIA 發布 TensorRT-LLM for Windows —— 一個用于加速大語言模型(LLM)推理的庫。

本月底發布的 TensorRT-LLM v0.6.0 更新將帶來至高達 5 倍的推理性能提升,并支持更多熱門的 LLM,包括全新 Mistral 7B 和 Nemotron-3 8B。這些 LLM 版本將可在所有采用 8GB 及以上顯存的 GeForce RTX 30系列和 40系列 GPU 上運行,從而使最便攜的 Windows PC 設備也能獲得快速、準確的本地運行 LLM 功能。

wKgaomVWFwiAI5yYAAD9zpwM1bA457.jpg

TensorRT-LLM v0.6.0

帶來至高達 5 倍推理性能提升

新發布的 TensorRT-LLM 可在/NVIDIA/TensorRT-LLMGitHub 代碼庫中下載安裝,新調優的模型將在ngc.nvidia.com提供。

從容對話

世界各地的開發者和愛好者將 OpenAI 的聊天 API 廣泛用于各種應用——從總結網頁內容、起草文件和電子郵件,到分析和可視化數據以及創建演示文稿。

這類基于云的 AI 面臨的一大挑戰是它們需要用戶上傳輸入數據,因此對于私人或專有數據以及處理大型數據集來說并不實用。

為應對這一挑戰,NVIDIA 即將啟用 TensorRT-LLM for Windows,通過全新封裝接口提供與 OpenAI 廣受歡迎的 ChatAPI 類似的 API 接口,為開發者帶來類似的工作流,無論他們設計的模型和應用要在 RTX PC 的本地運行,還是在云端運行。只需修改一兩行代碼,數百個 AI 驅動的開發者項目和應用現在就能從快速的本地 AI 中受益。用戶可將數據保存在 PC 上,不必擔心將數據上傳到云端。

使用由 TensorRT-LLM 驅動的

Microsoft VS Code 插件 Continue.dev 編碼助手

此外,最重要的一點是這些項目和應用中有很多都是開源的,開發者可以輕松利用和擴展它們的功能,從而加速生成式 AI 在 RTX 驅動的 Windows PC 上的應用。

該封裝接口可與所有對 TensorRT-LLM 進行優化的 LLM (如,Llama 2、Mistral 和 NV LLM)配合使用,并作為參考項目在 GitHub 上發布,同時發布的還有用于在 RTX 上使用 LLM 的其他開發者資源。

模型加速

開發者現可利用尖端的 AI 模型,并通過跨供應商 API 進行部署。NVIDIA 和微軟一直致力于增強開發者能力,通過 DirectML API 在 RTX 上加速 Llama。

在 10 月宣布的為這些模型提供最快推理性能的基礎上,這一跨供應商部署的全新選項使將 AI 引入 PC 變得前所未有的簡單。

開發者和愛好者可下載最新的 ONNX 運行時并按微軟的安裝說明進行操作,同時安裝最新 NVIDIA 驅動(將于 11 月 21 日發布)以獲得最新優化體驗。

這些新優化、模型和資源將加速 AI 功能和應用在全球 1 億臺 RTX PC 上的開發和部署,一并加入 400 多個合作伙伴的行列,他們已經發布了由 RTX GPU 加速的 AI 驅動的應用和游戲。

隨著模型易用性的提高,以及開發者將更多生成式 AI 功能帶到 RTX 驅動的 Windows PC 上,RTX GPU 將成為用戶利用這一強大技術的關鍵。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,立即注冊 GTC 大會。


原文標題:點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3926

    瀏覽量

    93257

原文標題:點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。
    的頭像 發表于 06-12 15:37 ?373次閱讀
    使用NVIDIA Triton和<b class='flag-5'>TensorRT-LLM</b>部署TTS應用的最佳實踐

    詳解 LLM 推理模型的現狀

    領域的最新研究進展,特別是自DeepSeekR1發布后興起的推理時間計算擴展相關內容。LLM中實施和改進推理簡單來說,基于LLM
    的頭像 發表于 04-03 12:09 ?339次閱讀
    詳解 <b class='flag-5'>LLM</b> <b class='flag-5'>推理模型</b>的現狀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本; NVIDIA Blackwell 推理優化
    的頭像 發表于 03-20 15:03 ?582次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?643次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    新品| LLM630 Compute Kit,AI 大語言模型推理開發平臺

    LLM630LLM推理,視覺識別,可開發,靈活擴展···LLM630ComputeKit是一款AI大語言模型
    的頭像 發表于 01-17 18:48 ?620次閱讀
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,<b class='flag-5'>AI</b> 大語言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>開發平臺

    NVIDIA推出面向RTX AI PCAI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?498次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-L
    的頭像 發表于 12-25 17:31 ?655次閱讀
    <b class='flag-5'>在</b>NVIDIA <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?760次閱讀

    Arm KleidiAI助力提升PyTorchLLM推理性能

    熱門的深度學習框架尤為突出,許多企業均會選擇其作為開發 AI 應用的庫。通過部署 Arm Kleidi 技術,Arm 正在努力優化 PyTorch,以加速基于 Arm 架構的處理器
    的頭像 發表于 12-03 17:05 ?1419次閱讀
    Arm KleidiAI助力提升PyTorch<b class='flag-5'>上</b><b class='flag-5'>LLM</b><b class='flag-5'>推理性能</b>

    NVIDIA TensorRT-LLM Roadmap現已在GitHub公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM支持TensorRT-LLM 的 Roadmap 現已在 GitHub 公開發布!
    的頭像 發表于 11-28 10:43 ?658次閱讀
    NVIDIA <b class='flag-5'>TensorRT-LLM</b> Roadmap現已在GitHub<b class='flag-5'>上</b>公開發布

    TensorRT-LLM低精度推理優化

    本文將分享 TensorRT-LLM 中低精度量化內容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發表于 11-19 14:29 ?1149次閱讀
    <b class='flag-5'>TensorRT-LLM</b>低精度<b class='flag-5'>推理</b>優化

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    。 中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》(征求意見稿)相關要求,使用AISBench?2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI模型
    的頭像 發表于 09-06 15:33 ?719次閱讀
    開箱即用,AISBench測試展示英特爾至強處理器的卓越<b class='flag-5'>推理性能</b>

    RTX AI PC和工作站提供強大AI性能

    由 NVIDIA RTX 和 GeForce RTX 技術驅動AI PC 時代已經到來。在這一背景下,一種評估
    的頭像 發表于 08-23 16:57 ?951次閱讀

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型
    的頭像 發表于 08-23 15:48 ?1040次閱讀

    LLM模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型
    的頭像 發表于 07-24 11:38 ?1698次閱讀
    主站蜘蛛池模板: 黄的三级在线播放 | 免费久久精品国产片香蕉 | 成人黄色一级片 | 噜噜色.com| 狠狠干狠狠爱 | 免费看污视频的网站 | 麻豆国产三级在线观看 | 插插操操 | 亚洲资源最新版在线观看 | 国产一级片免费 | 免费一日本一级裸片在线观看 | 日本一卡二卡3卡四卡网站精品 | 美女鲜嫩bbbb | 538porm在线看国产亚洲 | 人人澡人人草 | 一二三四日本视频社区 | 亚洲人成网站色7799在线观看 | 性欧美另类| 日本三级免费 | 99综合色 | 黑森林福利视频导航 | 久久午夜宅男免费网站 | 国产精品一区二区三 | 手机看片国产精品 | 成年人电影黄色 | 天天干天天舔 | 日本黄色高清视频 | 黄色hd | 欧美成人伊人十综合色 | 色爱综合区 | 窝窝午夜看片成人精品 | 午夜高清福利 | 免费观看视频高清www | 日本污视频 | 福利视频免费观看 | 视频网站免费 | 黄色录像视频网站 | 思思久久好好热精品国产 | 成人精品视频在线观看播放 | 日本在线观看成人小视频 | 四虎国产精品影库永久免费 |