在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2023-11-16 21:15 ? 次閱讀

微軟 Ignite 2023 技術大會發布的新工具和資源包括 OpenAIChatAPI 的 TensorRT-LLM 封裝接口、RTX 驅動的性能改進 DirectMLforLlama2、其他熱門 LLM

Windows PC 上的 AI 標志著科技史上的關鍵時刻,它將徹底改變玩家、創作者、主播、上班族、學生乃至普通 PC 用戶的體驗。

AI 為 1 億多臺采用 RTX GPU 的 Windows PC 和工作站提高生產力帶來前所未有的機會。NVIDIA RTX 技術使開發者更輕松地創建 AI 應用,從而改變人們使用計算機的方式。

在微軟 Ignite 2023 技術大會上發布的全新優化、模型和資源將更快地幫助開發者提供新的終端用戶體驗。

TensorRT-LLM 是一款提升 AI 推理性能的開源軟件,它即將發布的更新將支持更多大語言模型,在 RTX GPU 8GB 及以上顯存的 PC 和筆記本電腦上使要求嚴苛的 AI 工作負載更容易完成。

Tensor RT-LLM for Windows 即將通過全新封裝接口與 OpenAI 廣受歡迎的聊天 API 兼容。這將使數以百計的開發者項目和應用能在 RTX PC 的本地運行,而非云端運行,因此用戶可以在 PC 上保留私人和專有數據。

定制的生成式 AI 需要時間和精力來維護項目。特別是跨多個環境和平臺進行協作和部署時,該過程可能會異常復雜和耗時。

AI Workbench 是一個統一、易用的工具包,允許開發者在 PC 或工作站上快速創建、測試和定制預訓練生成式 AI 模型和 LLM。它為開發者提供一個單一平臺,用于組織他們的 AI 項目,并根據特定用戶需求來調整模型。

這使開發者能夠進行無縫協作和部署,快速創建具有成本效益、可擴展的生成式 AI 模型。加入搶先體驗名單,成為首批用戶以率先了解不斷更新的功能,并接收更新信息。

為支持 AI 開發者,NVIDIA 與微軟發布 DirectML 增強功能以加速最熱門的基礎 AI 模型之一的 Llama 2。除了全新性能標準,開發者現在有更多跨供應商部署可選。

便攜式 AI

2023 年 10 月,NVIDIA 發布 TensorRT-LLM for Windows —— 一個用于加速大語言模型(LLM)推理的庫。

本月底發布的 TensorRT-LLM v0.6.0 更新將帶來至高達 5 倍的推理性能提升,并支持更多熱門的 LLM,包括全新 Mistral 7B 和 Nemotron-3 8B。這些 LLM 版本將可在所有采用 8GB 及以上顯存的 GeForce RTX 30系列和 40系列 GPU 上運行,從而使最便攜的 Windows PC 設備也能獲得快速、準確的本地運行 LLM 功能。

wKgaomVWFwiAI5yYAAD9zpwM1bA457.jpg

TensorRT-LLM v0.6.0

帶來至高達 5 倍推理性能提升

新發布的 TensorRT-LLM 可在/NVIDIA/TensorRT-LLMGitHub 代碼庫中下載安裝,新調優的模型將在ngc.nvidia.com提供。

從容對話

世界各地的開發者和愛好者將 OpenAI 的聊天 API 廣泛用于各種應用——從總結網頁內容、起草文件和電子郵件,到分析和可視化數據以及創建演示文稿。

這類基于云的 AI 面臨的一大挑戰是它們需要用戶上傳輸入數據,因此對于私人或專有數據以及處理大型數據集來說并不實用。

為應對這一挑戰,NVIDIA 即將啟用 TensorRT-LLM for Windows,通過全新封裝接口提供與 OpenAI 廣受歡迎的 ChatAPI 類似的 API 接口,為開發者帶來類似的工作流,無論他們設計的模型和應用要在 RTX PC 的本地運行,還是在云端運行。只需修改一兩行代碼,數百個 AI 驅動的開發者項目和應用現在就能從快速的本地 AI 中受益。用戶可將數據保存在 PC 上,不必擔心將數據上傳到云端。

使用由 TensorRT-LLM 驅動的

Microsoft VS Code 插件 Continue.dev 編碼助手

此外,最重要的一點是這些項目和應用中有很多都是開源的,開發者可以輕松利用和擴展它們的功能,從而加速生成式 AI 在 RTX 驅動的 Windows PC 上的應用。

該封裝接口可與所有對 TensorRT-LLM 進行優化的 LLM (如,Llama 2、Mistral 和 NV LLM)配合使用,并作為參考項目在 GitHub 上發布,同時發布的還有用于在 RTX 上使用 LLM 的其他開發者資源。

模型加速

開發者現可利用尖端的 AI 模型,并通過跨供應商 API 進行部署。NVIDIA 和微軟一直致力于增強開發者能力,通過 DirectML API 在 RTX 上加速 Llama。

在 10 月宣布的為這些模型提供最快推理性能的基礎上,這一跨供應商部署的全新選項使將 AI 引入 PC 變得前所未有的簡單。

開發者和愛好者可下載最新的 ONNX 運行時并按微軟的安裝說明進行操作,同時安裝最新 NVIDIA 驅動(將于 11 月 21 日發布)以獲得最新優化體驗。

這些新優化、模型和資源將加速 AI 功能和應用在全球 1 億臺 RTX PC 上的開發和部署,一并加入 400 多個合作伙伴的行列,他們已經發布了由 RTX GPU 加速的 AI 驅動的應用和游戲。

隨著模型易用性的提高,以及開發者將更多生成式 AI 功能帶到 RTX 驅動的 Windows PC 上,RTX GPU 將成為用戶利用這一強大技術的關鍵。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,立即注冊 GTC 大會。


原文標題:點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3854

    瀏覽量

    92070

原文標題:點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?199次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    新品| LLM630 Compute Kit,AI 大語言模型推理開發平臺

    LLM630LLM推理,視覺識別,可開發,靈活擴展···LLM630ComputeKit是一款AI大語言模型
    的頭像 發表于 01-17 18:48 ?179次閱讀
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,<b class='flag-5'>AI</b> 大語言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>開發平臺

    NVIDIA推出面向RTX AI PCAI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?261次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-L
    的頭像 發表于 12-25 17:31 ?273次閱讀
    <b class='flag-5'>在</b>NVIDIA <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?291次閱讀

    Arm KleidiAI助力提升PyTorchLLM推理性能

    熱門的深度學習框架尤為突出,許多企業均會選擇其作為開發 AI 應用的庫。通過部署 Arm Kleidi 技術,Arm 正在努力優化 PyTorch,以加速基于 Arm 架構的處理器
    的頭像 發表于 12-03 17:05 ?946次閱讀
    Arm KleidiAI助力提升PyTorch<b class='flag-5'>上</b><b class='flag-5'>LLM</b><b class='flag-5'>推理性能</b>

    NVIDIA TensorRT-LLM Roadmap現已在GitHub公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM支持TensorRT-LLM 的 Roadmap 現已在 GitHub 公開發布!
    的頭像 發表于 11-28 10:43 ?346次閱讀
    NVIDIA <b class='flag-5'>TensorRT-LLM</b> Roadmap現已在GitHub<b class='flag-5'>上</b>公開發布

    TensorRT-LLM低精度推理優化

    本文將分享 TensorRT-LLM 中低精度量化內容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發表于 11-19 14:29 ?488次閱讀
    <b class='flag-5'>TensorRT-LLM</b>低精度<b class='flag-5'>推理</b>優化

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    。 中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》(征求意見稿)相關要求,使用AISBench?2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI模型
    的頭像 發表于 09-06 15:33 ?437次閱讀
    開箱即用,AISBench測試展示英特爾至強處理器的卓越<b class='flag-5'>推理性能</b>

    RTX AI PC和工作站提供強大AI性能

    由 NVIDIA RTX 和 GeForce RTX 技術驅動AI PC 時代已經到來。在這一背景下,一種評估
    的頭像 發表于 08-23 16:57 ?730次閱讀

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型
    的頭像 發表于 08-23 15:48 ?535次閱讀

    LLM模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型
    的頭像 發表于 07-24 11:38 ?1030次閱讀

    NVIDIA推出用于支持全新GeForce RTX AI筆記本電腦運行AI助手及數字人

    NVIDIA 宣布推出全新 NVIDIA RTX?技術,用于支持全新 GeForce RTX AI 筆記本電腦
    的頭像 發表于 06-04 10:19 ?925次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型TensorRT-LLM 是一個開源庫,用于優化從
    的頭像 發表于 04-28 10:36 ?648次閱讀

    自然語言處理應用LLM推理優化綜述

    當前,業界將傳統優化技術引入 LLM 推理的同時,同時也探索從大模型自回歸解碼特點出發,通過調整推理
    發表于 04-10 11:48 ?688次閱讀
    自然語言處理應用<b class='flag-5'>LLM</b><b class='flag-5'>推理</b>優化綜述
    主站蜘蛛池模板: 国产免费好大好硬视频 | 天天射美女 | 欧美线人一区二区三区 | 五月六月伊人狠狠丁香网 | 丁香六月纪婷婷激情综合 | 日本在线黄色网址 | 加勒比黑人喝羽月希奶水 | 天堂在线最新资源 | 久久精品综合视频 | 天天操天天艹 | www.色老头.com | 欧美性猛交xxxx免费看久久 | 日日噜夜夜噜 | 四虎影院成人 | 黄网站色视频免费看无下截 | 免费a级网站 | 亚洲人成电影院 | 日本最新免费网站 | 免费的黄色的视频 | 日本不卡高清视频 | 韩国中文字幕在线观看 | 亚洲黄网在线 | 成 人 免费观看网站 | 欧洲不卡一卡2卡三卡4卡网站 | 在线高清视频大全 | 中文字幕不卡一区 | 欧美一级鲁丝片 | 91一区二区三区四区五区 | 999毛片免费观看 | 久久h| 色网站观看 | 国产高清美女一级a毛片 | 操插干 | 欧美天天性 | 色天使久久综合给合久久97色 | 女人被男人免费播放网站 | 黄色三级视频在线观看 | 色偷偷免费 | 亚洲va欧美va国产综合久久 | 性欧美黑人巨大videos | 成人激情综合网 |