在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天

jf_MYvksKR0 ? 來源:MicroComputer ? 2024-02-23 09:42 ? 次閱讀

NVIDIA今天在其官方博客中表示,今天與谷歌合作,在所有NVIDIA AI平臺上為Gemma推出了優化。Gemma是谷歌最先進的新輕量級2B(20億)和7B(70億)參數開放語言模型,可以在任何地方運行,降低了成本,加快了特定領域用例的創新工作。

這兩家公司的團隊密切合作,主要是使用NVIDIA TensorRT LLM加速谷歌Gemma開源模型的性能。開源模型Gemma采用與Gemini模型相同的底層技術構建,而NVIDIA TensorRT LLM是一個開源庫,用于在數據中心的NVIDIA GPU、云服務器以及帶有NVIDIA RTX GPU的PC上運行時,可以極大優化大型語言模型推理。這也這使得開發人員能夠完全利用全球超過1億臺數量的RTX GPU AI PC完成自己的工作。

9c3d6116-d19c-11ee-a297-92fbcf53809c.png

同時,開發人員還可以在云計算服務器中的NVIDIA GPU上運行Gemma,包括在谷歌云基于H100 Tensor Core GPU,以及很快谷歌將于今年部署的NVIDIA H200 TensorCore GPU——該GPU具有141GB的HBM3e內存,內存帶寬可以達到4.8TB/s。

9c7d73b4-d19c-11ee-a297-92fbcf53809c.png

另外,企業開發人員還可以利用NVIDIA豐富的工具生態系統,包括具有NeMo框架的NVIDIA AI Enterprise和TensorRT LLM,對Gemma進行微調,并在其生產應用程序中部署優化模型。

9c90b0dc-d19c-11ee-a297-92fbcf53809c.png

NVIDIA表示,先期上線支持Gemma的是Chat with RTX,這是一款NVIDIA技術演示應用,使用檢索增強生成和TensorRT LLM擴展,在基于RTX GPU的本地Windows PC上為用戶提供生成式AI應用的功能。通過RTX聊天,用戶可以輕松地將PC上的本地文件連接到大型語言模型,從而使用自己的數據對聊天機器人進行個性化設置。

由于該模型在本地運行,因此可以快速提供結果,并且用戶數據保留在設備上。與基于云的LLM服務不同,使用Chat with RTX聊天可以讓用戶在本地PC上處理敏感數據,而無需與第三方共享或連接互聯網。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103724
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5898
  • LLM
    LLM
    +關注

    關注

    0

    文章

    299

    瀏覽量

    400
  • 生成式AI
    +關注

    關注

    0

    文章

    514

    瀏覽量

    547

原文標題:TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天

文章出處:【微信號:Microcomputer,微信公眾號:Microcomputer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA推出面向RTX AI PC的AI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?244次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發表于 01-06 10:45 ?224次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡稱 ReDrafter) 是蘋果公司為大語言模型 (LLM) 推理開發并開源的一種新型推測解碼技術,該技術現在可與 NVIDIA TensorRT-LLM 一起使用。
    的頭像 發表于 12-25 17:31 ?260次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個專為優化大語言模型 (LLM) 推理而設計的庫。它提供了多種先進的優化技術,包括自定義 Attention Kernel、Inflight
    的頭像 發表于 12-17 17:47 ?278次閱讀

    NVIDIA TensorRT-LLM Roadmap現已在GitHub上公開發布

    感謝眾多用戶及合作伙伴一直以來對NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現已在 GitHub 上公開發布!
    的頭像 發表于 11-28 10:43 ?339次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b> Roadmap現已在GitHub上公開發布

    NVIDIA RTX AI Toolkit擁抱LoRA技術

    RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微調 LLM,最高可將性能提升至原來的 6 倍。
    的頭像 發表于 11-20 09:14 ?333次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>AI</b> Toolkit擁抱LoRA技術

    TensorRT-LLM低精度推理優化

    本文將分享 TensorRT-LLM 中低精度量化內容,并從精度和速度角度對比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發表于 11-19 14:29 ?444次閱讀
    <b class='flag-5'>TensorRT-LLM</b>低精度推理優化

    魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區是中國最具影響力的模型開源社區,致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM,大大提高了大語言模型的推理性能,方便了模型應用部署,提高了大模型產業應用效率,更大規模地釋放大模型的應用價值。”
    的頭像 發表于 08-23 15:48 ?512次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM
    的頭像 發表于 04-28 10:36 ?637次閱讀

    谷歌AI大模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現已在全球范圍內開放使用。這一重要舉措不僅彰顯了谷歌AI領域的領先地位,還為其在全球范圍內的
    的頭像 發表于 02-28 18:12 ?1218次閱讀

    谷歌發布開源AI大模型Gemma

    近日,谷歌發布了全新AI大模型Gemma,這款模型為各種規模的組織提供了前所未有的機會,以負責任的方式在商業應用中進行分發。
    的頭像 發表于 02-28 17:38 ?913次閱讀

    Google Gemma優化后可在NVIDIA GPU上運行

    2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發布面向 Gemma 的優化功能,Gemma
    的頭像 發表于 02-25 11:01 ?510次閱讀

    谷歌發布輕量級開源人工智能模型Gemma

    谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年OpenAI的ChatGPT引領
    的頭像 發表于 02-23 11:38 ?930次閱讀

    谷歌宣布Gemma大模型全球開放使用

    谷歌公司近日宣布,其先進的AI大模型Gemma即日起在全球范圍內開放使用。這一新模型由谷歌DeepMind和其他團隊合作開發,并與其最大的AI
    的頭像 發表于 02-23 10:41 ?826次閱讀

    英偉達推出全新AI聊天機器人

    近日,英偉達(Nvidia)宣布推出其全新的AI聊天機器人——“Chat With RTX”。這款聊天機器人被視為英偉達版的ChatGPT,
    的頭像 發表于 02-19 11:09 ?1006次閱讀
    主站蜘蛛池模板: 小雪被撑暴黑人黑人与亚洲女人 | 亚洲四虎影院 | 日日干天天干 | 色视视频| 无毒不卡在线播放 | 四虎影院视频 | 11111日本网站| 性夜影院爽黄a爽免费视频 性瘾高h姚蕊全文免费阅读 | 在线成人 | 一级毛片看真人在线视频 | 老司机午夜网站 | 免费一区二区视频 | 欧美午夜寂寞影院安卓列表 | 国模福利| 欧美69xx性欧美 | 国产高清在线播放免费观看 | 丁香婷婷亚洲 | 天天干天天日天天射天天操毛片 | v视界影院最新地址 | 韩国黄色三级视频 | 国产欧美另类第一页 | 亚洲成年人免费网站 | 日本欧美一区二区三区免费不卡 | 激情综合五月婷婷 | 婷婷5月天| 五月天婷婷在线观看高清 | 在线视频一区二区三区 | 四虎影院中文字幕 | 九色亚洲| 四虎影院久久久 | 免费一级毛片正在播放 | 天天视频国产免费入口 | 西西人体大胆高清啪啪欧洲 | 激情综合六月 | 日本成人小视频 | 久久黄色录像 | 大片毛片女女女女女女女 | 黄在线观看网站 | 久久免费看视频 | 国产精品午夜免费观看网站 | 免费人成网ww777kkk手机 |