在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA視覺生成式AI的最新進展

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-09-09 10:08 ? 次閱讀

NVIDIA Research 發(fā)表 50 多篇論文,介紹 AI 軟件在創(chuàng)意產(chǎn)業(yè)、自動駕駛汽車開發(fā)、醫(yī)療和機器人領(lǐng)域的潛在應(yīng)用。

NVIDIA 的研究人員站在快速發(fā)展的視覺生成式 AI 領(lǐng)域最前沿,正在開發(fā)用于創(chuàng)建和解釋圖像、視頻與 3D 環(huán)境的新技術(shù)。

NVIDIA日前在西雅圖舉行的國際計算機視覺與模式識別會議(CVPR)上展示 50 多個此類項目成果。其中的兩篇論文(一篇關(guān)于擴散模型訓(xùn)練動態(tài),另一篇關(guān)于自動駕駛汽車高清地圖)入圍了 CVPR 最佳論文獎。

NVIDIA 同時還在 CVPR 自動駕駛大型挑戰(zhàn)賽中獲得了大規(guī)模端到端駕駛類別第一名。這座重要的里程碑代表 NVIDIA 正在將生成式 AI 全面應(yīng)用于自動駕駛模型。NVIDIA 提交的獲獎作品在全球 450 多件參賽作品中脫穎而出,還獲得了 CVPR 創(chuàng)新獎。

NVIDIA 在 CVPR 上展示的研究成果包括:一種可輕松定制以描繪特定物體或角色的文本轉(zhuǎn)圖像模型、全新的物體姿態(tài)估計模型、神經(jīng)輻射場(NeRF)編輯技術(shù)以及一種能夠理解流行語的視覺語言模型等。另外還展示了介紹汽車、醫(yī)療和機器人等行業(yè)的特定領(lǐng)域創(chuàng)新的論文。

這些研究成果都加入了強大的 AI 模型,幫助創(chuàng)作者能夠更快地將其藝術(shù)構(gòu)想變?yōu)楝F(xiàn)實,加快制造業(yè)自主機器人的訓(xùn)練速度,通過協(xié)助處理放射學(xué)報告為醫(yī)療專業(yè)人員提供支持。

NVIDIA 感知與學(xué)習(xí)研究副總裁 Jan Kautz 表示:“人工智能,尤其是生成式人工智能,是一次關(guān)鍵的技術(shù)進步。從可以為專業(yè)創(chuàng)作者提供超強助力的強大圖像生成模型,一直擴展到可以幫助開發(fā)新一代自動駕駛汽車的自動駕駛軟件,都將在 CVPR 上呈現(xiàn) NVIDIA Research 如何不斷拓寬技術(shù)邊界。”

NVIDIA 還在 CVPR 上發(fā)布了 NVIDIA Omniverse Cloud Sensor RTX,這套能實現(xiàn)物理級精確傳感器仿真的微服務(wù),從而加速各類全自主機器的開發(fā)工作。

無需微調(diào),JeDi 簡化自定義圖像生成

擴散模型是當(dāng)前基于文本生成圖像的核心方法。使用擴散模型的創(chuàng)作者通常以一個特定的角色或物體為中心,例如圍繞一只動畫老鼠創(chuàng)作一個故事,或者集思廣益討論一款特定玩具的廣告等。

此前的研究已經(jīng)讓這些創(chuàng)作者能夠通過微調(diào)(即用戶在自定義數(shù)據(jù)集上訓(xùn)練模型)對擴散模型的輸出結(jié)果進行個性化處理,使模型能夠?qū)W⒂谔囟ǖ闹黝}。但這一過程非常耗時,而且不支持普通用戶使用。

由約翰-霍普金斯大學(xué)(Johns Hopkins University)、豐田工業(yè)大學(xué)芝加哥分校(Toyota Technological Institute at Chicago)和 NVIDIA 研究人員共同撰寫的論文《JeDi》提出了一種新的技術(shù),使用戶只需要使用參考圖像就能在幾秒鐘內(nèi)輕松實現(xiàn)個性化的擴散模型輸出結(jié)果。研究小組發(fā)現(xiàn)該模型達到了最先進的質(zhì)量水平,明顯優(yōu)于當(dāng)前基于微調(diào)和無微調(diào)的方法。

JeDi 還可以與檢索增強生成(RAG)相結(jié)合,為品牌產(chǎn)品目錄等數(shù)據(jù)庫生成特定視覺效果。

新基礎(chǔ)模型讓姿態(tài)更完美

NVIDIA 研究人員還在 CVPR 上展示了用于物體姿態(tài)估計和跟蹤的基礎(chǔ)模型 FoundationPose。該模型無需進行微調(diào),即可在推理過程中即時應(yīng)用于新的物體。

該模型通過一小組參考圖像或者物體的 3D 呈現(xiàn)了解物體的形狀,并且在流行的物體姿態(tài)估計基準測試中創(chuàng)下了新紀錄。在了解物體形狀后,它就可以識別并跟蹤物體在視頻中的 3D 移動和旋轉(zhuǎn)情況,即使在光線條件較差或有視覺障礙物的復(fù)雜場景中也不受影響。

FoundationPose 可用于工業(yè)應(yīng)用,以幫助自主機器人識別和跟蹤與之交互的物體。它還可以用于增強現(xiàn)實應(yīng)用,使用 AI 模型在實時場景上疊加視覺效果。

NeRFDeformer 轉(zhuǎn)換 3D 場景,

只需一張快照

NeRF 是一種 AI 模型,可以基于在環(huán)境不同位置拍攝的一系列 2D 圖像進行 3D 場景渲染。在機器人等領(lǐng)域,NeRF 可用于生成現(xiàn)實世界復(fù)雜場景的沉浸式 3D 渲染,例如雜亂無章的房間或建筑工地等。一旦需要進行更改,開發(fā)人員就需要手動定義場景的轉(zhuǎn)變方式,或者重新制作 NeRF。

伊利諾伊大學(xué)香檳分校(University of Illinois Urbana-Champaign)和 NVIDIA 的研究人員則使用 NeRFDeformer 簡化了這一過程。在 CVPR 大會上展示的這一方法,可以利用單張 RGB-D 圖像成功轉(zhuǎn)換現(xiàn)有的 NeRF。RGB-D 圖像由正常照片與深度圖組合而成,深度圖可以捕捉到場景中每個物體與攝像機之間的距離。

VILA 視覺語言模型獲取圖像

NVIDIA 與麻省理工學(xué)院(MIT)聯(lián)合開展的 CVPR 研究項目正在推動視覺語言模型技術(shù)的發(fā)展。視覺語言模型是一種能夠處理視頻、圖像和文本的生成式 AI 模型。

該研究小組開發(fā)的 VILA 是一個開源視覺語言模型系列。在測試 AI 模型回答圖像問題能力的關(guān)鍵基準測試中,VILA 的表現(xiàn)優(yōu)于先前的神經(jīng)網(wǎng)絡(luò)。VILA 獨特的預(yù)訓(xùn)練流程解鎖了新的模型能力,包括更加深厚的世界知識、更強大的上下文學(xué)習(xí)能力以及多圖像間的推理能力。

VILA 可以理解流行語并基于多個圖像或視頻進行推理。

VILA 模型系列支持使用 NVIDIA TensorRT-LLM 開源程序庫進行推理優(yōu)化,并且可以部署在數(shù)據(jù)中心、工作站甚至邊緣設(shè)備的 NVIDIA GPU 上。

在 NVIDIA 技術(shù)博客和 GitHub 上均可進一步了解 VILA。

生成式 AI 助力自動駕駛和智慧城市研究

在 NVIDIA 主筆的 CVPR 論文中,關(guān)于自動駕駛汽車研究的論文有十多篇。其他與自動駕駛汽車相關(guān)的重點內(nèi)容包括:

NVIDIA 自動駕駛汽車應(yīng)用研究,贏得 CVPR 自動駕駛挑戰(zhàn)賽冠軍并在如下 demo 中進行了演示。

NVIDIA AI 研究副總裁 Sanja Fidler 于 6 月 17 日的自動駕駛研討會上發(fā)表關(guān)于視覺語言模型的演講。

多倫多大學(xué)和 NVIDIA 研究人員共同撰寫的論文《在軌跡預(yù)測中生成和利用在線地圖的不確定性》成為 24 篇入圍 CVPR 最佳論文獎的論文之一。

此外,在本屆 CVPR 上,NVIDIA 為 AI 城市挑戰(zhàn)賽提供了有史以來最大的室內(nèi)合成數(shù)據(jù)集,助力研究人員和開發(fā)人員推進智慧城市與工業(yè)自動化解決方案的開發(fā)。該挑戰(zhàn)賽的數(shù)據(jù)集使用 NVIDIA Omniverse 生成,這是一個由 APISDK 和服務(wù)構(gòu)成的平臺,可幫助開發(fā)人員構(gòu)建基于通用場景描述(OpenUSD)的應(yīng)用和工作流。

NVIDIA Research 在全球擁有數(shù)百名科學(xué)家和工程師,專注于 AI、計算機圖形學(xué)、計算機視覺、自動駕駛汽車和機器人等領(lǐng)域的研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5274

    瀏覽量

    105941
  • 自動駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14246

    瀏覽量

    169958
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    528

    瀏覽量

    723

原文標題:CVPR 2024 | NVIDIA Research 在 CVPR 上展示視覺生成式 AI 最新進展

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    百度在AI領(lǐng)域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進展
    的頭像 發(fā)表于 04-30 10:14 ?480次閱讀

    谷歌Gemini API最新進展

    體驗的 Live API 的最新進展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?938次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進展

    近日,華為公司常務(wù)董事、華為云計算CEO張平安在華為云生態(tài)大會2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?880次閱讀

    NVIDIA技術(shù)在汽車領(lǐng)域的最新進展

    全球領(lǐng)先汽車制造商、移動出行創(chuàng)新企業(yè)、供應(yīng)商和軟件供應(yīng)商利用 NVIDIA 的加速計算,實現(xiàn)從云端到車端的 AI 應(yīng)用部署。
    的頭像 發(fā)表于 03-25 15:02 ?597次閱讀

    京東方華燦光電氮化鎵器件的最新進展

    日前,京東方華燦的氮化鎵研發(fā)總監(jiān)馬歡應(yīng)半導(dǎo)體在線邀請,分享了關(guān)于氮化鎵器件的最新進展,引起了行業(yè)的廣泛關(guān)注。隨著全球半導(dǎo)體領(lǐng)域?qū)Ω咝阅堋⒏咝势骷男枨蟛粩嗉哟螅墸℅aN)技術(shù)逐漸成為新一代電子器件的熱點,其優(yōu)越的性能使其在電源轉(zhuǎn)換和射頻應(yīng)用中展現(xiàn)出巨大的潛力。
    的頭像 發(fā)表于 03-13 11:44 ?674次閱讀

    垂直氮化鎵器件的最新進展和可靠性挑戰(zhàn)

    過去兩年中,氮化鎵雖然發(fā)展迅速,但似乎已經(jīng)遇到了瓶頸。與此同時,不少垂直氮化鎵的初創(chuàng)企業(yè)倒閉或者賣盤,這引發(fā)大家對垂直氮化鎵未來的擔(dān)憂。為此,在本文中,我們先對氮化鎵未來的發(fā)展進行分析,并討論了垂直氮化鎵器件開發(fā)的最新進展以及相關(guān)的可靠性挑戰(zhàn)。
    的頭像 發(fā)表于 02-17 14:27 ?1082次閱讀
    垂直氮化鎵器件的<b class='flag-5'>最新進展</b>和可靠性挑戰(zhàn)

    NVIDIA Omniverse擴展至生成物理AI領(lǐng)域

    NVIDIA近日宣布,其Omniverse?平臺再次實現(xiàn)重大突破,成功推出多個生成AI模型和藍圖,將Omniverse的應(yīng)用范圍進一步擴展至物理A
    的頭像 發(fā)表于 01-13 10:56 ?729次閱讀

    NVIDIA推出多個生成AI模型和藍圖

    NVIDIA 宣布推出多個生成 AI 模型和藍圖,將 NVIDIA Omniverse 一體化進一步擴展至物理
    的頭像 發(fā)表于 01-08 10:48 ?558次閱讀

    FF將發(fā)布FX品牌最新進展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發(fā)布以來的最新進展,包括最新項目進展、重大里程碑、新產(chǎn)品品類戰(zhàn)略及下一步計劃。
    的頭像 發(fā)表于 01-03 15:58 ?616次閱讀

    NVIDIA探討自動駕駛汽車安全問題

    行業(yè)專家齊聚華盛頓,探討 AI最新進展,強調(diào)汽車安全準則和監(jiān)管的必要性。
    的頭像 發(fā)表于 11-19 14:42 ?518次閱讀

    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進展(2024Q4)

    近期,由博通、思科、Arista、微軟、Meta等國際頂級半導(dǎo)體、設(shè)備和云廠商牽頭成立的超以太網(wǎng)聯(lián)盟(UEC)在OCP Global Summit上對外公布其最新進展——UEC規(guī)范1.0的預(yù)覽版本。讓我們一睹為快吧!
    的頭像 發(fā)表于 11-18 16:53 ?1229次閱讀
    揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范<b class='flag-5'>最新進展</b>(2024Q4)

    Qorvo在射頻和電源管理領(lǐng)域的最新進展

    了半導(dǎo)體行業(yè)的重大變革,還成功引領(lǐng)Qorvo成為射頻技術(shù)的領(lǐng)導(dǎo)者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領(lǐng)域的最新進展,并探討HPA事業(yè)部如何通過技術(shù)創(chuàng)新應(yīng)對全球電氣化和互聯(lián)化的挑戰(zhàn)。
    的頭像 發(fā)表于 11-17 10:57 ?858次閱讀

    芯片和封裝級互連技術(shù)的最新進展

    近年來,計算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實現(xiàn)計算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計算機架構(gòu)創(chuàng)新的焦點。本文探討了通用、專用和量子計算系統(tǒng)中芯片和封裝級互連的最新進展,并強調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑戰(zhàn)和機遇。
    的頭像 發(fā)表于 10-28 09:50 ?1061次閱讀

    AI大模型的最新研究進展

    AI大模型的最新研究進展體現(xiàn)在多個方面,以下是對其最新進展的介紹: 一、技術(shù)創(chuàng)新與突破 生成AI
    的頭像 發(fā)表于 10-23 15:19 ?1316次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國佛羅里達州奧蘭多舉行的 SAP Sapphire 大會上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成
    的頭像 發(fā)表于 09-09 09:37 ?766次閱讀
    主站蜘蛛池模板: 中文字幕在线观看一区二区 | 中国videos偷窥 | 狠狠色网站 | 精品爱爱 | 免费在线观看视频 | 亚洲视频福利 | 日韩毛片免费视频 | 色老头影院 | 草综合| 午夜色在线 | 久久久久久午夜精品 | 男人和女人在床做黄的网站 | 美国三级网 | 男人的天堂色偷偷 | 边摸边吃奶边做视频叫床韩剧 | 在线观看免费国产 | 91色蝌蚪| 一区在线播放 | 男人的天堂视频网站清风阁 | 久久99热精品免费观看k影院 | 欧美3d动漫网站 | 国产精品一区在线播放 | 久久久精品免费热线观看 | 一级日本高清视频免费观看 | 狠狠色丁香婷婷综合激情 | 色老二精品视频在线观看 | 四虎a456tncom | 人人做人人插 | 看全黄大片狐狸视频在线观看 | 特级免费毛片 | 黄网站免费大全 | 亚洲qingse中文久久网 | 三级电影在线观看视频 | 在线播放交视频 | 四虎永久精品免费网址大全 | 色视频免费在线观看 | 日韩黄网 | 涩涩高清无乱码在线观看 | 国产精品va在线观看不 | 日本亚洲视频 | 欧美肉到失禁高h视频在线 欧美三级成人 |