在一年一度的 AI 城市挑戰賽中,來自世界各地的數百支參賽隊伍在 NVIDIA Omniverse 生成的基于物理學的數據集上測試了他們的 AI 模型。
NVIDIA 為國際計算機視覺與模式識別會議(CVPR)中的年度 AI 城市挑戰賽提供了有史以來最大的室內合成數據集,幫助研究人員和開發者推進智慧城市和工業自動化解決方案的開發工作。
這項挑戰賽吸引了來自近 50 個國家的 700 多支隊伍參賽,參賽者的任務是開發 AI模型,以提高物理環境(如零售和倉庫環境)和智能交通系統的運營效率。
參賽隊伍在由NVIDIA Omniverse生成的數據集上測試了模型。NVIDIA Omniverse 是一個由應用編程接口(API)和軟件開發套件(SDK)組成的平臺,能夠幫助開發者構建基于通用場景描述(OpenUSD)的應用和工作流。
創建和仿真
大型空間的數字孿生
工廠、倉庫等大型室內空間每天都會有源源不斷的人員和小型車輛,并且在未來還將出現自主機器人。開發者需要那些能夠在復雜的大型環境中觀測活動、提高運營效率,并把人員安全放在第一位的解決方案。
研究人員正在使用能夠感知和理解物理世界的計算機視覺模型來滿足這一需求。該方法適用于多攝像頭追蹤等應用,其可以在特定環境中由一個模型追蹤多個實體。
為了確保準確性,模型必須針對各種現實場景,在大型真實的數據集上進行訓練,但這些數據的采集過程可能十分困難、耗時且成本高昂。
因此,AI 研究人員開始使用基于物理學的仿真(例如物理世界的數字孿生等),來加強 AI 仿真和訓練。此類虛擬環境有助于生成用于訓練 AI 模型的合成數據,同時,仿真也是一種既能在安全環境中運行多種“假設”場景,又能解決隱私和 AI 偏見問題的方式。
創建合成數據能夠獲得大量可擴展和可擴充的數據,這對于 AI 訓練十分重要。團隊可以改變照明、物體位置、紋理、顏色等諸多參數,來生成一個多樣化的訓練數據集。
為 AI 城市挑戰賽
構建合成數據集
今年的 AI 城市挑戰賽由五項計算機視覺比賽組成,涵蓋了交通管理、工作者安全等領域。
NVIDIA 為第一項比賽——“多攝像頭人員追蹤”提供了數據集。這項比賽的參與度最高,共有 400 多個隊伍參賽。賽事使用了一個基準數據集和一個同類中最大的室內合成數據集(包含 212 小時每秒 30 幀的 1080p 視頻,涵蓋 6 個虛擬環境中的 90 個場景,這些場景包括倉庫、零售店和醫院等)。
這些場景均在 Omniverse 中創建而成,仿真了近 1000 臺攝像機,并使用了約 2500 個數字人角色。這項比賽還讓研究人員了解到如何根據所需要的結果來生成適當大小和保真度的數據。
這些基準數據使用NVIDIA Isaac Sim中的Omniverse Replicator創建而成。NVIDIA Isaac Sim 是一款參考應用,借助它,開發者能夠在基于 NVIDIA Omniverse 構建的物理仿真環境中設計、仿真和訓練適用于機器人、智能空間或自主機器的 AI。
Omniverse Replicator 是一個用于構建合成數據生成管線的 SDK,它能夠自動完成高質量合成數據生成所涉及的許多手動任務,包括域隨機化、攝像頭放置和校準、角色移動、數據語義標注以及基準測試的基準事實等。共有十家機構和組織在本屆 AI 城市挑戰賽中與 NVIDIA 合作:
澳大利亞國立大學(澳大利亞)
阿聯酋移動研究中心(阿聯酋)
印度理工學院坎普爾分校(印度)
愛荷華州立大學(美國)
約翰霍普金斯大學(美國)
國立陽明交通大學(中國臺灣)
圣塔克拉拉大學(美國)
阿聯酋大學(阿聯酋)
紐約州立大學奧爾巴尼分校(美國)
Woven by Toyota(日本)
推動生成式物理 AI 的未來
世界各地的研究人員和企業正在開發由物理 AI 賦能的基礎設施自動化系統與機器人,這些模型能夠理解指令,并在現實世界中自主執行復雜的任務。
生成式物理 AI 利用強化學習,在仿真環境中通過準確仿真的傳感器來感知世界、按照物理定律執行動作,并根據接收到的反饋推理下一組動作。
開發者可以使用開發者 SDK 和 API(例如包含多攝像頭追蹤參考工作流的NVIDIA Metropolis開發者堆棧等)為工廠、倉庫和零售業務添加增強感知功能。最新版本的 NVIDIA Isaac Sim 使開發者能夠在實際部署之前,先在基于物理學的虛擬空間中仿真和訓練 AI 機器人,從而為機器人工作流提供超強助力。
研究人員和開發者還將基于物理學的高保真仿真與先進 AI 相結合,以彌合仿真訓練與實際應用之間的差距。這有助于確保合成訓練環境與實際情況相吻合,從而更無縫地實現機器人部署。
NVIDIA 最近發布的NVIDIAOmniverse Cloud Sensor RTX進一步提高了仿真的準確性和規模。這套全新的微服務能夠實現物理級精確傳感器仿真,從而加速全自主機器的開發工作。
憑借這項技術,工廠、車輛、機器人等自主系統將能夠采集到有效感知、適應現實世界,并與之交互所必需的數據。開發者可以使用這些微服務,在逼真的虛擬環境中對傳感器的感知能力進行大規模測試,這將大大減少與現實世界測試相關的時間和成本。
Omniverse Cloud Sensor RTX 微服務將于今年晚些時候提供。
展示先進的 AI 研究成果
參賽者們為 AI 城市挑戰賽提交了研究論文,一些論文獲得了最高排名,其中包括:
用于離線多攝像頭人物追蹤的重疊抑制聚類:本文介紹了一種追蹤方法,包括識別單個攝像頭視圖中的個體、選擇清晰的圖像以便于識別、對相似外觀進行分組,以及在具有挑戰性的情況下幫助辨明身份。
具有幾何一致性和狀態感知的 Re-ID 校正的強大在線多攝像頭人體追蹤系統:這項研究提出了一種使用幾何和外觀數據來提高追蹤準確性的新系統,并包括一種調整識別特征以修正追蹤錯誤的機制。
增強在線多攝像頭人物追蹤的集群自細化:這篇研究論文解決了在線追蹤面臨的具體挑戰,例如劣質數據的存儲和身份分配錯誤。
所有被接受的論文將在 6 月 17 日舉行的2024 年 AI 城市挑戰賽研討會上發表: https://cvpr.thecvf.com/virtual/2024/workshop/23656
NVIDIA Research將在 CVPR 2024 上發表 50 多篇論文,介紹生成式物理 AI 的突破,以及在自動駕駛汽車開發和機器人等領域的潛在應用。
使用 NVIDIA Omniverse 平臺生成合成數據或環境數字孿生以進行模型仿真、測試和驗證的論文包括:
FoundationPose:統一的 6D 姿態估計和新物體跟蹤:FoundationPose 是一種用于估計并追蹤物體 3D 位置和方向的多功能模型。該模型通過使用少量參考圖像或 3D 表示來準確地理解物體的形狀。
構建未知鉸接物體數字孿生的隱式神經表示:該研究論文介紹了一種根據兩個 3D 掃描圖像創建物體數字模型的方法,該方法可通過分析活動部件的連接方式和在不同位置之間的移動方式來提高準確性。
BEHAVIOR 視覺套件:通過仿真生成可定制數據集:BEHAVIOR 視覺套件可生成適用于計算機視覺研究的可定制合成數據,使研究人員能夠調整照明、物體放置等設置。
-
NVIDIA
+關注
關注
14文章
5076瀏覽量
103722 -
AI
+關注
關注
87文章
31518瀏覽量
270333 -
計算機視覺
+關注
關注
8文章
1700瀏覽量
46127
原文標題:CVPR 2024 | NVIDIA 在 CVPR 上通過最大室內合成數據集推進物理 AI 的發展
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論