人形機器人需要能夠適應人類工作空間,處理重復性或高強度任務。然而,為真實世界的任務和不可預測的環境創建通用人形機器人是一項挑戰。通常來說,這些任務中的每一個都需要一個專用的 AI 模型。由于需要大量特定于任務的數據、高昂的計算成本,且模型的泛化能力有限,針對每一個新的任務和環境,從零開始訓練這些模型是一個非常繁瑣的過程。
NVIDIA Isaac GR00T通過提供開源的 SimReady 數據、仿真框架(如NVIDIA Isaac Sim和Isaac Lab)、合成數據藍圖和預訓練基礎模型,能夠幫助解決這些挑戰并加速通用人形機器人的開發。
NVIDIA Isaac GR00T N1 的特點和優勢
NVIDIA Isaac GR00T N1是世界上首個用于通用人形機器人推理和技能的開源基礎模型。這個跨實體模型接受包括語言和圖像在內的多模態輸入,以便在各種不同的環境中執行操作任務。
GR00T N1 基于一個龐大的人形機器人數據集進行訓練,訓練數據還補充了通過NVIDIA Isaac GR00T Blueprint生成的合成數據,以及來自互聯網的大量視頻數據。它可以通過后訓練適應特定的實體、任務和環境。現在,開發者可以通過 Hugging Face 上的開源 NVIDIA 物理 AI 數據集免費獲得其中的部分數據。
GR00T N1 使用一個模型和一組權重來實現人形機器人上的操作行為,例如 Fourier GR-1 和 1X Neo。它展示了在一系列任務中的強大泛化能力,包括用單臂或雙臂抓取和操作物體,以及在雙臂之間轉移物品。
它還可以執行需要持續上下文理解和整合多種技能的復雜多步驟任務。這些功能可應用于物品搬運、包裝和檢查等各種使用場景中。
GR00T N1 2B 模型已經正式推出,這是 NVIDIA 一系列可完全定制模型中的首個模型。NVIDIA 將對這一系列模型進行預訓練并發布。
GR00T N1 模型架構
受人類認知原理的啟發,GR00T N1 基礎模型采用雙系統架構:
視覺-語言模型(系統 2):這個系統基于 NVIDIA-Eagle 和 SmolLM-1.7B,是一個方法論思考系統。它通過視覺和語言指令解釋環境,使機器人能夠對其環境和指令進行推理,并規劃正確的行動。
擴散 Transformer(系統 1):這個動作模型生成連續動作以控制機器人的運動,將系統 2 制定的動作計劃轉化為精確、連續的機器人運動。
這兩個系統緊密耦合,使它們在后訓練期間可以一起優化。
圖 2. GR00T N1 模型架構
GR00T N1 的預訓練數據策略
訓練像 GR00T N1 這樣的通用模型需要一個強大的數據策略,該策略能夠利用不同數據類型的互補優勢。GR00T N1 的訓練數據構成了一個金字塔結構,從底部到頂部,數據量逐漸減少,而針對具體實體的特定性則逐漸增強。
底層的數據集合了來自互聯網的大規模數據和人類視頻,提供了一個廣泛的視覺和語言信息基礎。這些數據集記錄了人與物體的交互情況,有助于深入了解自然動作模式和任務語義。
中間層為由 NVIDIA Omniverse 平臺生成的合成數據。
頂部是通過在各種平臺上遠程操作收集的真實機器人數據,能精準反映機器人的實際能力。
以人為中心的在線視頻提供了關于人類與物體交互的有價值的信息,但缺乏機器人的電機控制信號。仿真數據通過 GPU 加速提供了無限的實時數據,填補了這一空白,但它面臨仿真到現實的差距。
真實機器人數據彌合了這一差距,但成本高昂且耗時。通過結合這些多樣化的數據并使用諸如潛在動作訓練等技術,機器人可以從大規模、未標記的人類視頻數據中學習而無需監督,從而形成一種強大的策略,增強機器人訓練,提高 GR00T N1 的性能和適應性。
這種策略通過 NVIDIA Isaac GR00T Blueprint 得以實際應用。通過它,可以在短短 11 小時內生成超過 75 萬個合成軌跡,相當于 6500 小時或九個月連續的人類演示數據。將這些合成數據與真實數據相結合后,與僅使用真實數據進行訓練的情況相比,GR00T N1 的性能能夠提升 40%。
利用 GR00T N1 進行開發
您可以按照以下步驟開始使用 GR00T N1:
數據準備:將您的機器人演示數據(視頻、狀態、動作)三元組格式化為與 Hugging Face LeRobot 格式兼容的 GR00T 數據集。
數據驗證:使用驗證腳本確保您的數據符合正確的格式。
后訓練:使用 PyTorch 腳本,用您的自定義數據集對預訓練的 GR00T N1 模型進行微調。
推理:將推理腳本連接到您的機器人控制器,以使用后訓練的 GR00T N1 模型在目標硬件或仿真環境中執行動作。
評估:運行評估腳本以獲取模型的任務成功率。
性能
GR00T N1 模型通過仿真和真實世界的基準測試進行評估,以檢驗其在不同的機器人實體和操作任務中的性能。仿真實驗采用了三個不同的基準,而真實世界的測試則聚焦于使用 GR-1 人形機器人執行的桌面操作任務。
仿真基準測試
仿真實驗使用了三個基準測試:兩個來自先前研究的開源基準測試和一個模仿現實世界桌面操作任務的新套件,選擇這些基準測試是為了在不同的機器人實體和多種操作任務中評估模型。
表 1. 每個任務使用 100 次演示的仿真基準測試平均成功率
現實基準測試
針對一系列需要精準物體操控、雙手協調動作以及具備高級空間感知能力的操作任務,對這些模型進行了評估,這使得模型在復雜的交互操作中能夠實現精細的控制。
表 2. 使用 GR-1 人形機器人在現實任務上的平均策略成功率
表 3. 使用 GR-1 人形機器人在真實任務上的平均策略成功率
與擴散策略基線相比,Isaac GR00T N1 模型展示了更平滑和流暢的運動,以及在抓取精度上的顯著提高,特別是在使用較小的后訓練數據集進行微調時。
進一步的結果表明,GR00T N1 不僅更有效地學習新任務,而且比基線方法更精確地遵循語言指令。
-
NVIDIA
+關注
關注
14文章
5299瀏覽量
106302 -
AI
+關注
關注
88文章
35041瀏覽量
279204 -
開源
+關注
關注
3文章
3673瀏覽量
43793 -
人形機器人
+關注
關注
7文章
732瀏覽量
17613
原文標題:加速通用人形機器人的開發:NVIDIA Isaac GR00T N1
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
NVIDIA 通過云端至機器人計算平臺驅動人形機器人技術,賦能物理 AI

NVIDIA與光輪智能合作實現GR00T N1落地汽車工廠
借助OpenUSD與合成數據推動人形機器人發展
NVIDIA Isaac GR00T 詳細解析
NVIDIA發布GR00T N1基礎模型等方案,人形機器人開發效率顯著提升
NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發
NVIDIA發布全球首個開源人形機器人基礎模型Isaac GR00T N1
機器人Blue亮相 搭載英偉達最新GR00T N1人形機器人通用基礎模型

深度解讀GR00T N1:英偉達開源人形機器人功能模型的技術革新與行業影響
NVIDIA 發布全球首個開源人形機器人基礎模型 Isaac GR00T N1——并推出加速機器人開發的仿真框架

智元機器人基于NVIDIA Isaac GR00T打造高效仿真數據采集方案

NVIDIA發布Isaac GR00T Blueprint,加速人形機器人開發
NVIDIA推出Isaac GR00T Blueprint
NVIDIA發布人形機器人重磅更新!Isaac GR00T Blueprint厲害在哪?

評論