91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過NVIDIA Cosmos模型增強機器人學習

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-07-14 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通用機器人的時代已經到來,這得益于機械電子技術和機器人 AI 基礎模型的進步。但目前機器人技術的發展仍面臨一個關鍵挑戰:機器人需要大量的訓練數據來掌握諸如組裝和檢查之類的技能,而手動演示的方式難以擴展。基于NVIDIA Cosmos構建的NVIDIA Isaac GR00T-Dreams blueprint,可以通過單張圖像和語言提示生成海量的合成軌跡數據,能夠有效解決這一難題。

利用 Cosmos 世界基礎模型 (WFMs) 和生成式 AI,開發者可以快速創建用于訓練諸如NVIDIA Isaac GR00T N1.5(全球首個面向人形機器人推理和技能的開源基礎模型)等模型的數據。

本文將介紹 Isaac GR00T-Dreams blueprint,詳述其先進功能及其在開發 Isaac GR00T N1.5 基礎模型中的作用。

GR00T-Dreams blueprint 概覽

Isaac GR00T-Dreams blueprint 是用于生成大量合成軌跡數據的參考工作流,生成的數據可以用于教會人形機器人在新環境中執行新動作。

借助這一藍圖,機器人僅需極少量的人類演示數據,就能夠泛化各種行為,并適應新的環境。因此,一個小型人類演示團隊就能創造出以往需要數千人才能產出的訓練數據量。

GR00T-Dreams blueprint 是對Isaac GR00T-Mimic blueprint的補充。通過使用NVIDIA Omniverse和 Cosmos Transfer-1 WFM 擴展已知任務的現有演示數據,GR00T-Mimic 可幫助機器人培養深度熟練程度,并成為這些特定技能的專家。GR00T-Dreams 采用 Cosmos Predict-2 和 Cosmos Reason 為新任務和環境生成全新數據,致力于使機器人成為具有廣泛適應性的通用機器人。

GR00T-Dreams blueprint 工作流

該藍圖為訓練通用機器人提供強大的“現實到現實 (real-to-real)”數據工作流,使用真實機器人數據創建合成軌跡,然后用于訓練物理機器人。這種方法顯著減少了對大量人類演示的需求。具體步驟如下:

8a78bc1e-5e3b-11f0-baa5-92fbcf53809c.jpg

圖 1. GR00T-Dreams blueprint 架構

第一步:利用人類演示進行后訓練

首先,開發者收集用于人形機器人在單一環境中執行單一任務(如抓取與放置)的一組有限的人類遠程操作軌跡。然后利用這些真實世界數據對 Cosmos Predict-2 世界基礎模型進行后訓練。這一步驟可讓模型學習該機器人特有的特定移動能力和功能約束。

第二步:生成“夢境”

接下來,開發者向經過微調的 Cosmos 模型輸入初始圖像和基于文本的新指令,要求生成的機器人執行相應動作。這會促使生成式模型創建大量多樣化和新穎的任務場景或未來世界狀態(也稱為“夢境”),例如打開、關閉、整理物體、清潔和分類等。這些場景以 2D 視頻的形式創建。

第三步:推理和過濾

生成大量“夢境”后,Cosmos Reason 模型可用于評估每個“夢境”的質量和成功率。它會過濾掉“不好的夢境”,也就是描繪不成功或有缺陷的任務嘗試,確保僅讓高質量和相關的場景進入下一階段。

第四步:提取神經軌跡

選中的“夢境”最初只是 2D 視頻中的像素,隨后利用逆動力學模型 (IDM) 生成 3D 動作軌跡。IDM是用于動作標記的生成式 AI 模型,該模型通過輸入 2D 視頻中的兩個圖像幀,即“之前”和“之后”的畫面,預測出這兩個畫面之間發生的一系列動作。

這一步驟將“夢境”視頻中的視覺信息轉化為機器人能夠學習的可操作數據。這些已添加 3D 動作數據的 2D 視頻被稱為神經軌跡。

第五步:訓練視覺運動策略

最后,這些神經軌跡作為大規模的合成數據集,用于訓練視覺運動策略,既可以與真實世界數據協同訓練以增強性能,也可以僅通過對這些數據進行訓練,來實現對新行為和不可見環境的泛化。

用于機器人學習的高級功能

GR00T-Dreams 為機器人學習提供了先進的功能,包括新行為、新環境等。

新行為:即使僅有單一任務(例如抓取與放置)的訓練數據,機器人也能從語言指令中學習新動作。

由 GR00T-Dreams 支持的機器人打開筆記本電腦的神經軌跡和真實機器人 (Fourier GR-1) 執行情況

新環境:即使世界模型僅在一個實驗室環境中訓練過,機器人也能夠泛化到完全未見過的環境。

由 GR00T-Dreams 支持的機器人將橘子放入碗中的神經軌跡和真實機器人 (Fourier GR-1) 執行情況

多種機器人類型:適用于從人形機器人到機械臂(如 Franka 和 SO-100)等不同類型的機器人,并支持多種攝像頭視圖。

由 GR00T-Dreams 支持的 Franka 機械臂和 SO-100 機械臂執行不同操作任務

針對復雜任務增強學習:為具有挑戰性的接觸密集型任務,比如操作可變形物體(折疊)或使用工具(錘擊)等增強訓練數據,形成從初始真實畫面開始的“真實到真實”工作流。

由 GR00T-Dreams 支持的機器人錘擊操作的神經軌跡和真實機器人 (Fourier GR-1) 執行情況

使用 GR00T-Dreams

對 GR00T N1.5 進行后訓練

可以使用 GR00T-Dreams 對視覺語言動作 (VLA) 模型進行后訓練,以在未見過的環境中實現新行為和操作。

NVIDIA 研究中心使用 GR00T-Dreams blueprint 生成合成訓練數據,僅用 36 小時就完成了 GR00T N1.5 的開發。如果使用人工收集人類數據,這一過程需要近三個月的時間。

GR00T N1.5 是 GR00T N1 的首次更新,GR00T N1 是全球首個面向通用人形機器人推理和技能的開源基礎模型。這個跨形態模型可以接收語言和圖像等多模態輸入,在多樣化的環境中執行操作任務。

GR00T N1.5 的新功能:

提高對語言指令的理解準確性

借助 Isaac GR00T-Dreams,增強對新物體和新環境的泛化能力

通過 Eagle 2.5 提供更好的空間理解和開放世界視覺定位,提升視覺語言基礎

在材料處理和制造任務中成功率更高

開源的 NVIDIA 物理 AI 數據集

NVIDIA 擴展了其開源物理AI數據集。該數據集是 Hugging Face 上下載量最多的機器人數據集,最初于 2025 年 3 月推出,如今新增了數千條機器人軌跡,包括 Unitree G1 機器人的首批真實訓練數據和 24,000 條仿真遠程操作軌跡。

該數據集還包含各種操作任務的合成仿真數據,在開發 GR00T N1.5 的過程中發揮了重要的作用。

GR00T N 模型在機器人生態系統的應用

GR00T N 模型已經被很多生態合作伙伴采用,包括 AeiRobot、Foxlink、光輪智能和 NEURA Robotics 等。

AeiRobot 利用這一模型使其工業機器人能夠理解自然語言,從而完成復雜的抓取與放置任務。Foxlink 利用這一模型提高其工業機械臂的靈活性和效率。光輪智能借助這一模型驗證合成數據,以加快人形機器人在工廠中的部署。NEURA Robotics 正在評估這一模型,以加速其家用自動化系統的開發。

開始加速機器人學習

Isaac GR00T-Dreams blueprint 是用于生成大量合成軌跡數據的參考工作流,這些數據可用于教會人形機器人在新環境中執行新動作。這一藍圖使機器人僅需極少量的人類演示數據,就能夠泛化各種行為,并適應新的環境。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5304

    瀏覽量

    106328
  • 模型
    +關注

    關注

    1

    文章

    3517

    瀏覽量

    50390
  • 人形機器人
    +關注

    關注

    7

    文章

    734

    瀏覽量

    17618

原文標題:通過世界基礎模型生成的合成軌跡數據增強機器人學習

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Isaac Lab可用環境與強化學習腳本使用指南

    Lab 是一個適用于機器人學習的開源模塊化框架,其模塊化高保真仿真適用于各種訓練環境,Isaac Lab 同時支持模仿學習(模仿人類)和強化學習(在嘗試和錯誤中進行學習),為所有
    的頭像 發表于 07-14 15:29 ?268次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab可用環境與強化<b class='flag-5'>學習</b>腳本使用指南

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關鍵模型——NVIDIA C
    的頭像 發表于 07-09 10:17 ?145次閱讀

    NVIDIA Isaac Sim和Isaac Lab現已推出早期開發者預覽版

    NVIDIA 發布了機器人仿真參考應用 Isaac Sim 和機器人學習框架 Isaac Lab 的開發者預覽版。開發者現在可以通過 GitHub 訪問早期版本,搶先體驗先進功能,用于
    的頭像 發表于 07-04 14:23 ?366次閱讀

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期發布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態大語言模型 (MLLM),它們經過了“物理 AI 監督微調”和“物理 AI 強化學習”兩個階段
    的頭像 發表于 06-04 13:43 ?294次閱讀

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA
    的頭像 發表于 05-28 10:06 ?564次閱讀

    NVIDIA Cosmos加速機器人和自動駕駛汽車物理AI發展

    NVIDIA Cosmos 通過可預測未來世界狀態的世界基礎模型加速物理 AI 的發展。
    的頭像 發表于 04-24 11:01 ?534次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b>加速<b class='flag-5'>機器人</b>和自動駕駛汽車物理AI發展

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎模型和物理AI數據工具的重大更新

    模型可實現物理 AI 的預測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓練提供海量物理 AI 合成數據生成技術。 1X、Agility Robotics
    的頭像 發表于 03-20 19:01 ?873次閱讀

    深度解讀英偉達Newton機器人平臺:技術革新與跨界生態構建

    Newton是由NVIDIA、Google DeepMind和Disney Research開發的開源、可擴展的物理引擎,旨在推進機器人學習和開發。 Newton建立在 NVIDIA Warp
    的頭像 發表于 03-20 15:15 ?1710次閱讀
    深度解讀英偉達Newton<b class='flag-5'>機器人</b>平臺:技術革新與跨界生態構建

    英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數據問題

    Cosmos 世界基礎模型(WFM)使開發者能夠輕松生成大量基于物理學的逼真合成數據,以用于訓練和評估其現有的模型。開發者還可以通過微調 Cosm
    的頭像 發表于 01-14 11:04 ?1254次閱讀
    英偉達推出基石世界<b class='flag-5'>模型</b><b class='flag-5'>Cosmos</b>,解決智駕與<b class='flag-5'>機器人</b>具身智能訓練數據問題

    NVIDIA發布Cosmos平臺,加速物理AI開發

    )和機器人等物理AI系統的快速發展。 Cosmos平臺的核心在于其強大的生成式世界基礎模型,能夠模擬和預測復雜環境中的各種物理現象。結合高級tokenizer,Cosmos能夠高效地處
    的頭像 發表于 01-13 11:06 ?793次閱讀

    NVIDIA發布Cosmos?平臺,助力物理AI系統發展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos?平臺,該平臺專為自動駕駛汽車(AV)和機器人等物理AI系統而設計,旨在推動這些領域的快速發展。
    的頭像 發表于 01-08 15:36 ?612次閱讀

    NVIDIA Cosmos世界基礎模型平臺發布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進的生成式世界基礎模型、高級 tokenizer、護欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和
    的頭像 發表于 01-08 10:39 ?556次閱讀

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人模型

    。 多模態融合的創新與突破 機器人控制技術的另一個重要突破在于多模態大模型的應用。相比于僅通過文字進行人機交互的傳統方法,現代機器人能夠融合視覺、聲音、定位等多模態輸入信息,為任務執行
    發表于 12-29 23:04

    NVIDIA發布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機器人學習大會(CoRL)上發布了全新 AI 和仿真工具以及工作流。機器人開發者可以使用這些工具和工作流,大大加快 AI 機器人(包括人形
    的頭像 發表于 11-09 11:52 ?891次閱讀

    麻省理工學院推出新型機器人訓練模型

    近日,據TechCrunch報道,麻省理工學院的研究團隊展示了一種創新的機器人訓練模型,該模型突破了傳統模仿學習方法的局限,不再依賴標準數據集,而是借鑒了大型語言
    的頭像 發表于 11-04 14:56 ?936次閱讀
    主站蜘蛛池模板: 高颜值露脸极品在线播放 | 在线 色| 国产成人综合欧美精品久久 | 天堂男人网 | 色视频www在线播放国产人成 | 天天综合网天天综合色不卡 | 精品videosex性欧美 | 国产精品久久国产三级国不卡顿 | 天天综合色天天综合 | 一级a级国产不卡毛片 | 日本欧美一区二区三区不卡视频 | 国语自产拍在线观看7m | 毛片2016免费视频 | 免费观看老外特级毛片 | 日日摸夜夜添免费毛片小说 | 78m-78模成视频在线 | 2021国产成人午夜精品 | 午夜在线网站 | 亚洲男人的天堂久久香蕉 | 亚洲第一页国产 | 激情九月婷婷 | 国产精品青草久久 | 手机亚洲第一页 | 天天做夜夜爱 | 怡红院精品视频 | 四虎国产精品视频免费看 | 综合免费一区二区三区 | 国漫在线观看 | 97影院理论片在线观看 | 三级完整在线观看高清视频 | 国模人体一区二区三区 | 亚洲精品久久久久影 | 一卡二卡三卡四卡无卡在线 | 美女网站视频一区 | 亚洲一二三四 | 日本69式xxx视频 | 欧美一级乱理片免费观看 | 国产成人精品三级 | 又粗又长又爽又长黄免费视频 | 中文字幕在线播放不卡 | www在线视频 |