這篇文章是“NVIDIA 機(jī)器人研究與開(kāi)發(fā)摘要 (R2D2)”的一部分,旨在讓開(kāi)發(fā)者更深入地了解 NVIDIA 研究中心在物理 AI 和機(jī)器人應(yīng)用方面的最新突破。
本期 NVIDIA 機(jī)器人研究與開(kāi)發(fā)摘要 (R2D2) 將探討 NVIDIA 研究中心針對(duì)機(jī)器人裝配任務(wù)的多種接觸密集型操作工作流,以及它們?nèi)绾谓鉀Q傳統(tǒng)固定自動(dòng)化在魯棒性、適應(yīng)性和可擴(kuò)展性等方面的關(guān)鍵挑戰(zhàn)。
什么是接觸密集型操作?
接觸密集型操作是指機(jī)器人與環(huán)境中的物體進(jìn)行持續(xù)或重復(fù)物理接觸的任務(wù),需要精確控制力和運(yùn)動(dòng)。與簡(jiǎn)單的抓取和放置操作不同,這些任務(wù)需要精細(xì)的交互來(lái)處理不確定性下的摩擦、順應(yīng)性和對(duì)齊問(wèn)題。
接觸密集型操作在機(jī)器人、制造和汽車等行業(yè)中起著關(guān)鍵作用,常見(jiàn)任務(wù)包括插入銷釘、嚙合齒輪、旋緊螺栓以及組裝卡扣零件。作為機(jī)器人裝配的核心能力之一,接觸密集型操作使機(jī)器人能夠執(zhí)行復(fù)雜的高精度任務(wù),這對(duì)于自動(dòng)化裝配和應(yīng)對(duì)真實(shí)世界的多樣化變化至關(guān)重要。
NVIDIA 研究中心應(yīng)對(duì)
機(jī)器人裝配任務(wù)的工作流
由于需要在動(dòng)態(tài)環(huán)境中進(jìn)行精確操作,機(jī)器人裝配一直是極具挑戰(zhàn)性的課題。傳統(tǒng)的機(jī)器人裝配依賴固定自動(dòng)化,靈活性受限。然而隨著 AI、機(jī)器學(xué)習(xí)和機(jī)器人仿真技術(shù)的進(jìn)步,機(jī)器人能夠處理更復(fù)雜的任務(wù)。NVIDIA 研究中心開(kāi)發(fā)的以下一系列裝配工作流,標(biāo)志著從剛性自動(dòng)化向靈活、可擴(kuò)展的機(jī)器人系統(tǒng)的轉(zhuǎn)變:
Factory:基于物理的快速仿真與學(xué)習(xí)工具包,用于實(shí)時(shí)接觸密集型交互。
IndustReal:使機(jī)器人能夠通過(guò)強(qiáng)化學(xué)習(xí)在仿真中學(xué)習(xí)裝配任務(wù),并將其遷移到真實(shí)世界的一套算法和系統(tǒng)工具包。
AutoMate:用于在不同幾何形狀的裝配任務(wù)中訓(xùn)練專用和通用機(jī)器人裝配策略的全新策略學(xué)習(xí)框架。
MatchMaker:使用生成式 AI 自動(dòng)生成多樣化、可用于仿真的裝配資產(chǎn)對(duì)的全新流程。
SRSA:從現(xiàn)有技能中進(jìn)行檢索,用以對(duì)新的機(jī)器人裝配任務(wù)進(jìn)行微調(diào)的框架。
TacSL:基于 GPU 的視觸覺(jué)傳感器仿真與學(xué)習(xí)庫(kù)。
FORGE:利用力測(cè)量作為輸入,實(shí)現(xiàn)零樣本仿真到現(xiàn)實(shí)遷移的強(qiáng)化學(xué)習(xí)策略框架。
機(jī)器人裝配的基礎(chǔ)性突破:
Factory、IndustReal 和 AutoMate
長(zhǎng)期以來(lái),接觸密集型交互的實(shí)時(shí)仿真一直被視為計(jì)算上難以實(shí)現(xiàn)的難題,但是 Factory 實(shí)現(xiàn)了突破。Factory 是一個(gè)基于 GPU 的仿真框架,使用 SDF 碰撞、接觸簡(jiǎn)化和 Gauss-Seidel 求解器。
NVIDIA Isaac Lab 中已經(jīng)可以提供這些環(huán)境,如圖 1 所示。在此基礎(chǔ)上,在仿真感知策略更新、基于 SDF 的獎(jiǎng)勵(lì)、基于采樣的課程和策略級(jí)動(dòng)作整合器等創(chuàng)新的推動(dòng)下,IndustReal 的發(fā)布實(shí)現(xiàn)了裝配技能從仿真到現(xiàn)實(shí)世界的零樣本遷移,在 600 次試驗(yàn)中成功率達(dá) 83% 至 99%。這項(xiàng)技術(shù)已經(jīng)在 Franka Panda 和 UR10e 機(jī)器人上進(jìn)行了測(cè)試,為現(xiàn)實(shí)工業(yè)應(yīng)用鋪平了道路。
圖 1. Isaac Lab 中的接觸密集型仿真環(huán)境
AutoMate 進(jìn)一步推動(dòng)了這項(xiàng)技術(shù)的發(fā)展。通過(guò)引入首個(gè)基于仿真的框架,將強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)相結(jié)合,解決了廣泛的挑戰(zhàn)性裝配任務(wù),實(shí)現(xiàn)了大規(guī)模的零樣本仿真到現(xiàn)實(shí)的遷移。它提供了 100 個(gè)仿真兼容的裝配資產(chǎn)、解決約 80 項(xiàng)任務(wù)的專用策略,以及通過(guò)蒸餾和微調(diào)訓(xùn)練可處理 20 項(xiàng)任務(wù)的通用策略(成功率均達(dá)到約 80%)。
值得注意的是,這兩種策略類型均展示了零樣本仿真到現(xiàn)實(shí)遷移的能力,有時(shí)甚至超過(guò)了仿真性能。如圖 2 所示,AutoMate 經(jīng)過(guò)超過(guò) 500 萬(wàn)次仿真試驗(yàn)和 500 次真實(shí)試驗(yàn)的評(píng)估。專用策略通過(guò)拆卸實(shí)現(xiàn)裝配 (assembly-by-disassembly)、強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)、以及 Dynamic Time Warping (DTW) 的組合進(jìn)行訓(xùn)練。通用策略使用 PointNet 自動(dòng)編碼器進(jìn)行幾何表示,從專用策略中提取知識(shí),并基于強(qiáng)化學(xué)習(xí)進(jìn)行微調(diào)。
圖 2. 在仿真和真實(shí)世界中部署的 AutoMate 策略,每個(gè)示例上方顯示唯一的裝配 ID
借助先進(jìn)學(xué)習(xí)算法和自動(dòng)化,
探索機(jī)器人裝配領(lǐng)域的邊界
在 Factory 和 IndustReal 突破性成果的基礎(chǔ)上,研究團(tuán)隊(duì)利用自動(dòng)化資產(chǎn)生成、技能檢索與適應(yīng)、強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí),以及不同的感官輸入,應(yīng)對(duì)更復(fù)雜和多樣的裝配挑戰(zhàn),推動(dòng)接觸密集型操作的邊界。下面將重點(diǎn)介紹這一系列創(chuàng)新技術(shù)。
MatchMaker:
機(jī)器人裝配的自動(dòng)化資產(chǎn)生成
圖 3. MatchMaker 資產(chǎn)生成流程
MatchMaker(在 ICRA 2025 上展示)是一種全新的生成式流程,可自動(dòng)生成多樣化、兼容仿真的裝配資產(chǎn)對(duì),以促進(jìn)裝配技能的學(xué)習(xí)。它通過(guò)生成無(wú)貫穿、幾何匹配的零件,解決了手動(dòng)創(chuàng)建管理資產(chǎn)的挑戰(zhàn)。MatchMaker 支持三種可能的輸入——無(wú)輸入、單個(gè)資產(chǎn)或裝配對(duì),并輸出具有可調(diào)間隙的可用于仿真的資產(chǎn)對(duì)。
主要功能:
自動(dòng)轉(zhuǎn)換:將不兼容的資產(chǎn)對(duì)轉(zhuǎn)換為與仿真兼容的模型。
資產(chǎn)對(duì)生成:從單個(gè)資產(chǎn)創(chuàng)建幾何匹配的零件,用于新的裝配任務(wù)。
真實(shí)接觸交互:根據(jù)用戶定義的間隙貼近接觸表面,確保零件之間的真實(shí)交互。
如圖 3 所示,MatchMaker 作為形狀補(bǔ)全任務(wù),分三個(gè)階段生成裝配對(duì):
接觸面檢測(cè):基于VLM (GPT-4o) 識(shí)別資產(chǎn)類型、裝配方向與接觸軸;
形狀補(bǔ)全:使用3D生成模型生成裝配對(duì)中的第二個(gè)資產(chǎn);
間隙設(shè)定:貼近接觸面,避免穿模,并確保與仿真器兼容。
圖 4 展示了生成的資產(chǎn)示例。MatchMaker 已在仿真和真實(shí)環(huán)境中得到驗(yàn)證,證明了其在開(kāi)發(fā)穩(wěn)健的裝配策略方面的有效性。
圖 4. MatchMaker 生成的裝配對(duì)示例
SRSA:
機(jī)器人裝配任務(wù)的技能檢索與適應(yīng)
SRSA(ICLR 2025 上的一個(gè)亮點(diǎn))是一個(gè)數(shù)據(jù)高效的機(jī)器人學(xué)習(xí)框架,能從裝配任務(wù)技能庫(kù)中重用和調(diào)整預(yù)訓(xùn)練技能。該框架根據(jù)幾何形狀、動(dòng)力學(xué)、動(dòng)作和預(yù)測(cè)成功率,為新任務(wù)選擇最優(yōu)現(xiàn)有策略,并針對(duì)目標(biāo)任務(wù)進(jìn)行策略微調(diào)。
圖 5. SRSA 可檢索和微調(diào)已有的最佳技能,然后再將其添加到技能庫(kù)中
與從零開(kāi)始學(xué)習(xí)(比如使用 AutoMate 技術(shù)進(jìn)行學(xué)習(xí))相比,SRSA 具有更好的性能、效率和穩(wěn)定性,同時(shí)支持持續(xù)學(xué)習(xí)。它在新任務(wù)上的成功率提高了 19%,所需樣本減少了 2.4 倍,在真實(shí)世界測(cè)試中達(dá)到了 90% 的平均成功率。
TacSL:
用于視觸覺(jué)傳感器仿真和學(xué)習(xí)的庫(kù)
TacSL (taxel) 是一個(gè)基于 GPU 的視觸覺(jué)加速仿真庫(kù)(即主流機(jī)器人觸覺(jué)傳感器的輸出),可實(shí)現(xiàn)視觸覺(jué)傳感器及相應(yīng)接觸力場(chǎng)的仿真,速度比現(xiàn)有最先進(jìn)技術(shù)快 200 倍以上。
圖 6. TacSL 工具包的組件
觸覺(jué)感知對(duì)人類理解世界至關(guān)重要,能幫助我們感知壓力、紋理和形狀。在機(jī)器人中,觸覺(jué)感知 (tactile sensing) 是指使用特殊的觸覺(jué)傳感器檢測(cè)與物體的接觸,這一能力在抓取物體、零件裝配或調(diào)整抓握力等任務(wù)中尤為重要。盡管觸覺(jué)感知非常重要,但受限于數(shù)據(jù)分析難度大、真實(shí)觸覺(jué)仿真存在挑戰(zhàn),以及訓(xùn)練機(jī)器人基于觸覺(jué)數(shù)據(jù)執(zhí)行動(dòng)作的復(fù)雜性較高,與視覺(jué)感知相比,觸覺(jué)感知在機(jī)器人中尚未廣泛應(yīng)用。
TacSL 通過(guò)針對(duì)視觸覺(jué)傳感器的快速 GPU 加速觸覺(jué)仿真模塊和學(xué)習(xí)算法,解決了這些長(zhǎng)期存在的挑戰(zhàn)。它使機(jī)器人能夠在仿真中借助真實(shí)的觸覺(jué)反饋,學(xué)習(xí)接觸密集型任務(wù),比如插入銷釘。TacSL 支持大規(guī)模訓(xùn)練以及仿真到現(xiàn)實(shí)的成功遷移(成功率 83% 至 91%),使基于觸覺(jué)的學(xué)習(xí)更具實(shí)用性和可擴(kuò)展性。
視頻 1. 不同插銷位置、持銷釘位置和持銷釘方向的插入策略執(zhí)行,展示了對(duì)劇烈光照變化的魯棒性
FORGE:
在不確定性下實(shí)現(xiàn)穩(wěn)健的
接觸密集型操作的力引導(dǎo)探索
圖 7. FORGE 訓(xùn)練流程和多級(jí)行星齒輪箱裝配示例
FORGE 引入了一種方法,使以力測(cè)量值為輸入的強(qiáng)化學(xué)習(xí)策略能夠?qū)崿F(xiàn)零樣本仿真到現(xiàn)實(shí)的遷移。這種方法在零件位姿存在顯著不確定性或任務(wù)需要高精度和準(zhǔn)確性時(shí)非常重要。
主要功能:
力觀測(cè)輸入:自適應(yīng)調(diào)節(jié)操作期間施加的力度。
力閾值機(jī)制:限制最大力度以保護(hù)精密零件。
動(dòng)態(tài)隨機(jī)化方案:在訓(xùn)練期間對(duì)機(jī)器人動(dòng)力學(xué)和零件屬性進(jìn)行隨機(jī)化處理,以實(shí)現(xiàn)穩(wěn)健的真實(shí)世界泛化能力。
成功預(yù)測(cè)器:實(shí)現(xiàn)自主完成任務(wù),而不依賴固定持續(xù)時(shí)間的執(zhí)行。
憑借這些功能,即使在位置估計(jì)誤差高達(dá) 5 毫米的情況下,F(xiàn)ORGE 仍能夠支持安全探索和成功執(zhí)行。圖 8 展示了這一能力在多級(jí)行星齒輪系統(tǒng)裝配中的應(yīng)用。該任務(wù)需要三項(xiàng)裝配技能:插入銷釘、齒輪嚙合和螺母螺栓擰入。
圖8. FORGE在三項(xiàng)不同裝配技能中的應(yīng)用:插入銷釘、齒輪嚙合和螺母螺栓擰入
FORGE 能夠處理如卡扣插入等需要施加力的任務(wù),并在所需力未知時(shí),使用成功預(yù)測(cè)自動(dòng)調(diào)整力度限制。這展示了其具備高精度處理復(fù)雜任務(wù)并適應(yīng)真實(shí)世界不確定性的能力。
總結(jié)
機(jī)器人裝配非常復(fù)雜,需要精確的接觸和真實(shí)世界的適應(yīng)性。本文重點(diǎn)介紹了在仿真到現(xiàn)實(shí)的遷移、觸覺(jué)和力傳感以及自動(dòng)化資產(chǎn)生成方面的研究進(jìn)展,為更靈活、適應(yīng)性更強(qiáng)的自動(dòng)化打下基礎(chǔ)。
這篇文章是“NVIDIA 機(jī)器人研究與開(kāi)發(fā)摘要 (R2D2)”的一部分,旨在讓開(kāi)發(fā)者更深入地了解 NVIDIA 研究中心在物理 AI 和機(jī)器人應(yīng)用方面的最新突破。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29568瀏覽量
211966 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5274瀏覽量
105942 -
AI
+關(guān)注
關(guān)注
88文章
34589瀏覽量
276244
原文標(biāo)題:R2D2:通過(guò) NVIDIA 研究中心的工作流,實(shí)現(xiàn)機(jī)器人裝配和接觸密集型操作
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 第14期:2025.06.2--2025.06.6
I/O密集型任務(wù)開(kāi)發(fā)指導(dǎo)
智能配送裝配機(jī)器人
機(jī)器人產(chǎn)業(yè)的路在何方
什么是工業(yè)機(jī)器人
智久AGV搬運(yùn)機(jī)器人呼喚更多中國(guó)籍的機(jī)器人
機(jī)器人VS人:替代還是協(xié)作?
工業(yè)機(jī)器人結(jié)構(gòu)、驅(qū)動(dòng)及技術(shù)指標(biāo)詳解
工業(yè)機(jī)器人的技術(shù)原理
工業(yè)機(jī)器人視覺(jué)裝配實(shí)訓(xùn)平臺(tái)實(shí)驗(yàn)
計(jì)算密集型的程序簡(jiǎn)析
機(jī)器人是如何實(shí)現(xiàn)運(yùn)作的呢
機(jī)器人裝配操作的控制綜述
搬運(yùn)機(jī)器人的出現(xiàn) 動(dòng)了產(chǎn)業(yè)發(fā)展的轉(zhuǎn)變
使用NVIDIA Isaac的新型仿真方法推進(jìn)機(jī)器人裝配

評(píng)論