如何讓3D人形機器人學會行走

來自英特爾 AI實驗室和俄勒岡州立大學工程學院協作機器人和智能系統研究所的研究人員結合了多種方法，制作了性能更好的強化學習系統，可應用于機器人控制，控制自主車輛功能的系統和其他復雜系統。

協同進化強化學習(CERL)可以在類人、Hopper、Swimmer、HalfCheetah和Walker2D等基準測試中獲得更好的性能。使用CERL方法，研究人員能夠基于OpenAI的Humanoid基準測試使3D人形機器人直立行走。

這些成果在一定程度上是通過訓練系統實現的，該系統探索了更多的強化學習訓練環境，以尋求獎勵并完成特定的任務。

環境探索對于確保記錄各種經驗并考慮行動方案非常重要。研究人員在一篇解釋CERL工作原理的論文中說，與環境探索相關的問題已經出現，特別是在使用深度強化學習來完成具有挑戰性的現實任務越來越普及的情況下。該論文寫道，“神經進化將整個過程結合在一起，產生了一個超越任何個體學習者能力的學習者。”

CERL將基于策略梯度的強化學習和進化算法相結合，然后在每批或每一代訓練系統中選擇表現最佳的神經網絡。這樣，研究人員可以就可以使用最強大的神經網絡來創建新一代的系統，并且可以將計算資源分配給實現最佳性能的算法。

CERL還結合了重放緩沖區，用于存儲學習者在環境中的體驗，以便創建單個重放緩沖區并在系統之間共享體驗，從而實現比以前方法更高的樣本效率。

當前，人工智能正在從多個方面賦予機器人越來越多的能力，相信隨著相關技術的不斷增強，人形機器人的應用場景也將會大大拓展。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
213

文章
29718

瀏覽量
212769

精選推薦
更多

文章

資料

帖子

一文詳解NMOS與PMOS晶體管的區別

芯長征科技
13小時前

382 閱讀

智能體浪潮里，豆包的崛起之路

腦極體
14小時前

336 閱讀

NVIDIA Isaac Lab可用環境與強化學習腳本使用指南

麗臺科技
15小時前

273 閱讀

兆易創新加入RT-Thread高級會員合作伙伴計劃 | 戰略新篇

RT-Thread官方賬號
21小時前

410 閱讀

如何提高LED驅動控制電路抗干擾能力

無錫中微愛芯電子有限公司
20小時前

525 閱讀

MR-J2S使用手冊

哈哈哈
16.7 MB

10積分

172下載

電子線路非線性部分教程

笑是留言
16.9 MB

免費

0下載

openharmony第三方組件適配移植的自定義折線控件庫

姚小熊27
0.10 MB

免費

2下載

BiliCC-Srt字幕下載工具

劉滿貴
0.02 MB

2積分

1下載

華瑞昇CR216芯片數字萬用表規格書附原理圖及校正流程方法

靈寶滾滾紅塵
0.74 MB

3積分

76下載

【微五科技CF5010RBT60開發板試用體驗】+步進電機的驅動控制

jinglixixi
1天前

334 閱讀

【項目分享】Xii-Boy-Ultra 無線便攜式 Wii 游戲機

dianzi_0101
1天前

145 閱讀

【米爾RK3576開發板免費體驗】1、開發環境、鏡像燒錄、QT開發環境搭建以及應用部署

EPTmachine
1天前

177 閱讀

【社區之星】李靜：不斷學習，去追隨新技術的腳步，將知識通過實踐轉換為能力

dianzi_0101
4天前

943 閱讀

《電子發燒友電子設計周報》聚焦硬科技領域核心價值第19期：2025.07.7--2025.07.11

電子人steve
4天前

948 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

如何讓3D人形機器人學會行走

評論