近日,北京大學與智元機器人的聯合實驗室有了重大成果,北?攜?智元機器?團隊提出 OmniManip 架構。
在具身智能領域,將視覺語言基礎模型(VLMs)應用于機器人實現通用操作一直是核心問題。目前存在兩大挑戰,一是VLMs缺乏精確3D理解能力,二是難以將高層次推理轉化為機器人低層次動作。
為解決這些難題,OmniManip架構應運而生。它基于以對象為中心的3D交互基元,把VLM的高層次推理能力轉化為機器人的低層次高精度動作。針對大模型幻覺和真實環境操作的不確定性,OmniManip引入了VLM規劃和機器人執行的雙閉環系統設計。
OmniManip的關鍵設計亮點頗多,包括基于VLM的任務解析,可將復雜任務分解為多個明確主動物體、被動物體和動作類型的結構化階段。還有閉環機器人執行,通過物體6D姿態跟蹤器實時更新物體位姿,轉換為機械臂操作軌跡。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
機器人
+關注
關注
212文章
29161瀏覽量
210608 -
語言模型
+關注
關注
0文章
556瀏覽量
10553
發布評論請先 登錄
相關推薦
宇樹科技攜兩款機器人亮相2025GDC
等大模型AI突破的刺激下, 有望成為人形機器人真正的量產元年。 在春晚亮相的宇樹科技一直備受關注,我們今天又看到一條消息,宇樹科技攜兩款機器人亮相2025GDC。 2025全球開發者先鋒大會(GDC)于22日在上海徐匯西岸大劇
寧德時代自研機器人團隊成立,探索多元科技領域
寧德時代近期加大對機器人領域的投入,已在上海組建了一支數十人的專業團隊,專注于自研機器人本體、控制算法以及人機交互技術。該團隊的目標是推動機械臂、AGV等工業
字節豆包大模型團隊提出稀疏模型架構
字節跳動豆包大模型Foundation團隊近期研發出UltraMem,一種創新的稀疏模型架構,旨在解決推理過程中的訪存問題,同時確保模型效果不受影響。
字節豆包大模型團隊推出UltraMem稀疏架構
字節跳動豆包大模型Foundation團隊近期在稀疏模型架構領域取得了新突破,提出了一種名為UltraMem的新型架構。這一架構通過將計算和
寧德時代自研機器人團隊成立
寧德時代在機器人領域的布局正逐步展開。去年底,該公司開始加大對機器人領域的投入,并已在上海組建了一支由數十人構成的團隊,專注于自研機器人本體、控制及人機交互算法。 該
《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型
研讀《具身智能機器人系統》第7-9章,我被書中對大模型與機器人技術融合的深入分析所吸引。第7章詳細闡述了ChatGPT for Robotics的核心技術創新:它摒棄了傳統的分層控制架構,創造性地
發表于 12-24 15:03
走進北大 | 算能RISC-V通用處理器設計成功開課
近日,北京大學集成電路學院賈天宇老師開設的《現代SoC處理器架構設計》如期進行,算能首席科學家楊柳西博士、處理器架構師張明俊受邀,為北大博士講授了RXU高性能通用處理器設計的課程。《現代系統SoC

“0元購”智元靈犀X1機器人,軟硬件全套圖紙和代碼全公開!資料免費下載!
出定制化的運動控制策略。尤其是專業人士或初創團隊,基于智元提供的核心組件,可以輕松打造出個性化的人形機器人產品,并借助開源代碼快速完成整機工程,極大地降低了研發成本和門檻。
智元靈犀X
發表于 10-25 15:20
飛利浦家電全球首席執行官攜全球高層團隊來華 持續看好中國市場
下,展開了為期4天的交流。 這也是自Véronique今年3月上任以來,攜高層團隊首次來華訪問。此行不僅極大地促進了總部與中國團隊之間的緊密聯系與高效協作,也彰顯了在中國市場強大的"磁吸力"下,飛利浦家電對于中國市場的高度重視及

【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受
”,好奇于這種大模型算力中心到底是如何建設的,用什么設備、什么架構建設的?對這些問題真是一無所知,甚至都沒有想過,帶著這份好奇開始閱讀。
先瀏覽目錄,共分十三章,目錄中出現最多的就是GPU,比如機器學習
發表于 10-08 10:40
AMD贊助多支FIRST機器人競賽團隊
AMD 在 2024 賽季贊助了多支 FIRST 機器人競賽團隊。FIRST 機器人競賽旨在教導高中生如何構建能夠執行特定任務的機器人,同時也讓他們有機會學習重要的商業和時間管理技能、
戴爾重組銷售架構,成立AI新團隊
戴爾公司近期宣布了一項重大戰略調整,旨在通過銷售團隊重組及新團隊的成立,加速其向人工智能(AI)領域的轉型步伐。此次重組中,戴爾不僅裁減了部分銷售人員以優化成本結構,更關鍵的是,公司正式成立了專注于AI產品和服務的新團隊,標志著
日本團隊發布在富岳超算上訓練的Fugaku-LLM大模型
自2023年5月起,Fugaku-LLM模型的開發工作開始展開,最初參與團隊包括富士通、東京工業大學、日本東北大學以及日本理化學研究所(簡稱理研)。
谷歌解散整個Python團隊
近日,谷歌Python工程師Thomas Wouters在社交媒體上透露,谷歌對其Python團隊進行了架構調整,整個團隊被解散。這一變動可能源于公司的成本優化策略,涉及團隊重組和裁員
評論