在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

佛山智能裝備院與華數(shù)機器人在具身智能工業(yè)機器人領(lǐng)域的研究成果

HSR華數(shù)機器人 ? 來源:佛山智能裝備技術(shù)研究院 ? 2025-04-09 15:40 ? 次閱讀

來源:佛山智能裝備技術(shù)研究院

近日,佛山智能裝備技術(shù)研究院(簡稱“佛山智能裝備院”)與佛山華數(shù)機器人有限公司(簡稱“華數(shù)機器人”)在具身智能工業(yè)機器人領(lǐng)域的研究成果“Advancing general robotic manipulation with Multimodal Foundation Models: an embodied Al paradigm”刊登在中科院一區(qū)TOP級SCI期刊SCIENCE CHINA Technological Sciences。該研究成果由佛山智能裝備院關(guān)鍵技術(shù)實驗室創(chuàng)新團隊牽頭,實驗室主任黃石峰博士為第一完成人,中國工程院外籍院士張建偉教授為通訊作者,北京大學(xué)前沿計算研究中心、銀河通用機器人有限公司創(chuàng)始人兼CTO王鶴教授,華數(shù)機器人楊海濱總經(jīng)理,佛山智能裝備院周星常務(wù)副院長,德國漢堡大學(xué)陳文凱博士后研究員為共同完成人。

智能工業(yè)機器人勢在必行

當(dāng)前的機器人技術(shù)能否全面勝任人類生產(chǎn)生活中的所有勞動呢?實際上,機器人的應(yīng)用仍然受到限制,尤其是在日常場景中常見的開放、非結(jié)構(gòu)化環(huán)境中,比如服務(wù)、醫(yī)療、農(nóng)業(yè)、建筑以及眾多其他領(lǐng)域,如圖2 所示。從通用機器人操作的角度來看,挑戰(zhàn)源于以下方面:

操作門檻高:需要人類操作員掌握專門的機器人編程語言,并深入理解手頭的任務(wù)。這些任務(wù)需要被分解為機器人能夠執(zhí)行的一系列連續(xù)動作,即動作層面的機器人程序開發(fā)。這種方式導(dǎo)致了高昂的勞動力成本,尤其是在諸如船舶制造這類多品種、小批量的應(yīng)用場景中。

自主任務(wù)執(zhí)行能力有限:機器人缺乏面向高層級抽象任務(wù)的自主動作生成能力(自主決策、自主規(guī)劃、自主執(zhí)行能力弱)。這一限制使得傳統(tǒng)機器人不適合部署在那些需要與人類進行復(fù)雜交互和無縫協(xié)作的開放、非結(jié)構(gòu)化環(huán)境中。

操作技能欠佳:機器人在許多任務(wù)上表現(xiàn)不佳,尤其是那些需要靈巧操作技能的任務(wù)。例如,在鞋廠中,仍然需要工人手動穿鞋帶。一方面,機器人在獲取特定操作所需的專業(yè)且復(fù)雜的技能方面面臨重大挑戰(zhàn)。另一方面,它們執(zhí)行這些技能時往往較為僵硬且效率低下,缺乏人類操作時的流暢性。

圖2 機器人低滲透率的應(yīng)用場景:(a) 造船業(yè);(b) 家庭服務(wù);(c) 服裝廠的疊衣應(yīng)用;(d) 鞋廠的穿鞋帶應(yīng)用;(e) 建筑工地;(f) 新能源汽車電池的極耳組裝

具身智能與生成式人工智能

近年來,具身智能(指擁有物理實體的人工智能系統(tǒng))的興起,似乎為通用機器人操作技術(shù)的發(fā)展提供了一條充滿希望的路徑。在這種背景下,機器人仿佛擁有了一顆智能的“大腦”,展現(xiàn)出了適應(yīng)多樣環(huán)境的潛力以及執(zhí)行各類任務(wù)的靈活性。這些特質(zhì)對于通用機器人操作而言至關(guān)重要。然而,早期將人工智能與機器人技術(shù)相結(jié)合的嘗試并未實現(xiàn)如此高水平的智能。一個有趣的現(xiàn)象是:具身智能的出現(xiàn),幾乎與生成式人工智能的重大突破同步發(fā)生,其中的典型代表就是2022年末發(fā)布的ChatGPT,它是大語言模型(LLMs)發(fā)展歷程中的一項里程碑式成果。這些創(chuàng)新的交匯引發(fā)了一些發(fā)人深省的思考:

為什么大語言模型能夠推動具身智能的發(fā)展?

僅憑大“語言”模型,是否足以實現(xiàn)我們所期望的通用機器人操作愿景?

因此,這促使我們深入思考具身智能的本質(zhì),并評估在通用機器人操作方面大語言模型的能力和局限性。我們對上述問題的看法如下。

大語言模型(LLMs)基于在大規(guī)模互聯(lián)網(wǎng)數(shù)據(jù)上進行預(yù)訓(xùn)練,通過無監(jiān)督學(xué)習(xí)的方式在語言建模中預(yù)測下一個詞元,它們在上下文理解以及通過思維鏈提示進行連續(xù)對話方面表現(xiàn)了出色的能力。此外,借助由縮放定律(scaling laws)所支撐的超大型模型,大語言模型在常識知識和推理方面展現(xiàn)出了卓越的性能。傳統(tǒng)意義的工業(yè)機器人在人們心目中的主流形象更像是單純的“自動化設(shè)備”,而非“智能體”。幾十年來,機器人一直受困于缺乏一個類似智能大腦的系統(tǒng)。近期的研究進展表明,大語言模型可以為機器人配備一個類似大腦的系統(tǒng)。大語言模型促進了操作員與機器人之間的自然語言交互,使機器人能夠有效地理解人類意圖并做出決策。因此,大語言模型有潛力克服“操作門檻高”這一瓶頸,并緩解在開放、非結(jié)構(gòu)化環(huán)境中“自主任務(wù)執(zhí)行能力有限”所帶來的挑戰(zhàn)。

然而,具身智能的內(nèi)涵強調(diào)的是智能源于智能體的實體(物理身體)與其現(xiàn)實世界環(huán)境之間的動態(tài)交互,并且在其整個生命周期中持續(xù)學(xué)習(xí)與發(fā)展。因此,具身智能與傳統(tǒng)人工智能(即離身智能)的根本區(qū)別在于具身智能中存在物理實體。機器人操作是具身智能的一個基礎(chǔ)研究課題,它超越了基于語言的反饋模式,涵蓋了機器人本體感受、觸覺感知、力/扭矩反饋、視覺等多個方面。這些豐富的感知模式對于識別物體的可供性以及智能的形成至關(guān)重要。例如,當(dāng)我們抓取一個物體時,我們會利用觸覺反饋來評估物體的質(zhì)地和重量,而視覺輸入則有助于確定物體的形狀和方位。這些綜合的感知模式使我們能夠了解如何操作該物體。顯然,僅靠大語言模型(僅基于語言)無法滿足具身智能的要求,因為它們?nèi)狈C器人操作所需的面向動作的能力。因此,我們需要更強大的基礎(chǔ)模型,這些模型能夠整合機器人所感知到的各種模態(tài)信息,比如視覺語言模型(VLMs)和視覺語言動作模型(VLAs),它們統(tǒng)稱為多模態(tài)基礎(chǔ)模型(MFMs)。

edf82520-145a-11f0-9310-92fbcf53809c.png

圖3 典型的端到端架構(gòu)

智能工業(yè)機器人的體系架構(gòu)

在具身智能范式下,多模態(tài)基礎(chǔ)模型(MFMs)能夠推動通用機器人操作技術(shù)的發(fā)展。如今,適用于具身智能的技術(shù)框架仍然是一個開放話題,大致可分為兩類:1)端到端(E2E)架構(gòu)和2)模塊化(或分層式)架構(gòu)。下面,我們將對這兩類架構(gòu)分別進行討論。

端到端架構(gòu)直接將原始傳感器數(shù)據(jù)映射為動作,無需中間的手工設(shè)計模塊,如圖3所示。這種方法避免了模塊間信息傳輸過程中的失真,減少了累積誤差和延遲,并實現(xiàn)了更無縫的集成。此外,端到端流程能夠更有效地捕捉人類技能,因為抽象的動作往往難以用分析方法精確建模。特斯拉的完全自動駕駛第12版(FSD V12)就是端到端實現(xiàn)的一個突出例子。

盡管端到端架構(gòu)具有很大的潛力,但其局限性也不容忽視。一個完全的端到端架構(gòu)就像一個黑箱模型,缺乏可解釋性和安全保障。其性能在很大程度上依賴于訓(xùn)練階段大規(guī)模高質(zhì)量數(shù)據(jù)集的可用性,并且要實現(xiàn)高泛化能力需要大規(guī)模的神經(jīng)網(wǎng)絡(luò)架構(gòu)。這種對大量數(shù)據(jù)和復(fù)雜模型的依賴,會在數(shù)據(jù)標(biāo)注成本、計算資源以及過擬合風(fēng)險等方面帶來重大挑戰(zhàn)。此外,由于缺乏可解釋性,很難驗證模型的決策,這對安全關(guān)鍵型應(yīng)用是不利的。為了緩解這些問題,需要進行廣泛的驗證和測試,并且可以采用增強模型可解釋性的技術(shù),以便更好地理解決策過程。總的來說,我們認為端到端架構(gòu)可以作為一個長期的發(fā)展目標(biāo)。

ee0ab10e-145a-11f0-9310-92fbcf53809c.png

圖4模塊化框架:“小腦 - 大腦” 耦合、復(fù)雜任務(wù)拆解、元技能組合、融合建模學(xué)習(xí)

對于大多數(shù)機器人制造商而言,一種更具可部署性且更具成本效益的解決方案是采用模塊化架構(gòu)。在這種架構(gòu)中,諸如感知、規(guī)劃和控制等模塊是獨立設(shè)計的。我們提出了一種模塊化架構(gòu)解決方案,其特點是“大腦-小腦” 耦合、復(fù)雜任務(wù)拆解、元技能組合、融合模型學(xué)習(xí),如圖4所示。多模態(tài)基礎(chǔ)模型(MFMs)的功能類似于大腦,支持多模態(tài)感知、推理和決策,同時也滿足自然的人機交互(nHRI)要求。在這種情況下,人類用戶可以通過各種形式傳達任務(wù),包括語音、文本和圖像,并且機器人能夠理解所接收信息背后的潛在意圖。此外,多模態(tài)基礎(chǔ)模型以自上而下的方式(任務(wù)規(guī)劃)將任務(wù),尤其是復(fù)雜且長程任務(wù),拆解為更簡單的子任務(wù)。然后,每個子任務(wù)都可以映射為多種技能的組合。當(dāng)前層面的技能顆粒度仍然相對較粗,可以進一步拆解為元技能。在機器人領(lǐng)域,對于元技能(primitive skills)的嚴格定義尚未標(biāo)準(zhǔn)化。我們將元技能視為構(gòu)成更復(fù)雜技能的動作單元。元技能的關(guān)鍵特征如下:

原子性:元技能是基本動作,是構(gòu)建復(fù)雜技能的基礎(chǔ)。這些動作通常簡單直接,例如移動、扭轉(zhuǎn)、抓取、放置、按壓等。

可復(fù)用性:由于其原子性,元技能可以在各種任務(wù)中重復(fù)使用和組合。例如,抓取技能不僅可以應(yīng)用于拾取物體,還可以用于操作工具。

可組合性:通過組合不同的元技能,可以創(chuàng)建更復(fù)雜的技能和任務(wù)序列。例如,將抓取、移動和放置技能相結(jié)合,就可以實現(xiàn)搬運和重新放置物體的能力。

對于元技能的描述可以表述為:[動作] + [工具] + [被操作物體] + [目標(biāo)位置] + [條件]。需要注意的是,即使是相同的動作,當(dāng)它與不同的工具、物體或其他組成部分相結(jié)合時,仍然被視為相同的元技能。

現(xiàn)實生活中的任務(wù)幾乎是無窮無盡的,并且常常需要掌握一些意想不到的技能,同時環(huán)境也會隨著時間而變化。因此,對于元技能的策略學(xué)習(xí),比如利用強化學(xué)習(xí)(RL)或模仿學(xué)習(xí)(IL)來掌握這些技能,應(yīng)該設(shè)計成一種持續(xù)學(xué)習(xí)的范式,以避免對先前學(xué)到的技能產(chǎn)生災(zāi)難性遺忘。我們建議使用輕量級模型進行策略學(xué)習(xí),以便于訓(xùn)練并確保能夠?qū)崟r響應(yīng)。此外,所提出的策略學(xué)習(xí)架構(gòu)(即“小腦”部分)是融合建模方式。基于機理的方法可以作為數(shù)據(jù)驅(qū)動策略學(xué)習(xí)的輔助組成部分。例如,在以插入操作為元技能的精密裝配任務(wù)中,將接觸力/扭矩轉(zhuǎn)化為機器人關(guān)節(jié)動作的策略模型可以分解為兩個部分:1)從末端執(zhí)行器感知的六維力/扭矩向量到工具的六維位姿調(diào)整的映射,利用數(shù)據(jù)驅(qū)動的學(xué)習(xí)策略來封裝人類的專業(yè)知識;2)從工具的末端執(zhí)行器位姿到機器人關(guān)節(jié)構(gòu)型的映射,這可以利用基于機器人原理的解析逆運動學(xué)方法有效地計算。此外,一些涉及幾何元素的元技能,如直線運動、圓周運動或擺線運動,可以直接使用解析方法來構(gòu)建。這些都是傳統(tǒng)機器人很容易掌握的經(jīng)典技能,但當(dāng)通過數(shù)據(jù)驅(qū)動的方法學(xué)習(xí)時,往往會得到不盡如人意的結(jié)果(例如,精度低)。這種融合建模架構(gòu)降低了策略學(xué)習(xí)的復(fù)雜性,同時提供了更好的物理可解釋性。

所提出的模塊化架構(gòu)強調(diào)了復(fù)雜任務(wù)的拆解以及元技能的組合,同時還探討了生成式人工智能如何與機器人的經(jīng)典控制系統(tǒng)相集成。事實上,任務(wù)拆解和元技能組合背后的原理是受到人類認知的啟發(fā)。當(dāng)面對一項長期任務(wù)時,人類會自然而然地將其拆解為較小的子任務(wù)。人類智慧的一個關(guān)鍵方面在于能夠從一個示例推廣到另一個示例,這使我們能夠在各種不同的情境中靈活運用所學(xué)知識。例如,掌握了“插入”這樣的元技能后,我們就能執(zhí)行一系列廣泛的相關(guān)任務(wù),比如插入三腳電源插頭、USB接口,或者將機械軸裝配到孔中,而無需針對每個單獨的任務(wù)重新學(xué)習(xí)基本技能。這種卓越的泛化能力源于對這些操作所需的底層元技能的深入掌握。

具身智能在通用機器人操作領(lǐng)域的重點發(fā)展方向

最后,為了推動具身智能在通用機器人操作領(lǐng)域的發(fā)展,應(yīng)著重關(guān)注以下幾個方面:1)開發(fā)高性能的人工智能芯片以及面向具身智能的網(wǎng)絡(luò)體系架構(gòu),以便在終端平臺上部署大型模型并實現(xiàn)實時計算。2)探索多具身智能的認知演化與協(xié)作,構(gòu)建安全、具有因果關(guān)系且值得信賴的世界模型。3)實現(xiàn)基于詞元化的多模態(tài)集成優(yōu)化,開發(fā)用于透明決策的可解釋人工智能理論,并致力于減少多模態(tài)基礎(chǔ)模型產(chǎn)生幻覺的情況。4)利用真實世界的數(shù)據(jù)和合成數(shù)據(jù),為各個領(lǐng)域創(chuàng)建高質(zhì)量的數(shù)據(jù)集。5)構(gòu)建具有可擴展功能和長期記憶的特定領(lǐng)域模型,以支持垂直應(yīng)用。6)通過零樣本模擬到真實的遷移,提高學(xué)習(xí)復(fù)雜技能的效率,并應(yīng)對在現(xiàn)實世界環(huán)境中實現(xiàn)終身技能發(fā)展所面臨的挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 工業(yè)機器人
    +關(guān)注

    關(guān)注

    91

    文章

    3426

    瀏覽量

    93554
  • 華數(shù)機器人
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    1014
  • 具身智能
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    316

原文標(biāo)題:佛山智能裝備院在《中國科學(xué)》發(fā)表關(guān)于智能工業(yè)機器人底座技術(shù)的最新研究成果

文章出處:【微信號:HSR華數(shù)機器人,微信公眾號:HSR華數(shù)機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    解碼“什么是智能工業(yè)機器人

    智能”從虛擬算法延伸至物理實體,為柔性制造注入革命性力量。富唯智能作為國內(nèi)領(lǐng)先的智能裝備企業(yè),以自主研發(fā)的
    的頭像 發(fā)表于 03-21 14:47 ?262次閱讀
    解碼“什么是<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b><b class='flag-5'>工業(yè)</b><b class='flag-5'>機器人</b>”

    成都微與科技深化人工智能機器人領(lǐng)域合作

    近日,成都微與四川人形機器人科技有限公司(科技)在成都高新區(qū)四川人工
    的頭像 發(fā)表于 02-28 16:58 ?460次閱讀

    數(shù)機器人亮相2025智能機器人科技產(chǎn)業(yè)金融大會

    近日,2025智能機器人科技產(chǎn)業(yè)金融大會暨重慶市機器人智能
    的頭像 發(fā)表于 02-27 11:36 ?501次閱讀

    佛山智能裝備技術(shù)研究院機器人動力學(xué)研究成果取得世界級突破

    佛山智能裝備技術(shù)研究院(以下簡稱“智能裝備”)在蛇
    的頭像 發(fā)表于 02-20 10:02 ?355次閱讀
    <b class='flag-5'>佛山</b><b class='flag-5'>智能</b><b class='flag-5'>裝備</b>技術(shù)<b class='flag-5'>研究院</b><b class='flag-5'>機器人</b>動力學(xué)<b class='flag-5'>研究成果</b>取得世界級突破

    【「智能機器人系統(tǒng)」閱讀體驗】2.智能機器人的基礎(chǔ)模塊

    智能機器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機器人計算系統(tǒng),自主機器人
    發(fā)表于 01-04 19:22

    智能機器人系統(tǒng)》第10-13章閱讀心得之智能機器人計算挑戰(zhàn)

    閱讀《智能機器人系統(tǒng)》第10-13章,我對智能
    發(fā)表于 01-04 01:15

    【「智能機器人系統(tǒng)」閱讀體驗】+兩本互為支持的書

    最近在閱讀《智能機器人系統(tǒng)》這本書的同時,還讀了 《計算機視覺之PyTorch數(shù)字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇。《計算機視覺之PyTorch數(shù)字圖像處理》
    發(fā)表于 01-01 15:50

    【「智能機器人系統(tǒng)」閱讀體驗】2.智能機器人大模型

    近年來,人工智能領(lǐng)域的大模型技術(shù)在多個方向上取得了突破性的進展,特別是在機器人控制領(lǐng)域展現(xiàn)出了巨大的潛力。在“
    發(fā)表于 12-29 23:04

    【「智能機器人系統(tǒng)」閱讀體驗】1.初步理解智能

    的進步。自2000年中國國防科技大學(xué)研制出國內(nèi)第一臺仿智能機器人“先行者”以來,國內(nèi)在該領(lǐng)域
    發(fā)表于 12-28 21:12

    【「智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

    了解智能機器人相關(guān)的知識,我感到十分榮幸和幸運。 全書簡介 本書以循序漸進的方式展開,通過對
    發(fā)表于 12-27 14:50

    智能機器人系統(tǒng)》第7-9章閱讀心得之智能機器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應(yīng)新工藝流程。
    發(fā)表于 12-24 15:03

    【「智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    提高機器人的自適應(yīng)性和自主性,賦能機器人在多種場景中的應(yīng)用。例如在家庭自動化領(lǐng)域智能
    發(fā)表于 12-20 19:17

    智能機器人系統(tǒng)》第1-6章閱讀心得之智能機器人系統(tǒng)背景知識與基礎(chǔ)模塊

    、谷歌的RT系列等前沿產(chǎn)品中展露鋒芒。這些突破性成果標(biāo)志著AI正從虛擬世界邁向物理世界的深度交互。 而研讀《智能機器人系統(tǒng)》前六章,我對
    發(fā)表于 12-19 22:26

    名單公布!【書籍評測活動NO.51】智能機器人系統(tǒng) | 了解AI的下一個浪潮!

    智能通過提高機器人的自適應(yīng)性和自主性,賦能機器人在多種場景中的應(yīng)用。 例如,在家庭自動化領(lǐng)域
    發(fā)表于 11-11 10:20

    國內(nèi)首個智能工業(yè)機器人領(lǐng)域報告重磅開啟!

    9月26日,工博會期間開展的“2024年上海智能機器人前沿發(fā)展大會”上,由微億智造、捷勃特和中國信通華東分院共同發(fā)起并聯(lián)合編寫的《
    的頭像 發(fā)表于 09-29 09:07 ?471次閱讀
    國內(nèi)首個<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b><b class='flag-5'>工業(yè)</b><b class='flag-5'>機器人</b><b class='flag-5'>領(lǐng)域</b>報告重磅開啟!
    主站蜘蛛池模板: 国产一级特黄aa大片爽爽 | 国产精品第页 | 亚洲a区视频 | 老色批在线播放视频网站免费 | 视频在线免费看 | 免费美剧在线观看 | 亚洲成在人线久久综合 | 日本级毛片免费观看 | 久久国产午夜精品理论篇小说 | 综合亚洲色图 | 91福利视频网站 | 亚洲天堂成人网 | 久久天天躁夜夜躁狠狠85麻豆 | 国产三级日本三级韩国三级在线观看 | 天天撸视频| 99久久精品国产免费 | 亚洲精品卡1卡二卡3卡四卡 | 小草影院亚洲私人影院 | 夜夜爽爽爽 | 女性一级全黄生活片在线播放 | 中日韩精品视频在线观看 | 俺要色 | 波多野结衣在线网站 | 大胆国模一区二区三区伊人 | 九九re热| 国产日本特黄特色大片免费视频 | 一本到午夜92版免费福利 | 一级毛片女人喷潮 | 可以免费看黄色的网站 | 国产乱人视频免费播放 | 一级黄色免费毛片 | 国产美女精品一区二区三区 | 奇米777me | 亚洲一区二区精品推荐 | 久久精品夜夜夜夜夜久久 | 国语自产自拍秒拍在线视频 | 农村一级片 | 黄 色 免费网 站 成 人 | 日本亚洲欧美国产日韩ay高清 | 天天躁夜夜躁狠狠躁躁88 | 四虎影院永久在线观看 |