具身智能的關(guān)鍵卡點(diǎn)到底在哪?中國具身智能的機(jī)遇在哪?最近行業(yè)是否有陷入泡沫危機(jī)的風(fēng)險(xiǎn)?
隨著具身智能發(fā)展從實(shí)驗(yàn)研發(fā)轉(zhuǎn)向產(chǎn)業(yè)落地階段,一系列關(guān)鍵問題接踵而至。
近期,來自具身智能學(xué)界與產(chǎn)業(yè)界的重量級(jí)嘉賓——上海交通大學(xué)副教授、上海人工智能研究院首席科學(xué)家閆維新,庫帕思 CEO黃海清,松應(yīng)科技創(chuàng)始人CEO聶凱旋,銀河通用合伙人、大模型負(fù)責(zé)人張直政,商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆及主持人量子位總編輯李根等齊聚一堂,圍繞當(dāng)前具身智能的熱議話題,站在產(chǎn)業(yè)鏈視角,共同探討了具身智能與AI基礎(chǔ)設(shè)施如何協(xié)同創(chuàng)新,破題行業(yè)困境,實(shí)現(xiàn)正向可持續(xù)發(fā)展。
01模型能力進(jìn)展快、場景潛力待釋放,具身智能機(jī)遇與挑戰(zhàn)并存
在大模型的加持下,具身智能突飛猛進(jìn),大小腦模型的突破、仿真系統(tǒng)的構(gòu)建、場景應(yīng)用潛力的挖掘,成為當(dāng)前最為鮮明的行業(yè)趨勢。
閆維新教授表示,得益于深度模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的深度協(xié)同,具身智能的小腦進(jìn)化迅速,機(jī)器人的直膝行走能力進(jìn)步顯著,在不同地形和摩擦系數(shù)的環(huán)境中,魯棒性和泛化性均大幅增強(qiáng)。同時(shí),在大腦方面的創(chuàng)新也在加速,隨著百萬真機(jī)數(shù)據(jù)集積累、以及“一腦多能、一腦多機(jī)”通用平臺(tái)的出現(xiàn),正推動(dòng)具身智能在日常生活和工作場景中展現(xiàn)更多應(yīng)用潛能。
張直政也認(rèn)為,具身智能領(lǐng)域呈現(xiàn)出“科研-創(chuàng)新-應(yīng)用“全鏈條蓬勃發(fā)展態(tài)勢。在數(shù)據(jù)層面,仿真合成數(shù)據(jù)與真實(shí)采集數(shù)據(jù)積累均呈現(xiàn)爆發(fā)式增長態(tài)勢;在架構(gòu)層面,大小腦模型、分層端到端模型等創(chuàng)新理念不斷涌現(xiàn);疊加國家政策的有力支持,更讓行業(yè)對(duì)具身智能的規(guī)模化商業(yè)應(yīng)用充滿信心,其商業(yè)化落地潛力非常值得大家期待。
盡管發(fā)展勢頭正盛,但具身智能仍處于技術(shù)探索期,面臨數(shù)據(jù)、成本、能力等方面的諸多挑戰(zhàn)。黃海清指出,各企業(yè)間的數(shù)據(jù)難以互通,數(shù)據(jù)構(gòu)建成本居高不下,阻礙了模型的訓(xùn)練效率;同時(shí),高昂的成本也限制了機(jī)器人的普及速度;此外,機(jī)器人在主動(dòng)思考和復(fù)雜環(huán)境適應(yīng)能力上與人類仍存較大差距,適用場景有限,亟待行業(yè)共同探討、共同解決、共同推進(jìn)。
物理AI仿真對(duì)促進(jìn)具身智能模型的訓(xùn)練起著關(guān)鍵作用。聶凱旋將其比作連接AI與物理世界,以及教會(huì)AI理解物理世界的橋梁,讓機(jī)器人可以自我進(jìn)化,快速學(xué)習(xí)抓取、行走,甚至翻跟頭、跳舞等技能。而一套完善的物理AI仿真系統(tǒng),需要涵蓋視覺、觸覺、聽覺、運(yùn)動(dòng)控制等各類組件,讓機(jī)器人真正做到像人一樣能夠360度地感知物理世界。
02發(fā)揮數(shù)據(jù)優(yōu)勢,是中國具身智能“彎道超車”的關(guān)鍵
算法、算力、數(shù)據(jù)是人工智能的三要素,同時(shí)也是具身智能發(fā)展的重要基礎(chǔ)設(shè)施。作為全球具身智能領(lǐng)域的“領(lǐng)跑者”,中國和美國在具身智能這一處于起步階段的新興前沿領(lǐng)域,存在哪些差距?
在算法層面,嘉賓一致認(rèn)為中美差距并不大,基本可以達(dá)到旗鼓相當(dāng)?shù)臓顟B(tài)。張直政還指出,VLA將成為具身智能未來的核心技術(shù)路徑。其高度泛化能力可實(shí)現(xiàn)從結(jié)構(gòu)化場景應(yīng)用到非結(jié)構(gòu)化場景應(yīng)用的進(jìn)步;同時(shí),提供了將泛化動(dòng)作和通用感知相結(jié)合的全新技術(shù)范式,可大幅提升環(huán)境感知、任務(wù)規(guī)劃推理和動(dòng)作執(zhí)行能力;并且,能夠以更高的數(shù)據(jù)利用效率,端到端提升從感知到規(guī)劃再到執(zhí)行的整體性能。
在算力層面,閆維新教授坦承中美在訓(xùn)練算力和推理算力方面仍有差距,尤其和英偉達(dá)CUDA生態(tài)的差距更為顯著,但隨著國產(chǎn)算力加速創(chuàng)新,也在加快追趕步伐。
楊帆認(rèn)為,盡管國產(chǎn)算力受上游產(chǎn)能制約存在客觀差距,但可以通過模型結(jié)構(gòu)與硬件的端到端聯(lián)合優(yōu)化來縮小差異,這也是DeepSeek實(shí)現(xiàn)了行業(yè)領(lǐng)先的推理性價(jià)比的關(guān)鍵所在。商湯大裝置也著力于系統(tǒng)軟件層的優(yōu)化創(chuàng)新,針對(duì)特定的應(yīng)用場景進(jìn)行端到端調(diào)優(yōu),為行業(yè)輸出更具性價(jià)比的解決方案。
在數(shù)據(jù)層面,現(xiàn)場嘉賓紛紛表示,中國在物理場景和應(yīng)用數(shù)據(jù)采集上具有全棧優(yōu)勢,樣本豐富度高于美國,是中國具身智能彎道超車的關(guān)鍵。
閆維新教授特別強(qiáng)調(diào),中國在樣本端的收集能力遠(yuǎn)超國外,尤其是最為稀缺的機(jī)器人應(yīng)用場景數(shù)據(jù),中國比美國有更好的機(jī)會(huì)和能力收集這樣的數(shù)據(jù)。
盡管我國在數(shù)據(jù)體量上擁有顯著優(yōu)勢,但數(shù)據(jù)難流通依然是行業(yè)發(fā)展的掣肘。尤其對(duì)于創(chuàng)業(yè)公司來說,語料數(shù)據(jù)高昂的成本是不可承受之痛,行業(yè)迫切需要解決語料數(shù)據(jù)獲取難、獲取貴、不共享的問題。
對(duì)此,黃海清提出了四項(xiàng)舉措:牽頭探討語料數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)劃、探索生產(chǎn)伴隨式的數(shù)據(jù)采集方式、研發(fā)自動(dòng)化標(biāo)注工具鏈平臺(tái)、推進(jìn)數(shù)據(jù)合成技術(shù)的應(yīng)用,進(jìn)而激活數(shù)據(jù)價(jià)值,推動(dòng)具身智能產(chǎn)業(yè)更好的服務(wù)千行百業(yè)。
針對(duì)這個(gè)話題,聶凱旋強(qiáng)調(diào),中國作為制造業(yè)大國,擁有豐富的全產(chǎn)業(yè)鏈數(shù)據(jù),結(jié)合物理AI仿真的快速創(chuàng)新,更可以加速技術(shù)的迭代和驗(yàn)證。
當(dāng)前,商湯科技與松應(yīng)科技已在數(shù)據(jù)仿真、研發(fā)管線、客戶服務(wù)層面展開全面合作。商湯大裝置面向具身智能的解決方案,能夠端到端賦能技術(shù)研發(fā),覆蓋數(shù)據(jù)生產(chǎn)、工具支撐及模型研發(fā)全流程,為企業(yè)提供“開箱即用” 的研發(fā)工具鏈,致力于解決具身智能落地最后一公里難題。
03具身智能的“打臉時(shí)刻” 何時(shí)上演?
發(fā)展歷程,從AlphaGo戰(zhàn)勝人類圍棋冠軍到ChatGPT實(shí)現(xiàn)流暢人機(jī)對(duì)話,這些 “打臉時(shí)刻”一次次顛覆了人們對(duì)人工智能的認(rèn)知。在具身智能領(lǐng)域,同樣令人期待的“打臉時(shí)刻”也成為嘉賓們熱議的焦點(diǎn)。
張直政認(rèn)為,具身智能的“打臉時(shí)刻”將在各個(gè)行業(yè)悄然降臨。與場景相對(duì)單一的自動(dòng)駕駛不同,具身智能應(yīng)用場景豐富多樣,它可先學(xué)習(xí)通用知識(shí),再快速在特定場景中成為專家,以多層次、全方位的方式在不同領(lǐng)域?qū)崿F(xiàn)突破。
閆維新教授以自己在冬奧會(huì)期間參與過的烹飪機(jī)器人項(xiàng)目為例,他介紹說,餐廳中的人形機(jī)器人在無預(yù)設(shè)程序的情況下,能夠自主完成復(fù)雜烹飪過程,從食材處理、火候把控到菜品烹制、擺盤,一氣呵成,色香味形俱佳。這種自主完成復(fù)雜任務(wù)的能力,正是具身智能“打臉時(shí)刻”的生動(dòng)體現(xiàn)。
黃海清提出了“打臉時(shí)刻”的兩個(gè)標(biāo)準(zhǔn)。一方面,在商業(yè)超市、工廠等場景中,機(jī)器人若能以較低成本完成簡單重復(fù)性任務(wù),實(shí)現(xiàn)從50萬開發(fā)成本到5~10萬的突破,便是重要的“打臉時(shí)刻”。另一方面,當(dāng)機(jī)器人具備與人類一樣的共情能力,能在情感陪護(hù)、康養(yǎng)養(yǎng)老等場景中給予人們情感關(guān)懷時(shí),也將是具身智能的又一次重大飛躍。
聶凱旋從技術(shù)供應(yīng)商角度出發(fā),認(rèn)為在近10個(gè)大類、100個(gè)小類的具身智能應(yīng)用場景中,每個(gè)子行業(yè)都有望誕生冠軍企業(yè)。這些冠軍企業(yè)不僅代表著技術(shù)領(lǐng)先,還能激活產(chǎn)業(yè)鏈,推動(dòng)行業(yè)轉(zhuǎn)型發(fā)展。當(dāng)具身智能能夠助力制造業(yè)、交通物流、康養(yǎng)醫(yī)療等傳統(tǒng)行業(yè)效率大幅提高,推動(dòng) GDP 增長時(shí),便是“打臉時(shí)刻”的到來。
楊帆心中期待的“打臉時(shí)刻”更為長遠(yuǎn)且具體。他希望看到機(jī)器人在完成復(fù)雜任務(wù)的同時(shí),能與外界人類社會(huì)進(jìn)行無約束的交互。比如,在主人提出需求后,機(jī)器人能獨(dú)自前往辦公室取回遺忘物品,在這過程中,不僅要完成識(shí)別、拿取物品的任務(wù),還要應(yīng)對(duì)復(fù)雜的外界環(huán)境,如與陌生人交流、防范意外情況等。
04“批量退出”不等于“泡沫”,克服質(zhì)疑才能走向產(chǎn)業(yè)落地
“具身智能是否會(huì)是一場資本狂歡下的泡沫”的爭論被擺上臺(tái)面。
數(shù)據(jù)顯示,截止3月26日,今年具身智能領(lǐng)域共發(fā)生投融資42次,已達(dá)到2024年全年的50%,熱度持續(xù)攀升。然而,前不久創(chuàng)投圈“批量退出具身智能”的相關(guān)言論,引發(fā)不小熱議。
張直政認(rèn)為,行業(yè)內(nèi)出現(xiàn)不同的討論聲音,反而說明人們對(duì)技術(shù)的想象力和它的邊界之間產(chǎn)生了碰撞。消滅泡沫是科技創(chuàng)新的驅(qū)動(dòng)力,創(chuàng)業(yè)者的使命就在于從宏觀思考出發(fā),結(jié)合微觀的具體的產(chǎn)業(yè)應(yīng)用需求,把對(duì)前沿技術(shù)的想象變成真正落地的產(chǎn)品。
閆維新教授也提到,泡沫是遠(yuǎn)離了價(jià)值以外的內(nèi)容,只要大方向正確,總能找到機(jī)器人能力上限和應(yīng)用場景下限之間的交集。比如在危險(xiǎn)替代領(lǐng)域,具身智能和非視距遙操作結(jié)合,未來三五年有望實(shí)現(xiàn)落地應(yīng)用,要對(duì)行業(yè)發(fā)展有信心。
楊帆認(rèn)為,投資人的公開質(zhì)疑是行業(yè)的標(biāo)志性事件,只有直面這些質(zhì)疑,經(jīng)歷這些質(zhì)疑,克服這些質(zhì)疑,行業(yè)才能真正從實(shí)驗(yàn)探索階段走向認(rèn)真、嚴(yán)肅的產(chǎn)業(yè)落地階段。
盡管面臨數(shù)據(jù)壁壘、技術(shù)瓶頸與商業(yè)化的多重挑戰(zhàn),但大家的共識(shí)清晰可見——泡沫爭議背后是產(chǎn)業(yè)突破的前奏,從烹飪機(jī)器人的自主操作到低成本工業(yè)場景的規(guī)模化落地,從情感交互的突破到跨行業(yè)效率的革命性提升,“打臉時(shí)刻”或許不會(huì)一蹴而就,卻已在細(xì)分領(lǐng)域悄然醞釀。
正如論壇所揭示的,唯有產(chǎn)學(xué)研協(xié)同攻堅(jiān)、開放共享基礎(chǔ)設(shè)施、直面質(zhì)疑并迭代價(jià)值,才能將具身智能從資本的“想象力試驗(yàn)”轉(zhuǎn)化為推動(dòng)社會(huì)進(jìn)步的“生產(chǎn)力引擎”,也終將在質(zhì)疑與突破的循環(huán)中,書寫屬于AI產(chǎn)業(yè)的新篇。
-
人工智能
+關(guān)注
關(guān)注
1805文章
48843瀏覽量
247404 -
商湯科技
+關(guān)注
關(guān)注
8文章
557瀏覽量
36693 -
具身智能
+關(guān)注
關(guān)注
0文章
125瀏覽量
417
原文標(biāo)題:具身智能,中國“彎道超車”的關(guān)鍵在這↓↓↓
文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄

英特爾? 具身智能大小腦融合方案發(fā)布:構(gòu)建具身智能落地新范式

激活具身智能創(chuàng)新加速度,九章云極DataCanvas公司領(lǐng)航CEAI 2025中國具身智能大會(huì)

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人的基礎(chǔ)模塊
《具身智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之具身智能機(jī)器人計(jì)算挑戰(zhàn)
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊
什么是具身智能?自動(dòng)駕駛是具身智能嗎?
具身智能與機(jī)器學(xué)習(xí)的關(guān)系
具身智能在人工智能中的應(yīng)用
廣和通榮登36氪具身智能創(chuàng)新應(yīng)用案例及《2024年具身智能產(chǎn)業(yè)發(fā)展研究報(bào)告》

廣和通榮登36氪具身智能創(chuàng)新應(yīng)用案例及2024年具身智能產(chǎn)業(yè)發(fā)展研究報(bào)告

評(píng)論