微軟團隊正探索如何將 OpenAI研發(fā)的ChatGPT擴展到機器人領域,旨在讓人類用自然語言控制如機械臂、無人機、家庭輔助機器人等多個平臺。3月23日,OpenAI還領投了挪威人形機器人公司1X。
3月8日,谷歌和柏林工業(yè)大學的團隊重磅推出了史上最大的視覺語言模型——PaLM-E,同時谷歌表示,計劃探索PaLM-E在現(xiàn)實世界場景中的更多應用,例如家庭自動化或工業(yè)機器人,希望PaLM-E能夠激發(fā)更多關于多模態(tài)推理和具身AI的研究。
據(jù)了解,阿里云工程師也正在實驗將千問大模型接入工業(yè)機器人,以便實現(xiàn)遠程指揮機器人工作。在近日舉行的第六屆數(shù)字中國建設峰會上,阿里云發(fā)布的一個演示視頻中展示了千問大模型的實際應用場景。
“我渴了,找點東西喝吧。”工程師通過釘釘對話框向機器人發(fā)出指令后,千問大模型回答,“好的,我找找有什么喝的?!彪S后,千問大模型在后臺自動編寫了一組代碼發(fā)給機器人,機器人開始識別周邊環(huán)境,從附近的桌上找到一瓶水,并自動完成移動、抓取、配送等一系列動作,遞送給工程師。
科幻電影中機器人和人交互的畫面正在變成現(xiàn)實。
▍技術能力解析
從技術原理上來理解,這意味著千問大模型首先理解了人類這句話的內容,然后在后臺自動編寫一組代碼發(fā)給機器人,機器人則完成識別周邊環(huán)境、找水至配送等一系列動作。
在釘釘對話框輸入一句人類語言即可指揮機器人工作,這將為工業(yè)機器人的開發(fā)和應用帶來革命性的變化。其背后意味著大模型為工業(yè)機器人的開發(fā)打開了新的大門。因為千問等大模型為機器人提供了推理決策的能力,從而有望讓機器人的靈活性和智能性大幅提升。
阿里云工程師表示,這種能力意味著新的變革。機器人之前能夠完成一些人類設置的固定任務,但并不能執(zhí)行一些需要“隨機應變”的任務,“AI大模型突破了機器人的局限,讓人類可以通過自然語言指揮機器完成負責任務,讓機器人真有了大腦。”
可以說大模型的誕生為工業(yè)機器人打開了一扇新的窗,據(jù)阿里云工程師介紹,例如在生產(chǎn)運行時,一線工程師只需發(fā)送一段文字,千問就能理解其意圖進行任務推理,并自動翻譯成機器可以理解的代碼,指揮機器執(zhí)行任務,有效提升生產(chǎn)效率。
阿里巴巴董事會主席兼 CEO、阿里云智能 CEO 張勇表示,數(shù)字化是基礎,智能化是方向,當前的人工智能浪潮是和 20 年前的數(shù)字化浪潮同等重要的機會,行業(yè)正處于智能化時代的歷史新起點。阿里正朝著這個方向快速邁進。
“就像數(shù)字化時代出現(xiàn)一批數(shù)字原生企業(yè),智能化時代也必將出現(xiàn)一系列智能原生企業(yè)。我們深刻感受到,‘所有不可想象,終將化為尋?!!彼f。
目前,人們依然嚴重依賴代碼來實現(xiàn)對機器人的控制,人類操作機器人需要學習復雜的編程語言或機器人系統(tǒng)的細節(jié),而GPT等大模型的出現(xiàn),為推翻豎立在人類與AI面前的“巴別塔”提供了新思路,即將多模態(tài)的大語言模型作為人類與機器人溝通的橋梁。
正如阿里云工程師所說,“AI大模型突破了機器人的局限,讓人類可以通過自然語言指揮機器完成負責任務,讓機器人真正有了大腦?!?/p>
張勇也表示,由于實體經(jīng)濟是智能化主戰(zhàn)場,新的AI大模型讓千行百業(yè)將被重新定義。“AI大模型將以更低門檻、更高效率,打通一個個數(shù)據(jù)斷流節(jié)點,推動數(shù)據(jù)在研發(fā)、生產(chǎn)、配送、服務等環(huán)節(jié)暢通流動,服務實體經(jīng)濟的智能化升級?!?/p>
當然,大模型對機器人領域的加持不僅體現(xiàn)在應用環(huán)節(jié),也可參與開發(fā)環(huán)節(jié)。
面向制造領域,阿里云將進一步融合千問大模型與阿里云物聯(lián)網(wǎng)平臺能力,為企業(yè)提供智能解決方案,讓生產(chǎn)制造全流程變得更智能、更高效。
據(jù)阿里云工程師介紹,在機器人開發(fā)階段,工程師可通過千問大模型自動生成代碼指令完成機器人功能的開發(fā)與調試,甚至還能為機器人創(chuàng)造一些全新的功能。
日前,阿里云已宣布啟動“通義千問伙伴計劃”,將優(yōu)先為千問伙伴提供大模型領域的技術、服務與產(chǎn)品支持,共同推動大模型在不同行業(yè)的應用,已有超20萬企業(yè)用戶申請接入千問測試。
▍難點和未來
不過,大模型只是提供了一種新思路,距離能聽懂“人話”的機器人面世,或許還有很長的路要走。
因為語言模型固然可以為機器人提供更好的步驟規(guī)劃評估和選擇,但并不能面面俱到,比如不能告訴機器人打開冰箱時應施加多大的力。因此,我們發(fā)現(xiàn)全世界包括谷歌在內的巨頭也暫時沒有將裝上大模型的機器人商業(yè)化的計劃。
但制造業(yè)是AI大模型的重要應用場景之一,未來的機遇在于云、AI與物理世界機器的融合,AI大模型必然能為工業(yè)機器人、服務機器人的智能化發(fā)展帶來了新的機遇和挑戰(zhàn),而這也將推動實體經(jīng)濟向更加智能化的方向發(fā)展。
為此,除了阿里外,國內多家互聯(lián)網(wǎng)巨頭也在AI+機器人領域動作頻頻。
4月25日,據(jù)騰訊Robotics X實驗室公布最新機器人研究進展,首次展示在靈巧操作領域的成果,推出自研機器人靈巧手“TRX-Hand”和機械臂“TRX-Arm”。
4月24日,據(jù)企查查APP顯示,近日北京小米機器人技術有限公司成立,注冊資本5000萬元人民幣。經(jīng)營范圍包含:智能機器人的研發(fā);人工智能行業(yè)應用系統(tǒng)集成服務;人工智能基礎資源與技術平臺;微特電機及組件制造等。資料顯示,小米在國內機器人布局版圖不斷擴大,從CyberDog(仿生機器狗),再到Cyberone(仿生機器人),持續(xù)加注在機器人領域的研發(fā)和創(chuàng)新。
而國內2022年受益于汽車動力 電池、光伏等新能源行業(yè)的發(fā)展機遇,隨著今年工業(yè)機器人行業(yè)景氣度繼續(xù)提升,多家機器人企業(yè)也在開辟自己的新方向,例如通過機器視覺、傳感器等相關技術的發(fā)展及與工業(yè)機器人深度結合,促進工業(yè)機器人的可用性和易用性。
根據(jù)國家統(tǒng)計局統(tǒng)計,2015—2022年我國工業(yè)機器人產(chǎn)量由3.30萬臺增長至44.31 萬臺,CAGR達44.92%,2023年1-3月工業(yè)機器人累計產(chǎn)量10.37萬臺,同比-3.00%,工業(yè)機器人行業(yè)正步入窗口期。多家企業(yè)收入實現(xiàn)快速增長,但盈利能力需要進一步改善。
從發(fā)展方向上看,隨著工業(yè)機器人應用門檻的下降,工業(yè)機器人的應用已經(jīng)不再局限于對負載、響應性、一致性要求較高的行業(yè),AI的發(fā)展更是已經(jīng)推動了機器人企業(yè)軟硬件迭代加速。未來工業(yè)機器人的發(fā)展以提升應用廣度和深度為方向,其中運動控制技術、控制系統(tǒng)技術促進產(chǎn)品性能提升,AI相關技術促進智能化提升,未來工業(yè)機器人會向著智能化、精細化方向努力,另一部分硬件制造、集成新技術則推動工業(yè)機器人賦能多行業(yè)進一步深化。
審核編輯 :李倩
-
AI
+關注
關注
88文章
34778瀏覽量
277025 -
智能化
+關注
關注
15文章
5114瀏覽量
57084 -
工業(yè)機器人
+關注
關注
91文章
3450瀏覽量
93912
原文標題:為機器人注入靈魂?阿里“千問”大模型帶來了哪些新動向?
文章出處:【微信號:信息與電子工程前沿FITEE,微信公眾號:信息與電子工程前沿FITEE】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論