谷歌借助Gemini AI系統(tǒng)深化對機(jī)器人的訓(xùn)練

7月12日，國際科技界傳來新動(dòng)態(tài)，谷歌正借助其先進(jìn)的Gemini AI系統(tǒng)，深化對旗下機(jī)器人的訓(xùn)練，旨在顯著提升它們的導(dǎo)航能力和任務(wù)執(zhí)行能力。DeepMind機(jī)器人團(tuán)隊(duì)最新發(fā)布的研究論文，詳細(xì)闡述了如何利用Gemini 1.5 Pro的強(qiáng)化長上下文窗口功能，極大地優(yōu)化了用戶通過自然語言指令與RT-2機(jī)器人交互的體驗(yàn)。

這一創(chuàng)新技術(shù)的核心在于，機(jī)器人首先通過拍攝并分析家庭或辦公室等指定區(qū)域的視頻，利用Gemini 1.5 Pro的強(qiáng)大能力來“學(xué)習(xí)”并理解其所在環(huán)境。隨后，機(jī)器人能夠基于這些視覺信息，靈活運(yùn)用語音和/或圖像反饋，執(zhí)行用戶的復(fù)雜指令。例如，當(dāng)用戶詢問“我在哪里可以給手機(jī)充電？”時(shí)，機(jī)器人能迅速識(shí)別環(huán)境，并引導(dǎo)用戶至最近的電源插座。

據(jù)DeepMind透露，在覆蓋超過9，000平方英尺的測試區(qū)域內(nèi)，這些由Gemini驅(qū)動(dòng)的機(jī)器人成功響應(yīng)并完成了50多項(xiàng)不同用戶指令，成功率高達(dá)90%，展現(xiàn)了極高的準(zhǔn)確性和效率。

更令人振奮的是，初步研究還揭示了Gemini 1.5 Pro賦予機(jī)器人的額外能力——即除了精準(zhǔn)導(dǎo)航外，還能規(guī)劃并執(zhí)行更為復(fù)雜的任務(wù)指令。例如，面對詢問是否有特定飲料的用戶，機(jī)器人能夠自主決定前往冰箱檢查，隨后返回并報(bào)告結(jié)果，這一連串動(dòng)作展現(xiàn)了其強(qiáng)大的決策與執(zhí)行能力。

盡管在視頻演示中，機(jī)器人對每條指令的迅速確認(rèn)給人留下了深刻印象，但研究報(bào)告也誠實(shí)地指出了背后隱藏的“秘密”——處理這些復(fù)雜指令實(shí)際上需要10至30秒的時(shí)間。這表明，盡管技術(shù)進(jìn)步顯著，但實(shí)現(xiàn)完全無縫的人機(jī)交互仍需時(shí)日。

不過，這一系列的進(jìn)展無疑為我們描繪了一幅未來生活的美好圖景：或許不久的將來，我們就能與這些高度智能化的機(jī)器人共享家園，讓它們幫助我們找到遺失的鑰匙、錢包，甚至是執(zhí)行更多日常生活中的瑣碎任務(wù)，極大地提升生活的便捷性與舒適度。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
213

文章
29748

瀏覽量
212979
谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6231

瀏覽量
108181
AI

AI

+關(guān)注

關(guān)注
88

文章
35168

瀏覽量
280135

評(píng)論

要長高
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 量子芯片是什么東西量子芯片和普通芯片的區(qū)別
Hot openai是哪個(gè)公司的 OpenAI的代表產(chǎn)品有哪些

New AD203SN加固型軍用溫度范圍隔離放大器技術(shù)手冊
New MAX250/MAX251 5V、隔離型、RS-232驅(qū)動(dòng)器/接收器技術(shù)手冊

精選推薦
更多

文章

資料

帖子

基于睿擎派輕松玩轉(zhuǎn)CANopen電機(jī)控制

RT-Thread官方賬號(hào)
1天前

184 閱讀

RK3568開發(fā)板暗藏32位兼容開關(guān)？飛凌嵌入式帶你一鍵解鎖！

飛凌嵌入式
1天前

191 閱讀

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
1天前

810 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
1天前

899 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
1天前

786 閱讀

電調(diào)諧調(diào)頻收音機(jī)的設(shè)計(jì)

yezi888
178 KB

免費(fèi)

321下載

單片機(jī)控制系統(tǒng)的抗干擾設(shè)計(jì)

Kelly Yang
130.0 KB

免費(fèi)

114下載

ScrapydWeb用于Scrapyd集群管理的web應(yīng)用

尤立虔
0.98 MB

2積分

2下載

Flannel容器集群子網(wǎng)

李皓圳
11.46 MB

免費(fèi)

0下載

xdelta差量更新算法

王越建
0.00 MB

2積分

1下載

【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章：探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

jf_83922529
21小時(shí)前

67 閱讀

【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】EASY-EAI-Toolkit人臉識(shí)別

1653149838.791300
21小時(shí)前

57 閱讀

【Banana Pi BPI-RV2開發(fā)板試用體驗(yàn)】從零編譯Banana Pi BPI-RV2開發(fā)板的openWRT

大菠蘿Alpha
21小時(shí)前

70 閱讀

【RA-Eco-RA6M4開發(fā)板評(píng)測】基于SHELL進(jìn)行ADC測試

jf_1137202360
21小時(shí)前

154 閱讀

【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】3、開源大語言模型部署

左岸cpx
1天前

357 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

搜索歷史

谷歌借助Gemini AI系統(tǒng)深化對機(jī)器人的訓(xùn)練

評(píng)論