在發(fā)布會(huì)上,除了多款機(jī)器人新品亮相以外,ROOBO CTO雷宇還重點(diǎn)發(fā)布了一款人工智能機(jī)器人系統(tǒng)。
雷宇表示,ROOBO決心做機(jī)器人,因?yàn)闄C(jī)器人是最值得做的智能硬件產(chǎn)品。ROOBO人工智能機(jī)器人系統(tǒng)包含三個(gè)部分:智能硬件、人機(jī)交互和人工智能。未來(lái),這個(gè)人工智能機(jī)器人系統(tǒng)不僅會(huì)用于開發(fā)ROOBO旗下的機(jī)器人及智能硬件產(chǎn)品,也會(huì)開放給更多智能硬件的開發(fā)團(tuán)隊(duì),打造一個(gè)完整的人工智能生態(tài),將整個(gè)產(chǎn)業(yè)做大做好。
技術(shù)積累做扎實(shí) 不做PPT產(chǎn)品
發(fā)布會(huì)上,雷宇在介紹ROOBO的人工智能機(jī)器人系統(tǒng)之前,首先向所有的與會(huì)者表明了這樣一個(gè)態(tài)度:ROOBO是一家注重產(chǎn)品的企業(yè),從來(lái)也絕不會(huì)生產(chǎn)PPT產(chǎn)品。
為了解決機(jī)器人聽覺方面例如降噪、識(shí)別準(zhǔn)確度等方面的問(wèn)題,ROOBO在新的機(jī)器人產(chǎn)品中應(yīng)用了mic陣列技術(shù),并且結(jié)合了大數(shù)據(jù)和大搜索來(lái)最大程度的提高語(yǔ)音識(shí)別的準(zhǔn)確度。而在視覺方面,ROOBO對(duì)智能機(jī)器人進(jìn)行了上萬(wàn)種物品的學(xué)習(xí)積累,意圖達(dá)到機(jī)器人在家庭場(chǎng)景中的定位、巡航及家居控制。同樣的,在機(jī)器人運(yùn)動(dòng)方面,ROOBO將機(jī)器人運(yùn)動(dòng)視作人機(jī)交互的一個(gè)重要組成部分,投入了不少精力以解決技術(shù)難題。正如在演講中雷宇表示:“ROOBO一直非常重視技術(shù)的積累。”
有“心意”的人機(jī)交互系統(tǒng)
在雷宇的眼中,機(jī)器人并非一件裝飾品或者擺設(shè),他更希望看到ROOBO的機(jī)器人能夠融入到消費(fèi)者生活的各個(gè)場(chǎng)景當(dāng)中去。所以,在這款機(jī)器人系統(tǒng)當(dāng)中,ROOBO創(chuàng)造了全新的交互系統(tǒng),以優(yōu)化消費(fèi)者與機(jī)器人之間的交互體驗(yàn)。在這款最新發(fā)布的機(jī)器人系統(tǒng)上所承載的人機(jī)交互設(shè)計(jì),不僅包含了觸碰、語(yǔ)音、圖像等現(xiàn)有的交互形式,為了能夠使機(jī)器人更好的融入到生活場(chǎng)景當(dāng)中,還加入了溫度、濕度等環(huán)境因素的感知。雷宇的發(fā)言中還提到了,目前ROOBO正在積極研發(fā)有關(guān)機(jī)器人情緒管理的技術(shù),未來(lái)將實(shí)現(xiàn)機(jī)器人能夠理解人類的情緒并對(duì)之作出帶有情緒的反饋。
“人工智能”的榮光 需要更多人與ROOBO共同努力
在演講中雷宇提到:“我們都是做互聯(lián)網(wǎng)出身的,我們非常懂得一個(gè)道理,一個(gè)行業(yè)真正起來(lái)光靠ROOBO是不夠的,用戶要的永遠(yuǎn)是功能和服務(wù),ROOBO不可能把所有的功能和服務(wù)全部做完”。雷宇表示,此番發(fā)布的機(jī)器人系統(tǒng)將會(huì)是開放式的,所有的模塊都是標(biāo)準(zhǔn)化并可以二次調(diào)用和再開發(fā)的。除此之外,ROOBO還將在硬件層面、應(yīng)用層面來(lái)對(duì)開發(fā)者進(jìn)行支持,并且歡迎諸如滴滴等場(chǎng)景化應(yīng)用企業(yè)進(jìn)行人工智能領(lǐng)域的合作。通過(guò)以上的努力,ROOBO將團(tuán)結(jié)更多的力量打造一個(gè)完整的人工智能生態(tài),將整個(gè)行業(yè)做大做好。
以下為ROOBO CTO雷宇演講原文:
雷宇:我的感覺ROOBO這家公司是做產(chǎn)品的,公司的品牌更實(shí)在。其實(shí)我也不認(rèn)為這是一件壞事,其實(shí)我們都非常努力的在做產(chǎn)品,我們非常努力的在做技術(shù),過(guò)去兩年當(dāng)中我們積累了非常多的在技術(shù)上、用戶體驗(yàn)上的一些東西,今天就由我代表ROOBO向各位、向行業(yè)發(fā)布我們成果。
我今天要發(fā)布的是“ROOBO人工智能機(jī)器人系統(tǒng)”,顧名思義機(jī)器人系統(tǒng)是面向機(jī)器人的一個(gè)完整的系統(tǒng)。今天我會(huì)占用大家一點(diǎn)時(shí)間來(lái)詳細(xì)的介紹一下機(jī)器人系統(tǒng)的定義。
我覺得ROOBO從來(lái)不做PPT產(chǎn)品,今天我講之前,大家看這邊的機(jī)器人是我們最近研發(fā)的代號(hào)為J2的商業(yè)服務(wù)機(jī)器人,接下來(lái)由它和我們產(chǎn)品經(jīng)理馬雅跟大家演示一下整個(gè)機(jī)器人的人機(jī)交互。
這一款機(jī)器人其實(shí)就是搭載了整個(gè)人工智能機(jī)器人系統(tǒng),其實(shí)大家剛才體驗(yàn)到的功能里面包含了人機(jī)交互還有一些功能沒(méi)有展示。
接下來(lái),我來(lái)講一下ROOBO人工智能機(jī)器人系統(tǒng),首先,ROOBO的人工智能機(jī)器人系統(tǒng),我們的定義里面分為三大部分:首先就是智能硬件,然后是人機(jī)交互和人工智能,這三個(gè)部分互相是獨(dú)立的,但是他們互相又有依賴,因?yàn)楝F(xiàn)在有很多人說(shuō)這不就是一個(gè)操作系統(tǒng)嗎,我會(huì)告訴大家不是這樣子,因?yàn)椴僮飨到y(tǒng)是很重要,但是他的重要更多的在于做PC或者手機(jī)這樣的硬件,在形態(tài)和硬件的解決方案都比較固定的情況下,操作系統(tǒng)才是比較重要的。現(xiàn)在操作系統(tǒng)是很重要,但是我們的機(jī)器人系統(tǒng)要定義更多東西。
第一塊就是硬件智能。作為我們做機(jī)器人來(lái)講,首先就要解決“耳朵”的問(wèn)題,其實(shí)像這一款機(jī)器人還有一些別的機(jī)器人,已經(jīng)過(guò)渡到麥克風(fēng)陣列了。可能大家知道語(yǔ)音識(shí)別這種技術(shù),但這種技術(shù)如果沒(méi)有前瞻性的東西把它處理好,它也做不到100%。這一塊我們可以認(rèn)為是一個(gè)聽覺系統(tǒng)先要解決這個(gè)問(wèn)題,我們一直在這個(gè)上面積累,應(yīng)用了很多已經(jīng)積累的技術(shù)來(lái)進(jìn)行改寫、轉(zhuǎn)換和聯(lián)想,從而最大限度的提高語(yǔ)音的識(shí)別率。
第二部分就是“眼睛”。當(dāng)然,ROOBO并不是做攝象頭的,這里要講的是說(shuō)大家知道攝象頭有很多種,我們權(quán)衡了成本的情況下,我們選擇的是雙目攝像頭的方案,我們?cè)陔p目的基礎(chǔ)上衍生的算法。這樣子我們會(huì)盡量達(dá)到一個(gè)比較好的平衡,從而實(shí)現(xiàn)3D建模,包含室內(nèi)的定位,包含室內(nèi)的導(dǎo)航,包括家電控制等等,這一塊我們一直在積累,我們大概積累了1萬(wàn)種物體的樣本資料,我們一直在搜集這方面的數(shù)據(jù)進(jìn)行深度學(xué)習(xí),這一塊我們主要的物體指的家居、家庭設(shè)備、家電、實(shí)物這一塊的東西,希望在家庭范圍機(jī)器人的使用更順暢,包括家居的控制這些都是一些關(guān)鍵的技術(shù)積累,包括人體跟蹤。
第三部分是機(jī)器人的運(yùn)動(dòng),首先是我們的轉(zhuǎn)動(dòng)平臺(tái),我們會(huì)在水平、俯仰還有轉(zhuǎn)動(dòng),在機(jī)器人上的人機(jī)交互這種運(yùn)動(dòng)是非常重要的,這一塊運(yùn)動(dòng)的控制是核心技術(shù)的積累。接下來(lái)的部分是我們的移動(dòng)平臺(tái),移動(dòng)平臺(tái)主要強(qiáng)調(diào)一定要防跌,還有一定的指標(biāo),現(xiàn)在ROOBO做的機(jī)器人都不是很大的機(jī)器人,未來(lái)也會(huì)往這個(gè)方向走。大家都知道我們先做一個(gè)兒童機(jī)器人,再做一個(gè)兒童學(xué)習(xí)機(jī)器人,寵物機(jī)器人、商務(wù)機(jī)器人,我們一直非常重視技術(shù)的積累。
第二塊是人機(jī)交互,這一塊是今天講的重點(diǎn),大家知道每當(dāng)一個(gè)平臺(tái)出現(xiàn)的時(shí)候,都會(huì)與之相配合的人機(jī)交互出現(xiàn),比如說(shuō)Windows和安卓,接下來(lái)我講一下機(jī)器人上的應(yīng)用,剛才J2為我們做了一個(gè)比較好的演示。其實(shí)在輸入和輸出上面必須要迎合利用它的多模的輸入輸出,因?yàn)闄C(jī)器人畢竟不是一個(gè)冷冰冰的硬件,機(jī)器人有自己的表現(xiàn)力,我認(rèn)為這些表現(xiàn)力都是在組合人機(jī)交互上的工具,因?yàn)槲覀冏霎a(chǎn)品也許和現(xiàn)在行業(yè)里我看到的別人不一樣。因?yàn)榫拖褡鎏O果手機(jī)一樣,我們會(huì)去用我們的產(chǎn)品觀和從用戶的角度來(lái)做產(chǎn)品
我們做人工智能機(jī)器人系統(tǒng)定義上更重要的,第一是最短路徑,第二個(gè)是主動(dòng)式。最短路徑剛才大家看到了我要看《瑯琊榜》,傳統(tǒng)的方法沒(méi)有兩三步是不行的,借用機(jī)器人的技術(shù)就可以把體驗(yàn)做的非常簡(jiǎn)單易用。我認(rèn)為這是我們做機(jī)器人上的人機(jī)交互的關(guān)鍵,就是要把最短路徑做出來(lái),各種服務(wù)的最短路徑能不能做到。
剛才的演示并沒(méi)有展示更多的主動(dòng)式,這個(gè)主要是在一問(wèn)一答或者需求上,我認(rèn)為我們創(chuàng)業(yè)并沒(méi)有選擇做手環(huán)或者別的東西,原因很簡(jiǎn)單,我們認(rèn)為機(jī)器人在所有的智能硬件里面是最值得我們做的,下一步對(duì)標(biāo)Windows PC就只有智能機(jī)器人,別的東西也很重要,但是能夠成為平臺(tái)級(jí)的就是它,平臺(tái)級(jí)最大的變化就是主動(dòng)式,我們希望給所有的家具帶去管家,我認(rèn)為主動(dòng)式是我們要把握的東西。
剛才講到語(yǔ)音、視覺和界面,接下來(lái)我講一講我們?cè)谇榫w這一塊做了什么,其實(shí)我們做機(jī)器人系統(tǒng)剛才提到了一些特點(diǎn),其實(shí)情緒這一塊是讓一個(gè)機(jī)器人系統(tǒng)更貼近于真正偏人機(jī)交互重要的基礎(chǔ),我們會(huì)通過(guò)語(yǔ)音,也會(huì)通過(guò)當(dāng)下的環(huán)境,當(dāng)下的場(chǎng)景,更重要的會(huì)識(shí)別表情,還有一個(gè)最近我們也在做就是通過(guò)一些語(yǔ)音的聲調(diào)來(lái)讓機(jī)器人理解你語(yǔ)言背后的真實(shí)情緒進(jìn)而使機(jī)器人的所有反饋都是帶有情緒標(biāo)簽的,不同的機(jī)器人會(huì)有不同的演繹。
提到這里,因?yàn)槲覀冏龊萌藱C(jī)交互系統(tǒng)的同時(shí),以前我們都是做互聯(lián)網(wǎng)出身的,我們非常懂得一個(gè)道理,一個(gè)行業(yè)真正起來(lái)光靠ROOBO是不夠的,用戶要的永遠(yuǎn)是功能和服務(wù),ROOBO不可能把所有的功能和服務(wù)全部做完。我們?cè)谧鲞@個(gè)系統(tǒng)的第一天開始,我就要求所有的研發(fā)必須把系統(tǒng)做成開放式的,也就是說(shuō)我們會(huì)把所有的模塊都標(biāo)準(zhǔn)化,所有的模塊都可以進(jìn)行調(diào)用,并且還不僅限于此,可以邀請(qǐng)開發(fā)者在上面開發(fā),更重要的是像優(yōu)酷這種。移動(dòng)互聯(lián)網(wǎng)上有成千論萬(wàn)的開發(fā)者,有上百萬(wàn)的APP,我們?yōu)槭裁床荒芾盟麄兡兀覀儗?shí)際上對(duì)系統(tǒng)做了深度的修改,可以把安卓里面所有的事項(xiàng)全部立項(xiàng)成語(yǔ)音,這樣可以讓既有的APP有一個(gè)更新的體驗(yàn)。
最后一點(diǎn)就是人工智能,剛才胡郁總也講了人工智能和機(jī)器人的關(guān)系。我個(gè)人認(rèn)為機(jī)器人上的人工智能是有自己的獨(dú)特性的,因?yàn)槿斯ぶ悄苓@個(gè)話題太大了,手機(jī)上也可以做人工智能,大數(shù)據(jù)也可以做人工智能。但是什么是機(jī)器人上的人工智能呢,首先,不能為了做人工智能而人工智能,人工智能要解決什么問(wèn)題,在機(jī)器人上很簡(jiǎn)單,我認(rèn)為就是要解決在各種場(chǎng)景下理解用戶的需求,理解用戶的意圖。然后把我們的服務(wù)和內(nèi)容比較簡(jiǎn)單,最短路徑式的,主動(dòng)式的給到我們。現(xiàn)在基本上以一到兩周的時(shí)間會(huì)接入一個(gè)互聯(lián)網(wǎng)服務(wù)。我們會(huì)在這上面做的非常到位,剛才滴滴叫車也都是大家可以實(shí)際體驗(yàn)到的,我們可以通過(guò)跟滴滴人機(jī)的交互完成打車的過(guò)程。
以上我跟大家講了一下整個(gè)ROOBO人工智能機(jī)器人系統(tǒng)的三大模塊。其實(shí)把這三大塊磨合起來(lái),從下至上形成了一個(gè)生態(tài),這個(gè)生態(tài)從今天開始也算是向行業(yè)來(lái)推出這一套系統(tǒng),我們做了三層開放。第一層開放就是向硬件開發(fā)者開放,因?yàn)楝F(xiàn)在有很多硬件開發(fā)者,自己有很多東西想做,他想做一個(gè)功能,他想做一個(gè)場(chǎng)景。就像前面說(shuō)的一樣,機(jī)器人是很難做的,我個(gè)人認(rèn)為做一個(gè)機(jī)器人的系統(tǒng)很復(fù)雜,我們?cè)敢獍堰@一套解決方案拿出來(lái)跟他們合作,讓他們集中做好自己的應(yīng)用,做好自己的功能,我們來(lái)給他巨大的支持。
第二層是應(yīng)用開發(fā)者,我們歡迎更多的應(yīng)用開發(fā)者,大家一起來(lái)把這個(gè)生態(tài)做好,因?yàn)楣饪课覀兪遣粔虻摹0沧慨?dāng)年出來(lái)的時(shí)候,其實(shí)安卓加入了虛擬機(jī)的概念大家是有很多垢病的,但是安卓會(huì)堅(jiān)持說(shuō)這個(gè)會(huì)帶來(lái)非常多的開發(fā)者,后來(lái)發(fā)現(xiàn)這個(gè)是對(duì)的。有了更多的功能就有更多的用戶,就會(huì)倒逼產(chǎn)業(yè)。
第三個(gè)就是服務(wù)提供商,我們也歡迎滴滴這種互聯(lián)網(wǎng)上的服務(wù),在我們的平臺(tái)上以一種更好的體驗(yàn)輸出給用戶,我認(rèn)為用戶一定會(huì)買單的。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1248瀏覽量
56494 -
機(jī)器人
+關(guān)注
關(guān)注
213文章
29756瀏覽量
213051 -
人工智能
+關(guān)注
關(guān)注
1807文章
49035瀏覽量
249782
發(fā)布評(píng)論請(qǐng)先 登錄
盤點(diǎn)#機(jī)器人開發(fā)平臺(tái)
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
宇樹“功夫機(jī)器人”爆火,這顆芯片的價(jià)值藏不住了

機(jī)器人看點(diǎn):宇樹科技王興興回上海母校 加速商業(yè)化落地 宇樹機(jī)器人二手租賃火爆
宇樹科技攜兩款機(jī)器人亮相2025GDC
宇樹科技王興興:AI驅(qū)動(dòng)機(jī)器人每日快速進(jìn)化
宇樹科技人形機(jī)器人G1京東下架
宇樹科技在物聯(lián)網(wǎng)方面
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊
移動(dòng)機(jī)器人的技術(shù)突破和未來(lái)展望

關(guān)于全自動(dòng)裝車機(jī)器人的詳細(xì)介紹
在用機(jī)器人與未來(lái)機(jī)器人并行推進(jìn)的權(quán)重關(guān)系

評(píng)論