一手創(chuàng)造史上最強(qiáng)圍棋人工智能AlphaGo的DeepMind團(tuán)隊(duì),又教會了人工智能在迷宮中“抄近路”。
北京時(shí)間5月10日凌晨1時(shí),該英國團(tuán)隊(duì)在世界頂級學(xué)術(shù)雜志《自然》上發(fā)表論文稱,其最新研發(fā)出的一個(gè)人工智能程序具有類似哺乳動物一樣的尋路能力,非常類似大腦中網(wǎng)格細(xì)胞的工作原理。
神秘的網(wǎng)格細(xì)胞:大腦內(nèi)置GPS
從家出發(fā)到新的地點(diǎn),再原路返回,從中選擇盡可能的捷徑,這是絕大多數(shù)動物都能勝任的簡單任務(wù)。然而,大腦這種本能的導(dǎo)航機(jī)制尚未被完全理解。
科學(xué)家們在動物和人類大腦中找到了三種跟認(rèn)路相關(guān)的細(xì)胞,分別是位置細(xì)胞、方向細(xì)胞和網(wǎng)格細(xì)胞。
位置細(xì)胞能在主體到達(dá)特定地點(diǎn)時(shí)放電,從而賦予對過往地點(diǎn)的記憶;方向細(xì)胞能感應(yīng)前進(jìn)的方向;網(wǎng)格細(xì)胞則是最神秘的一種:它們能將整個(gè)空間環(huán)境劃分成蜂窩狀的六邊形網(wǎng)格,仿佛地圖上的坐標(biāo)系。
發(fā)現(xiàn)網(wǎng)格細(xì)胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學(xué)或醫(yī)學(xué)獎。不過,網(wǎng)格細(xì)胞僅僅是在空間環(huán)境中提供GPS定位服務(wù)嗎?一些科學(xué)家猜測,它們也會參與矢量計(jì)算,輔助動物規(guī)劃路徑。
人工神經(jīng)網(wǎng)絡(luò)中自動出現(xiàn)類似結(jié)構(gòu)
DeepMind團(tuán)隊(duì)決定用人工神經(jīng)網(wǎng)絡(luò)檢驗(yàn)上述猜想。人工神經(jīng)網(wǎng)絡(luò)是一種利用多層處理模擬大腦神經(jīng)網(wǎng)絡(luò)的運(yùn)算結(jié)構(gòu)。團(tuán)隊(duì)首先用深度學(xué)習(xí)算法訓(xùn)練神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)哺乳動物的覓食運(yùn)動路徑,利用線速度、角速度等信號在視覺環(huán)境中進(jìn)行定位。
研究人員隨后發(fā)現(xiàn),一種類似于網(wǎng)格細(xì)胞活動特征的結(jié)構(gòu)自動誕生了!在此前的訓(xùn)練中,研究人員并未刻意引導(dǎo)神經(jīng)網(wǎng)絡(luò)產(chǎn)生此種結(jié)構(gòu)。
人工神經(jīng)網(wǎng)絡(luò)中自動出現(xiàn)了與大鼠網(wǎng)格細(xì)胞(下)類似的網(wǎng)格結(jié)構(gòu)(上) 圖片來源:DeepMind官方博客
這再次顯示了深度學(xué)習(xí)的可喜又可畏之處:這是一種通過大量匹配的輸入和輸出值訓(xùn)練機(jī)器自我摸索的算法,最后得到的機(jī)器邏輯是不為人知的黑匣子。正如AlphaGo自動領(lǐng)悟了人類千年棋史上從所未見的“天外飛仙”棋招,這次的神經(jīng)網(wǎng)絡(luò)也自動出現(xiàn)了令人驚喜的結(jié)構(gòu)。
迷宮尋路
DeepMind團(tuán)隊(duì)隨后利用強(qiáng)化學(xué)習(xí)檢驗(yàn)這種網(wǎng)格結(jié)構(gòu)是否能夠進(jìn)行矢量導(dǎo)航。強(qiáng)化學(xué)習(xí)被普遍用于訓(xùn)練游戲AI,人類告訴AI一種游戲的得分獎懲機(jī)制,但卻不教授游戲方法,由AI在反復(fù)進(jìn)行游戲、努力爭取更高分的過程中自我進(jìn)化。后期的AlphaGo就完全擯棄了人類棋譜經(jīng)驗(yàn),在純粹的自我對弈中從零進(jìn)化到更強(qiáng)版本。
研究人員將之前自動出現(xiàn)的網(wǎng)格結(jié)構(gòu)與一個(gè)更大型的神經(jīng)網(wǎng)絡(luò)架構(gòu)結(jié)合成了人工智能體,置于虛擬現(xiàn)實(shí)的游戲環(huán)境中。經(jīng)歷強(qiáng)化學(xué)習(xí)后,該人工智能在游戲迷宮中向目的地前進(jìn)的導(dǎo)航能力超越了一般人,達(dá)到了職業(yè)游戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。
人工智能學(xué)習(xí)在迷宮中抄近路
最關(guān)鍵的是,當(dāng)研究人員“靜默”原來的網(wǎng)格結(jié)構(gòu)后,人工智能體的導(dǎo)航能力就會變?nèi)酰袛嗄繕?biāo)的距離和方向都更不準(zhǔn)確了。
論文作者之一Dharshan Kumaran說道:“我們證明了網(wǎng)格細(xì)胞遠(yuǎn)不只是給我們提供GPS定位信號,也是一種大腦賴以計(jì)算兩個(gè)地點(diǎn)間的最短距離的核心導(dǎo)航機(jī)制。”
用人工智能代替小白鼠做實(shí)驗(yàn)
與一直強(qiáng)調(diào)“人工智能不是仿生學(xué)”的Facebook人工智能首席科學(xué)家楊立昆(Yann Lecun)不同,天才創(chuàng)始人戴密斯·哈薩比斯(Demis Hassabis)執(zhí)掌的DeepMind熱衷探索人工智能與腦科學(xué)的相輔相成。這項(xiàng)研究再一次體現(xiàn)了他們的科學(xué)理念:腦科學(xué)啟發(fā)下的人工智能算法能反過來幫助人類探索大腦運(yùn)行機(jī)制,從而也更好地理解人工智能的內(nèi)在邏輯。哈薩比斯評價(jià)道:“我們相信人工智能和神經(jīng)科學(xué)是相互啟發(fā)的。這項(xiàng)工作就是很好的證明:通過研發(fā)出一個(gè)能在復(fù)雜環(huán)境中導(dǎo)航的人工智能體,我們對網(wǎng)格細(xì)胞在哺乳動物導(dǎo)航中的重要性有了更深的理解。”DeepMind團(tuán)隊(duì)相信,類似的研究方法還可以用來探索大腦聽覺和控制四肢的機(jī)制。在更遠(yuǎn)的將來,神經(jīng)科學(xué)家們甚至可以用人工智能代替小白鼠來做實(shí)驗(yàn)。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240336
原文標(biāo)題:DeepMind新論文:人工智能學(xué)會像哺乳動物那樣抄近路
文章出處:【微信號:jingzhenglizixun,微信公眾號:機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論