魔方可謂20世紀80年代的標志性智力玩具,如今它正在被用作連接深度學習與高等數(shù)學之間的橋梁。
計算機科學教授Pierre Baldi是加州大學歐文分校(UCI)研究團隊從事此項工作的負責人,他認為深度學習與高等數(shù)學之間的“鴻溝”是當今人工智能所面臨的最大難題。
“大家會抱怨深度學習是一個黑盒子,他們不知道這個網(wǎng)絡(luò)在做些什么。”Baldi說道,“而我們可以看到該網(wǎng)絡(luò)正在學習數(shù)學。”
自從匈牙利雕塑家兼建筑學教授Ern? Rubik于1974年發(fā)明了魔方之后,這種各個面色彩不一的立方體就開始讓人們?yōu)橹院屠Щ蟆?/p>
研究團隊發(fā)現(xiàn),深度學習模型可以用于教會機器如何做數(shù)學題(這里是一種被稱為“群論”的代數(shù)概念),這就是Baldi所說的“AI 重大挑戰(zhàn)中的一小步”。
無心插柳
研究人員最初的目標是構(gòu)建一個深度學習模型,可在無需任何人工協(xié)助的情況下解開魔方,就像早期的模型掌握了國際象棋的游戲方式一樣。
為了實現(xiàn)這一目標,他們像教小孩子一樣引導(dǎo)模型學習如何還原魔方。
從已還原的魔方開始,模型首先向后倒退一步,然后還原魔方。接著向后倒退兩步并還原魔方,隨后再向后倒退三步,如此類推。這會讓算法在每一次嘗試中逐漸學習。Baldi將這一過程比作學習高爾夫球,首先從近距離推桿進球開始,然后隨著精確度的提升而逐漸遠離球洞。
該研究團隊最近發(fā)表了一篇論文,詳細介紹了他們的工作。該團隊為其開發(fā)出的增強學習算法起了一個名字:“自學迭代(autodidactic iteration)”。該算法可在平均30步之內(nèi)完全還原被打亂的魔方,也可以實現(xiàn)人類玩家所能達到的最快速度。
研究人員在訓練該模型時使用了搭載NVIDA GPU的機器,同時還使用了CUDA編程模型、TensorFlow機器學習框架和Keras神經(jīng)網(wǎng)絡(luò)API。
據(jù)Baldi估計,GPU將工作速度加快了5到10倍,并且其團隊可以無限制地將更多GPU投入使用,進一步推動深度學習研究。
“我們對GPU求之若渴,”他說道,“它們對于這項工作來說必不可少。”
充滿無限可能的一次進步
Baldi表示,魔方展現(xiàn)了一個獨特的深度學習挑戰(zhàn):魔方的正確解法只有一種,但錯誤的組合形式卻有數(shù)百億億之多。這里用的還只是傳統(tǒng)的三階魔方,每個面各有9個方塊。
解開更高階的魔方是該團隊的下一個奮斗目標。他們想知道將這種“自學迭代”的方式應(yīng)用于四階和五階魔方的效果如何。但首先,團隊必須對該方法進行調(diào)整,以應(yīng)對大幅提高的復(fù)雜度。
“如果將速度降至原來的二分之一,則不會出現(xiàn)什么問題。”Baldi 說道,“但如果將速度減慢到與大陸漂移的速度一樣,那么問題就來了。”
同時Baldi發(fā)現(xiàn),也可以利用這種方式教會自學迭代模型掌握其他游戲的玩法。
他認為這項工作在其他數(shù)學領(lǐng)域也擁有潛在的應(yīng)用機會,尤其是高中水平以上的數(shù)學內(nèi)容。他表示,AI一直在努力實現(xiàn)這一點。
而Baldi的團隊對此的看法則是這種難題很快就會成為明日黃花。同時,解開更復(fù)雜、更困難的問題才是其奮斗目標。
-
gpu
+關(guān)注
關(guān)注
28文章
4806瀏覽量
129585 -
AI
+關(guān)注
關(guān)注
87文章
32021瀏覽量
270891 -
深度學習
+關(guān)注
關(guān)注
73文章
5523瀏覽量
121711
原文標題:通過魔方有望實現(xiàn)AI領(lǐng)域的重大突破
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
Embarcadero:人工智能驅(qū)動發(fā)展我們的期望是什么
用“麥琳文學”打開人工智能,我配擁有一個好的AI學習方法嗎?

評論