在Machine Learning and the Market for Intelligence 2017大會上,“強化學(xué)習(xí)之父”Richard S. Sutton與美國企業(yè)家、風(fēng)險投資人士Steve Jurvetson進(jìn)行了關(guān)于“為何目標(biāo)對于智能至關(guān)重要”的對談。Sutton表示,創(chuàng)造人工智能就是在創(chuàng)造一種新的人類。我們應(yīng)對此感到歡欣鼓舞。
在Machine Learning and the Market for Intelligence 2017大會上,艾伯塔大學(xué)計算機科學(xué)教授Richard S. Sutton與美國企業(yè)家、風(fēng)險投資人士Steve Jurvetson進(jìn)行了關(guān)于“為何目標(biāo)對于智能至關(guān)重要”的對談。
Richard S. Sutton是艾伯塔大學(xué)計算科學(xué)系的教授兼iCORE主席。在2003年加入艾伯塔大學(xué)之前,他曾在美國AT&T公司和GTE實驗室以及馬薩諸塞大學(xué)工作。他于1984年獲得馬薩諸塞大學(xué)計算機科學(xué)博士學(xué)位,并于1978年獲得斯坦福大學(xué)心理學(xué)學(xué)士學(xué)位。2016年他當(dāng)選為加拿大皇家學(xué)會會員。在艾伯塔大學(xué),Sutton領(lǐng)導(dǎo)了強化學(xué)習(xí)和人工智能實驗室,是艾伯塔機器情報研究所的首席研究員。
他的研究興趣集中在決策者與環(huán)境相互作用所面臨的學(xué)習(xí)問題上,他認(rèn)為這是人工智能的核心。他還對動物學(xué)習(xí)心理學(xué),連接網(wǎng)絡(luò)以及不斷改進(jìn)世界的表征和模型的系統(tǒng)感興趣。Richard Sutton 被認(rèn)為是強化學(xué)習(xí)之父。今年6月,Demis Hassabis宣布Richard Sutton將聯(lián)合領(lǐng)導(dǎo)一個位于加拿大的DeepMind辦公室,同時在艾伯塔大學(xué)保留他的教授職位。
Q:AI以人類為中心?或是一個完全不同的物種(對人類生存具有攻擊性和毀滅性)?(human-centric or alien AI)
A:我想提出一種觀點,AI比我們想得更加以人類為中心。通常的觀點都是認(rèn)為AI與人類相對立,機器會淘汰人類。但這僅是一家之言,因此我提出另一種觀點來平衡上述觀點。先從“人工智能”這個名字說起。這個名字暗示著這是一種和人類智能不同的智能,是人造的智能。但首先我們要定義這是一種與人類相似的智能。所以從定義來看,AI是以人類為中心的。因此,也許我們不該把它叫做“人工智能”,我們應(yīng)該直接叫它“智能”。現(xiàn)在人們都把AI看作是一種工程上的存在,不是一種類人的存在。但我認(rèn)為,在當(dāng)今很多領(lǐng)域,AI都是以人類為中心的。比如機器翻譯就是關(guān)于人的溝通。因此,AI實際上是在增強 (enhancing) 人類,這也是AI具有重要商業(yè)意義的原因。AI不是在完虐人類,而是在增強人類。
Q:這聽起來很像是人類的感知,視覺、觸覺、聽覺乃至嗅覺都已經(jīng)通過模擬的方式被使用了。這意味,我們可以了解經(jīng)過刻意訓(xùn)練的輸入輸出。但我們真的了解內(nèi)在原理嗎?
A:這同樣涉及到人類。人類也有神經(jīng)網(wǎng)絡(luò),用來形成反射、反應(yīng)、直覺等。我們不了解人類是如何做到這些的,但我們就是相信。人們?yōu)槭裁聪嘈潘緳C、飛機駕駛員?為什么相信那些做重要商業(yè)決策的人?這個道理同樣適用于機器。從宇宙范圍來看,人類就是一種地球上能夠發(fā)明工具的動物。歷史上,人類通過發(fā)明工具、創(chuàng)造技術(shù)來增強自身。比如,鉛筆、眼鏡這些都是異常強大的工具。而且語言本身就是最重要的工具。我們用眼鏡增強自己。我們通過語言來更好地交流合作。所以,人類通過創(chuàng)造工具來過得更好。這和AI沒什么差別。無法將人類與技術(shù)割裂開來。
Q:你是否相信,有一天自主代理機器人情感系統(tǒng)將成為通往通用人工智能的一步?
A:我認(rèn)為預(yù)測是一個很微妙復(fù)雜的事情。作為普通人,預(yù)測能使人作出更好的決策。但AI超越了這一點。AI將決策、目標(biāo)和預(yù)測整合在一起。就像養(yǎng)育孩子一樣,孩子是自主的,他們的目標(biāo)并不在家長的掌控之下。我的專長是建立一個類似的情感系統(tǒng),有絕對的自主權(quán)和決策權(quán)。
Q:你提到了好幾次“目標(biāo)”。看起來這是一個關(guān)鍵因素。你認(rèn)為這是一個通向更高智力水平的路徑嗎?
A:是的。我們要有更多、更抽象的目標(biāo)。但不能光有目標(biāo),而沒有實現(xiàn)目標(biāo)的系統(tǒng)。
“目標(biāo)”是一個簡單的詞,但你很可能會被誤導(dǎo)。處理方法是去找一些更長的詞組,例如“尋找目標(biāo)”、“目標(biāo)性”等。“目標(biāo)”對于智能來說是至關(guān)重要的。假設(shè)有一個非常聰明的存在能夠進(jìn)行預(yù)測,它有一個想達(dá)成的目標(biāo)。它就能根據(jù)目標(biāo)采取行動。
另外,我還想談一下人們對AI的擔(dān)憂。有很多報道都將AI和人類對立起來,認(rèn)為我們終將被淘汰。這種想法是錯誤的。在我看來,AI將增強人類,它將淘汰的是人類的“舊我”(former selves)。但我承認(rèn)的確存在這種將AI與人類對立起來的趨勢。我認(rèn)為這都是“人工智能”這個名字惹的禍。這讓AI聽起來很像外星人。
我想說的是,我們正在設(shè)計創(chuàng)造一種全新的人類。我們將要創(chuàng)造一種新的存在,可能和人類的膚色、宗教略有不同。人類對此感到恐懼,這是正常的。人們總是對與自己不同的事物心生恐懼。Alpha Go是一個很好的例子。在西方,很多人認(rèn)為它是與人類相對的機器。但在圍棋社區(qū)里,有人認(rèn)為它是一個神奇的機器,能夠很好地去理解圍棋,與人們一道加入對于圍棋這項優(yōu)雅游戲的無限探索之中。因此,我認(rèn)為我們需要學(xué)會來歡迎AI這種不同類型的“人”。它具有如此多的多樣性,我們?yōu)楹尾粴g呼慶祝?
Q:我們想聽聽您評價AlphaGo Zero。問題是,扔掉人類的訓(xùn)練數(shù)據(jù)集似乎是創(chuàng)造更好的產(chǎn)品的一個方式,這如何適用于這種框架?
A:我們需要可擴展的方法。現(xiàn)在沒有人這么做,這讓我很吃驚,沒有人展示計算機計算能力的指數(shù)級增長。你知道,現(xiàn)在這有一點mundane,但是這是一個復(fù)雜的效果,我們很難去意識到,我們需要可以擴展的方法和強大的計算力。我的意思是不僅要擴展問題的大小,還有隨著計算力一起擴展,你的計算能力越強,你的系統(tǒng)效果就越好。所以,如果你是從人類的數(shù)據(jù)庫中進(jìn)行學(xué)習(xí),那么很快,訓(xùn)練數(shù)據(jù)集很快就會成為你的瓶頸。
Q:早期在計算機國際象棋上的研究發(fā)現(xiàn),最高段的棋手+計算機的組合,并沒有直接使計算機能力更強?最新的AlphaGo Zero,如果我沒有理解錯,也是沒有進(jìn)入人類訓(xùn)練這一循環(huán),只需要與其他的計算機進(jìn)行對抗學(xué)習(xí)。從哲學(xué)上說,這跟您剛才所提到的以人類為中心(huaman centric approach)似乎是完全相反的?
A:其實不是的。作為人類,我們并不只是在學(xué)校才會學(xué)習(xí)。我們從很小的時候就開始學(xué)習(xí),甚至在還沒開始說話前,我們就開始學(xué)習(xí)。我們通過試錯進(jìn)行學(xué)習(xí)。
接下來我要談一談強化學(xué)習(xí),這是我所擅長的專業(yè)領(lǐng)域,也是我最喜歡的一種“學(xué)習(xí)”。強化學(xué)習(xí)就是在試錯中進(jìn)行學(xué)習(xí),這種試錯中使用的是“自學(xué)習(xí)”的方法,你需要在很多很多的對局中進(jìn)行嘗試。所以,這并不是從人身上進(jìn)行學(xué)習(xí),而是以人類學(xué)習(xí)的方式進(jìn)行學(xué)習(xí)。這和人類很像,就是從不斷的嘗試中進(jìn)行學(xué)習(xí)。
確實,在游戲的對弈中,你可以進(jìn)行無數(shù)次的嘗試,這一方法(AlphaGo Zero)確實利用了這一點。但是,試錯這一想法本身并不要求有模擬。
我還要補充一點,博弈是很特殊的,因為我們知道游戲的規(guī)則,我們可以分解它讓后知道其運行的規(guī)則是什么。我們知道桌上的花瓶可能會掉到地上,因為我們知道物理理論,知道物體移動的方式,所以我們需要制定計劃。
正如AlphaGo要用到現(xiàn)實世界,你需要用現(xiàn)實世界的規(guī)則來替代圍棋的規(guī)則,比如,物理定律是什么、很重要的是,物理定律很多都是直覺性的,比如,我打了我朋友一拳,他可能會還回來。這可能不是物理定理,比如如果我尖叫,那么我的保鏢可能會過來提供幫助。
所以,我們需要了解世界的運行方式,我們需要制定計劃。在象棋、圍棋和撲克中,我們可能不能計劃得那么好。
-
AI
+關(guān)注
關(guān)注
87文章
31834瀏覽量
270611
原文標(biāo)題:強化學(xué)習(xí)之父Sutton:創(chuàng)造AI,就是創(chuàng)造一種新的人類
文章出處:【微信號:drc_iite,微信公眾號:全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
高通展望2025年邊緣側(cè)AI的發(fā)展趨勢
【書籍評測活動NO.55】AI Agent應(yīng)用與項目實戰(zhàn)
馬斯克預(yù)言:AI將全面超越人類智力
NVIDIA將在越南開設(shè)首個研發(fā)中心以推動AI發(fā)展
AI數(shù)據(jù)中心的布線考量
![<b class='flag-5'>AI</b>數(shù)據(jù)<b class='flag-5'>中心</b>的布線考量](https://file1.elecfans.com/web3/M00/01/1C/wKgZPGdRAl2AOIIHAABIysqzMqQ259.png)
Meta AI數(shù)據(jù)中心網(wǎng)絡(luò)用了哪家的芯片
![Meta <b class='flag-5'>AI</b>數(shù)據(jù)<b class='flag-5'>中心</b>網(wǎng)絡(luò)用了哪家的芯片](https://file1.elecfans.com/web2/M00/0D/34/wKgaomdD3LuAd4WJAAA-2e0mQvs825.png)
AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得
平衡創(chuàng)新與倫理:AI時代的隱私保護(hù)和算法公平
AI時代,我們需要怎樣的數(shù)據(jù)中心?AI重新定義數(shù)據(jù)中心
![<b class='flag-5'>AI</b>時代,<b class='flag-5'>我們</b>需要怎樣的數(shù)據(jù)<b class='flag-5'>中心</b>?<b class='flag-5'>AI</b>重新定義數(shù)據(jù)<b class='flag-5'>中心</b>](https://file1.elecfans.com/web2/M00/FD/A7/wKgaomaV60OAVxpnAAA4JNscNqc103.png)
羅杰·瑞迪:AI能力已遠(yuǎn)超我們人類
智謀紀(jì) AI+Multi LED 打開人類健康新寶藏
![智謀紀(jì) <b class='flag-5'>AI</b>+Multi LED 打開<b class='flag-5'>人類</b>健康新寶藏](https://file1.elecfans.com//web2/M00/EF/09/wKgZomZvujWALMrpABM4w_VS1N454.jpeg)
一圖看懂星河AI園區(qū)網(wǎng)絡(luò),以體驗為中心,企業(yè)數(shù)智升級首選
![一圖看懂星河<b class='flag-5'>AI</b>園區(qū)網(wǎng)絡(luò),以體驗<b class='flag-5'>為</b><b class='flag-5'>中心</b>,企業(yè)數(shù)智升級首選](https://file1.elecfans.com/web2/M00/E7/CC/wKgaomZJbhSAL4YjAAF5TFSYakw058.jpg)
risc-v多核芯片在AI方面的應(yīng)用
富士通發(fā)布最新的人工智能(AI)戰(zhàn)略,聚焦深化人類與AI之間的協(xié)作
![富士通發(fā)布最新的人工智能(<b class='flag-5'>AI</b>)戰(zhàn)略,聚焦深化<b class='flag-5'>人類</b>與<b class='flag-5'>AI</b>之間的協(xié)作](https://file1.elecfans.com/web2/M00/C1/68/wKgaomXVviaAPv57AAAxcbEkp80444.png)
評論