君子以泽,大主宰天蚕土豆小说,完美世界国际版下载

在Machine Learning and the Market for Intelligence 2017大會(huì)上，“強(qiáng)化學(xué)習(xí)之父”Richard S. Sutton與美國企業(yè)家、風(fēng)險(xiǎn)投資人士Steve Jurvetson進(jìn)行了關(guān)于“為何目標(biāo)對于智能至關(guān)重要”的對談。Sutton表示，創(chuàng)造人工智能就是在創(chuàng)造一種新的人類。我們應(yīng)對此感到歡欣鼓舞。

在Machine Learning and the Market for Intelligence 2017大會(huì)上，艾伯塔大學(xué)計(jì)算機(jī)科學(xué)教授Richard S. Sutton與美國企業(yè)家、風(fēng)險(xiǎn)投資人士Steve Jurvetson進(jìn)行了關(guān)于“為何目標(biāo)對于智能至關(guān)重要”的對談。

Richard S. Sutton是艾伯塔大學(xué)計(jì)算科學(xué)系的教授兼iCORE主席。在2003年加入艾伯塔大學(xué)之前，他曾在美國AT&T公司和GTE實(shí)驗(yàn)室以及馬薩諸塞大學(xué)工作。他于1984年獲得馬薩諸塞大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位，并于1978年獲得斯坦福大學(xué)心理學(xué)學(xué)士學(xué)位。2016年他當(dāng)選為加拿大皇家學(xué)會(huì)會(huì)員。在艾伯塔大學(xué)，Sutton領(lǐng)導(dǎo)了強(qiáng)化學(xué)習(xí)和人工智能實(shí)驗(yàn)室，是艾伯塔機(jī)器情報(bào)研究所的首席研究員。

他的研究興趣集中在決策者與環(huán)境相互作用所面臨的學(xué)習(xí)問題上，他認(rèn)為這是人工智能的核心。他還對動(dòng)物學(xué)習(xí)心理學(xué)，連接網(wǎng)絡(luò)以及不斷改進(jìn)世界的表征和模型的系統(tǒng)感興趣。Richard Sutton 被認(rèn)為是強(qiáng)化學(xué)習(xí)之父。今年6月，Demis Hassabis宣布Richard Sutton將聯(lián)合領(lǐng)導(dǎo)一個(gè)位于加拿大的DeepMind辦公室，同時(shí)在艾伯塔大學(xué)保留他的教授職位。

Q：AI以人類為中心？或是一個(gè)完全不同的物種（對人類生存具有攻擊性和毀滅性）？(human-centric or alien AI)

A：我想提出一種觀點(diǎn)，AI比我們想得更加以人類為中心。通常的觀點(diǎn)都是認(rèn)為AI與人類相對立，機(jī)器會(huì)淘汰人類。但這僅是一家之言，因此我提出另一種觀點(diǎn)來平衡上述觀點(diǎn)。先從“人工智能”這個(gè)名字說起。這個(gè)名字暗示著這是一種和人類智能不同的智能，是人造的智能。但首先我們要定義這是一種與人類相似的智能。所以從定義來看，AI是以人類為中心的。因此，也許我們不該把它叫做“人工智能”，我們應(yīng)該直接叫它“智能”。現(xiàn)在人們都把AI看作是一種工程上的存在，不是一種類人的存在。但我認(rèn)為，在當(dāng)今很多領(lǐng)域，AI都是以人類為中心的。比如機(jī)器翻譯就是關(guān)于人的溝通。因此，AI實(shí)際上是在增強(qiáng) (enhancing) 人類，這也是AI具有重要商業(yè)意義的原因。AI不是在完虐人類，而是在增強(qiáng)人類。

Q：這聽起來很像是人類的感知，視覺、觸覺、聽覺乃至嗅覺都已經(jīng)通過模擬的方式被使用了。這意味，我們可以了解經(jīng)過刻意訓(xùn)練的輸入輸出。但我們真的了解內(nèi)在原理嗎？

A：這同樣涉及到人類。人類也有神經(jīng)網(wǎng)絡(luò)，用來形成反射、反應(yīng)、直覺等。我們不了解人類是如何做到這些的，但我們就是相信。人們?yōu)槭裁聪嘈潘緳C(jī)、飛機(jī)駕駛員？為什么相信那些做重要商業(yè)決策的人？這個(gè)道理同樣適用于機(jī)器。從宇宙范圍來看，人類就是一種地球上能夠發(fā)明工具的動(dòng)物。歷史上，人類通過發(fā)明工具、創(chuàng)造技術(shù)來增強(qiáng)自身。比如，鉛筆、眼鏡這些都是異常強(qiáng)大的工具。而且語言本身就是最重要的工具。我們用眼鏡增強(qiáng)自己。我們通過語言來更好地交流合作。所以，人類通過創(chuàng)造工具來過得更好。這和AI沒什么差別。無法將人類與技術(shù)割裂開來。

Q：你是否相信，有一天自主代理機(jī)器人情感系統(tǒng)將成為通往通用人工智能的一步？

A：我認(rèn)為預(yù)測是一個(gè)很微妙復(fù)雜的事情。作為普通人，預(yù)測能使人作出更好的決策。但AI超越了這一點(diǎn)。AI將決策、目標(biāo)和預(yù)測整合在一起。就像養(yǎng)育孩子一樣，孩子是自主的，他們的目標(biāo)并不在家長的掌控之下。我的專長是建立一個(gè)類似的情感系統(tǒng)，有絕對的自主權(quán)和決策權(quán)。

Q：你提到了好幾次“目標(biāo)”。看起來這是一個(gè)關(guān)鍵因素。你認(rèn)為這是一個(gè)通向更高智力水平的路徑嗎？

A：是的。我們要有更多、更抽象的目標(biāo)。但不能光有目標(biāo)，而沒有實(shí)現(xiàn)目標(biāo)的系統(tǒng)。

“目標(biāo)”是一個(gè)簡單的詞，但你很可能會(huì)被誤導(dǎo)。處理方法是去找一些更長的詞組，例如“尋找目標(biāo)”、“目標(biāo)性”等。“目標(biāo)”對于智能來說是至關(guān)重要的。假設(shè)有一個(gè)非常聰明的存在能夠進(jìn)行預(yù)測，它有一個(gè)想達(dá)成的目標(biāo)。它就能根據(jù)目標(biāo)采取行動(dòng)。

另外，我還想談一下人們對AI的擔(dān)憂。有很多報(bào)道都將AI和人類對立起來，認(rèn)為我們終將被淘汰。這種想法是錯(cuò)誤的。在我看來，AI將增強(qiáng)人類，它將淘汰的是人類的“舊我”（former selves）。但我承認(rèn)的確存在這種將AI與人類對立起來的趨勢。我認(rèn)為這都是“人工智能”這個(gè)名字惹的禍。這讓AI聽起來很像外星人。

我想說的是，我們正在設(shè)計(jì)創(chuàng)造一種全新的人類。我們將要?jiǎng)?chuàng)造一種新的存在，可能和人類的膚色、宗教略有不同。人類對此感到恐懼，這是正常的。人們總是對與自己不同的事物心生恐懼。Alpha Go是一個(gè)很好的例子。在西方，很多人認(rèn)為它是與人類相對的機(jī)器。但在圍棋社區(qū)里，有人認(rèn)為它是一個(gè)神奇的機(jī)器，能夠很好地去理解圍棋，與人們一道加入對于圍棋這項(xiàng)優(yōu)雅游戲的無限探索之中。因此，我認(rèn)為我們需要學(xué)會(huì)來歡迎AI這種不同類型的“人”。它具有如此多的多樣性，我們?yōu)楹尾粴g呼慶祝？

Q：我們想聽聽您評價(jià)AlphaGo Zero。問題是，扔掉人類的訓(xùn)練數(shù)據(jù)集似乎是創(chuàng)造更好的產(chǎn)品的一個(gè)方式，這如何適用于這種框架？

A：我們需要可擴(kuò)展的方法。現(xiàn)在沒有人這么做，這讓我很吃驚，沒有人展示計(jì)算機(jī)計(jì)算能力的指數(shù)級增長。你知道，現(xiàn)在這有一點(diǎn)mundane，但是這是一個(gè)復(fù)雜的效果，我們很難去意識(shí)到，我們需要可以擴(kuò)展的方法和強(qiáng)大的計(jì)算力。我的意思是不僅要擴(kuò)展問題的大小，還有隨著計(jì)算力一起擴(kuò)展，你的計(jì)算能力越強(qiáng)，你的系統(tǒng)效果就越好。所以，如果你是從人類的數(shù)據(jù)庫中進(jìn)行學(xué)習(xí)，那么很快，訓(xùn)練數(shù)據(jù)集很快就會(huì)成為你的瓶頸。

Q：早期在計(jì)算機(jī)國際象棋上的研究發(fā)現(xiàn)，最高段的棋手+計(jì)算機(jī)的組合，并沒有直接使計(jì)算機(jī)能力更強(qiáng)？最新的AlphaGo Zero，如果我沒有理解錯(cuò)，也是沒有進(jìn)入人類訓(xùn)練這一循環(huán)，只需要與其他的計(jì)算機(jī)進(jìn)行對抗學(xué)習(xí)。從哲學(xué)上說，這跟您剛才所提到的以人類為中心（huaman centric approach）似乎是完全相反的？

A：其實(shí)不是的。作為人類，我們并不只是在學(xué)校才會(huì)學(xué)習(xí)。我們從很小的時(shí)候就開始學(xué)習(xí)，甚至在還沒開始說話前，我們就開始學(xué)習(xí)。我們通過試錯(cuò)進(jìn)行學(xué)習(xí)。

接下來我要談一談強(qiáng)化學(xué)習(xí)，這是我所擅長的專業(yè)領(lǐng)域，也是我最喜歡的一種“學(xué)習(xí)”。強(qiáng)化學(xué)習(xí)就是在試錯(cuò)中進(jìn)行學(xué)習(xí)，這種試錯(cuò)中使用的是“自學(xué)習(xí)”的方法，你需要在很多很多的對局中進(jìn)行嘗試。所以，這并不是從人身上進(jìn)行學(xué)習(xí)，而是以人類學(xué)習(xí)的方式進(jìn)行學(xué)習(xí)。這和人類很像，就是從不斷的嘗試中進(jìn)行學(xué)習(xí)。

確實(shí)，在游戲的對弈中，你可以進(jìn)行無數(shù)次的嘗試，這一方法（AlphaGo Zero）確實(shí)利用了這一點(diǎn)。但是，試錯(cuò)這一想法本身并不要求有模擬。

我還要補(bǔ)充一點(diǎn)，博弈是很特殊的，因?yàn)槲覀冎烙螒虻囊?guī)則，我們可以分解它讓后知道其運(yùn)行的規(guī)則是什么。我們知道桌上的花瓶可能會(huì)掉到地上，因?yàn)槲覀冎牢锢砝碚摚牢矬w移動(dòng)的方式，所以我們需要制定計(jì)劃。

正如AlphaGo要用到現(xiàn)實(shí)世界，你需要用現(xiàn)實(shí)世界的規(guī)則來替代圍棋的規(guī)則，比如，物理定律是什么、很重要的是，物理定律很多都是直覺性的，比如，我打了我朋友一拳，他可能會(huì)還回來。這可能不是物理定理，比如如果我尖叫，那么我的保鏢可能會(huì)過來提供幫助。

所以，我們需要了解世界的運(yùn)行方式，我們需要制定計(jì)劃。在象棋、圍棋和撲克中，我們可能不能計(jì)劃得那么好。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
88

文章
35093

瀏覽量
279466

原文標(biāo)題：強(qiáng)化學(xué)習(xí)之父Sutton：創(chuàng)造AI，就是創(chuàng)造一種新的人類

文章出處：【微信號(hào)：drc_iite，微信公眾號(hào)：全球技術(shù)地圖】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

AI比我們想得更加以人類為中心

評論