在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)可以被用來(lái)做什么?新的基元將會(huì)如何改變和擴(kuò)大人類(lèi)思考的方式呢?

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-07-03 10:08 ? 次閱讀

計(jì)算機(jī)不僅可以是解決數(shù)學(xué)問(wèn)題的工具,還可以是擁有實(shí)時(shí)交互能力,協(xié)助人類(lèi)解決問(wèn)題,甚至完成創(chuàng)造性工作的輔助系統(tǒng)。具有可交互界面的的機(jī)器學(xué)習(xí)工具,可以幫助人類(lèi)更高效地設(shè)計(jì)字體、制作圖片,甚至創(chuàng)造出藝術(shù)作品。人工智能可以大大增強(qiáng)人類(lèi)智能,本文詳細(xì)介紹了這方面的一些探索。本文作者是谷歌大腦團(tuán)隊(duì)科學(xué)家Shan Carter和物理學(xué)家、YC Research的Michael Nielsen,英文原文發(fā)表于可視化機(jī)器學(xué)習(xí)平臺(tái)Distill。

計(jì)算機(jī)可以被用來(lái)做什么?

在歷史上,這個(gè)問(wèn)題的不同答案——即對(duì)計(jì)算的不同見(jiàn)解——有助于啟發(fā)和確立最終建立的人性化計(jì)算系統(tǒng)。早期的電子計(jì)算機(jī) ENIAC,是世界上第一臺(tái)通用電子計(jì)算機(jī),它的目的是為美國(guó)軍隊(duì)計(jì)算火炮射擊表。其他早期的計(jì)算機(jī)也被用于解決數(shù)值問(wèn)題,如模擬原子彈爆炸、預(yù)測(cè)天氣、規(guī)劃火箭的運(yùn)動(dòng)。在批處理模式下運(yùn)行的機(jī)器,使用粗糙的輸入和輸出設(shè)備,而且沒(méi)有任何實(shí)時(shí)的交互。這種觀點(diǎn)把計(jì)算機(jī)看作是數(shù)值處理機(jī)器,用于加速在之前要花費(fèi)數(shù)周、數(shù)月或需要一個(gè)團(tuán)隊(duì)人力才能完成的計(jì)算任務(wù)。

在 20 世紀(jì) 50 年代,對(duì)計(jì)算機(jī)用來(lái)做什么的另一個(gè)不同的觀點(diǎn)開(kāi)始發(fā)展起來(lái)。在 1962 年,當(dāng) DouglasEngelbart 提出計(jì)算機(jī)可以被看作一種增強(qiáng)人類(lèi)智能[1] 的方式時(shí),這個(gè)觀點(diǎn)開(kāi)始變得明確起來(lái)。在這種觀點(diǎn)下,計(jì)算機(jī)不是主要解決數(shù)值計(jì)算問(wèn)題的工具,而是實(shí)時(shí)交互的系統(tǒng),有著豐富的輸入和輸出,使得人類(lèi)可以一起工作來(lái)支持和擴(kuò)展他們自己解決問(wèn)題的過(guò)程。

這種智能增強(qiáng)(Intelligence Augmentation,簡(jiǎn)稱(chēng)IA)的觀點(diǎn)深深地影響了很多其他人,包括研究員如施樂(lè)帕克研究中心(Xerox PARC 的 Alan Kay 和企業(yè)家如蘋(píng)果的 Steve Jobs,而且導(dǎo)致了很多現(xiàn)代計(jì)算系統(tǒng)的關(guān)鍵想法的產(chǎn)生。這個(gè)觀點(diǎn)同樣深深地影響了數(shù)字藝術(shù)與音樂(lè),還有交互設(shè)計(jì)、數(shù)據(jù)可視化、計(jì)算創(chuàng)造力和人機(jī)交互等領(lǐng)域。

IA 領(lǐng)域的研究經(jīng)常和人工智能(Artificial Intelligence,簡(jiǎn)稱(chēng) AI)的研究相互競(jìng)爭(zhēng):在研究經(jīng)費(fèi)上的競(jìng)爭(zhēng),吸引有才能的研究員上的競(jìng)爭(zhēng)。盡管這兩個(gè)領(lǐng)域之間總是存在著交叉,但是IA 通常專(zhuān)注于構(gòu)建系統(tǒng)使人類(lèi)和機(jī)器可以共同協(xié)作,而 AI 則專(zhuān)注于將智能任務(wù)完全外包給機(jī)器。尤其是,AI 的問(wèn)題通常專(zhuān)注于匹配或者超過(guò)人類(lèi)水平:在象棋或圍棋上打敗人類(lèi);學(xué)會(huì)像人類(lèi)一樣識(shí)別語(yǔ)音和圖像或翻譯語(yǔ)言;等等。

本文描述了一個(gè)新的領(lǐng)域,這個(gè)領(lǐng)域來(lái)自于 AI 和 IA 的綜合。我們建議將這個(gè)領(lǐng)域命名為人工智能增強(qiáng)(artificial intelligence augmentation,簡(jiǎn)稱(chēng) AIA):使用 AI 系統(tǒng)幫助開(kāi)發(fā)智能增強(qiáng)(IA)的新方法。這個(gè)新領(lǐng)域引入了新的重要的基礎(chǔ)問(wèn)題,這些問(wèn)題無(wú)法關(guān)聯(lián)到任何的父領(lǐng)域中。我們相信 AIA 的原理和系統(tǒng)將會(huì)與大多數(shù)存在的系統(tǒng)完全不同。

我們的文章開(kāi)始于對(duì)近期技術(shù)工作的調(diào)查,這些工作隱含了人工智能增強(qiáng)技術(shù),包括生成式界面(generative interfaces)的工作——可用于探索和可視化生成機(jī)器學(xué)習(xí)模型。這樣的模型發(fā)展出一種生成模型的制圖學(xué),使人們可以用于去探索模型以及從模型中構(gòu)建意義,并且融合模型知道的信息到他們創(chuàng)造性的工作中。

本文不僅僅是技術(shù)工作的綜述。我們相信這是個(gè)好的時(shí)間點(diǎn),在這個(gè)新領(lǐng)域的建立中識(shí)別出一些廣泛而根本的問(wèn)題。這些新工具能夠多大程度激發(fā)創(chuàng)造力?他們能被用于生成令人驚訝的新的想法嗎?還是說(shuō)這些想法只是陳詞濫調(diào),是基于現(xiàn)存想法的無(wú)價(jià)值的再結(jié)合?這樣的系統(tǒng)能被用于發(fā)展出基礎(chǔ)性的新的接口基元嗎?這些新的基元將會(huì)如何改變和擴(kuò)大人類(lèi)思考的方式呢?

使用生成模型產(chǎn)生有意義的創(chuàng)意操作

讓我們看一個(gè)例子,機(jī)器學(xué)習(xí)模型使一類(lèi)新的接口成為可能。為了理解接口,想象你是一個(gè)字體設(shè)計(jì)師,正在創(chuàng)造一種新的字體。在描述了一些最初的設(shè)計(jì)后,你希望用粗體、斜體和壓縮的變體進(jìn)行試驗(yàn)。讓我們看看一個(gè)工具,能從初始設(shè)計(jì)中生成和探索這些變體。結(jié)果的質(zhì)量是相當(dāng)粗糙的,我們將在稍后解釋具體原因,請(qǐng)諒解。

當(dāng)然,變化粗度(如重量)、斜度和寬度只是變化字體的三種方法。想象一下不是構(gòu)造特定的工具,而是用戶(hù)可以?xún)H僅通過(guò)選擇現(xiàn)存的字體樣例來(lái)構(gòu)造他們自己的工具。比如,假設(shè)你想變化字體的襯線(xiàn)的程度。在下面,請(qǐng)?jiān)陧敳康暮兄校x擇 5 至 10 個(gè)無(wú)襯線(xiàn)字體,然后拖到左邊的盒子;接著選擇 5 至 10 個(gè)襯線(xiàn)字體,拖到右邊的盒子。當(dāng)你在操作時(shí),運(yùn)行在瀏覽器中的機(jī)器學(xué)習(xí)模型將會(huì)自動(dòng)從這些例子中,推測(cè)出如何在襯線(xiàn)或無(wú)襯線(xiàn)的方向上對(duì)初始字體進(jìn)行調(diào)整:

原文中的控件 1 截圖(可點(diǎn)擊 閱讀原文 操作)

實(shí)際上,我們使用這個(gè)相同的技術(shù)構(gòu)造了上面的粗體、斜體和濃縮工具。為了實(shí)現(xiàn)工具,我們使用了下面的例子:粗體和非粗體、斜體和非斜體、濃縮和非濃縮字體:

為了構(gòu)建這些工具,我們使用了生成模型(generative model),具體使用的是 James Wexler[2] 訓(xùn)練的模型。為了理解生成模型的用法,想象一下描繪一個(gè)字體原本似乎需要大量的數(shù)據(jù)。比如,如果字體是 64x64 的像素,那么我們需要 64x64=4096 個(gè)參數(shù)去描述單個(gè)字形。但是我們可以使用生成模型找到一個(gè)更簡(jiǎn)單的描述。

我們通過(guò)構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn),它只使用了少量的輸入變量,叫隱變量(latent variable),來(lái)產(chǎn)生整個(gè)的字形輸出。在我們使用的模型中,隱變量空間維度是 40 維,并將其映射到 4096 維可以描述所有字形像素的空間中。換句話(huà)說(shuō),這個(gè)想法是將一個(gè)低維的空間映射到一個(gè)高維空間:

我們使用的生成模型是一類(lèi)叫做變分自編碼器(variational autoencoder, VAE)[3] 的神經(jīng)網(wǎng)絡(luò)。對(duì)我們的目的來(lái)說(shuō),生成模型的細(xì)節(jié)并不是很重要。重要的是,通過(guò)改變作為輸入的隱變量,能夠得到不同的字體作為輸出。所以隱變量的一種選擇將會(huì)產(chǎn)生一種字體,然而另一種選擇將會(huì)產(chǎn)生另一個(gè)不同的字體:

你可以把隱變量看成是一種緊湊的、高層次的字體表示。神經(jīng)網(wǎng)絡(luò)輸入高層次表示,并且轉(zhuǎn)化成全像素?cái)?shù)據(jù)。值得注意的是,我們只需要 40 個(gè)數(shù)字就能捕捉一個(gè)字形的表面復(fù)雜性,而最初需要 4096 個(gè)變量。

我們使用的生成模型是從 Bernhardsson[4] 在公開(kāi)網(wǎng)頁(yè)收集的超過(guò) 5 萬(wàn)個(gè)字體的訓(xùn)練集中學(xué)習(xí)到的。在訓(xùn)練中,網(wǎng)絡(luò)的權(quán)重和偏置被調(diào)整,只要隱變量被恰當(dāng)?shù)剡x擇,就能使得網(wǎng)絡(luò)輸出對(duì)任意訓(xùn)練集字體的近似。在某種程度上,模型在學(xué)習(xí)一個(gè)所有訓(xùn)練集字體的高度壓縮的表示。

實(shí)際上,模型不僅重現(xiàn)了訓(xùn)練字體,而且能泛化、產(chǎn)生訓(xùn)練集中沒(méi)有的字體。通過(guò)被強(qiáng)制尋找訓(xùn)練樣本的一個(gè)緊湊描述,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到了一個(gè)抽象的、更高層次的字體表征模型。更高層次的模型使得在已知的訓(xùn)練樣本上的泛化成為可能,能產(chǎn)生具有真實(shí)感的字體。

理想情況下,一個(gè)好的生成模型在面對(duì)少量訓(xùn)練樣本時(shí),能夠利用它泛化到所有可能的人類(lèi)可識(shí)別的字體的空間。對(duì)任意可能的字體——已經(jīng)存在的或可能在未來(lái)可想象的——我們可能找到正好對(duì)應(yīng)那個(gè)字體的隱變量。當(dāng)然我們使用的模型還遠(yuǎn)達(dá)不到理想的效果——一個(gè)非常嚴(yán)重的失敗是很多模型生成的字體遺漏了大寫(xiě)字母 “Q” 的尾部(你可以在上面的例子中看到)。然而,記住一個(gè)理想的生成模型能做什么還是有用的。

在某些方式上,這些生成模型類(lèi)似于科學(xué)理論的作用方式。科學(xué)理論經(jīng)常極大地簡(jiǎn)化對(duì)出現(xiàn)的復(fù)雜現(xiàn)象的描述,把大量的變量減少為僅僅很少的變量,并從中可以推導(dǎo)出系統(tǒng)行為的很多方面。而且,好的科學(xué)理論有時(shí)能夠被一般化來(lái)發(fā)現(xiàn)新的現(xiàn)象。

作為一個(gè)例子,考慮普通的物體。這些物體有著物理學(xué)家稱(chēng)為相(phase)的東西——它們可能是液態(tài)、固態(tài)、氣態(tài)或有時(shí)可能更奇異,像超導(dǎo)體或波爾 - 愛(ài)因斯坦凝聚態(tài)。起初,這樣的系統(tǒng)看起來(lái)極其復(fù)雜,涉及到 10^23 或更多的分子。但是熱力學(xué)定律和統(tǒng)計(jì)力學(xué)使我們找到一個(gè)更簡(jiǎn)單的描述,把復(fù)雜性減少為僅僅幾個(gè)變量(溫度、壓力等等),但是包含了系統(tǒng)的大量行為。

而且,有時(shí)可能被一般化來(lái)預(yù)測(cè)意想不到的新的相態(tài)。例如,在 1924 年,物理學(xué)家使用熱力學(xué)和統(tǒng)計(jì)力學(xué)預(yù)測(cè)了一個(gè)顯著的新的相態(tài),波爾 - 愛(ài)因斯坦凝聚態(tài),其中所有原子可能全部處于相同的量子狀態(tài),導(dǎo)致驚人的大規(guī)模量子干涉效應(yīng)。稍后我們?cè)陉P(guān)于創(chuàng)造性和生成模型的討論中會(huì)回到這種預(yù)測(cè)能力上的話(huà)題上來(lái)。

回到生成模型的具體細(xì)節(jié)上來(lái),我們?nèi)绾问褂眠@種模型做基于樣例的推理,像上述工具所展示的?讓我們考慮粗體工具的情形,在那個(gè)例子中,我們分別對(duì)所有用戶(hù)指定的粗體字體和非粗體字體取均值。然后,我們計(jì)算這兩個(gè)均值向量的差:

我們把它成為稱(chēng)為粗體向量(bolding vector),為了使給定的字體變粗,我們簡(jiǎn)單地加入一點(diǎn)粗體向量到相關(guān)的隱變量中,加入粗體向量的量控制著結(jié)果的粗度:

這個(gè)技術(shù)是由 Larsen 等人 [5] 提出的,類(lèi)似粗體向量的向量有時(shí)叫做屬性向量(attribute vectors)。相同的想法被用于所有上述的工具的實(shí)現(xiàn)中。于是,我們利用樣例字體產(chǎn)生一個(gè)粗體向量、一個(gè)斜體向量、一個(gè)壓縮向量和一個(gè)用戶(hù)自定義的襯線(xiàn)向量。所以,這個(gè)界面提供了在這四個(gè)方向上隱空間的一個(gè)探索方法。

我們展示的工具有很多的不足。比如,我們從中間的樣例字體開(kāi)始,分別向右或向左,增加或減小字體的粗度:

檢查在左邊和右邊的字體,我們看到很多不幸的變形。尤其最右邊的字體,邊緣開(kāi)始變得粗糙,襯線(xiàn)開(kāi)始消失。一個(gè)更好的生成模型會(huì)減少這些變形。這是一個(gè)好的長(zhǎng)期的研究項(xiàng)目,它展現(xiàn)了很多有趣的問(wèn)題。但是即使是當(dāng)前的模型,生成模型的使用同樣有著引人注目的優(yōu)勢(shì)。

為了理解這些優(yōu)勢(shì),考慮一種簡(jiǎn)單的加粗方法,我們簡(jiǎn)單地加入一些額外的像素在字體的邊緣,使其變厚。盡管這種加厚可能符合一種非專(zhuān)家的思考字體設(shè)計(jì)的方式,但是專(zhuān)家會(huì)做更多深入的事情。下面,我們展示了這種簡(jiǎn)單加厚程序結(jié)果和 Georgia 和 Helveticade 所做的字體的比較:

正如看到的,簡(jiǎn)單的加粗方法在兩種情形下都產(chǎn)生了相當(dāng)不同的結(jié)果。例如,在 Georgia 的結(jié)果中,左邊筆畫(huà)只加粗改變了一點(diǎn)點(diǎn),而右邊的筆畫(huà)極大地被增大,但是只在一邊。在兩種字體中,加粗不會(huì)改變字體的高度,然而這種簡(jiǎn)單的方法會(huì)改變。

如這些例子展現(xiàn)的,好的加粗方法不是一個(gè)簡(jiǎn)單的加厚字體的過(guò)程。專(zhuān)業(yè)的字體設(shè)計(jì)師有很多關(guān)于粗體的啟發(fā)式,這些啟發(fā)是從很多過(guò)去的實(shí)驗(yàn)中和歷史樣例的仔細(xì)研究中推斷出來(lái)。在傳統(tǒng)程序中捕捉這些啟發(fā)是個(gè)繁重的工作。使用生成模型的好處是它可以自動(dòng)學(xué)習(xí)很多的啟發(fā)。

例如,一個(gè)簡(jiǎn)單的粗體工具會(huì)在字母 “A” 的封閉的上部區(qū)域,快速地填充封閉的負(fù)空間。字體工具不會(huì)這樣做,它會(huì)保留封閉的負(fù)空間,向下移動(dòng) "A" 的橫桿,相比于外部更加緩慢地填充內(nèi)部筆畫(huà)。在上述例子中,這個(gè)原則是明顯的,尤其對(duì) Helvetica ,它也被看成是字體工具的操作:

保留封閉負(fù)空間的啟發(fā)不是一個(gè)明顯的先驗(yàn)直覺(jué),然而,它在很多專(zhuān)業(yè)的字體設(shè)計(jì)中被采用。如果檢查上面的例子,你會(huì)容易知道為什么:它提高了清晰度。在訓(xùn)練中,我們的生成模型從它看過(guò)的樣例中自動(dòng)推測(cè)出這個(gè)原則,而且我們的加粗界面將其提供給用戶(hù)。

實(shí)際上,模型捕捉到很多其他的啟發(fā)。比如,在上面的例子中,字體的高度是幾乎不變的,這是專(zhuān)業(yè)字體設(shè)計(jì)中的規(guī)范。同樣,粗體操作不僅僅是將字體的加粗,而是應(yīng)用了一個(gè)從生成模型推測(cè)出的更微妙的啟發(fā)。這些啟發(fā)式可以被用于創(chuàng)造帶有屬性的字體,而這些屬性是之前用戶(hù)幾乎不可能想到的。所以,這個(gè)工具擴(kuò)展了普通人類(lèi)在有意義的字體空間中的探索能力。

字體工具是認(rèn)知技術(shù)的一個(gè)例子。尤其,它包含的基本操作能夠內(nèi)化為用戶(hù)思考方式一部分。在這里,它類(lèi)似于一個(gè) Photoshop 或 3D 圖形軟件。它們都提供了一組新奇的界面基元,這些基本元素能被用戶(hù)內(nèi)化為他們思考過(guò)程中基本的新元素。新元素內(nèi)化是很多智能增強(qiáng)領(lǐng)域工作的基礎(chǔ)。

字體工具中的想法可以擴(kuò)展到其他領(lǐng)域。使用相同的接口,我們可以使用一個(gè)生成模型來(lái)操作人臉圖像,如基于表情、性別或頭發(fā)顏色等屬性;或基于長(zhǎng)度、諷刺或語(yǔ)氣操作句子;或基于化學(xué)性質(zhì)操作分子。

該生成接口提供了一種生成模型的繪圖法,一種人類(lèi)使用生成模型探索和創(chuàng)造意義的方法。

我們之前看到字體模型自動(dòng)地推理出關(guān)于字體設(shè)計(jì)的相對(duì)深刻的原則,并提供給用戶(hù)。然而這樣的深刻原則能被推理出來(lái)是很好的,但是有時(shí),模型推測(cè)出一些錯(cuò)誤或令人不快的東西。例如,White 指出 [6] 一些臉部模型中微笑向量的加入將會(huì)使臉部不僅僅出現(xiàn)更多微笑,而且變得更女性化。為什么呢?因?yàn)樵谟?xùn)練數(shù)據(jù)中,微笑的女性比微笑的男性更多。所以,這些模型不僅僅學(xué)習(xí)到關(guān)于世界的深刻事實(shí),而且同時(shí)內(nèi)化了偏見(jiàn)或錯(cuò)誤的信仰。一旦偏差被知道,通常它是可能被糾正的。但是為了找到那些偏見(jiàn)需要對(duì)模型進(jìn)行仔細(xì)的審核,而且迄今我們?nèi)圆磺宄绾伪WC這些審核是徹底的。

更廣泛地說(shuō),我們可以問(wèn)為什么屬性向量有作用,它們什么時(shí)候起作用,什么時(shí)候不起作用?現(xiàn)在,我們對(duì)這些問(wèn)題的答案了解甚少。

為了使屬性工作,我們需要輸入任意開(kāi)始字體,通過(guò)在隱空間中加入相同向量來(lái)構(gòu)造相關(guān)的粗體版本。然后,我們知道,沒(méi)有理由使用單個(gè)常量向量的移動(dòng)才會(huì)工作,也許我們應(yīng)該用很多不同的移動(dòng)方法。比如,用于粗體襯線(xiàn)和無(wú)襯線(xiàn)字體的啟發(fā)是相當(dāng)不同的,所以似乎應(yīng)該使用非常不同的移動(dòng)方法:

當(dāng)然,我們可以做比使用單個(gè)常量屬性向量更復(fù)雜的事情。給定一對(duì)樣例字體(非粗體,粗體),我們能夠訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)算法,輸入非粗體版本的隱向量,輸出粗體版本的隱向量。給出更多字體權(quán)重的訓(xùn)練數(shù)據(jù),機(jī)器學(xué)習(xí)算法能學(xué)習(xí)生成任意權(quán)重的字體。屬性向量只是一種實(shí)現(xiàn)這類(lèi)操作的極其簡(jiǎn)單的方法。

由于這些原因,屬性向量將不太可能作為一種最終的操作高層次特征的方法。在未來(lái)幾年,更好的方法將會(huì)發(fā)展出來(lái)。然而,我們?nèi)阅軌蚱谕涌谀軌蛱峁V泛地類(lèi)似于上面描述的操作,能夠操作高層次的和潛在的用戶(hù)定義的概念。接口模式不再依賴(lài)于屬性向量的技術(shù)細(xì)節(jié)。

交互生成對(duì)抗模型

讓我們看另一個(gè)使用機(jī)器學(xué)習(xí)模型增強(qiáng)人類(lèi)創(chuàng)造力的例子。它是 2016 年,Zhu 等人 [9] 提出的交互生成對(duì)抗網(wǎng)絡(luò)(interactive generative adversarial networks)或 iGAN。

這篇文章中的一個(gè)例子是在一個(gè)接口中使用 iGAN 生成消費(fèi)品的圖片,如鞋子。傳統(tǒng)上,這個(gè)接口需要程序員編寫(xiě)一個(gè)包含大量鞋子相關(guān)知識(shí)的程序:鞋底、鞋帶、鞋跟等等。Zhu 等人沒(méi)有這樣做,而是使用從 Zappos 下載的 5 萬(wàn)張鞋子的圖片,訓(xùn)練了一個(gè)生成模型。然后他們使用這個(gè)生成模型構(gòu)建了一個(gè)界面讓用戶(hù)可以大概地描述鞋子的形狀、鞋底、鞋帶等等:

視覺(jué)效果并不是太好,部分因?yàn)?Zhu 等人使用的生成模型在現(xiàn)代(2017)的標(biāo)準(zhǔn)中是過(guò)時(shí)的——使用更現(xiàn)代的模型,視覺(jué)效果會(huì)更好。

但是視覺(jué)效果不是重點(diǎn)。在這個(gè)原型中,很多有趣的事情正在發(fā)生。比如,注意當(dāng)鞋底被填滿(mǎn)時(shí),鞋子的整體形狀會(huì)如何顯著地變化——它變得更窄和更光滑。很多小的細(xì)節(jié)被填滿(mǎn),像白色鞋底上方的黑條,和鞋子上部到處填滿(mǎn)的紅色。這些和其他的事實(shí)是自動(dòng)從底層的生成模型中推斷出來(lái)的,我們將會(huì)簡(jiǎn)單描述該方法。

相同的界面可能被用于描述風(fēng)景。唯一的區(qū)別是背后的生成模型使用的是風(fēng)景圖片來(lái)訓(xùn)練,而不是鞋子的圖片。在這種情形下,只描述和風(fēng)景相關(guān)的顏色變得可能。

在這些接口中使用的生成模型不同于我們的字體模型,不是使用變分自編碼器,而是基于生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks, GANs)。但是背后的想法仍然是找到一個(gè)低維的隱空間,能夠表示所有的風(fēng)景圖片,并且將該隱空間映射到相關(guān)的圖片中。同樣,我們可以認(rèn)為隱空間中的點(diǎn)是描述風(fēng)景圖片的一種緊湊的方法。

大概來(lái)說(shuō),iGAN 的工作方式如下所示。不論當(dāng)前的圖片是什么,它關(guān)聯(lián)到隱空間中的一些點(diǎn):

假設(shè),如之前視頻中發(fā)生的,用戶(hù)現(xiàn)在用筆劃描述山的形狀輪廓。我們可以認(rèn)為筆劃是圖片上的一個(gè)約束,在隱空間中選擇一個(gè)子空間,該子空間由匹配輪廓的圖片的所有隱空間中的點(diǎn)組成:

接口工作的方法是找到隱空間中一個(gè)距離當(dāng)前圖片最近的點(diǎn),所以圖片不僅變化很大,同時(shí)也接近滿(mǎn)足強(qiáng)制的約束。這是通過(guò)優(yōu)化一個(gè)目標(biāo)函數(shù)實(shí)現(xiàn)的,該目標(biāo)結(jié)合了到每個(gè)強(qiáng)制約束的距離和偏移當(dāng)前點(diǎn)的距離。如果只有單個(gè)約束,比如,關(guān)于山的筆劃,它看起來(lái)如下圖:

然后,我們可以把它看作是一種應(yīng)用對(duì)隱空間的約束,用有意義的方式移動(dòng)圖片。

iGAN 和我們之前展示的字體工具有很多共同點(diǎn)。它們的操作都編碼了很多關(guān)于世界的精細(xì)的知識(shí),比如當(dāng)它學(xué)習(xí)理解山看起來(lái)是什么或加粗字體時(shí),推測(cè)出封閉負(fù)空間應(yīng)該保留。iGAN 和字體工具都提供了理解和在高維空間導(dǎo)航的方法,使我們保持在字體、鞋子或風(fēng)景的自然空間中。

如 Zhu 等人提到的:

對(duì)我們大多數(shù)人,Photoshop 中簡(jiǎn)單的圖片處理呈現(xiàn)了不可逾越的困難。任何不那么完美的編輯立刻使圖片看起來(lái)完全不真實(shí)。換另一種方式,傳統(tǒng)的視覺(jué)操作范式不會(huì)防止用戶(hù) “脫落” 自然圖片的流形。

像字體工具一樣,iGAN 是一種認(rèn)知技術(shù)。用戶(hù)可以?xún)?nèi)化界面的操作為他們思考中的新的基本元素。比如,在鞋子的例子中,他們可以學(xué)習(xí)用他們想要應(yīng)用的差異來(lái)思考,如加入鞋跟或更高的頂部或特別的高亮。這比傳統(tǒng)方式中非專(zhuān)家對(duì)鞋子的思考(“尺碼 11, 黑色” 等等)更加豐富。

在非專(zhuān)家用更復(fù)雜的方式思考的范圍——“使頂部更高點(diǎn)或更光滑”——他們?cè)谶@種思考方式下得到的經(jīng)驗(yàn)很少,或很難看到他們選擇的結(jié)果。像這樣的界面使探索、發(fā)展風(fēng)格的能力、規(guī)劃的能力、和朋友交換想法等等都更簡(jiǎn)單。

計(jì)算的兩種模型

讓我們重新審視本文開(kāi)始的問(wèn)題,計(jì)算機(jī)可以被用來(lái)做什么?它和智能增強(qiáng)有什么關(guān)系。

計(jì)算機(jī)的一個(gè)常見(jiàn)概念是——它們是解決問(wèn)題的機(jī)器:“計(jì)算機(jī),在這樣或者那樣的風(fēng)向下(等等情況)下發(fā)射炮彈的結(jié)果是什么?”;“計(jì)算機(jī),在未來(lái) 5 天東京的最高溫度是多少?”;“計(jì)算機(jī),當(dāng)圍棋棋盤(pán)處于這個(gè)位置時(shí),最好的選擇是什么?”;“計(jì)算機(jī),這個(gè)圖片該如何分類(lèi)?” 等等。

在計(jì)算機(jī)作為數(shù)字運(yùn)算機(jī)器的早期看法中,還有大量 AI 上的工作中,在歷史和今天的看法中,這是一個(gè)很常見(jiàn)的概念。這個(gè)模型是計(jì)算機(jī)作為一種外包認(rèn)知的方法。在 AI 未來(lái)的可能推測(cè)上,這種外包認(rèn)知模型在 AI 的視角下經(jīng)常作為預(yù)言家出現(xiàn),能夠以比人類(lèi)更好的水平解決一些大類(lèi)問(wèn)題。

但是對(duì)于計(jì)算機(jī)為了什么這個(gè)問(wèn)題,一個(gè)非常不同的概念是可能的,一個(gè)和智能增強(qiáng)的工作更一致的概念。

為了理解另一個(gè)觀點(diǎn),考慮我們對(duì)于思考的主觀經(jīng)驗(yàn)。對(duì)很多人,這個(gè)經(jīng)驗(yàn)是口頭上的:他們用語(yǔ)言思考,在頭腦中形成單詞鏈,類(lèi)似于演講或?qū)懺诩埳系木渥印?duì)于另一些人,思考是一個(gè)更加視覺(jué)的體驗(yàn),處理像圖和地圖的表示。仍然有些人混合了數(shù)學(xué)到他們的思考中,使用代數(shù)表示或圖表技術(shù),比如費(fèi)曼圖和彭羅斯圖。

在每種情形下,我們都使用了別人發(fā)明的表示來(lái)思考:?jiǎn)卧~、圖、地圖、代數(shù)、數(shù)學(xué)圖表等等。隨著成長(zhǎng),我們內(nèi)化了這些認(rèn)知技術(shù),并且使用它們作為我們思考的一種基底。

在大多數(shù)歷史中,可獲取的認(rèn)知技術(shù)的范圍是緩慢、逐漸變化的。一個(gè)新的單詞或一個(gè)新的數(shù)學(xué)符號(hào)將被引入。更少見(jiàn)的,一個(gè)激進(jìn)的新的認(rèn)知技術(shù)將會(huì)被發(fā)展。例如,在 1637 年,笛卡爾發(fā)表了他的《方法論》,解釋了用代數(shù)表示幾何觀點(diǎn),反之亦然:

這使得我們?cè)趯?duì)代數(shù)和幾何的思考方式發(fā)生了根本上的改變和擴(kuò)展。

歷史上,持久的認(rèn)知技術(shù)很少被發(fā)明出來(lái)。但是現(xiàn)代計(jì)算機(jī)是元 - 媒介(meta-medium),使得很多新的認(rèn)知技術(shù)被快速發(fā)明出來(lái)。考慮一個(gè)相對(duì)平常的例子,例如 Photoshop,精于 Photoshop 的用戶(hù)經(jīng)常出現(xiàn)之前不可能有的想法比如:“讓我們對(duì)這個(gè)的層應(yīng)用克隆圖章”。這是一個(gè)更一般的思考類(lèi)型的例子:“計(jì)算機(jī),【新型動(dòng)作】這個(gè)【新設(shè)想的對(duì)象類(lèi)的新型表示】”。當(dāng)它發(fā)生時(shí),我們?cè)谑褂?a target="_blank">電腦擴(kuò)展我們可以思考的想法范圍。

這種認(rèn)知轉(zhuǎn)換模型(cognitive transformation model)成為了大量智能增強(qiáng)領(lǐng)域中那些深入工作的基礎(chǔ)。不僅僅是外包認(rèn)知,它改變了我們用于思考的操作和表示;它改變了思想本身的基底。而且雖然認(rèn)知外包很重要,這種認(rèn)知轉(zhuǎn)換觀點(diǎn)提供了一種對(duì)智能增強(qiáng)更有意義的模型。在這種觀點(diǎn)下,計(jì)算機(jī)是改變和擴(kuò)大人類(lèi)思想的工具。

歷史上,認(rèn)知技術(shù)是人類(lèi)發(fā)明家發(fā)展出來(lái)的,從在蘇美爾和中美洲的寫(xiě)作的發(fā)明,到現(xiàn)代界面的設(shè)計(jì),如 Douglas Engelbart,Alan Kay 和其他設(shè)計(jì)師。

本文描述的例子表明,AI 系統(tǒng)推動(dòng)了新的認(rèn)知技術(shù)的發(fā)明。字體工具不僅僅是當(dāng)你需要一個(gè)新字體時(shí)可以咨詢(xún)的預(yù)言家。而且,它們可以被用于探索和發(fā)現(xiàn),提供新的表示和操作,能夠被內(nèi)化為用戶(hù)思考的一部分。雖然這些例子只處于早期階段,但是它們預(yù)示著 AI 不僅僅是關(guān)于認(rèn)知外包。對(duì)于 AI 的一個(gè)不同觀點(diǎn)是,它幫助我們發(fā)明新的認(rèn)知技術(shù),轉(zhuǎn)換我們思考的方式。

本文中,我們集中于少量例子,更多涉及隱空間的探索。有很多其他人工智能增強(qiáng)的例子,舉一些,但不全面:sketch-rnn system[11],用神經(jīng)網(wǎng)絡(luò)輔助畫(huà)畫(huà);Wekinator[12],使用戶(hù)快速建立新的樂(lè)器和藝術(shù)系統(tǒng);TopoSketch[13],通過(guò)探索隱空間生成動(dòng)畫(huà);機(jī)器學(xué)習(xí)模型設(shè)計(jì)整個(gè)印刷排版 [15];生產(chǎn)模型能在樂(lè)句間插值[15]。在每種情形下,系統(tǒng)使用機(jī)器學(xué)習(xí)把新的元素整合到用戶(hù)的思考中。更廣泛地,人工智能增強(qiáng)將會(huì)開(kāi)拓像計(jì)算創(chuàng)造性[16] 和交互機(jī)器學(xué)習(xí) [17] 這樣的領(lǐng)域。

尋找強(qiáng)大的思想新基元

我們認(rèn)為機(jī)器學(xué)習(xí)系統(tǒng)能有助于創(chuàng)造表示和操作,作為人類(lèi)思考中的新基元。在這些新基元中我們應(yīng)該尋找什么樣的性質(zhì)?這是一個(gè)太大的問(wèn)題,無(wú)法在一篇短文中全面地回答。但是我們將會(huì)簡(jiǎn)略地探索一下。

歷史上,重要的新媒介形式剛引入時(shí)通常看起來(lái)很奇怪。很多這樣的故事傳到流行文化中:“斯特拉文斯基Stravinsky和尼金斯基Nijinksy的《春之祭》的首映禮的暴亂”;” 早期立體畫(huà)派引起的恐慌,紐約時(shí)報(bào)對(duì)其評(píng)論:‘他們?cè)诒磉_(dá)什么?這些畫(huà)的作者是否失去理智?這是藝術(shù)還是瘋狂?誰(shuí)知道呢?’”。

另一個(gè)例子來(lái)自物理學(xué)。在 20 世紀(jì) 40 年代,量子電動(dòng)力學(xué)的理論構(gòu)想獨(dú)立地由物理學(xué)家朱利安 · 施溫格Julian Schwinger、朝永振一郎Shin’ichirō Tomonaga和理查德 · 費(fèi)曼Richard Feynman發(fā)展出來(lái)。在他們的工作中,施溫格和振一郎使用傳統(tǒng)代數(shù)的方法,沿著其他物理學(xué)家相似的路線(xiàn)。而費(fèi)曼使用一個(gè)更激進(jìn)的方法,基于現(xiàn)在有名的費(fèi)曼圖,用于描述光和物質(zhì)的交互:

最初,施溫格和振一郎的方法更容易被其他物理學(xué)家理解。當(dāng)費(fèi)曼和施溫格在 1948 年討論會(huì)上展示他們的工作時(shí),施溫格立刻受到贊揚(yáng)。相反,費(fèi)曼的工作使觀眾感到困惑。

如 James Cleick 在他的費(fèi)曼傳記 [19] 中寫(xiě)到:

這打擊了費(fèi)曼,每個(gè)人都有一個(gè)喜歡的原理或定理,他當(dāng)時(shí)全部違背了它們... 費(fèi)曼知道他失敗了。當(dāng)時(shí),他極其痛苦。后來(lái),他簡(jiǎn)單地說(shuō):“我的東西太多了,我的機(jī)器來(lái)自太遙遠(yuǎn)的地方。”

當(dāng)然,僅僅是因?yàn)槠婀值钠婀质菦](méi)有用的。但是,這些例子暗示了在表示上的重大突破在一開(kāi)始經(jīng)常顯得奇怪。還有其他正確的潛在原因嗎?

部分原因是因?yàn)槿绻恍┍硎臼欠浅P碌模敲此雌饋?lái)會(huì)和你之前見(jiàn)到的事情不同。費(fèi)曼圖、畢加索的畫(huà)、斯特拉文斯基的音樂(lè)都揭示了真正的有意義的新方法。好的表示能讓你敏銳地洞察事物,幫助使熟悉的事物盡可能生動(dòng)地展現(xiàn)出新事物。但是因?yàn)閷?duì)不熟悉的強(qiáng)調(diào),表示會(huì)看起來(lái)很奇怪:它展示了你之前從未見(jiàn)過(guò)的關(guān)系。在某種程度上,設(shè)計(jì)師的任務(wù)是識(shí)別出關(guān)鍵的奇特,然后盡可能地放大它。

奇特的表示經(jīng)常是難以理解的。開(kāi)始,物理學(xué)家們喜歡施溫格 - 振一郎的方法甚于費(fèi)曼的。但是,隨著費(fèi)曼的方法慢慢被物理學(xué)家理解,他們意識(shí)到雖然施溫格 - 振一郎的方法和費(fèi)曼的在數(shù)學(xué)上是等價(jià)的,費(fèi)曼的方法更加強(qiáng)大。

如 Gleick 所說(shuō):

施溫格的學(xué)生們?cè)诠鹛幱诟?jìng)爭(zhēng)的劣勢(shì),一如別處的同僚們與之而言,同僚們懷疑他們是不是在偷偷地使用著費(fèi)曼圖。這有時(shí)是正確的,默里蓋爾曼之后花了一個(gè)學(xué)期待在施溫格的家里,后來(lái)喜歡說(shuō)他已經(jīng)搜索了費(fèi)曼圖的每個(gè)地方,他沒(méi)有找到什么,除了一個(gè)已經(jīng)被鎖上的門(mén)...

這些想法不僅對(duì)歷史上的表示是正確的,對(duì)計(jì)算機(jī)的接口同樣是。然而我們對(duì)奇怪的主張違反了很多傳統(tǒng)界面的智慧,特別是被廣泛持有的信念,它們應(yīng)該是 "用戶(hù)友好" 的,如簡(jiǎn)單、初學(xué)者能立刻使用。

這經(jīng)常意味著界面是陳舊的,是用傳統(tǒng)元素以標(biāo)準(zhǔn)的方法構(gòu)造而成。然而雖然使用陳舊的界面可能是簡(jiǎn)單和有趣的,它輕松的像閱讀一部公式化的浪漫小說(shuō)。它意味著界面沒(méi)有揭示任何關(guān)于主題區(qū)域的真正新奇的東西。所以它幾乎不能加深用戶(hù)的理解,或改變他們思考的方式。對(duì)一般的任務(wù)是沒(méi)問(wèn)題的,但是對(duì)更深刻的任務(wù),在更長(zhǎng)期上,你想要一個(gè)更好的接口。

理想上,界面能展示主題下的更深的原則,向用戶(hù)揭示一個(gè)新的世界。當(dāng)你學(xué)會(huì)這個(gè)界面,你能內(nèi)化這些原則,擁有更強(qiáng)大的對(duì)世界的推理能力。這些原則是你理解中的擴(kuò)散器,它們是你真正想看見(jiàn)的全部,其他都是處于最好的支持或最壞的不重要的碎渣。最好的界面的目的在淺層意義上不是用戶(hù)友好的,它是更強(qiáng)意義上的用戶(hù)友好,是具體化有關(guān)世界的原則 [20],使它們成為用戶(hù)生活和創(chuàng)造的工作環(huán)境。在那時(shí),一旦看起來(lái)奇怪的反而變得舒服和熟悉,變成思考模式的一部分。

在智能增強(qiáng)上使用 AI 模型意味著什么?

我們希望,如我們看到的,我們的機(jī)器學(xué)習(xí)模型將會(huì)幫助我們構(gòu)建接口,用對(duì)用戶(hù)有意義的方式使深刻原則具體化。為了實(shí)現(xiàn)它,模型必須發(fā)現(xiàn)關(guān)于世界的深刻原則、識(shí)別出這些原則、而且盡可能用一種用戶(hù)理解的方式,生動(dòng)地在接口中表現(xiàn)出來(lái)。

當(dāng)然,這是離譜的要求,我們展示的例子僅僅只是一個(gè)開(kāi)始。確實(shí)我們的模型有時(shí)能發(fā)現(xiàn)深刻的原則,像在加粗字體時(shí)對(duì)封閉負(fù)空間的保留,但是這僅僅隱藏在模型中。然而,我們已經(jīng)構(gòu)建了能利用這些原則的工具,如果模型能自動(dòng)地推測(cè)出重要的原則,并找到方法明確地表現(xiàn)出這些原則(鼓勵(lì)過(guò)程朝著 infoGAN[21] 的結(jié)果前進(jìn),它使用了信息論的想法找到隱空間的結(jié)構(gòu)),這就更好了。理想地,這樣的模型開(kāi)始得到真正的解釋?zhuān)恢皇庆o態(tài)的形式,還有動(dòng)態(tài)的形式,用戶(hù)可以操作的。但是我們離那一點(diǎn)還有很長(zhǎng)的路要走。

這些交互界面會(huì)抑制創(chuàng)造力嗎?

懷疑我們已經(jīng)描述的界面的表達(dá)豐富性,是件誘人的事情。如果一個(gè)界面約束我們只探索圖片的自然空間,是否意味著我們只在做被期望的事情呢?是否意味著這些接口只能被用于生成視覺(jué)的陳詞濫調(diào)呢?它會(huì)阻止我們生成真正新的東西、做真正有創(chuàng)造性的工作嗎?

為了回答這些問(wèn)題,識(shí)別出創(chuàng)新的兩種不同的模式是有幫助的。這兩種模式的模型是過(guò)于簡(jiǎn)化的:創(chuàng)造力并不能很好地分為這兩類(lèi)。盡管如此,這個(gè)模型還是澄清了在創(chuàng)造性工作中新接口的角色。

創(chuàng)造的第一個(gè)模式是一個(gè)工匠每天從事工作的創(chuàng)造性。比如,一個(gè)字體設(shè)計(jì)師的大量工作是由最好的現(xiàn)存經(jīng)驗(yàn)重新組合而成。這樣的工作通常是許多創(chuàng)造性的選擇,以滿(mǎn)足預(yù)期的設(shè)計(jì)目標(biāo),而不是開(kāi)發(fā)關(guān)鍵的新的內(nèi)在原則。

對(duì)于這樣的工作,我們一直討論的生成接口是有前景的。雖然它們目前有很多局限性,但未來(lái)的研究將發(fā)現(xiàn)并解決許多不足。這在 GAN 身上發(fā)生得很快:最初的 GAN 有很多限制 [10],但很快又出現(xiàn)了更適合圖片的模型 [22],改進(jìn)了分辨率,減少了工件等等。有了足夠的迭代,這些生成界面將成為工藝工作的強(qiáng)大工具。

第二種創(chuàng)造模式的目的是發(fā)展新的原則,從根本上改變創(chuàng)造性表達(dá)的范圍。人們可以在畢加索或莫奈等藝術(shù)家的作品中看到這一點(diǎn),他們違反了現(xiàn)存的繪畫(huà)原則,發(fā)展出新的原則,使人們能夠以新的方式看到事物。

在使用生成接口時(shí),是否有可能做這樣的創(chuàng)造性工作呢?這樣的接口會(huì)不會(huì)限制我們?cè)谧匀粓D片或自然字體的空間,因此阻止了我們積極地在創(chuàng)造性工作中探索有趣的方向?

情況比這更復(fù)雜。

在某種程度上,這是一個(gè)關(guān)于我們的生成模型的能力的問(wèn)題。在某些情況下,模型只能夠生成現(xiàn)存想法的重新組合。這是理想的 GAN 模型的限制,因?yàn)橐粋€(gè)經(jīng)過(guò)完美訓(xùn)練的 GAN 生成器將復(fù)制訓(xùn)練數(shù)據(jù)的分布。這樣的模型不能創(chuàng)造一個(gè)新的基本原則來(lái)直接生成圖片,因?yàn)檫@樣的圖片沒(méi)法從在訓(xùn)練數(shù)據(jù)中得來(lái)。

像 Mario Klingemann 和 Mike Tyka 這樣的藝術(shù)家現(xiàn)在用 GAN 來(lái)創(chuàng)作有趣的藝術(shù)品。他們使用的是 “不完美的” GAN 模型,他們似乎能用來(lái)探索有趣的新原則;也許不好的 GAN 比理想的 GAN 模型在藝術(shù)上更有趣。此外,沒(méi)有說(shuō)接口只能幫我們探索隱空間。也許可以添加一些操作,故意將我們帶出隱空間,或者減少自然圖片空間的可能性(以及更令人驚奇的)部分。

當(dāng)然,GAN 不是唯一的生成模型。在一個(gè)足夠強(qiáng)大的生成模型中,模型發(fā)現(xiàn)的概括可能包含了超越人類(lèi)發(fā)現(xiàn)的思想。在這種情況下,對(duì)隱空間的探索可能使我們能夠發(fā)現(xiàn)新的基本原則。模型會(huì)比人類(lèi)專(zhuān)家發(fā)現(xiàn)更強(qiáng)的抽象。想象一下,在立體畫(huà)派出現(xiàn)之前,一個(gè)專(zhuān)門(mén)研究繪畫(huà)的生成模型;也許通過(guò)探索這個(gè)模型,我們就有可能發(fā)現(xiàn)立體主義嗎?正如本文之前所討論的,這將是類(lèi)似于對(duì)波爾 - 愛(ài)因斯坦凝聚態(tài)預(yù)測(cè)的類(lèi)比。這種發(fā)明超越了當(dāng)今的生成模型,但似乎是對(duì)未來(lái)模型的一種有價(jià)值的渴望。

到目前為止,我們的例子都是基于生成模型的,但是有一些啟發(fā)性的例子不是基于生成模型的。考慮由 Isola 等人 [23] 提出的 pix2pix 系統(tǒng)這個(gè)系統(tǒng)訓(xùn)練成對(duì)的圖片,例如表現(xiàn)貓的邊緣和實(shí)際的貓。一旦經(jīng)過(guò)訓(xùn)練,就可以顯示一組邊緣,并要求它為生成實(shí)際對(duì)應(yīng)的貓的圖片,它經(jīng)常表現(xiàn)得很好:

在不尋常的限制條件下,pix2pix 可以產(chǎn)生驚人的圖片:

這也許不是畢加索式的高級(jí)創(chuàng)造力,但仍是驚人的。這當(dāng)然不像我們大多數(shù)人以前見(jiàn)過(guò)的圖片。pix2pix 和它的用戶(hù)是如何達(dá)到這種效果的呢?

與前面的例子不同,pix2pix 不是生成模型。這意味著它沒(méi)有隱空間,也沒(méi)有對(duì)應(yīng)的自然圖片空間。而是一個(gè)神經(jīng)網(wǎng)絡(luò),令人困惑地被稱(chēng)為生成器——這與我們?cè)缙诘纳赡P筒⒉煌约s束的圖片作為輸入,并生成填充的圖片。

生產(chǎn)器的訓(xùn)練和判別器網(wǎng)絡(luò)的訓(xùn)練是對(duì)抗的,判別器的工作是區(qū)分出從真實(shí)數(shù)據(jù)中生成的圖片組和由生成器生成的圖片組。

雖然這聽(tīng)起來(lái)很像傳統(tǒng)的 GAN,但是有一個(gè)關(guān)鍵的區(qū)別:生成器中沒(méi)有隱向量輸入,相反,這里只有一個(gè)輸入約束。當(dāng)人輸入一種與訓(xùn)練數(shù)據(jù)不一樣的約束時(shí),網(wǎng)絡(luò)就被迫即興發(fā)揮,盡其所能地根據(jù)之前所學(xué)的規(guī)則來(lái)解釋這個(gè)約束。創(chuàng)造力是由訓(xùn)練數(shù)據(jù)推斷出的知識(shí)與用戶(hù)提供的約束一起作用的結(jié)果。因此,即使是相對(duì)簡(jiǎn)單的想法——比如面包或眼睛貓——也能產(chǎn)生引人注目的新型圖片,這些圖片并不在我們之前認(rèn)為的自然圖片的空間中。

總結(jié)

傳統(tǒng)觀念認(rèn)為人工智能將改變我們與計(jì)算機(jī)交互方式。不幸的是,人工智能社區(qū)中的許多人大大低估了接口設(shè)計(jì)的深度,往往將其視為一個(gè)簡(jiǎn)單的問(wèn)題,主要是關(guān)注于如何使事物變得漂亮或易于使用。從這個(gè)角度來(lái)說(shuō),接口設(shè)計(jì)是一個(gè)交給別人的問(wèn)題,而繁重的工作是訓(xùn)練一些機(jī)器學(xué)習(xí)系統(tǒng)。

這種觀點(diǎn)是不正確的,接口設(shè)計(jì)最深層的含義是開(kāi)發(fā)人類(lèi)思考和創(chuàng)造的基本要素。這個(gè)問(wèn)題的知識(shí)起源可以追溯到字母表的發(fā)明者、制圖學(xué)的發(fā)明者、音樂(lè)符號(hào)的發(fā)明者以及現(xiàn)代的巨人如笛卡爾、普萊菲爾、費(fèi)曼、恩格爾巴特和凱。這是人類(lèi)所面臨的最困難、最重要、最根本的問(wèn)題之一。

如前所述,在人工智能的一個(gè)普遍觀點(diǎn)中,我們的計(jì)算機(jī)將繼續(xù)在解決問(wèn)題方面做得更好,但人類(lèi)基本保持不變。在第二種常見(jiàn)的觀點(diǎn)中,人類(lèi)將在硬件層面進(jìn)行修改,可能直接通過(guò)神經(jīng)接口,或者間接通過(guò)全腦模擬。

我們描述了第三種觀點(diǎn),AI 實(shí)際上改變了人類(lèi),幫助我們發(fā)明了新的認(rèn)知技術(shù),擴(kuò)展了人類(lèi)思維的范圍。或許有一天,這些認(rèn)知技術(shù)將反過(guò)來(lái)加速 AI 的發(fā)展,形成良性循環(huán):

它不會(huì)是機(jī)器中的奇點(diǎn),相反,它將是人類(lèi)思維中的一個(gè)奇點(diǎn)。當(dāng)然,這個(gè)循環(huán)目前僅僅只是一個(gè)推測(cè)。我們所描述的系統(tǒng)可以幫助開(kāi)發(fā)更強(qiáng)大的思維方式,但至多有一種間接的感覺(jué),即這些思維方式被用來(lái)開(kāi)發(fā)新的 AI 系統(tǒng)。

當(dāng)然,從長(zhǎng)期來(lái)看,機(jī)器在所有或大部分認(rèn)知任務(wù)上都有可能超過(guò)人類(lèi)。即便如此,認(rèn)知轉(zhuǎn)換仍將是一個(gè)有價(jià)值的目標(biāo),值得我們自己去追求。學(xué)習(xí)下象棋或圍棋是有趣和有價(jià)值的,即使機(jī)器做得更好。而在諸如講故事之類(lèi)的活動(dòng)中,益處往往更多地來(lái)自建構(gòu)故事和人物關(guān)系這一過(guò)程,而非最終的產(chǎn)物。個(gè)人的改變和成長(zhǎng)還具有內(nèi)在的價(jià)值,除了工具性利益以外。

我們討論的面向接口的工作超出了用來(lái)評(píng)價(jià) AI 中大多數(shù)現(xiàn)有工作的敘述。它不涉及擊敗某個(gè)分類(lèi)或回歸問(wèn)題的基準(zhǔn)。它無(wú)需非得在譬如圍棋這樣的比賽中,擊敗人類(lèi)的冠軍。相反,它涉及一個(gè)更為主觀和難以衡量的標(biāo)準(zhǔn):它是否有助于人類(lèi)以新的方式思考和創(chuàng)造?

這給這類(lèi)工作帶來(lái)了困難,尤其是在研究環(huán)境中。比如,這應(yīng)該發(fā)表在哪里呢?它屬于什么社區(qū)呢?應(yīng)該用什么標(biāo)準(zhǔn)來(lái)評(píng)判這樣的工作呢?好的工作和壞工作的區(qū)別是什么?

我們相信,在未來(lái)幾年內(nèi),將出現(xiàn)一個(gè)能夠回答這些問(wèn)題的社區(qū)。它將舉辦研討會(huì)和會(huì)議。它將在類(lèi)似 Distill 等地方發(fā)表工作。它的標(biāo)準(zhǔn)將來(lái)自許多不同的社區(qū):有藝術(shù)社區(qū)和音樂(lè)社區(qū)的探討;有數(shù)學(xué)社區(qū)的對(duì)抽象的品味及 “好” 的定義;以及現(xiàn)有的 AI 和 IA 社區(qū)(包括計(jì)算創(chuàng)造力和人機(jī)交互的工作)。

對(duì)成功的長(zhǎng)期測(cè)試將是開(kāi)發(fā)被創(chuàng)造者廣泛使用的工具。藝術(shù)家們是否在使用這些工具來(lái)開(kāi)發(fā)不同尋常的新風(fēng)格?其他領(lǐng)域的科學(xué)家是否用它們來(lái)發(fā)展用其他方法不可能獲得的理解?這些都是偉大的理想,需要一種建立在傳統(tǒng)人工智能上的方法之上,但也包含了非常不同的規(guī)范。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:【深度好文】怎樣用可交互對(duì)抗網(wǎng)絡(luò)增強(qiáng)人類(lèi)創(chuàng)造力

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    量子計(jì)算機(jī)或?qū)⑻崆皩?shí)現(xiàn)

    1000量子比特的體量,并且業(yè)內(nèi)其他專(zhuān)家也基本認(rèn)可這個(gè)預(yù)期。  谷歌或其他公司的模擬量子計(jì)算機(jī)一旦成功,則可以用來(lái)分析并解開(kāi)醫(yī)學(xué)和能源領(lǐng)域的難題,這些領(lǐng)域要求進(jìn)行原子級(jí)別的大規(guī)模仿真
    發(fā)表于 06-13 10:31

    如何讓計(jì)算機(jī)視覺(jué)更進(jìn)一步接近人類(lèi)視覺(jué)?

    如何讓計(jì)算機(jī)視覺(jué)更進(jìn)一步接近人類(lèi)視覺(jué)?
    發(fā)表于 06-01 06:27

    微型計(jì)算機(jī)在那些機(jī)器內(nèi)部做些什么

    的兒童玩具也使用微型計(jì)算機(jī)。那么,究竟微型計(jì)算機(jī)在那些機(jī)器內(nèi)部做些什么?微型計(jì)算機(jī)控制硬件,這是這些設(shè)備運(yùn)行的關(guān)鍵。例如,它接收來(lái)自按鈕和按鍵的輸入,并根據(jù)預(yù)設(shè)程序控制外圍電路,如電
    發(fā)表于 09-10 09:24

    什么是計(jì)算機(jī)

    我們人類(lèi)無(wú)時(shí)無(wú)刻不想著,自己能夠創(chuàng)造一個(gè)世界。什么是計(jì)算機(jī)計(jì)算社會(huì)我們人類(lèi)已經(jīng)步入了計(jì)算社會(huì)。縱覽人類(lèi)
    發(fā)表于 09-10 08:41

    電子計(jì)算機(jī)體積,世界上體積最大的計(jì)算機(jī) 精選資料分享

    作為我們?nèi)粘J褂玫碾娔X,小巧方便,那么世界上體積最大的計(jì)算機(jī)是什么!下面是學(xué)習(xí)啦小編為您收集整理的文章!世界上體積最大的計(jì)算機(jī)計(jì)算機(jī)(computer)俗稱(chēng)電腦,是20世紀(jì)最先進(jìn)的科
    發(fā)表于 09-13 08:24

    計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)

    計(jì)算機(jī)科學(xué)與技術(shù)是當(dāng)代科學(xué)技術(shù)的先導(dǎo),它的應(yīng)用正在改變社會(huì)的生產(chǎn)方式人類(lèi)的生活方式。本專(zhuān)業(yè)以加強(qiáng)基礎(chǔ)、拓寬專(zhuān)業(yè)、面向系統(tǒng)、兼顧應(yīng)用為指導(dǎo)思
    發(fā)表于 03-23 00:02 ?45次下載

    有關(guān)計(jì)算機(jī)體系結(jié)構(gòu)的思考匯總

    有關(guān)計(jì)算機(jī)體系結(jié)構(gòu)的思考匯總的內(nèi)容:幾類(lèi)網(wǎng)格計(jì)算機(jī)、Farming 計(jì)算模型與應(yīng)用、指導(dǎo)計(jì)算機(jī)設(shè)計(jì)的ASC模型、DSAG 的理論模型、程序模
    發(fā)表于 11-03 22:13 ?22次下載

    計(jì)算機(jī)取證工具及方式

    本內(nèi)容講述了計(jì)算機(jī)取證技術(shù),如何進(jìn)行計(jì)算機(jī)取證,計(jì)算機(jī)取證工具及方式等知識(shí)
    發(fā)表于 05-07 15:11 ?4605次閱讀

    什么是量子計(jì)算機(jī)?量子計(jì)算機(jī)的誕生,人類(lèi)是否有望模擬出來(lái)?

    中國(guó)制造出了世界上第一臺(tái)量子計(jì)算機(jī),通過(guò)大量的量子計(jì)算,能夠大規(guī)模地模擬復(fù)雜的物質(zhì)系統(tǒng),其中可能包括完整的生物體,甚至人類(lèi)。這些說(shuō)法聽(tīng)起來(lái)似乎很瘋狂,但是誰(shuí)又能證明,我們不是模擬出來(lái)
    發(fā)表于 05-19 17:41 ?2479次閱讀

    感知計(jì)算機(jī),靈感來(lái)自人類(lèi)大腦的全新計(jì)算機(jī)架構(gòu)

    和編程模型收集的算法庫(kù)可以模仿人類(lèi)大腦的神經(jīng)網(wǎng)絡(luò)執(zhí)行的所有基本功能,它旨在形成未來(lái)類(lèi)人腦計(jì)算機(jī)的各種感知功能。 我們所做的是創(chuàng)建一種全新的計(jì)算機(jī)架構(gòu)(包括硅片和軟件),靈感來(lái)自
    發(fā)表于 09-14 16:58 ?2次下載
    感知<b class='flag-5'>計(jì)算機(jī)</b>,靈感來(lái)自<b class='flag-5'>人類(lèi)</b>大腦的全新<b class='flag-5'>計(jì)算機(jī)</b>架構(gòu)

    人工智能的興起與思考和印度十大人工智能公司的初創(chuàng)現(xiàn)狀

    和工業(yè)部門(mén)部署。 人工智能包括建造可以人類(lèi)一樣自主做出聰明決定的計(jì)算機(jī)。機(jī)器學(xué)習(xí)和其它各子領(lǐng)域,如深度學(xué)習(xí),是實(shí)現(xiàn)人工智能的方式。傳統(tǒng)的編程是告訴
    發(fā)表于 09-22 15:06 ?0次下載

    量子計(jì)算機(jī)將如何改變大數(shù)據(jù)能力?

    我們正處于傳統(tǒng)計(jì)算機(jī)數(shù)據(jù)處理能力的極限,而數(shù)據(jù)卻依然在不斷增長(zhǎng)。正因?yàn)槿绱耍瑯I(yè)界領(lǐng)導(dǎo)者們展開(kāi)了激烈競(jìng)爭(zhēng),看誰(shuí)能首先要推出一款比現(xiàn)有計(jì)算機(jī)更強(qiáng)大的量子計(jì)算機(jī),來(lái)處理我們每天產(chǎn)生的所有數(shù)據(jù),并解決日益復(fù)雜的問(wèn)題。那么量子
    發(fā)表于 02-05 16:06 ?1522次閱讀

    和超級(jí)計(jì)算機(jī)相比,人類(lèi)的大腦很弱嗎

    縱觀人類(lèi)的發(fā)展史,電子計(jì)算機(jī)(也稱(chēng)電腦)絕對(duì)是一個(gè)劃時(shí)代的產(chǎn)物,憑借著強(qiáng)大、精準(zhǔn)的計(jì)算能力,電子計(jì)算機(jī)一舉將人類(lèi)從繁復(fù)、枯燥的工作中解脫出來(lái)
    的頭像 發(fā)表于 04-01 16:19 ?2926次閱讀

    未來(lái)已來(lái)!足以改變世界的量子計(jì)算機(jī)

    在當(dāng)前階段,量子計(jì)算機(jī)認(rèn)為將會(huì)引導(dǎo)新一輪的技術(shù)革新,可謂是至關(guān)重要。量子計(jì)算機(jī)目前主要有兩種:光量子計(jì)算機(jī)和分子量子
    的頭像 發(fā)表于 09-11 14:51 ?3873次閱讀

    量子計(jì)算機(jī)可以用來(lái)破解世界上一些最常見(jiàn)的加密算法?

    現(xiàn)代計(jì)算機(jī)從根本上改變了日常生活,而且它們每天都在變得更加強(qiáng)大。你現(xiàn)在用來(lái)讀這篇文章所使用的智能手機(jī),相比較幾十年前的超級(jí)計(jì)算機(jī)來(lái)說(shuō),也更加強(qiáng)大了。 但即使是今天最強(qiáng)大的
    的頭像 發(fā)表于 07-06 15:44 ?1460次閱讀
    主站蜘蛛池模板: 卡1卡2卡3精品推荐老狼 | 欧美成人亚洲 | 丁香花在线电影小说观看 | 国内在线观看精品免费视频 | 在线播放免费 | 欧美区在线播放 | 午夜无遮挡怕怕怕免费视频 | 天堂网在线资源www种子 | h网站在线看 | 日本aaaaa高清免费看 | 四虎在线播放免费永久视频 | 天天干夜夜操 | 九九热精品在线观看 | 一级做a爰片久久毛片毛片 一级做a爰片久久毛片美女图片 | 欧美一级特黄aa大片视频 | 日韩毛片在线看 | 日韩在线免费看网站 | 爱爱免费视频网站 | 国产精品成人在线播放 | 午夜在线播放视频在线观看视频 | 激情97| 操操操干干干 | 国产伦精品一区二区三区免 | 免费观看黄视频网站 | 国产精品vv在线 | 婷婷久久综合九色综合九七 | 色婷婷综合网 | 国产片在线 | 四虎国产永久在线观看 | 日日草天天干 | 欧美一区二区三区视频在线观看 | 欧美精品videofree720p | 深爱激情站 | 性久久久久| 精品国内视频 | 欧美人成网 | 4438x成人免费| 欧美视频精品在线 | 特级黄色免费片 | 免费看污黄视频软件 | 欧美色综合高清免费 |