國外一項(xiàng)研究認(rèn)為,在未來的幾十年間,美國47%的現(xiàn)有工作崗位將面臨被AI(人工智能)和自動(dòng)化取代的風(fēng)險(xiǎn)。雖然不少專家質(zhì)疑了這一算法,但是AI的威脅確實(shí)越來越近了。我們現(xiàn)在聊以自慰的就是,手動(dòng)的或者重復(fù)性的工作可能會(huì)被AI搶走,但是創(chuàng)意性的工作則相對安全。事實(shí)真的如此嗎?其實(shí)AI早就對人類創(chuàng)意工作虎視耽耽,并且有了長足的進(jìn)步。
AI自畫像技驚四座
紐約時(shí)報(bào)的編輯找到IBM研究院,希望他們能夠通過AI的方式畫一幅畫,以便作為一期AI專輯的封面。這個(gè)請求看起來簡單,其實(shí)暗藏了很大的挑戰(zhàn)。已有的AI技術(shù),比如汽車智能駕駛、翻譯、玩游戲,甚至制作電影的預(yù)告片等等,這些任務(wù)不需要AI創(chuàng)建新材料,只需分析手頭已有的信息并根據(jù)訓(xùn)練做出選擇即可。而現(xiàn)在要讓AI跳出已有資料,以“自我思考”的方式創(chuàng)造出全新的藝術(shù)作品,難度可想而知。最終,IBM的AI還是交出了令人驚訝的作業(yè)(圖1)。
圖1 AI自畫像——AI與人類創(chuàng)造力手牽手(圖源:IBM Research)
像人類一樣提煉作品主題
上述AI作品的產(chǎn)生,它的算法可以分為三大部分,有點(diǎn)類似于藝術(shù)家的創(chuàng)作過程,下面我們就來一一解說。
首先是確定作品的核心概念,也就是作品的主題。主題作為藝術(shù)作品的核心思想,在以往的AI創(chuàng)作中(比如寫詩),基本上都是由人事先指定好關(guān)鍵詞,AI是被動(dòng)的。而此次的AI創(chuàng)作,研究員們決定由AI自行確定。
研究員們首先匯集了紐約時(shí)報(bào)上大約3000篇左右的AI相關(guān)文章,然后通過自然語言處理軟件分析這些文章,找出和AI高度關(guān)聯(lián)的語義概念,比如“機(jī)器人”、“自動(dòng)駕駛”和“計(jì)算”等,共選擇了30項(xiàng)。
因?yàn)檫@些詞語本身并不包含“AI”字樣,所以軟件通過簡單的關(guān)鍵詞搜索是不可能將它們提取出來的,軟件只有像人一樣智能地“理解”了詞語的意義,才能精確完成篩選任務(wù),其中自然語言處理技術(shù)起著重要作用(圖2)。
圖2 自然語言理解的實(shí)現(xiàn)模型之一(想要理解語言,電腦必須要理解這個(gè)世界)
文字概念需要圖形化,AI通過上述篩選出來的30項(xiàng)概念,訓(xùn)練一個(gè)用于視覺識(shí)別的神經(jīng)網(wǎng)絡(luò)(圖3),以便從紐約時(shí)報(bào)紛繁復(fù)雜的文章圖片中,挑選出含有AI意義的所有圖片,并按與AI的密切程度對圖片打分。在評分前十的圖像里,項(xiàng)目參與人員最終選定一張人和機(jī)器人握手的圖像(還是不能完全排除人類干預(yù),需要與人類攜手合作)。
圖3 視覺識(shí)別神經(jīng)網(wǎng)絡(luò)模型之一
從學(xué)習(xí)模仿開始的原創(chuàng)圖像
主題概念確定之后,AI接下來正式進(jìn)入創(chuàng)作過程。人類畫家,開始學(xué)畫時(shí)大都經(jīng)歷過一個(gè)學(xué)習(xí)模仿的過程,AI畫畫也是如此,只是它的方法更為獨(dú)特些。研究員們首先收集到1000多個(gè)機(jī)器人及人的手的圖片,作為AI的學(xué)習(xí)訓(xùn)練數(shù)據(jù)集(圖4)。
圖4 機(jī)器人和人的手圖片示例
AI的學(xué)習(xí)模型大致分兩類,一類是判別模型(Discriminative Model),一類是生成模型(Generative Model)。假設(shè)給定一張圖,要求判斷圖里面是什么動(dòng)物,貓還是狗,這就是判別模型。假設(shè)給定的是多個(gè)貓的圖集,然后生成一張不在此圖集中的新的貓圖,那么這就是生成模型。
本文所述的AI采用的則是深度學(xué)習(xí)模型生成式對抗網(wǎng)絡(luò)(GAN, Generative Adversarial Networks ),它同時(shí)包括了判別模型(D)和生成模型(G)。G不斷生成新的機(jī)器人和人的手的圖片,盡可能貼近原有數(shù)據(jù)集中的圖,以欺騙D;D不斷識(shí)別G所生成的圖片是不是真實(shí)的,將假的圖排除。這兩個(gè)學(xué)習(xí)模塊不斷博弈的過程,最終的結(jié)果就是產(chǎn)生一個(gè)足以亂真的牽手的圖片,并且是與原來數(shù)據(jù)集中的圖不同的新作品(圖5)。
圖5 生成式對抗網(wǎng)絡(luò)的工作原理模型
錦上添花的作品包裝
既然是為特定報(bào)刊定制的作品,當(dāng)然要盡可能符合原有報(bào)刊的一貫風(fēng)格。這對AI來說已經(jīng)不是什么難事,將紐約時(shí)報(bào)以往的封面圖片匯集成數(shù)據(jù)集,訓(xùn)練出風(fēng)格轉(zhuǎn)換神經(jīng)網(wǎng)絡(luò),對上面新創(chuàng)作的人與機(jī)器牽手的圖片進(jìn)行自動(dòng)風(fēng)格轉(zhuǎn)換,生成多幅作品,從中挑選出最滿意的就可以了,效果便是本文開篇的那樣圖了。
更多的拓展應(yīng)用
IBM的AI自畫像技術(shù),其獨(dú)到之處就是可以由AI自動(dòng)確定主題概念,再以此概念生成全新的藝術(shù)作品,并且還可以根據(jù)要求定制不同的藝術(shù)風(fēng)格。這可以應(yīng)用到很多領(lǐng)域。比如作家可以通過它設(shè)計(jì)新書的封面,影視可以通過它設(shè)計(jì)海報(bào),音樂家通過它設(shè)置專輯封面等等。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29730瀏覽量
212839 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249365 -
智能駕駛
+關(guān)注
關(guān)注
4文章
2810瀏覽量
49949
發(fā)布評論請先 登錄
后摩爾時(shí)代:芯片不是越來越涼,而是越來越燙

大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?
小智AI移植到ESP32P4-Fucntion-EV-Board實(shí)機(jī)演示
海思SD3403邊緣計(jì)算AI數(shù)據(jù)訓(xùn)練概述
90元打造小智AI腕表,語音交互超有趣!

當(dāng)我問DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......
寧德時(shí)代計(jì)劃在歐洲建立第四座電池工廠,深化合資合作戰(zhàn)略
我國首款四座電動(dòng)飛機(jī)獲頒型號(hào)合格證 續(xù)航可達(dá)1.5小時(shí)
為什么越來越多的視頻監(jiān)控AI分析做到了攝像頭上?

越來越“熱”的芯片,如何降溫?

我們的城市為什么越來越熱?


評論