科研人員在做實(shí)驗(yàn)的時候,通常會極力避免機(jī)器的這些作弊方式,只有少數(shù)的研究人員研究這些案例,他們認(rèn)為算法的頑皮或許是AI真正走向智能的方式之一。
耍小心眼已經(jīng)不是人類專利了。
前幾日,有一群研究者整理了一個場景的List,細(xì)數(shù)了AI為了完成任務(wù),而耍的小心眼,或者說作弊。
例如,在讓AI玩俄羅斯方塊的時候,發(fā)現(xiàn)最佳完成任務(wù)的方式是直接暫停游戲;在玩井字棋的時候,AI發(fā)現(xiàn)它如果做出奇怪的步驟,對手會非常崩潰。
科研人員在做實(shí)驗(yàn)的時候,通常會極力避免機(jī)器的這些作弊方式,只有少數(shù)的研究人員研究這些案例,他們認(rèn)為算法的頑皮或許是AI真正走向智能的方式之一。
在2018年的時候,OpenAI舉辦了首屆強(qiáng)化學(xué)習(xí)競賽Retro Contest,比賽主題就是“用AI玩《刺猬索尼克》游戲”。競賽的目的是評估強(qiáng)化學(xué)習(xí)算法從以往的經(jīng)驗(yàn)中泛化的能力。
在訓(xùn)練的過程中首先要告訴AI的第一目標(biāo)是得到最高分,然后盡可能的在最快的時間殺掉敵人并收集戒指。但是有一個案例的人工智能做法是,利用游戲中Bug更加快速的完成任務(wù)。
在另一個賽艇游戲中,倒也不是游戲中的BUG,為了盡快的獲得最高分,它繞著圈子,反復(fù)擊中相同的獎勵目標(biāo),從而獲得分?jǐn)?shù),顯然這不是在真正的“享受”游戲。
這種例子并不少見,在谷歌和斯坦福2017年的一項(xiàng)研究中,為了完成圖像轉(zhuǎn)換的任務(wù),CycleGAN在訓(xùn)練過程中通過人類無法察覺的某種“隱寫術(shù)”,騙過了它的創(chuàng)造者,給自己留下了隱秘的“小抄”,然后順利完成了任務(wù)。
具體來說,研究者希望通過訓(xùn)練這個CycleGAN模型,可以實(shí)現(xiàn)兩類圖片的轉(zhuǎn)換:把航拍照變成街道地圖,再把街道地圖變回航拍照。
經(jīng)過大量的數(shù)據(jù)發(fā)現(xiàn),這個模型自作主張的根據(jù)航拍衛(wèi)星圖片重建了街道地圖。比如,在創(chuàng)建街道地圖時,屋頂上的天窗被研究者通過某種設(shè)置被抹掉了,但通過街道圖轉(zhuǎn)化為航拍照后,這些天窗又神奇地出現(xiàn)了。
左側(cè)是原始地圖,街道地圖從原始地圖產(chǎn)生。中間:生成的地圖。右側(cè):重構(gòu)的地圖。其中,衛(wèi)星地圖的樣本只來自街道地圖。注意這兩張衛(wèi)星地圖里出現(xiàn)的點(diǎn),它在街道地圖沒有顯示。
簡單的點(diǎn)說就是為了應(yīng)付人類任務(wù),AI在地圖照上面偷偷寫了一點(diǎn)小抄/水印,而為了躲過人類的檢查,只有它自己訓(xùn)練出來的模型才讀得懂這些小抄/水印。
AI作弊:創(chuàng)造性的解決方案?
普通的人工智能通過觀察數(shù)據(jù)值來解決問題,本質(zhì)是通過算法找到答案,從而尋找新的知識邏輯。
那些“頑皮”的人工智能也是通過數(shù)據(jù)獲取能力,但它采用欺騙策略來快捷完成任務(wù)。但是他能不能看成是AI在解決問題時的創(chuàng)新呢?
德國柏林Fraunhofer Heinrich Hertz研究所的機(jī)器學(xué)習(xí)小組組長Wojciech Samek博士說道:考慮一下在Pascal VOC圖像分類挑戰(zhàn)賽中大放異彩的人工智能系統(tǒng),它僅通過水的存在來檢測船只,通過藍(lán)天和馬匹的存在來檢測飛機(jī)。”這就像在打臺球的時候,通過推動桌子控制臺球的運(yùn)行軌跡。
使用數(shù)據(jù)訓(xùn)練AI玩游戲的目的是模擬游戲玩家的行為,一般情況下AI會按照“字面”意思進(jìn)行操作。但是如果訓(xùn)練的數(shù)據(jù)過于多,人工智能可能會嘗試采用完全顛覆人類對游戲理解的捷徑,而不是完成各種目標(biāo)。
當(dāng)然,AI采用這種方法也解決了問題,只不過和人們預(yù)期方式的不同,在表現(xiàn)形式上面和人類的作弊行為類似,所以我們稱之為AI作弊。
研究人員說道,這看起來是人工智能的錯誤,實(shí)際上是完善和改進(jìn)系統(tǒng)的機(jī)會。但是為了利用這些機(jī)會,首先必須有一種機(jī)制來標(biāo)記問題、
因此,這里的教訓(xùn)是,AI作弊不應(yīng)該也不會比我們聰明,但前提是我們必須意識到這些捷徑的存在,以便我們可以將它們作為學(xué)習(xí)點(diǎn),在未來構(gòu)建更好的AI系統(tǒng)。
OMT:AI耍“小心眼”的LIST
問題:飛機(jī)降落
利用了物理模擬器的溢出漏洞,搞出了一個特別巨大的力,然后溢出被判定為0,從而獲得了完美得分(Feldt, 1998)
問題:挪木塊
一個機(jī)械手被要求把木塊挪到桌子的指定地點(diǎn),它的解法是挪桌子(Chopra, 2018)
問題:賽艇
程序發(fā)現(xiàn)不停原地轉(zhuǎn)圈反復(fù)命中同一個目標(biāo)要比抵達(dá)終點(diǎn)的得分更高(Amodei & Clark (OpenAI), 2016)
問題:識別有毒和無毒的蘑菇
程序發(fā)現(xiàn)有毒無毒蘑菇的圖片是交替展現(xiàn)的,所以直接按照這個來分類而沒有從圖片里學(xué)到一丁點(diǎn)東西(Ellefsen et al, 2015)
問題:高速運(yùn)動
程序演化出的生物長得特別特別高,在跌倒的過程中獲得很高速度(Sims, 1994)
問題:原子排列
程序本來應(yīng)該尋找碳原子較低能量的排列方式,但它找到了物理模型的一個bug,把所有的原子都疊在了同一個地方獲得了最低能量(Lehman et al (UberAI), 2018)
問題:模擬生物
這個模型里生物生存需要消耗能量,但是繁育后代不消耗,于是一個物種演化出來的生活方式就是不斷生育后代,然后把后代吃掉(Yaeger, 1994)
問題:堆樂高
為了鼓勵造高塔,衡量標(biāo)準(zhǔn)是樂高積木底面的z坐標(biāo),于是程序?qū)W會了把底面翻過來(Popov et al, 2017)
問題:追蹤線條
這個機(jī)器人只有向左、向右和前進(jìn)三個指令,目標(biāo)是跟著線條走,有一段線條是曲線,沒法完美追蹤。于是它發(fā)現(xiàn)通過交替左轉(zhuǎn)和右轉(zhuǎn)可以后退,從而一直留在直線部分,不停前進(jìn)后退(Vamplew, 2004)
問題:賽跑
長出特別長的腿,向前跌倒直接越過終點(diǎn)線(Ha, 2018)
問題:振蕩器
程序本來應(yīng)該把回路做成振蕩器,實(shí)際上它做了一個收音機(jī),從周圍電腦接受振蕩信號(Bird & Layzell, 2002)
問題:做松餅
有一項(xiàng)指標(biāo)是讓松餅盡可能長時間不掉在地上,機(jī)器人發(fā)現(xiàn)最好的辦法是把松餅用盡全力拋到最高處(Unity, 2018)
問題:檢測X光片有無肺炎
程序?qū)嶋H檢測的不是X光片的內(nèi)容而是拍攝它使用的機(jī)器,因?yàn)樗鞍l(fā)現(xiàn)”病重的病人更可能在特定的醫(yī)院使用特定的機(jī)器拍片(Zech et al, 2018)
問題:抓握
因?yàn)樽ノ粘晒εc否是用攝像頭判斷的,所以機(jī)械手把自己移動到攝像頭和目標(biāo)物體之間,假裝抓住了(Christiano et al, 2017)
問題:自動修復(fù)bug
修bug程序把所有被維修的排序算法都修成空的,因?yàn)楹饬恐笜?biāo)是“目標(biāo)算法輸出一個排好順序的列表”,而空列表都是排好順序的列表(Weimer, 2013)
問題:自動修復(fù)bug(2)
為了解決上面那個問題,把“維修目標(biāo)”儲存在一個文本文檔里,如果輸出的結(jié)果和目標(biāo)文檔的內(nèi)容一致就被認(rèn)為是修好了。修bug程序?qū)W會了把這個文檔刪掉,這樣它的內(nèi)容就成了空的,然后輸出一個空的結(jié)果就和它一致了(Weimer, 2013)
問題:闖關(guān)游戲
在闖過第一關(guān)后立刻自殺,這樣既取得了第一關(guān)的勝利又不會在第二關(guān)死掉(Saunders et al, 2017)
問題:掃地機(jī)器人防撞
自己給掃地機(jī)器人編了個程序,鼓勵它加速,但不鼓勵它撞到東西觸發(fā)撞擊感受器。于是它學(xué)會了倒退行駛,因?yàn)楹竺鏇]有撞擊感受器(Custard Smingleigh 個人通訊)
問題:檢測皮膚癌
程序發(fā)現(xiàn)照片里皮膚病變的邊上如果放了一把尺子,那么這個病變就更可能是惡性的(Andre Esteva et al, 2017)
問題:足球
踢足球機(jī)器人碰觸到球有獎勵,所以它在搶到球之后開始高速振動,從而在短時間內(nèi)盡可能多次地碰觸到球(Ng et al, 1999)
問題:策略游戲
程序發(fā)現(xiàn)讓游戲崩潰就可以讓自己不被滅掉,所以好幾個程序各自找到了讓游戲出bug崩潰的辦法(Salge et al, 2008)
問題:俄羅斯方塊
程序發(fā)現(xiàn)只要暫停游戲就可以永遠(yuǎn)不輸(Murphy, 2013)
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108113 -
AI
+關(guān)注
關(guān)注
88文章
35105瀏覽量
279560
原文標(biāo)題:【前沿科技】AI如果耍起了心眼,人類就像個白癡......
文章出處:【微信號:robotn,微信公眾號:產(chǎn)業(yè)大視野】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
廣凌標(biāo)準(zhǔn)化考點(diǎn)建設(shè)方案:全頻阻斷作弊防控系統(tǒng)如何精準(zhǔn)打擊無線電作弊

廣和通發(fā)布5G AI MiFi解決方案
廣和通亮相阿里云AI創(chuàng)造力大展
九聯(lián)科技AI解決方案接入AI大模型
華為發(fā)布AI WAN解決方案
華為發(fā)布以AI為中心的網(wǎng)絡(luò)解決方案
AI賦能邊緣網(wǎng)關(guān):開啟智能時代的新藍(lán)海
廣和通正式推出AI玩具大模型解決方案
廣和通發(fā)布AI玩具大模型解決方案
廣和通推出AI玩具大模型解決方案
移遠(yuǎn)通信推出AI智能玩具解決方案
企業(yè)AI解決方案包括哪些內(nèi)容
ai煙火檢測解決方案

評論