這是一個(gè)驚人的圖像,說明了AI研究的根深蒂固的偏見。將美國(guó)第一任黑人總統(tǒng)巴拉克·奧巴馬(Barack Obama)的低分辨率圖片輸入到旨在生成去像素臉部的算法中,然后輸出的是白人。
也不僅僅是奧巴馬。獲取相同的算法,以從低分辨率輸入生成女演員露西·劉或女議員亞歷山大·奧卡西奧·科爾特斯的高分辨率圖像,并且所產(chǎn)生的面孔看起來明顯是白色的。正如一則流行的推文援引奧巴馬的例子所言:“這張圖片充分說明了人工智能存在偏見的危險(xiǎn)。”
但是,是什么原因?qū)е逻@些輸出的呢?它們真正告訴我們關(guān)于AI偏差的什么信息?
首先,我們需要對(duì)這里使用的技術(shù)有所了解。生成這些圖像的程序是稱為PULSE的算法,該算法使用一種稱為“放大”的技術(shù)來處理視覺數(shù)據(jù)。升級(jí)就像在電視和電影中看到的“縮放和增強(qiáng)”這樣的比喻,但是與好萊塢不同,真實(shí)的軟件不能僅僅從無到有地生成新數(shù)據(jù)。為了將低分辨率圖像轉(zhuǎn)換成高分辨率圖像,該軟件必須使用機(jī)器學(xué)習(xí)來填補(bǔ)空白。
對(duì)于PULSE,執(zhí)行這項(xiàng)工作的算法是StyleGAN,它是由NVIDIA研究人員創(chuàng)建的。盡管您以前可能沒有聽說過StyleGAN,但您可能對(duì)它的工作很熟悉。這是負(fù)責(zé)制作那些怪異逼真的人臉的算法,您可以在ThisPersonDoesNotExist.com等網(wǎng)站上看到這些人臉;如此真實(shí)的面孔經(jīng)常被用來制作虛假的社交媒體資料。
PULSE所做的是使用StyleGAN“想象”高分辨率版本的像素化輸入。它不是通過“增強(qiáng)”原始的低分辨率圖像來實(shí)現(xiàn)此目的,而是通過生成一個(gè)全新的高分辨率面(當(dāng)像素化時(shí)看起來與用戶輸入的像相同)。
這意味著可以以多種方式放大每個(gè)去像素的圖像,就像使用一組配料制作不同的菜肴一樣。這也是為什么您可以使用PULSE來查看《毀滅戰(zhàn)士》,《德軍總部3D》的英雄,甚至是哭泣的表情符號(hào)在高分辨率下的樣子的原因。并不是說算法會(huì)像“縮放并增強(qiáng)”底片那樣“尋找”圖像中的新細(xì)節(jié)。而是發(fā)明新的面孔以還原為輸入數(shù)據(jù)。
從理論上講,這種工作已經(jīng)進(jìn)行了幾年,但是,就像AI界經(jīng)常發(fā)生的那樣,當(dāng)這個(gè)周末在網(wǎng)上共享了易于運(yùn)行的代碼版本時(shí),它就吸引了更多的聽眾。那是種族差距開始擴(kuò)大的時(shí)候。
PULSE的創(chuàng)建者說趨勢(shì)很明顯:當(dāng)使用該算法按比例放大像素化圖像時(shí),該算法通常會(huì)生成具有白種人特征的人臉。
該算法的創(chuàng)建者在Github上寫道:“看起來PULSE產(chǎn)生白色面孔的頻率要比有色人種的面孔高得多。”“這種偏見很可能是從StyleGAN接受過數(shù)據(jù)集訓(xùn)練而來的,盡管可能還有其他我們不知道的因素。
換句話說,由于對(duì)StyleGAN進(jìn)行了數(shù)據(jù)訓(xùn)練,因此當(dāng)試圖繪制看起來像像素化輸入圖像的人臉時(shí),它默認(rèn)為白色特征。
這個(gè)問題在機(jī)器學(xué)習(xí)中極為普遍,這也是面部識(shí)別算法在非白人和女性臉上表現(xiàn)較差的原因之一。用于訓(xùn)練AI的數(shù)據(jù)通常偏向一個(gè)人口統(tǒng)計(jì)學(xué)的白人,并且當(dāng)程序看到不在該人口統(tǒng)計(jì)學(xué)中的數(shù)據(jù)時(shí),其性能就會(huì)很差。并非巧合的是,白人主導(dǎo)著AI研究。
但是,奧巴馬的例子所揭示的關(guān)于偏見的確切內(nèi)容以及它所代表的問題可能如何得到解決都是復(fù)雜的問題。實(shí)際上,它們是如此復(fù)雜,以至于單一圖像引發(fā)了AI學(xué)者,工程師和研究人員之間的激烈爭(zhēng)論。
從技術(shù)上講,一些專家不確定這是否是數(shù)據(jù)集偏差的一個(gè)示例。AI藝術(shù)家Mario Klingemann認(rèn)為,應(yīng)該歸咎于PULSE選擇算法本身,而不是數(shù)據(jù)。克林格曼指出,他能夠使用StyleGAN從相同的像素化奧巴馬圖像生成更多非白色輸出,如下所示:
克林格曼說,這些人臉是使用“相同的概念和相同的StyleGAN模型”生成的,但使用的搜索方法與Pulse不同,他說,我們不能僅僅從幾個(gè)樣本中真正判斷出一種算法。他告訴The Verge:“可能有數(shù)以百萬計(jì)的可能的面孔都將縮小為相同的像素模式,而且所有這些面孔都是‘正確的’。”
(順便說一下,這也是為什么這樣的工具不太可能用于監(jiān)視目的的原因。這些過程創(chuàng)建的面孔是虛構(gòu)的,并且如上面的示例所示,與輸入的基本事實(shí)無關(guān)。但是, ,這并不是說過去巨大的技術(shù)漏洞已阻止警察采用技術(shù)。)
但是,無論原因如何,算法的輸出似乎都是有偏差的-在該工具廣泛可用之前,研究人員并未注意到這一點(diǎn)。這說明了一種不同且普遍存在的偏見:一種在社會(huì)層面上起作用的偏見
-
分辨率
+關(guān)注
關(guān)注
2文章
1080瀏覽量
42633 -
人工智能
+關(guān)注
關(guān)注
1806文章
48996瀏覽量
249201
發(fā)布評(píng)論請(qǐng)先 登錄
Nordic收購(gòu) Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析
能否告訴我在CapSense按鈕觸發(fā)時(shí)是否有可能重新配置I/O的操作?
如何使用多個(gè)miniprog4對(duì)多個(gè)CCG7x設(shè)備進(jìn)行編程?
通過I2C總線從源讀取所有PDO,但在HPI規(guī)范中找不到相應(yīng)的寄存器,為什么?
【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+關(guān)于AI Agent開發(fā)入門的第一印象與相關(guān)官方文檔和社區(qū)資料的內(nèi)容補(bǔ)充
貼片電容容值較大偏差的原因分析

電磁脈沖:想做個(gè)大功率的電磁脈沖,請(qǐng)各位大神告訴我要買哪些設(shè)備?
《AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀體驗(yàn)--跟著迪哥學(xué)Agent
晶振的頻率偏差與解決方法

一文讀懂鋰電池方形的尺寸及型號(hào)命名規(guī)則

評(píng)論