在美國,很多公司和研究人員基于眾多“人臉識(shí)別數(shù)據(jù)庫”進(jìn)行編譯和分析,這些圖片在全球被廣泛流傳,而這些操作都是在人們不知情的情況下進(jìn)行的。
根據(jù)《紐約時(shí)報(bào)》報(bào)道,“人臉識(shí)別數(shù)據(jù)庫”抓取從社交網(wǎng)站、圖片網(wǎng)站、像 OkCupid 這樣的約會(huì)網(wǎng)站,以及在餐廳和大學(xué)校園架設(shè)的攝像機(jī)得來的圖片。雖然目前的數(shù)據(jù)尚不精確,隱私維權(quán)者還是指出,微軟建立的數(shù)據(jù)庫有超過一億張圖片,斯坦福大學(xué)有超過兩億張。
圖 | MS Celeb 數(shù)據(jù)庫中 2000 個(gè)人像信息可視化圖
這樣大規(guī)模的面部收集是為了能快人一步創(chuàng)造出領(lǐng)先的人臉識(shí)別技術(shù)。這項(xiàng)技術(shù)需要盡可能多地運(yùn)用“神經(jīng)網(wǎng)絡(luò)”分析數(shù)字圖片,從而鑒別人類。而所謂的“神經(jīng)網(wǎng)絡(luò)”是一個(gè)復(fù)雜的算法系統(tǒng),它建立在大批量的數(shù)據(jù)所建立的認(rèn)知模型上。
收集面部圖像的過程已經(jīng)進(jìn)行了十多年,但建立面部識(shí)別技術(shù)需要包括數(shù)據(jù)庫在內(nèi)的更多條件,涉及到生物學(xué)、生理學(xué)、心理學(xué)、認(rèn)知學(xué)、圖像圖形學(xué)、模式識(shí)別等領(lǐng)域,數(shù)據(jù)庫只是其中一個(gè)層面。人們往往不知道他們的圖片已經(jīng)在數(shù)據(jù)集中。盡管照片上沒有名字,但是每個(gè)人都可以被認(rèn)出來,因?yàn)槊繌埬樁际仟?dú)一無二的。
根據(jù)研究報(bào)告顯示,像 Facebook 和 Google 這樣的科技巨頭聚集了大量的人臉識(shí)別數(shù)據(jù),這些數(shù)據(jù)是不會(huì)被散播的。但根據(jù)一些學(xué)者、相關(guān)人士和公開論文顯示,一些公司和大學(xué)與澳大利亞、中國、印度、新加坡和瑞士的研究人員、政府和私人企業(yè)廣泛分享了他們的圖像數(shù)據(jù)。
數(shù)據(jù)集所帶來的問題正在凸顯,因?yàn)槟壳八鶈⒂玫募夹g(shù)正在以潛在的入侵方式被使用。近日公布的文件顯示,美國移民和海關(guān)執(zhí)法局用這一技術(shù)掃描司機(jī)照片以識(shí)別非法移民。根據(jù)美國政府問責(zé)局上個(gè)月的一份報(bào)告,美國聯(lián)邦調(diào)查局在過去十年里使用這一技術(shù)將駕照和簽證照片與犯罪嫌疑人的臉進(jìn)行對(duì)比。7 月 10 日,美國國會(huì)聽證會(huì)就該技術(shù)的使用問題進(jìn)行了討論。
由于缺少對(duì)數(shù)據(jù)集的監(jiān)管,人們的肖像可能被用在有道德問題的科技上,甚至這些照片會(huì)被濫用,維權(quán)者對(duì)這其中的可能性表示憤怒。
過去幾周,出于隱私考慮,微軟和斯坦福大學(xué)這類的公司和大學(xué)已經(jīng)從互聯(lián)網(wǎng)上抹掉了它們的人臉識(shí)別數(shù)據(jù)。但研究人員和維權(quán)者認(rèn)為,鑒于這些圖像早已被廣泛散播出去,它們?nèi)詫⒃诿绹推渌胤奖皇褂谩?/p>
圖 | “洗腦”數(shù)據(jù)已從斯坦福大學(xué)文獻(xiàn)庫刪除
斯坦福大學(xué)在 2014 年建立的人臉識(shí)別數(shù)據(jù)庫被稱為“洗腦”(Brainwash),在三天時(shí)間里,研究人員用相機(jī)拍攝超過 10000 張圖像并存入數(shù)據(jù)庫,這些數(shù)據(jù)被用來與其他人分享。但當(dāng)時(shí)咖啡廳的顧客并不知道自己被拍照且照片被用來做技術(shù)研究。
杜克大學(xué)的研究人員也在 2014 年用八臺(tái)攝像機(jī)建立了一個(gè)人臉識(shí)別數(shù)據(jù)庫,這些攝像機(jī)架設(shè)在校園里,這些攝像頭上標(biāo)有號(hào)碼和電子郵件,不想被拍攝的人可以跟他聯(lián)系。根據(jù)報(bào)道,杜克大學(xué)的研究人員最終收集到了 200 多萬幀視頻,其中包含 2700 多人的圖像。但這些圖像可能因?yàn)榻嵌群筒晒庠虿荒鼙徊捎谩?/p>
微軟聲稱他們建立了最大的面部數(shù)據(jù)集之一。這個(gè)名為 MS Celeb 的數(shù)據(jù)集包括超過 10 萬人的 1000 萬張照片。MS Celeb 表面上是一個(gè)名人數(shù)據(jù)庫,因?yàn)閿?shù)據(jù)都來自公眾人物,這些圖片也被認(rèn)為是公平的。但這仍然招來維權(quán)人士的不滿。這一數(shù)據(jù)庫曾在國際間傳播,但在今年春天被維權(quán)者發(fā)現(xiàn)之后便被撤下。
對(duì)此,民間成立了一個(gè)名為“監(jiān)視技術(shù)監(jiān)督項(xiàng)目”的民權(quán)和隱私組織,該組織建立了一個(gè)工具,可以讓人們檢查他們的肖像是否被收集在公開分享的人臉數(shù)據(jù)庫中。
-
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3905瀏覽量
65872 -
人臉識(shí)別
+關(guān)注
關(guān)注
77文章
4071瀏覽量
83818
原文標(biāo)題:大型數(shù)據(jù)庫支持面部識(shí)別抓取,隱私何處安放?
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于RV1126開發(fā)板實(shí)現(xiàn)人臉識(shí)別方案

基于RV1126開發(fā)板實(shí)現(xiàn)人臉識(shí)別方案

基于RV1126開發(fā)板實(shí)現(xiàn)人臉識(shí)別方案

斯坦福大學(xué)發(fā)布《2025 年人工智能指數(shù)報(bào)告》

阿里巴巴Qwen大模型助力開發(fā)低成本DeepSeek替代方案
斯坦福大學(xué)Nature Energy:鋰電還是鈉電?

MySQL數(shù)據(jù)庫的安裝

云數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

斯坦福STANFORD FS725銣鐘
斯坦福研究:電動(dòng)汽車電池實(shí)際壽命比預(yù)估長得多
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

評(píng)論