在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟刪除知名數(shù)據(jù)集 撥開數(shù)據(jù)隱私的迷霧

lviY_AI_shequ ? 來源:yxw ? 2019-06-26 17:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟在日前刪除了一個(gè)名人圖片數(shù)據(jù)集。這個(gè)本為世界上最大的公開人臉識(shí)別數(shù)據(jù)集,現(xiàn)在已經(jīng)不能通過微軟的渠道訪問。

在這次「靜默」刪除行為背后,又牽扯到了哪些問題呢?

微軟想解決的麻煩:MS Celeb 名人數(shù)據(jù)集

MS Celeb 1M 數(shù)據(jù)集,最早是微軟在 2016 年發(fā)布,其中共包含了10 萬個(gè)名人,近 1000 萬張面部圖片,而這些數(shù)據(jù)都是從網(wǎng)絡(luò)上搜集而來。

從網(wǎng)絡(luò)中 100 萬個(gè)名人中,根據(jù)受歡迎程選出 10 萬個(gè),然后利用搜索引擎,跳出每個(gè)人的大約 100 張圖片,就得到了這個(gè)龐大的數(shù)據(jù)集。

MS Celeb 數(shù)據(jù)集中的 Jobs 圖片,

其中綠色是年輕時(shí)代的圖片,紅色是合成圖像

而這個(gè)數(shù)據(jù)集最初是用來服務(wù)比賽的。MSR IRC是世界上最高水平的圖像識(shí)別賽事之一,MS Celeb 1M 數(shù)據(jù)集最初就是這個(gè)賽事所用。

MS Celeb 1M常被用來做面部識(shí)別的訓(xùn)練。但對(duì)于這些圖片均來自網(wǎng)絡(luò),所以也曾受到了質(zhì)疑。而微軟則表示,是根據(jù)「知識(shí)共享許可 C.C 協(xié)議」,來抓取和獲得這些圖像的。

根據(jù)協(xié)議,可以將照片重新用于學(xué)術(shù)研究,(照片中的人物并不一定授權(quán)許可,而是版權(quán)所有者授權(quán)。)但微軟發(fā)布數(shù)據(jù)集后,卻并不能掌管它的使用。英國(guó)「金融時(shí)報(bào)」進(jìn)行了一項(xiàng)深入調(diào)查,結(jié)果表明數(shù)據(jù)被大量的用在了多個(gè)企業(yè)測(cè)試中。

包括 IBM,松下,阿里巴巴,Nvidia 和日立等公司,都存在使用這個(gè)數(shù)據(jù)集的情況。

而這就涉及到了數(shù)據(jù)集使用的一些規(guī)范性問題,一位研究人員還指出,這涉及到人臉識(shí)別圖像數(shù)據(jù)集的倫理,起源和個(gè)人隱私等問題。

刪除原因:負(fù)責(zé)該數(shù)據(jù)集的員工離職?

微軟已經(jīng)在線上默默地刪除了MS Celeb 1M,并沒有特別的說明。

Github 上數(shù)據(jù)集的下載頁面已經(jīng)變成了 404

在金融時(shí)報(bào)的報(bào)道中,微軟表示「該網(wǎng)站主要目的是用于學(xué)術(shù),」而刪除它的原因是,「負(fù)責(zé)運(yùn)營(yíng)這個(gè)項(xiàng)目的員工離職了,不再與微軟合作,所以進(jìn)行了刪除。」

我們都相信肯定有其他原因,可能也有數(shù)據(jù)集圖片存在的問題。雖然微軟稱數(shù)據(jù)集均來自于公眾人物的照片。但其中還包括少量非知名人物。這部分人臉照片的所有者,對(duì)微軟使用他們的名稱和圖像信息,曾提出過質(zhì)疑和批評(píng)。

還有技術(shù)人員推測(cè),微軟可能會(huì)因違反歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)而刪除數(shù)據(jù),該法規(guī)于去年生效,旨在建立起數(shù)據(jù)安全的保護(hù)措施。

GDPR對(duì)個(gè)人信息的保護(hù)及其監(jiān)管

達(dá)到了前所未有的高度

但微軟表示,它們沒有涉及到 GDPR 的條款,數(shù)據(jù)集相關(guān)網(wǎng)站退役只是因?yàn)椋冈?jīng)的競(jìng)賽已經(jīng)結(jié)束」。

當(dāng)然,此次微軟移除 MS Celeb 數(shù)據(jù)集,并不妨礙它在學(xué)術(shù)研究等途徑的正常使用。那些用于處理數(shù)據(jù)庫(kù)的工具,現(xiàn)在也可正常訪問。

常用公開數(shù)據(jù)集,也可能有隱私問題

在英國(guó)「金融時(shí)報(bào)」調(diào)查之后,還有另外兩個(gè)學(xué)術(shù)單位也刪除了相關(guān)的數(shù)據(jù)集:分別是杜克大學(xué)的Duke MTMC 監(jiān)控?cái)?shù)據(jù)集,和斯坦福大學(xué)的Brainwash 數(shù)據(jù)集。

關(guān)于數(shù)據(jù)集和隱私問題,這不是第一次進(jìn)入人們的視野。在今年 1 月底,IBM 發(fā)布了百萬級(jí)別的無偏見「人臉多樣性」數(shù)據(jù)集,就曾引發(fā)了廣泛的爭(zhēng)議。

雖然 IBM 強(qiáng)調(diào)此舉是為減少面部識(shí)別中的「偏見」問題,但數(shù)據(jù)集的來源,人物的是知情度等問題,都引發(fā)了不少質(zhì)疑聲。

有媒體還報(bào)道, IBM 表示會(huì)按照被攝影者的意愿,刪除數(shù)據(jù)集里的相關(guān)照片,但都只是一面之詞,并沒有實(shí)際的行動(dòng)。

今年 5 月,舊金山曾頒布法令

禁止政府機(jī)構(gòu)使用人臉識(shí)別技術(shù)

對(duì)于數(shù)據(jù)集的采集和使用規(guī)則,還是一個(gè)很不太明確的區(qū)域,尤其是網(wǎng)絡(luò)便利之后,很多機(jī)構(gòu)都能輕易地獲得大量圖片,用于面部識(shí)別等用途。

其實(shí),對(duì)于數(shù)據(jù)集涉及的隱私問題,解決方案可以很簡(jiǎn)單:關(guān)乎到用戶個(gè)人隱私信息時(shí),應(yīng)保證用戶的知情權(quán),確保用戶是否愿意貢獻(xiàn)數(shù)據(jù)。

但似乎缺少的從來都不是方法,而是意識(shí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6679

    瀏覽量

    105586
  • 數(shù)據(jù)采集
    +關(guān)注

    關(guān)注

    40

    文章

    7088

    瀏覽量

    116155
  • 人臉識(shí)別
    +關(guān)注

    關(guān)注

    77

    文章

    4075

    瀏覽量

    83976
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    撥開迷霧:射頻連接器選型中的常見難題及解決方案

    作為連續(xù)三年榮獲“中國(guó)連接器行業(yè)十大品牌”的德索精密工業(yè),憑借專業(yè)的技術(shù)團(tuán)隊(duì)、先進(jìn)的生產(chǎn)工藝和嚴(yán)格的質(zhì)量管控體系,已為全球超10000家企業(yè)提供高性能、高可靠性的產(chǎn)品,助力客戶撥開選型迷霧,構(gòu)建高效穩(wěn)定的射頻系統(tǒng)。
    的頭像 發(fā)表于 05-19 08:53 ?98次閱讀
    <b class='flag-5'>撥開</b><b class='flag-5'>迷霧</b>:射頻連接器選型中的常見難題及解決方案

    請(qǐng)問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識(shí)別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請(qǐng)問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會(huì)有哪些原因?
    發(fā)表于 03-10 08:20

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)——MySQL數(shù)據(jù)庫(kù)誤刪除表記錄的數(shù)據(jù)恢復(fù)案例

    誤操作,在用Delete命令刪除數(shù)據(jù)時(shí)未添加where子句進(jìn)行篩選導(dǎo)致全表數(shù)據(jù)刪除刪除后未對(duì)該表進(jìn)行任何操作。
    的頭像 發(fā)表于 02-22 09:44 ?636次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>庫(kù)<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)——MySQL<b class='flag-5'>數(shù)據(jù)</b>庫(kù)誤<b class='flag-5'>刪除</b>表記錄的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    微軟暫停OpenAI威斯康星州數(shù)據(jù)中心建設(shè)

    近日,據(jù)知名科技新聞網(wǎng)站The Information報(bào)道,微軟公司已決定暫停OpenAI計(jì)劃在其威斯康星州建設(shè)的部分人工智能數(shù)據(jù)中心的建設(shè)工作。這一決定引發(fā)了業(yè)界的廣泛關(guān)注和討論。 微軟
    的頭像 發(fā)表于 01-07 10:28 ?390次閱讀

    微軟否認(rèn)使用用戶數(shù)據(jù)訓(xùn)練AI模型

    上指出,微軟要求他們退出“連接體驗(yàn)”功能,并猜測(cè)該功能可能被用于收集數(shù)據(jù)以訓(xùn)練人工智能模型。這些擔(dān)憂引發(fā)了廣泛的關(guān)注和討論,用戶們對(duì)于個(gè)人隱私數(shù)據(jù)安全表示了高度關(guān)注。 針對(duì)這一指控,
    的頭像 發(fā)表于 12-02 10:33 ?429次閱讀

    NetApp數(shù)據(jù)恢復(fù)—NetApp存儲(chǔ)WAFL文件系統(tǒng)下誤刪除數(shù)據(jù)恢復(fù)案例

    NetApp某型號(hào)存儲(chǔ),WAFL文件系統(tǒng)。 工作人員誤操作將該NetApp存儲(chǔ)中的重要數(shù)據(jù)刪除
    的頭像 發(fā)表于 10-11 14:17 ?426次閱讀

    康謀分享 | 數(shù)據(jù)隱私和匿名化:PIPL與GDPR下,如何確保數(shù)據(jù)合規(guī)?(一)

    自動(dòng)駕駛技術(shù)的快速發(fā)展伴隨著數(shù)據(jù)隱私保護(hù)的嚴(yán)峻挑戰(zhàn)。PIPL和GDPR為自動(dòng)駕駛數(shù)據(jù)合規(guī)設(shè)立了高標(biāo)準(zhǔn)。本篇文章將帶大家深入探討PIPL與GDPR的異同點(diǎn),期望能夠幫助車企更好地理解并應(yīng)對(duì)數(shù)據(jù)
    的頭像 發(fā)表于 09-29 10:28 ?1770次閱讀
    康謀分享 | <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>隱私</b>和匿名化:PIPL與GDPR下,如何確保<b class='flag-5'>數(shù)據(jù)</b>合規(guī)?(一)

    Oracle數(shù)據(jù)恢復(fù)—Oracle數(shù)據(jù)庫(kù)delete刪除數(shù)據(jù)恢復(fù)方法

    刪除Oracle數(shù)據(jù)庫(kù)數(shù)據(jù)一般有以下2種方式:delete、drop或truncate。下面針對(duì)這2種刪除oracle數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 09-11 11:45 ?666次閱讀

    NetApp數(shù)據(jù)恢復(fù)—NetApp存儲(chǔ)誤刪除數(shù)據(jù)恢復(fù)案例

    某公司一臺(tái)NetApp存儲(chǔ),該存儲(chǔ)中有24塊磁盤。 工作人員誤刪除了NetApp存儲(chǔ)中一個(gè)文件夾,文件夾中有非常重要的數(shù)據(jù)數(shù)據(jù)恢復(fù)工程師在現(xiàn)場(chǎng)對(duì)該存儲(chǔ)進(jìn)行了初檢。雖然這個(gè)文件夾被刪除
    的頭像 發(fā)表于 08-12 13:35 ?489次閱讀
    NetApp<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—NetApp存儲(chǔ)誤<b class='flag-5'>刪除</b>的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    Oracle數(shù)據(jù)恢復(fù)—Oracle刪除數(shù)據(jù)不用怕!這些數(shù)據(jù)恢復(fù)方法了解一下

    相信有很多oracle數(shù)據(jù)庫(kù)用戶都遇到過在操作Oracle數(shù)據(jù)庫(kù)時(shí)誤刪除某些重要數(shù)據(jù)的情況,這個(gè)時(shí)候如果數(shù)據(jù)庫(kù)沒有備份且
    的頭像 發(fā)表于 07-19 16:40 ?848次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強(qiáng)大的動(dòng)態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時(shí),數(shù)據(jù)是不可或缺的組成部分。然而,很多時(shí)候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?3471次閱讀
    主站蜘蛛池模板: 亚洲永久免费视频 | 91精品福利视频 | 国产三级精品三级在线观看 | 在线视频这里只有精品 | 正在播放国产乱子伦视频 | 一级毛片一级毛片 | 爱射综合 | 久久免费香蕉视频 | 黄录像欧美片在线观看 | 碰免费人人人视频 | 国产在线播放你懂的 | 狠狠色狠狠色狠狠五月ady | 成人欧美精品大91在线 | 国产一级特黄高清在线大片 | 国产毛片一区二区三区精品 | 四虎免费久久影院 | 正在播放久久 | 午夜精品久久久久久 | 手机看片福利1024 | 91操碰| 日本精品高清一区二区2021 | 手机看片1024手机在线观看 | 成人午夜精品久久久久久久小说 | 1000部啪啪未满十八勿入中国 | 欧美丝袜一区 | 黄色网址你懂的 | 奇米777狠狠 | 97福利视频 | 成人a毛片免费全部播放 | 四虎影院观看视频在线观看 | 人人干网站 | 日本免费色视频 | 国产午夜精品一区二区三区 | 特一级毛片| 天天色综合天天 | 四大名著成人高h肉版 | 国产精品美女www爽爽爽视频 | 国产午夜精品久久久久九九 | 天天射综合| 天天免费| 亚洲人成网站色在线观看 |