在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何解決人工智能應用中數(shù)據(jù)隱私保護帶來的挑戰(zhàn)?

電子工程師 ? 來源:lq ? 2019-04-29 10:22 ? 次閱讀

近日,在百大人物峰會上,創(chuàng)新工場創(chuàng)始人李開復談及數(shù)據(jù)隱私保護和監(jiān)管問題時,表示:“人們不應該只將人工智能帶來的隱私問題視為一個監(jiān)管問題,可嘗試用‘以子之矛攻己之盾’——用更好的技術解決技術帶來的挑戰(zhàn),例如同態(tài)加密、聯(lián)邦學習等技術?!?/p>

那么最近備受關注、被越來越多提及的聯(lián)邦學習是什么?如何解決人工智能應用中數(shù)據(jù)隱私保護帶來的挑戰(zhàn)?

▌“聯(lián)邦學習”到底是什么?能解決什么問題?

在回答 “聯(lián)邦學習” 是什么之前,我們需要了解為什么會有這樣的技術出現(xiàn),它的出現(xiàn)是為了解決什么問題。

近年來,隨著人工智能技術的發(fā)展和更廣泛的應用,數(shù)據(jù)隱私保護也被越來越多地關注,歐盟出臺了首個關于數(shù)據(jù)隱私保護的法案《通用數(shù)據(jù)保護條例》(General Data Protection Regulation, GDPR),明確了對數(shù)據(jù)隱私保護的若干規(guī)定,中國在 2017 年起實施的《中華人民共和國網絡安全法》和《中華人民共和國民法總則》中也指出 “網絡運營者不得泄露、篡改、毀壞其收集的個人信息,并且與第三方進行數(shù)據(jù)交易時需確保擬定的合同明確約定擬交易數(shù)據(jù)的范圍和數(shù)據(jù)保護義務?!?這意味著對于用戶數(shù)據(jù)的收集必須公開、透明,企業(yè)、機構之間在沒有用戶授權的情況下數(shù)據(jù)不能交換。

這給人工智能應用給機器學習帶來的挑戰(zhàn)是:如果機構之間的數(shù)據(jù)無法互通,一家企業(yè)一家機構數(shù)據(jù)量有限,或者是少數(shù)巨頭公司壟斷大量數(shù)據(jù),而小公司很難獲得數(shù)據(jù),形成大大小小的“數(shù)據(jù)孤島”。在這種沒有權限獲得足夠多的用戶數(shù)據(jù)的情況下,各個公司尤其是小公司,如何建模?

在這種情況下,“聯(lián)邦學習”的概念應運而生。所謂 “聯(lián)邦學習”,首先是一個“聯(lián)邦”。不同于企業(yè)之前的“各自為政”,擁有獨立的數(shù)據(jù)和獨立的模型,聯(lián)邦學習通過將企業(yè)、機構納入“一個國家、一個聯(lián)邦政府” 之下,將不同的企業(yè)看作是這個國家里的 “州”,彼此又保持一定的獨立自主,在數(shù)據(jù)不共享的情況下共同建模,提升模型效果。所以“聯(lián)邦學習” 實際上是一種加密的分布式機器學習技術,參與各方可以在不披露底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形態(tài)的前提下共建模型。

Google 公司率先提出了基于個人終端設備的“橫向聯(lián)邦學習”(Horizontal Federated Learning),其核心是,手機在本地進行模型訓練,然后僅將模型更新的部分加密上傳到云端,并與其他用戶的進行整合。目前該方法已在 Google 輸入法中進行實驗。一些研究者也提出了 CryptoDL 深度學習框架、可擴展的加密深度方法、針對于邏輯回歸方法的隱私保護等。但是,它們或只能針對于特定模型,或無法處理不同分布數(shù)據(jù),均存在一定的弊端。

在國內,聯(lián)邦技術的研究由微眾銀行首席人工智能官(CAIO)楊強教授帶領微眾銀行 AI 團隊主導,并且首次提出了基于 “聯(lián)邦學習” 的系統(tǒng)性的通用解決方案,強調在任何數(shù)據(jù)分布、任何實體上,均可以進行協(xié)同建模學習,解決個人 (to C) 和公司間 (to B) 聯(lián)合建模的問題,開啟了將聯(lián)邦學習技術進行商用,建立聯(lián)邦行業(yè)生態(tài)的探索。

▌如何在保護數(shù)據(jù)隱私前提下打破數(shù)據(jù)孤島?

因為孤島數(shù)據(jù)具有不同的分布特點,所以在聯(lián)邦學習的技術方案中,也大致分為:橫向聯(lián)邦學習、縱向聯(lián)邦學習、聯(lián)邦遷移學習三種方案。

考慮有多個數(shù)據(jù)擁有方,每個數(shù)據(jù)擁有方各自所持有的數(shù)據(jù)集 Di 可以用一個矩陣來表示。矩陣的每一行代表一個用戶,每一列代表一種用戶特征。同時,某些數(shù)據(jù)集可能還包含標簽數(shù)據(jù)。如果要對用戶行為建立預測模型,就必須要有標簽數(shù)據(jù)??梢园延脩籼卣鞫x為 X,把標簽特征定義為 Y。

比如,在金融領域,用戶的信用是需要被預測的標簽 Y;在營銷領域,標簽是用戶的購買愿望 Y;在教育領域,則是學生掌握知識的程度等。用戶特征 X 加標簽 Y 構成了完整的訓練數(shù)據(jù)(X,Y)。但是,在現(xiàn)實中,往往會遇到這樣的情況:各個數(shù)據(jù)集的用戶不完全相同,或用戶特征不完全相同。具體而言,以包含兩個數(shù)據(jù)擁有方的聯(lián)邦學習為例,數(shù)據(jù)分布可以分為以下三種情況:兩個數(shù)據(jù)集的用戶特征(X1,X2,…)重疊部分較大,而用戶 (U1,U2…) 重疊部分較?。粌蓚€數(shù)據(jù)集的用戶 (U1,U2…) 重疊部分較大,而用戶特征(X1,X2,…)重疊部分較??;兩個數(shù)據(jù)集的用戶 (U1,U2…) 與用戶特征重疊(X1,X2,…)部分都比較小。

可以看出,聯(lián)邦遷移學習解決了不同樣本(數(shù)據(jù)集)、不同特征維度之前聯(lián)合建模的問題,第一次讓不同領域的企業(yè)之間在保護彼此數(shù)據(jù)隱私的前提下實現(xiàn)跨領域創(chuàng)造價值。例如,銀行擁有用戶購買能力的特征,社交平臺擁有用戶個人偏好特征,而電商平臺則擁有產品特點的特征,傳統(tǒng)的機器學習模型無法直接在異構數(shù)據(jù)上進行學習,聯(lián)邦學習卻能在保護三方數(shù)據(jù)隱私的基礎上進行聯(lián)合建模,從而打破數(shù)據(jù)壁壘,構建跨領域合作。

為了更加清楚方案背后的邏輯,以包含兩個數(shù)據(jù)擁有方(即企業(yè) A 和 B)的場景為例來介紹聯(lián)邦學習的系統(tǒng)構架,這個架構可以拓展延伸到包含多個數(shù)據(jù)擁有方的場景。

假設企業(yè) A 和 B 想聯(lián)合訓練一個機器學習模型,它們的業(yè)務系統(tǒng)分別擁有各自用戶的相關數(shù)據(jù)。此外,企業(yè) B 還擁有模型需要預測的標簽數(shù)據(jù)。出于數(shù)據(jù)隱私和安全考慮,A 和 B 無法直接進行數(shù)據(jù)交換。此時,可使用聯(lián)邦學習系統(tǒng)建立模型,系統(tǒng)構架由兩部分構成,如圖 a 所示。

圖:聯(lián)邦學習系統(tǒng)構架

第一部分:加密樣本對齊。由于兩家企業(yè)的用戶群體并非完全重合,系統(tǒng)利用基于加密的用戶樣本對齊技術,在 A 和 B 不公開各自數(shù)據(jù)的前提下確認雙方的共有用戶,并且不暴露不互相重疊的用戶。以便聯(lián)合這些用戶的特征進行建模。

第二部分:加密模型訓練。在確定共有用戶群體后,就可以利用這些數(shù)據(jù)訓練機器學習模型。為了保證訓練過程中數(shù)據(jù)的保密性,需要借助第三方協(xié)作者 C 進行加密訓練。以線性回歸模型為例,訓練過程可分為以下 4 步(如圖 b 所示):第①步:協(xié)作者 C 把公鑰分發(fā)給 A 和 B,用以對訓練過程中需要交換的數(shù)據(jù)進行加密;第②步:A 和 B 之間以加密形式交互用于計算梯度的中間結果;第③步:A 和 B 分別基于加密的梯度值進行計算,同時 B 根據(jù)其標簽數(shù)據(jù)計算損失,并把這些結果匯總給 C。C 通過匯總結果計算總梯度并將其解密。第④步:C 將解密后的梯度分別回傳給 A 和 B;A 和 B 根據(jù)梯度更新各自模型的參數(shù)。

迭代上述步驟直至損失函數(shù)收斂,這樣就完成了整個訓練過程。在樣本對齊及模型訓練過程中,A 和 B 各自的數(shù)據(jù)均保留在本地,且訓練中的數(shù)據(jù)交互也不會導致數(shù)據(jù)隱私泄露。因此,雙方在聯(lián)邦學習的幫助下得以實現(xiàn)合作訓練模型。

第三部分:效果激勵。聯(lián)邦學習的一大特點就是它解決了為什么不同機構要加入聯(lián)邦共同建模的問題,即建立模型以后模型的效果會在實際應用中表現(xiàn)出來,并記錄在永久數(shù)據(jù)記錄機制(如區(qū)塊鏈)上。提供的數(shù)據(jù)多的機構會看到模型的效果也更好,這體現(xiàn)在對自己機構的貢獻和對他人的貢獻。這些模型對他人效果在聯(lián)邦機制上以分給各個機構反饋,并繼續(xù)激勵更多機構加入這一數(shù)據(jù)聯(lián)邦。以上三個步驟的實施,既考慮了在多個機構間共同建模的隱私保護和效果,又考慮了如何獎勵貢獻數(shù)據(jù)多的機構,以一個共識機制來實現(xiàn)。所以,聯(lián)邦學習是一個 “閉環(huán)” 的學習機制。

由此我們也可以看出聯(lián)邦學習的幾個顯著特征:

一、各方數(shù)據(jù)都保留在本地,不泄露隱私也不違反法規(guī);

二、多個參與者聯(lián)合數(shù)據(jù)建立虛擬的共有模型,實現(xiàn)各自的使用目的、共同獲益;

三、在聯(lián)邦學習的體系下,各個參與者的身份和地位相同;

四、聯(lián)邦學習的建模效果和傳統(tǒng)深度學習算法的建模效果相差不大;

五、“聯(lián)邦”就是數(shù)據(jù)聯(lián)盟,不同的聯(lián)邦有著不同的運算框架,服務于不同的運算目的。如金融行業(yè)和醫(yī)療行業(yè)就會形成不同的聯(lián)盟。

▌聯(lián)邦學習目前進展

說了那么多,聯(lián)邦學習目前到底有哪些技術進展呢?

最新消息顯示,Google 推出了首個產品級的聯(lián)邦學習系統(tǒng)并發(fā)布論文 “Towards Federated Learning at Scale:System Design”,介紹了聯(lián)邦學習系統(tǒng)的設計理念和現(xiàn)存挑戰(zhàn)并提出了自己的解決方案。國內方面,微眾 AI 團隊對外開源了自研的 “聯(lián)邦學習 FATE(Federated AI Technology Enabler)” 學習框架,目前在信貸風控、客戶權益定價、監(jiān)管科技等領域已經推出了相應的商用方案。

在系統(tǒng)框架之外,圍繞聯(lián)邦學習的技術標準也在陸續(xù)推進中。今年 2 月份,IEEE P3652.1(聯(lián)邦學習基礎架構與應用)標準工作組第一次會議在深圳召開,作為國際上首個針對人工智能協(xié)同技術框架訂立的標準,不僅明確了聯(lián)邦學習在數(shù)據(jù)合規(guī)、行業(yè)應用等方面的重要意義,還為立法機構在涉及隱私保護的問題時提供技術參考。

總而言之,無論是技術理論的探索還是統(tǒng)一標準的制定,在全球范圍內對聯(lián)邦學習的落地探索都會繼續(xù),聯(lián)邦學習作為一個新興的人工智能基礎技術,還有很長的路要走。我們也有理由期待,隨著聯(lián)邦學習理論、應用體系的逐漸豐富,隱私保護問題所帶來的技術挑戰(zhàn)將得到有效解決。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)

    關注

    8

    文章

    7170

    瀏覽量

    89700
  • 人工智能
    +關注

    關注

    1796

    文章

    47791

    瀏覽量

    240564
  • 遷移學習
    +關注

    關注

    0

    文章

    74

    瀏覽量

    5590

原文標題:李開復口中的“聯(lián)邦學習” 到底是什么?| 技術頭條

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得

    ,還促進了新理論、新技術的誕生。 3. 挑戰(zhàn)與機遇并存 盡管人工智能為科學創(chuàng)新帶來了巨大潛力,但第一章也誠實地討論了伴隨而來的挑戰(zhàn)。數(shù)據(jù)
    發(fā)表于 10-14 09:12

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    了電力的實時平衡和優(yōu)化,有效降低了電網的運行成本和故障率。 此外,書中還討論了人工智能在能源科學研究挑戰(zhàn)和機遇。這些挑戰(zhàn)包括數(shù)據(jù)質量、算
    發(fā)表于 10-14 09:27

    嵌入式和人工智能究竟是什么關系?

    理這些數(shù)據(jù),提高系統(tǒng)的響應速度和準確性。此外,嵌入式系統(tǒng)還可以為人工智能提供安全和隱私保護,避免數(shù)據(jù)泄露和攻擊。總之,嵌入式系統(tǒng)和
    發(fā)表于 11-14 16:39

    人工智能是什么?

    海量的數(shù)據(jù)通過不斷優(yōu)化的算法來組建適合的數(shù)據(jù)群組。單從這一點就可以看出,數(shù)據(jù)的大量積累也是需要經過長時間才能做到的,這也是為什么人工智能
    發(fā)表于 09-16 15:40

    人工智能--失業(yè)將是人類面臨的最大挑戰(zhàn)

    的失業(yè)人員再就業(yè);在這個生態(tài),我們知道社會里企業(yè)的形態(tài)、競爭機制甚至社會保險制度會面臨什么樣的選擇,又該如何做才能讓社會經濟良性運行?! ≡谖磥?0年,杰瑞·卡普蘭認為人類要應對人工智能帶來的最重大挑戰(zhàn)
    發(fā)表于 06-27 11:06

    人工智能會把人類從勞動解放出來嗎

    領域,人工終究會被機器所超越。  人工智能會把人從簡單的勞力勞動解放出來,大數(shù)據(jù)就是第一步。數(shù)據(jù)量的激增使得企業(yè)可以通過
    發(fā)表于 09-15 14:09

    數(shù)據(jù)人工智能發(fā)展的重要性

    。APP時代,我們常說中國創(chuàng)業(yè)成本達到歷史新低,很不幸,人工智能加大數(shù)據(jù),創(chuàng)業(yè)成本將會達到歷史新高。 第三是數(shù)據(jù)量需要非常多。數(shù)據(jù)收集是一個逐漸的過程。有些
    發(fā)表于 10-09 15:26

    從入門到研究,人工智能領域最值得一讀的10本資料(附下載)

    如今的使用案例。7.Artificial Intelligence, Robotics, Privacy and Data Protection(人工智能、機器人、隱私數(shù)據(jù)保護)這個
    發(fā)表于 10-12 11:38

    人工智能就業(yè)前景

    據(jù)相關招聘機構數(shù)據(jù)顯示,2018年AI領域仍然是大部分資深技術人才轉崗的首選目標,在人才最緊缺的前十大職位,時下最火的大數(shù)據(jù)、人工智能、算法類崗位占據(jù)半壁江山。據(jù)調查指出,2017年
    發(fā)表于 03-29 15:46

    人工智能醫(yī)生未來或上線,人工智能醫(yī)療市場規(guī)模持續(xù)增長

    。   ——提高癌癥篩查效率。早診早治是提高癌癥治愈率的關鍵。2018年12月,中山大學腫瘤防治中心牽頭開展上消化道腫瘤人工智能診療決策系統(tǒng)的研發(fā)及推廣應用項目,根據(jù)該系統(tǒng)試用初期數(shù)據(jù)分析,臨床試用惡性腫瘤識別
    發(fā)表于 02-24 09:29

    人工智能:超越炒作

    。對于人工智能用例在當前物聯(lián)網環(huán)境變?yōu)楝F(xiàn)實,必須滿足三個條件:非常大的真實數(shù)據(jù)集具有重要處理能力的硬件架構和環(huán)境開發(fā)新的強大算法和人工神經網絡(ANN)以充分利用上述內容很明顯,后兩
    發(fā)表于 05-29 10:46

    基于人工智能的傳感器數(shù)據(jù)協(xié)同作用

    作者:Kaustubh Gandhi,Bosch Sensortec軟件產品經理人工智能(AI)目前正在為社會的方方面面帶來革新。比如,通過結合數(shù)據(jù)挖掘和深度學習的優(yōu)勢,如今可以利用人工智能
    發(fā)表于 07-25 06:20

    【開源硬件系列04期】AI人工智能技術帶給EDA的機遇和挑戰(zhàn)(文中含回放+課件)

    for EDA開源數(shù)據(jù)集、建模與優(yōu)化等技術,并總結人工智能技術在EDA遇到的困難和挑戰(zhàn),展望其未來發(fā)展方向。本期重點:① EDA設計流程簡介②
    發(fā)表于 01-17 16:56

    人工智能在國際傳播數(shù)據(jù)隱私保護

    近年來,人工智能技術越來越多地被用于國際傳播,進而對國際輿論和國際交往構成影響。這種影響很大程度上是通過對大數(shù)據(jù)的深度挖掘與應用實現(xiàn)的,其中牽涉的一個重要方面即個人數(shù)據(jù)隱私如何界定和
    發(fā)表于 07-12 10:45 ?713次閱讀

    兼顧人工智能應用和隱私保護是新的趨勢嗎

    人工智能應用存在隱私泄露的倫理風險。人工智能應用需要以海量的個人信息數(shù)據(jù)作支撐。
    發(fā)表于 07-14 10:07 ?437次閱讀
    主站蜘蛛池模板: 男女在线免费视频 | 啪啪调教所29下拉式免费阅读 | 日韩欧美亚洲综合久久影院d3 | 国产免费人人看大香伊 | 一区二区在线观看高清 | 欧美性xxxx交 | 在线播放一区二区精品产 | 成 人网站免费 | 男男h啪肉np文总受 男男h全肉耽污 | 你懂的福利 | 中国人69xxx大全 | 欧美一级做一级做片性十三 | 特黄特色的大片观看免费视频 | 亚洲天堂视频一区 | 欧美成人精品福利网站 | 2021国产成人精品久久 | aaaaaa精品视频在线观看 | 五月激情视频 | 免费看又爽又黄禁片视频1000 | 午夜影院黄色片 | 国产婷婷一区二区三区 | 五月婷婷丁香在线观看 | 日本一区二区三区四区不卡 | 午夜免费片在线观看不卡 | 色多多免费观看在线 | 成人黄色一级片 | 久久久综合久久 | 69国产| 俺去啦五月 | 国产大乳美女挤奶视频 | 性欧美视频在线观看 | 人成网站在线观看 | 色.com| 久久午夜网 | 97影院理论 | 国产人成精品香港三级古代 | 在线看片成人 | 日日操天天操夜夜操 | 日韩亚洲人成在线综合 | 久久久久久免费播放一级毛片 | 国产黄色片在线观看 |