91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

差分隱私和現有的隱私保護方法相結合:從用戶群體中學習的系統架構詳解

zhKF_jqr_AI ? 2017-12-08 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

了解人們如何使用他們的設備通常有助于改善用戶體驗。但是,若想得到能洞察用戶行為的數據(例如用戶在鍵盤上打了什么字、訪問了什么網站),可能會侵犯他們的隱私。

近日,蘋果公司開發了一個系統架構,利用本地化差分隱私(local differential privacy)并結合現有的保護隱私的最佳方法,實現規?;瘜W習(learning at scale)。研究人員設計了高效可擴展的本地化差分隱私算法,經過嚴謹的分析確定了應用程序、隱私、服務器計算能力和設備帶寬四個要素的重要性應如何分配。平衡這些因素將有助于成功地部署本地差分隱私。這一部署將覆蓋數以億計的用戶,例如在Safari中跟蹤最受歡迎的emoji、最常用的健康數據類型以及媒體播放偏好。后臺回復“dp”可查看完整版論文。

項目介紹

深入了解用戶的整體行為對于改善用戶體驗至關重要,但所需的數據較為敏感私密,公司必須予以保密。除此之外,利用這些數據部署學習系統還必須考慮資源開銷、計算成本和通信成本。在本文中,作者概述了將差分隱私和現有的隱私保護方法相結合,然后從用戶群體中學習的系統架構。

經過嚴格的數學證明,差分隱私是目前最強的隱私保障法之一。它的原理在于用仔細調整過的噪聲掩蓋用戶的數據。當許多人提交數據時,增加到其中的噪聲達到平衡,并產生有意義的信息。

在差分隱私框架內,有兩種設定:中心(central)和本地(local)。在這套系統中,蘋果不收集中心化差別隱私所需的服務器上的原始數據,而是采用本地化差別隱私,這種形式更加可靠。本地差分隱私在數據被發送前就做了隨機處理,所以服務器無法看到或接收到原始數據。

該系統非常透明,用戶可以自愿選擇是否加入。若用戶不同意上報使用信息,則不會記錄或傳輸他們的私人數據。通過本地化的差分隱私,用戶的設備依據時間等級進行加密。另外,該系統還限制上傳隱私事件的數量。將信息傳輸到服務器每天只有一次,而且是在加密通道上進行,沒有用戶ID。用戶信息最終會到達一個訪問受限的服務器,其中沒有IP標識符,也沒有與其他記錄相關聯的信息。所以,我們無法區分一個emoji和另一個Safari網頁記錄是否來自同一個用戶,也就是說這些信息是完全保密的。這些記錄經過處理后加入統計數據中,然后再由蘋果內部相關團隊進行分析。

同時,蘋果的研究人員還在估計各種記錄的頻率,例如emoji和網絡域名。他們有兩個想法:從已知的所有類別的記錄中生成直方圖,或者自己創造一個能表現出數據集中出現頻率最多的圖表。

系統架構

該系統架構由設備端和服務端的數據組成。在設備上,原始數據在加密階段分別進行處理。受限訪問的服務器在對數據處理后進一步將其分為數據接入和數據聚合階段。下面就為大家詳細介紹每一個階段。

信息加密(Privatization)

用戶可在macOS或iOS的“系統偏好設置”里選擇是否同意共享個人記錄以供分析。對于不愿加入的用戶,系統將不會開啟服務。而對于愿意使用這項功能的用戶,蘋果內部為每個用戶行為都設置了隱私參數?。

蘋果還對每天傳輸的每項記錄設置了數量限制。而對于隱私參數?的選擇,則是基于每個記錄的基礎數據集的隱私特性。這些值與其他研究差分隱私的項目提出的參數是一致的。而且,由于hash沖突,下面的算法給用戶提供了進一步的否認條件。除了上述的方法,蘋果還會刪除用戶的ID和IP地址來進一步加強隱私,服務器上所產生的的用戶ID和IP地址是分隔開的,所以多個記錄之間沒有關聯。

無論何時用戶使用了設備,數據會立即通過有特殊參數?的本地差分隱私進行加密,并使用數據保護(data protection)臨時儲存在設備上,而不是立即傳輸到服務器上。

系統會根據設備的情況進行延遲,之后會隨機抽取不同的私人記錄,并將采樣記錄發送給服務器。這些記錄不包括設備ID或該行為發生的時間。設備和服務器之間的通信使用TLS進行加密。

加密過程

在iOS中打開“設置”>“隱私”>“分析”>“分析數據”后可看到“差分隱私”(DifferentialPrivacy)的入口。在macOS上,這些記錄在“關于本機”的“系統報告”中可見。下圖是算法對最受歡迎的emoji使用情況的樣本記錄,記錄所涉及的算法和參數在下文會有體現。

加密記錄的樣本報告

數據接入和聚合

在數據接入之前,加密記錄會刪除掉IP地址,然后數據庫收集所有用戶數據后進行批量處理。這一過程將刪除元數據,例如記錄發生的時間,并且根據記錄情況把它們分類。在將結果輸入到下一階段前,數據庫也會隨機對每個用戶行為記錄進行排序。

聚合器收到來自數據庫的記錄后,根據算法為每個使用記錄生成個性化的直方圖。計算統計數據時,無需合并來自多個記錄的數據。在這些直方圖中,只有高于規定閾值T的域名才算入其中。

算法

下面就為大家介紹三種本地化差分隱私算法。

1.Private Count Mean Sketch(CMS)

Private Count Mean Sketch(CMS)算法聚合了設備提交的記錄,并在域名類別中輸出數量的直方圖,同時保留本地化差分隱私。這一過程分為兩個階段:客戶端處理和服務器端聚合。

舉個例子吧,假設一名用戶訪問了 www.example.com 這個網站。客戶端算法從一組散列函數(hash function){h1,h2,h3,…,hk}中隨機抽取一個,假設抽到了h2,然后用它將上述網站域名以m的大小編碼,即h2(www.example.com)=31。該編碼被寫成大小為m的one-hot向量,其中第31位被設置為1。為了確保隱私的差分性,one-hot向量的每一位獨立地以概率翻轉,其中?是隱私參數,它構成了私有化的向量。這個向量和被選擇的散列函數一起被輸送至服務器。

服務器端的算法通過聚合加密向量組成了sketch矩陣M。該矩陣有k行、m列,每一行都代表一個散列函數,每一列代表從客戶端傳輸來的矢量大小。

當記錄到達服務器時,算法將加密過的矢量添加到第j行的矢量,其中j是設備采樣的散列函數的指數。然后適當地調整m的值,以便每行都能為每個類別進行無差別的頻率計算。

為了計算 www.example.com 的頻率,該算法通過讀取每個j行的M,然后計算這些結果的平均值。在原始論文中有詳細的分析過程。

2.Private Hadamard Count Mean Sketch(HCMS)

在完整版論文中,作者討論了如何通過增加設備帶寬讓CMS里的計算更精確。但是,這就增加了用戶的傳輸成本。蘋果希望在降低傳輸成本的同時把對準確性的影響降到最小,于是就有了Private Hadamard Count Mean Sketch算法(HCMS),其優點是設備可以以極小的精度損失進行傳輸。

依然用上面的來舉例。與CMS類似,客戶端同樣是從一組散列函數{h1,h2,h3,…,hk}中隨機抽取一個,假設抽到了h3。然后有h3(www.example.com)=42。編碼被寫成v=(0,0,…,0,1,0,…,0,0)的one-hot向量,這里第42位設置為1。因為我們只想傳輸一位信息,所以一個簡單的方法就是從向量中抽樣并發送一個隨機坐標。但是這可能導致結果直方圖的錯誤或變化。為了減少誤差,研究人員用Hadamard將v進行轉化,即v’=Hv=(+1,-1,…,+1)。同樣,為了確保隱私性,向量中的每一位以的概率翻轉。下圖展示了這一過程。

Hadamard Count Mean Sketch中客戶端的算法

同樣,服務端的算法與CMS的大致相同。

Hadamard Count Mean Sketch中服務端的算法

3.Private Sequence Fragment Puzzle(SFP

上述兩種算法都假設有已知的域名集合,服務器可根據它來列舉樣本,以確定相應的計數。

然而在某些情況下,一些域名非常大,由于計算能力有限無法全部列舉。例如,當研究人員在研究常用單詞時,即使限制只能輸入10位區分大小寫的英文單詞,服務器也要進行至少5210次循環。

所以,蘋果開發了一種名為Sequence Fragment Puzzle(SFP)的算法,并將其用于發現新單詞的任務中。由于一個流行字符串的子字符串使用也很頻繁,所以研究人員利用這一點,用客戶端的CMS算法對打出的字進行加密。

成果

通過這三種新穎的算法,蘋果在提升用戶體驗方面有了很大的收獲。以下是三個典型案例:

發現流行的emoji

emoji是聊天中必不可少的要素,蘋果公司想要知道用戶最常用的emoji都有哪些,以及地區的相對分布。于是,他們在鍵盤語言環境中部署了算法。CMS的中的參數設置為:m=1024,k=65536,?=4,本地emoji庫中含有2600個emoji。

數據顯示,鍵盤設置不同,emoji使用也有差異。下圖是英文和法語兩個語言環境下的emoji使用情況。根據這一結果,蘋果可以對emoji的快捷輸入做本地化調整。

英法兩種鍵盤下人們使用emoji的區別

找到Safari中占用大量內存的網站

有些網站真的是非常消耗資源,蘋果公司想找到這些網站,以優化用戶體驗。他們的目標有兩類:瀏覽時占用大量內存的以及大量占用CPU拖慢速度的。在iOS11和manOS High Sierra中,Safari可以自動檢測到這些域名,并通過差分隱私上報這些域名。

利用算法,研究人員發現,最常見的需要消耗大量資源的網站有視頻網站、購物網站和新聞網站。

擴充詞匯庫

為了優化“自動糾錯”功能,蘋果不斷地尋找詞庫中沒有的詞語。這里就用到了上面說的SFP算法。

該算法不僅能用在英語環境中,還能用于法語和西班牙語。拿英語來說吧,算法學習到的新單詞可以被分為以下幾類:

縮寫:wyd(what you doing),wbu(what about you),idc(I don’t care);

習慣表達:bruh(bro),hun(honey),bae(baby),tryna(trying to);

流行語:Mayweather,McGregor,Despacito,Moana,Leia;

外文詞匯:dia,queso,aqui,jai…

蘋果正是利用這些數據不斷更新在線詞典,改善鍵盤體驗。

他們還發現,現在很多人在打字時都會省去結尾的“e”或者“w”,比如lov(love),th(the)或者kno(know)。所以如果用戶不小心選擇了第一個預測詞語,也就是你目前所打出來的所有字符,那么系統會自動在單詞后面添加一個空格,而不是自動替換成你想要輸入的那個單詞。這一功能正是本地化差分隱私算法帶來的。

這篇文章介紹了蘋果公司為改善用戶體驗,同時保護用戶隱私推出的一種新穎的學習系統架構,將本地化差分隱私算法覆蓋到各個使用層面。同時還提出了三種獨特的算法——CMS、HCMS和SFP。這些工具幫助公司看到在不同語言環境下人們使用emoji的差異,并且搜索當下最流行的詞語,促進他們改善軟件的體驗。

研究人員希望這一項目能夠彌合隱私理論與實踐之間的差距,同時他們相信這一工作將繼續推進大規模學習問題的研究,同時進一步增強用戶隱私保護。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 蘋果
    +關注

    關注

    61

    文章

    24545

    瀏覽量

    203884
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134564

原文標題:蘋果用機器學習和差分隱私大規模分析用戶數據,并保證不會泄露信息

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【HarmonyOS 5】鴻蒙應用隱私保護詳解

    【HarmonyOS 5】鴻蒙應用隱私保護詳解 ##鴻蒙開發能力 ##HarmonyOS SDK應用服務##鴻蒙金融類應用 (金融理財# 一、前言 在今天這個手機不離手的時代,我們每天用手機支付
    的頭像 發表于 07-11 18:30 ?262次閱讀

    AI時代的隱私護盾:三星Knox Vault如何構建數據安全防線

    日程節奏。 這種高度個性化的體驗提供了更多便利,同時也對隱私保護提出了更高要求。手機知道得越多,隱私安全責任就越重大。那么,如何確保私人數據不被泄露? 三星始終堅信,強大的安全性是隱私
    的頭像 發表于 05-29 15:43 ?234次閱讀

    華企盾:電腦監控軟件是維護隱私安全還是挑戰隱私邊界?

    在這個信息化時代,電腦已深深融入我們的日常生活。互聯網的廣泛覆蓋與信息技術的迅猛發展,使得電腦監控軟件的應用變得日益普遍。這類軟件能夠詳盡記錄用戶行為,包括上網記錄、鍵盤敲擊、對話內容等。電腦監控
    的頭像 發表于 03-11 14:43 ?306次閱讀

    康謀方案 | 本地匿名化解決方案:隱私保護、自主掌控和高效運行!

    本地匿名化解決方案,以隱私和安全為核心設計原則,利用Terraform部署技術實現靈活自動擴展,確保高吞吐量與高效管理。該方案確保隱私保護、具備高靈活性與控制力,并支持離線操作,已廣泛應用于歐洲多個行業領導者,為企業數據管理、安
    的頭像 發表于 01-22 11:15 ?3519次閱讀
    康謀方案 | 本地匿名化解決方案:<b class='flag-5'>隱私</b><b class='flag-5'>保護</b>、自主掌控和高效運行!

    深度自然匿名化:隱私保護與視覺完整性并存的未來!

    在科技快速發展的當下,個人隱私保護的需求日益凸顯。如何能在隱私保護的基礎上,保持視覺完整性,從而推動企業開發與創新? 深度自然匿名化(DNAT)已被證明是傳統模糊化
    的頭像 發表于 01-15 15:57 ?4487次閱讀
    深度自然匿名化:<b class='flag-5'>隱私</b><b class='flag-5'>保護</b>與視覺完整性并存的未來!

    【「大模型啟示錄」閱讀體驗】如何在客服領域應用大模型

    的模型可以提高客戶滿意度和服務質量。新引入的模型需要能夠無縫集成到現有系統中,以確保服務的連續性和穩定性。因此,在選擇模型時需要考慮其與現有系統的兼容性。同時,隨著企業業務的發展,可能
    發表于 12-17 16:53

    隱私與安全:動態海外住宅IP如何保護你在線

    動態海外住宅IP在保護用戶在線隱私與安全方面發揮著重要作用。
    的頭像 發表于 11-25 08:09 ?400次閱讀

    智能語音開關:離線控制,守護隱私的新選擇

    智能家居依賴網絡,智能音箱成入口。但隱私泄露成問題,離線智能產品應運而生。九芯電子采用NRK3502離線語音芯片,實現精準語音控制,守護用戶隱私,操作便捷安全。
    的頭像 發表于 11-22 13:37 ?950次閱讀
    智能語音開關:離線控制,守護<b class='flag-5'>隱私</b>的新選擇

    比亞迪獲得國家首批汽車隱私保護標識

    近日,在2024中國汽車軟件大會上,中國汽車工業協會與中國網絡安全產業聯盟汽車網絡安全工作委員會聯合頒發“汽車隱私保護”標識證書,比亞迪成為首批通過測評并獲得“汽車隱私保護”標識授權的
    的頭像 發表于 11-18 16:14 ?660次閱讀

    探索海外IP代理:安全、速度與隱私的平衡

    探索海外IP代理時,用戶往往需要在安全性、速度與隱私之間找到平衡。
    的頭像 發表于 11-08 06:42 ?544次閱讀

    GNSS RTK基準站是什么?RTK基站應用在哪些領域?

    的應用。 ? 什么是RTK基準站? RTK,即實時動態技術(Real-Time Kinematic),是一種高精度測量方法,通過將測
    的頭像 發表于 10-10 10:44 ?2612次閱讀
    GNSS RTK<b class='flag-5'>差</b><b class='flag-5'>分</b>基準站是什么?RTK<b class='flag-5'>差</b><b class='flag-5'>分</b>基站應用在哪些領域?

    安全暢游世界:動態分配海外住宅IP,保護隱私與加速網絡訪問

    在數字化時代,互聯網已成為人們獲取信息、交流思想、開展業務的重要平臺。然而,隨著網絡環境的日益復雜,網絡安全與隱私保護問題日益凸顯。動態分配海外住宅IP作為一種先進的網絡工具,為用戶提供了在全球范圍內安全暢游的可能性。
    的頭像 發表于 09-26 08:13 ?463次閱讀

    IP地址安全與隱私保護

    在當今數字化時代,IP地址作為網絡設備的唯一身份標識,在網絡安全與隱私保護中扮演著至關重要的角色。然而,隨著網絡技術的飛速發展,IP地址也面臨著諸多挑戰,對用戶隱私和網絡安全構成了潛
    的頭像 發表于 09-03 15:59 ?1087次閱讀

    蘋果:Safari在隱私保護領域有卓越的性能

    近期,蘋果公司在全球范圍內啟動了一項戰略舉措,其目標直接指向全球超過14億的iPhone用戶群體,以一種微妙而堅定的方式鼓勵他們谷歌Chrome瀏覽器轉向蘋果自家的Safari瀏覽器。這一轉變的倡議,核心在于突出Safari在隱私
    的頭像 發表于 07-18 15:17 ?860次閱讀

    平衡創新與倫理:AI時代的隱私保護和算法公平

    在人工智能技術飛速發展的今天,它不僅帶來了前所未有的便利和效率,也暴露出了一系列倫理和隱私問題。數據隱私侵犯到“信息繭房”的形成,再到“大數據殺熟”、AI歧視和深度偽造技術的威脅,A
    發表于 07-16 15:07
    主站蜘蛛池模板: 欧美人与动性视频在线观 | 视频免费在线 | 色五月婷婷成人网 | 欧美一级一一特黄 | 欧美性色生活片天天看99 | 四虎永久网址 | bt种子天堂| 欧美xxx69| 色在线免费视频 | 国产精品va一区二区三区 | 在线成人免费 | 色噜噜狠狠狠色综合久 | 欧美午夜免费观看福利片 | 男女同床爽爽视频免费 | 精品久久久久久婷婷 | 天天色天天色天天色 | 天天干天天操天天舔 | 国产一级特黄的片子 | 欧美激情综合色综合啪啪五月 | 午夜精品久久久久久久四虎 | 欧美色频| 久久久久久久影院 | 屁股趴过来欠打高h | 特级片免费看 | 男人的视频网站 | 黄视频网站观看 | 日本黄色免费一级片 | 在线观看视频免费 | 射久久| 亚洲bt天堂| 新版天堂资源中文在线 | 中文字幕一区二区在线观看 | 欧美性三级 | 天天爱天天操 | 欧美成人午夜片一一在线观看 | 丁香六月婷婷精品免费观看 | 在线视频图片小说 | 手机看片福利1024 | 久久九色 | 思思99re66在线精品免费观看 | 国产高清色播视频免费看 |