今年4月,《中共中央、國務院關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱“《意見》”)發布,數據作為一種新型生產要素被寫入國家文件中,與土地、勞動力、資本、技術等傳統要素并列為要素之一。
《意見》明確,加快培育數據要素市場,推進政府數據開放共享、提升社會數據資源價值、加強數據資源整合和安全保護。
數據的價值正在被重新認識,那么數據的安全該如何守護呢?
數據要素時代來臨,隱私計算迎來爆發節點
其實,早在去年10月—11月,國家發改委先后授牌雄安、浙江、福建、廣東、重慶、四川在內的六個地區為“數字經濟創新發展試驗區”,探索數字經濟與各行業的融合發展。
更早的時間,以微信、短視頻、直播等為代表的互聯網應用改變了我們的生活;以淘寶、京東、拼多多為代表的電商平臺改變了我們的消費方式;以李佳琦、薇婭為代表的帶貨主播創新了新型商業業態;以5G、工業互聯網為代表的“新基建”力量正在帶動生產力的變革……
這一切的背后都是數據要素作為支撐。
Statista數據顯示,預計2020年,全球大數據市場的收入規模將達到560億美元,較2018年的預期水平將增長約33.33%,較2016年的市場收入規模翻一倍。全球數據量在2019年達到了41ZB,2020年預估達到50.5ZB。
全球大數據市場數據量和市場收入規模(數據來源:中國信息通信研究院,CB Insights China整理)
數據價值另一面,數據安全、隱私保護成為與之對立的矛盾。
比如很多政府數據不能對外公布,通訊運營商、銀行、互聯網公司等收集到的客戶數據受法律規定,也不能透露給第三者,因此數據被分割在一個個孤島之中,數據之間無法互通,數據價值難以體現。
然而即便如此,我們幾乎每天都會接到各種營銷電話,或推銷房產、或推薦股票,在各種黑產面前,沒有個人隱私可言,每年各行業曝出的數據、隱私泄露事件也層出不窮,公眾對數據價值產生的過程產生了極大的不信任。
2019年世界最大十起數據泄露事件(CB Insights China整理)
數據由于具備可復制和可傳播性,其本質上是不能被安全共享的,但在數據要素時代,我們雖然不共享數據本身,但數據價值應該被共享。
為解決這個矛盾,隱私計算技術出現了。
隱私計算,根據中國信息通信研究院的定義,是指在保證數據提供方不泄露敏感數據的前提下,對數據進行分析計算并能驗證計算結果的信息技術。
廣義上是指面向隱私保護的計算系統與技術,涵蓋數據的產生、存儲、計算、應用、銷毀等信息流程全過程,想要達成的效果是使數據在各個環節中“可用不可見”。
說的更通俗一些,就是在保證數據安全的前提下,讓數據可以自由流通或共享,消除數據孤島問題,從而釋放數據更大的價值,提升生產效率,進而推進產業創新。
從這一點來理解,大數據市場規模有多大,隱私計算的天花板就有多高。
為數據價值而生,隱私計算四小龍浮出水面
隱私計算是一門綜合技術,具體來說,目前主要包括三個方向。
其一為基于密碼學的多方安全計算(MPC)技術。通過秘密分享、遺忘傳輸、混淆電路或同態加密等特殊的加密算法和協議,從而支持在加密數據上直接進行計算。理論上,在不考慮代價的“理想”情況下,多方安全計算技術能實現任意的計算“功能”,并且達到比較高的安全性。但是由于數據通信量驟增,計算效率損失大和需要極高的算力要求等因素,MPC的技術產品化還有一定的限制,相關的技術解決方正在積極探索。
其二為基于人工智能的聯邦學習技術。在橫向維度,每個參與者在本地訓練計算自己的樣本,只分享模型訓練的梯度;縱向維度,各參與者訓練各自的embedding(“向量映射”),共同訓練上層模型。兩個維度的融合,從而讓多個相互不信任的數據擁有方不必共享數據的基礎上聯合進行模型訓練。
其三為基于可信硬件的安全沙箱計算(TEE)技術。其核心思想是構建一個硬件安全區域,數據僅在該安全區域內進行計算,利用可信任執行環境TEE防止操作系統惡意地查看應用執行環境的內容;利用安全沙箱防止惡意應用通過特殊調用控制操作系統。
目前業界的普遍共識是,要實現數據“可用不可見”,單一技術難以獨挑大梁,不同技術路徑(密碼學、人工智能、區塊鏈等)的互補融合才是發展趨勢。
也正是在這樣的背景下,螞蟻金服、微眾銀行、華控清交、翼方健數這4個隱私計算玩家在一眾競爭者中跑了出來,憑借著各有所長的綜合解決方案成為隱私計算賽道的“四小龍”。
比如螞蟻金服用來做數據安全與隱私保護的TED ENGINE引擎,就融合了敏感數據智能打標技術(Tag)、AI安全增強技術(Enhace)和智能威脅識別技術(Detection)三項技術。在Enhace技術中,螞蟻金服又以差分隱私和可信硬件為重點開發方向。
此外,螞蟻金服還開發了一個大規模多方安全計算商用平臺——摩斯Morse,直接向其他企業機構提供個性化的多方安全計算服務,解決業務實際的問題。
微眾銀行在融合密碼算法、隱私保護算法、安全多方計算等技術的基礎上,開發了一套即時可用的場景式隱私保護解決方案WeDPR。今年的杭州區塊鏈國際周上,WeDPR被評為“隱私計算場景應用最具實力派”。
另外值得一提的是,微眾銀行的聯盟學習開源項目Fate還擁有聯邦學習的自主知識產權。
華控清交專攻多方安全計算,創始人姚期智為清華大學交叉信息研究院院長,也是圖靈獎唯一的華人獲獎者。多方安全計算的技術理論源于姚期智在1980年代提出的「百萬富翁」設想,作為該理論的提出者和重要奠基人,致力于推動技術落地。其PrivPy平臺實現了高性能通用的安全計算框架、集群化和可擴展的解決方案。
翼方健數的數據隱私計算平臺翼數坊則以“數據和計算的互聯網”(IoDC)為核心,建設開放生態,并在廈門落地了全國首個大規模部署的隱私計算平臺,實現數據戰略從頂層設計到底層實現的“落地”。在平臺中不光融合了自研技術,還集成了第三方優秀的技術方案,其中包括同態加密、區塊鏈、聯邦學習等,通過計算實現數據的打通、共享和價值實現。
另外一個層面,從隱私計算應用的落地行業來看,金融和醫療是兩個最主要的賽道。
數據安全對于金融行業的重要性我們很好理解,往小了說,關系到我們每個人的錢袋子,往大了說,關系到國家的經濟基礎,因而我們可以看到,隱私計算“四小龍”中,螞蟻金服、微眾銀行和華控清交的基本盤都在金融賽道中。
數據安全對于醫療行業同樣重要,清華大學軟件學院副教授金濤在2019大數據產業峰會上接受媒體采訪時曾表示,健康醫療數據不僅涉及到個人層面,也涉及到公共利益,甚至是國家安全。比如,一個人患上流行病、傳染病,其個人數據可能涉及整個治療方案的優化改進,對整個社會大眾都有福祉;基因數據則可能關乎國家安全。
翼方健數則走了與其他三家不同的路線,將業務重心放在對隱私計算同樣有較大需求的醫療賽道中。
這樣一來就很好理解了,既有高人一籌的技術作為支撐底座,又在主要賽道中實現了搶跑占位,以上構成了隱私計算“四小龍”在市場競爭中的護城河。
帶來全面的數據價值,隱私計算還需做好三件事情
雖然目前隱私計算行業呈現出“四超多強”的競爭格局,但數據價值還沒有被完全挖掘出來,隱私計算技術也還遠遠沒有走到盡頭,未來的數據要素時代,尋找全面的數據價值,隱私計算還需做好三件事情。
1、業務落地:更多行業應用,保證數據泛化應用“魯棒性”
隱私計算目前主要在金融、醫療和營銷三個場景落地,在未來肯定還會滲透到更多行業和場景,這就要求技術要具備非常強的“魯棒性”,換了個環境之后,系統/技術還具體和之前環境里一樣的能力。
打個比方,一個開放的隱私計算平臺,在某個金融機構可以很好的滿足需求,換到另外一個金融機構后,同樣能夠快速調整,滿足該機構的個性需求;范圍再擴大一些,該隱私計算平臺切換到醫療行業中,也能很好的運行,具有全面的能力。
事實上,隱私計算“四小龍”雖然在金融和醫療兩個行業重點布局,但他們還持續向其他行業滲透。以醫療為切入點的翼方健數在金融、營銷、保險、政務等行業場景均有布局,跨行業泛數據應用的最大意義在于打破了數據孤島,讓數據價值得到最大程度釋放。
2、成果轉化:更大范圍覆蓋,數據應用從單一企業到整個城市
目前數據流通基本都是單個企業內部“自產自銷”,通過搭建數據平臺,對數據安全進行保障,但數據價值卻難以輸出,當數據孤島被消除之后,數據價值應該在無限空間中流通,即從單一企業到所有行業、整個城市的跨越。
城市級的落地,翼方健數有個可以借鑒的案例,他們在廈門構建了基于隱私計算技術的醫療大數據應用與開放平臺,是目前所知首個利用隱私計算技術實現城市級應用的案例。
更為關鍵的是,由于同一個機構可在平臺上可以擔任多個角色,比如政府機關、醫療企業等能夠提供大量原始數據,同時對于醫療數據又有需求,數據價值完成了重塑。翼方健數在廈門的科研轉化在一定程度上也成為醫療數據流通產生價值的轉折點。
3、戰略高度:更加開放的生態,在打法思維上實現升級跨越
現在隱私計算所說的業務,更多是針對企業的解決方案,數據價值單一,大家都知道要讓數據流通起來,但如何流通,并沒有明確的方向。
在這里互聯網行業常說的生態打法或許可以成為一個思路,無論什么東西的流通都需要在一個成熟的生態體系內,參與生態的各方都能從中有所獲益才能讓流通更有效率,數據流通當然也不會偏離這一規則。
上文提到的翼方健數正在建立的“數據和計算互聯網(IoDC)”,就其打法思維上來看,就頗具隱私計算生態的雛形,其下要建立三個生態:數據互聯互通的生態、數據和人工智能算法互聯互通的生態、數據提供方,數據使用者和數據服務方共存的生態。
根據翼方健數創始人、CEO羅震此前在演講中披露的信息顯示,目前翼方健數在數據生態方面已經聯合了微眾銀行、華控清交等垂直領域的伙伴共同參與IoDC網絡的構建。
如是看來,開始有企業對數據生態進行深度思考和探索,并沒有將數據價值單獨拽在手中,而是以生態開放的方式,讓每個生態參與者都能從中獲取收益。
眾人拾柴火焰高。
開放生態的打法不管是在技術研發層面,還是在市場開拓層面都更具戰斗力,在可以預見的未來也將成為隱私計算行業的主流。
責任編輯:Gt
-
運營商
+關注
關注
4文章
2399瀏覽量
44719 -
互聯網
+關注
關注
54文章
11196瀏覽量
104132 -
大數據
+關注
關注
64文章
8918瀏覽量
137990
發布評論請先 登錄
相關推薦
當我問DeepSeek AI爆發時代的FPGA是否重要?答案是......
數據要素時代下構建高效數據治理能力的策略
RISC-V,即將進入應用的爆發期
邊緣計算的技術挑戰與解決方案
全球視野下的國外IP節點布局與優化策略
平衡創新與倫理:AI時代的隱私保護和算法公平
中科曙光6項成果入選北京“數據要素×”典型案例
英特爾開啟新時代:Intel 3制程節點引領性能與能效飛躍
邊緣計算是什么意思?邊緣計算的應用
AI硬件大爆發,這個小魔盒直擊端側AIGC的痛點

邊緣計算網關是什么?有什么作用

評論