數據已成為數字經濟時代最核心、最具價值的生產要素,為全球經濟增長不斷注入新動力、新能量。隨著數據利用的不斷深入,數據規模不斷擴大,數據泄露、濫用等風險日益凸顯,亟需建設數據安全防護能力,防范數據安全風險,護航數字經濟發展。密碼是保護數據安全的關鍵技術手段,在建立網絡主體身份體系,確保數據機密性、完整性,促進數據流通等方面起到核心支撐作用。梳理了近期發布的數據安全相關法律法規中的密碼要求,重點分析了數據全生命周期中密碼發揮的核心作用,提出了基于密碼的數據安全防護體系,并探討了未來的研究方向和面臨的挑戰。
2020年,全球47個國家數字經濟增加值規模達到32.6萬億美元,我國數字經濟規模位近5.4萬億美元,居世界第二位。數據作為一種新興生產要素,已成為經濟社會發展的核心驅動力。數據規模迅猛增長,數據挖掘和利用不斷深入,推動了經濟發展、社會治理、人民生活模式重大而深刻的改變,同時日益嚴峻的數據安全風險使得數據安全已成為事關國家安全與經濟發展的重大問題。
在數據安全防護中,密碼技術是基礎和關鍵技術,在身份認證、訪問控制、數字簽名、傳輸加密、存儲加密、隱私保護等方面發揮重要作用,是構建數據安全防護體系的基石。
1 數據安全法規中的密碼要求
2021年是我國數據安全元年,在國家法律層面,我國相繼頒布了《數據安全法》《個人信息保護法》等一系列針對數據安全的法律法規和標準規范,大力推動數據安全的健康發展;在地方政策層面,多省市相繼出臺與數據相關的地方性法規,針對數據安全問題提出了相應的條例規范并作出具體部署;在行業標準層面,工信部、交通運輸部、中國銀保監會等部門紛紛發布相應規定,規范各行各業中數據安全管理工作。
法律法規一般包括其發布目的及意義、規范的對象及范圍、達到的目的和效果、管理和監督等方面的內容,極少涉及實現其目的使用的技術,但在《個人信息保護法》《網絡數據安全管理條例(征求意見稿)》中提出“采取相應的加密、去標識化等安全技術措施”“應當采取備份、加密、訪問控制等必要措施”等明確的密碼技術要求。標準規范是對法律法規的支撐,細化具體行業或領域要求,量化具體行為,確保其活動和結果能夠符合需要。例如,GB/T 37988—2019《信息安全技術數據安全能力成熟度模型》為數據生存周期和通用安全共30個安全過程域量化形成了成熟度模型,其中有10個過程明確要求使用密碼技術,另有12個過程選用密碼技術作為其技術工具;GB/T 35273—2020《信息安全技術個人信息安全規范》中明確要求“傳輸和存儲個人敏感信息時,應采用加密等安全措施”;GB/T 41479—2022《信息安全技術網絡數據處理安全要求》中同樣明確要求傳輸、存儲、共享、轉讓重要數據和個人信息等敏感網絡數據,應采用加密、脫敏等安全措施。
在國際層面,發達國家的數據保護起步較早,如德國、英國、意大利在20世紀就發布了各自的數據保護法,進入數字經濟時代,世界各國出臺了大量的數據法規,這些法規從不同層面和角度描述了各方對數據的權利、義務以及各種情況下的處理原則,其中涉及大量數據安全技術相關的要求,大多以“采用合理的技術手段”指代。國際標準化組織ISO/IEC?JTC1/WG9、ITU-T SG17、NIST也發布了多項與數據安全、個人信息保護有關的標準,以最新的ISO/IEC?27002:2022《信息安全網絡安全與隱私保護——信息安全控制》為例,其中包含了大量針對密碼技術的相關要求,例如,信息傳遞須使用加密技術保護;口令管理系統應根據批準的口令加密技術對口令進行加密和哈希處理;確保供應商組件真實性的“示例措施”包括防篡改標簽、加密哈希驗證或數字簽名;根據已識別風險,使用加密措施保護備份;動態訪問管理系統時需要進行身份鑒別、提供適當的憑證或證書來訪問信息等。
可以看出,密碼對于數據安全的核心支撐作用得到了世界各國在法律法規層面的認可。
2 數據安全防護中的密碼作用
我國國標GB/T 37988—2019《信息安全技術數據安全能力成熟度模型》將數據生命周期劃分為數據采集、數據傳輸、數據存儲、數據處理、數據交換、數據銷毀6個階段。密碼在數據生命周期的每一階段均能發揮核心關鍵的防護作用。近年來,對于數據處理、數據交換階段的隱私保護、數據確權等需求成為研究的熱點和難點。
2.1 數據采集階段
在數據采集階段,可能被人為注入惡意數據或篡改采集數據,導致采集數據被污染,使后續數據分析處理的可靠性和安全性受到影響。例如,在惡意代碼識別算法建模階段,攻擊者在數據采集階段注入惡意數據,影響訓練得到的模型,使得惡意代碼無法被模型所識別,達到成功繞過安全防護系統的目的。
密碼技術可以保證數據來源的可靠。一是基于密碼的安全認證技術可對數據提供方的傳感器、設備等進行身份認證,確保數據來源的合法性,比如數據獲取手段是否合法,數據權屬是否明確,獲取是否獲得授權;二是通過數字簽名等技術對數據源進行鑒別和認證,防止采集數據被篡改;三是從數據采集階段開始,根據數據分級分類的要求,采用基于密碼技術的數據標簽,確保數據生命周期中處理過程可溯可查。
2.2 數據傳輸階段
數據傳輸階段面臨的安全風險主要包括數據泄露、數據遭篡改、側信道攻擊等。自2020年以來,我國有關電信運營商、航空公司等單位的內網和信息系統先后多次出現越權登錄、數據外傳等異常網絡行為,疑似遭受網絡攻擊。國家安全機關依法開展技術檢查,確認部分骨干網絡節點設備、核心業務系統服務器等被植入特種木馬程序,已有部分數據在經由這些設備進行存儲和轉發的過程中被發送至境外。通過進一步深入調查證實,相關攻擊活動是由某境外間諜情報機關精心策劃、秘密實施的。該機構調集強力網絡攻擊力量,使用全球多地網絡資源和先進網絡武器,妄圖實現對我國關鍵信息基礎設施戰略控制的目的。
加密技術可以保障數據的機密性,通過數字簽名、數據摘要等技術可防止數據在傳輸過程中經由骨干網絡節點轉發時被未經授權的查看、篡改或破壞。在傳輸階段,將數據的加密分為物理層加密、鏈路層加密、網絡層加密、傳輸層加密和應用層加密。
2.3 數據存儲階段
隨著數據規模和復雜度的不斷增長,越來越多的企業和用戶傾向于將數據外包存儲于第三方云服務器中,從而獲取高效便捷的數據存取服務。但同時數據的外包存儲使得數據的機密性難以保證,導致數據的泄露和濫用。2022年3月1日,俄烏戰事正酣之際,在烏克蘭作戰的12萬俄羅斯軍人的個人信息被發布在《烏克蘭真理報》網站上,烏克蘭媒體稱這些信息由烏克蘭國防戰略中心獲取,這些資料詳細地記錄了12萬俄軍的名字、注冊編號、服役地點、職務等信息,頁數多達6 616頁。
在此階段需防止無授權入侵以及數據泄露。一方面,采用密碼技術解決存儲安全性問題;另一方面,利用公鑰密碼技術或哈希函數驗證遠程數據的完整性。將存儲數據的加密方案分為卷加密、文件系統加密、應用加密等。其中,卷加密為保護操作系統中卷上的所有數據而設計,可以防止繞過操作系統和NTFS權限控制而直接讀取硬盤數據的離線攻擊;文件系統加密是指通過與文件系統的深度結合,實現用戶無感知的加解密;應用加密是指在數據落盤前,由應用負責對數據進行加密,提供數據外包存儲時的機密性保護。
2.4 數據處理階段
隨著社會普遍意識到數據的可利用價值,各行各業都開始關注通過數據開發來獲得競爭優勢,數據分析和挖掘成為常態。人工智能和大數據分析算法需要更高的算力支持,往往采用彈性資源共享、數據動態遷移以及多租戶資源共享的云計算、大數據平臺等第三方計算基礎設施。然而,在最大化發揮資源集約化應用效應的同時,不可避免地會在數據處理階段面臨新的數據安全的風險。一方面,云平臺中各租戶網絡、存儲、計算等物理資源共享使用,租戶應用在共享資源中頻繁遷移,導致私有數據安全邊界模糊,存在惡意租戶跨越虛擬邊界,非法獲取私有數據的情況,從而引發租戶安全隔離問題;另一方面,用戶需要將數據存儲到云端或將計算任務外包給云服務商,這導致用戶數據的所有權和管理權分離,引發了一系列新的隱私保護和信任風險問題。在眾所周知的“Facebook數據泄露”丑聞中,劍橋分析公司將來自Facebook的數千萬用戶的數據,用于在2016年美國總統大選中針對目標受眾進行政治廣告投放。劍橋分析公司使用的機器學習模型基于種族、年齡、性別等人口特征來建立影響選民的方法。
針對租戶安全的問題,可以采用網絡傳輸加密技術實現密碼隔離,對不同租戶業務流量采用不同數據密鑰進行加密保護,構建相互隔離的虛擬專用網絡(Virtual Private Network,VPN)加密網絡環境。
針對隱私保護和信任風險的問題,可以使用隱私計算,在提供隱私保護的前提下實現數據價值挖掘,做到“數據可用不可見”。從技術機制來看,隱私計算三大技術路線之一的安全多方計算基于密碼學的算法協議其安全性有嚴格密碼理論證明參與計算的各方擁有各自數據的絕對控制權,不需要任何參與方、操作人員、系統、硬件或軟件的信任傳遞,保障基本數據和信息不會泄露,同時其計算準確度高,支持可編程通用計算。
在安全多方計算的眾多分支中,全同態加密技術備受關注。全同態加密方案提供一種對加密數據進行處理的功能。用戶對密文進行運算后再解密得到的結果,與直接對明文進行運算得到的結果一致。這一特性,允許不可信的第三方在沒有私鑰的情況下直接對密文進行處理和分析,實現了數據所有權和使用權的分離,避免了數據泄露的同時,還充分利用了外部算力,解決了將數據及其計算委托給第三方時的數據安全問題。例如,由于醫療數據隱私問題,醫療保健中的預測分析可能難以通過第三方服務提供商處理,如果第三方服務提供商可以對加密數據進行操作,就會減少因為使用第三方服務而產生的隱私安全問題,如圖1所示。即使服務提供商的系統受到安全威脅,數據也能保持安全。
圖1 基于同態加密的密文搜索應用
2.5 數據交換階段
作為數字經濟時代的關鍵要素,數據要以市場化的方式參與流通和分配,才能真正意義上賦能數字經濟的發展。當前,政府部門及金融、醫療等行業的機構擁有海量的數據,但是出于安全利益角度,數據難以流通起來,跨行業數據流通更是難上加難,導致存在大量數據孤島。
區塊鏈技術在數據共享交換方面有著天然的優勢,利用區塊鏈技術去中心化、公開透明、去信任化、不可篡改的技術特征,在確保數據完整可信、數據權屬明晰的前提下,構建開放、獨立、公開透明的數據交換、審計和監管流程,促進數據共享和交換,發揮數據資產的最大效能。
密碼是區塊鏈中的核心技術之一,為其提供重要的基礎支撐,保障區塊鏈在各領域的實際應用中安全有序發揮作用。一是采用非對稱公私鑰對構建可信身份。公私鑰對奠定了區塊鏈的賬戶體系及資產的所有權,是區塊鏈用戶身份的唯一憑證,將私鑰簽名交易提交到區塊鏈網絡,用公鑰對交易進行驗證。二是通過數字簽名技術實現數據確權。數據確權是數據開放共享和價值流通的先決條件。利用數字簽名的數據完整性、身份驗證和不可否認性的技術特征,實現身份與數據的可靠連接,在區塊鏈共識網絡中保障用戶的安全接入、發布驗證和權屬認定,從而界定數據權屬。三是通過計算不可逆的哈希算法能夠有效保證數據的完整性,并防范數據泄露。哈希算法是區塊鏈中使用最多的一種算法,被廣泛用于構建區塊和確認交易的完整性上,保護數據不被篡改、不能偽造。
2.6 數據銷毀階段
在云計算和大數據環境下,一方面,由于數據量較大、處理對象多,使得數據銷毀耗時較長,增加了數據銷毀環節中被竊取的概率;另一方面,云端數據可能沒有被云服務商徹底銷毀,導致數據殘留問題,這很容易被其他用戶非法恢復,產生數據泄露。
基于加密技術還可以進行數據銷毀。對云存儲中的數據進行多次加密,當需要銷毀數據或者希望銷毀數據時,可以直接刪除密鑰。由于密鑰的數據量比存儲的數據量小很多,因此數據銷毀可以在很短的時間內完成,即使云服務商保留了該文件的某些部分也無法解密數據。
3 基于密碼的數據安全防護體系
構建數據流動過程中動態的安全防護能力,確保在數據保護的基礎上安全地利用數據,促進數據價值發揮,已成為當前業界對數據安全防護目標形成的共識。本文以數據流轉的視角,提出基于密碼的數據安全防護體系,以服務化的密碼防護能力,為數據安全流通保駕護航。基于密碼的數據安全防護體系如圖2所示,該體系由密碼服務平臺、數據安全能力、數據安全標準、數據安全服務以及數據安全管理5個部分組成。
圖2 基于密碼的數據安全防護體系
3.1 密碼服務平臺
數字經濟背景下,信息化的交互大幅增加,隨著業務的協同,數據在網絡空間的不同載體間流動和留存,在業務系統的各層面、各環節中實現數據共享和利用。一方面,數據流通的環節增多,使得安全防護的戰線拉長,防護點位分散,數據載體所處的宿主環境從云計算到傳感器終端,對密碼防護的計算性能要求差異大;另一方面,數據安全的各個環節都需要密碼技術的防護。需要從提供多樣化密碼防護能力、避免重復建設和統籌密碼資源等方面著手,在體系中設計密碼服務平臺。
密碼服務平臺集成數字證書認證系統、密鑰管理系統、統一身份認證系統、密碼計算資源池等密碼基礎設施,為流轉中的數據提供統一的認證和彈性伸縮配置的加密計算資源。基于統一的密鑰、密碼和認證服務,將簡化密碼應用步驟,降低信息系統應用密碼的復雜度,加快密碼應用的建設部署周期。同時,還可以實現對密碼資源和密碼服務全程可視化監管,實時查看密碼設備的運行狀況,支撐數據安全能力中的防護和監測能力構建。
3.2 數據安全能力
數據是存在于網絡空間的一種網絡資產,可以借鑒美國國家標準與技術研究院的網絡安全框架(IPDRR)進行數據安全能力研究。以安全保障體系化的思想,結合管理和技術來有效保障數據的安全,通過持續監測來實現“識別、防護、監測、響應、恢復”數據安全閉環的防護體系能力,為用戶提供完善的數據安全能力框架和支撐體系。
在建設數據安全能力的過程中,基于密碼的防護能力主要體現在兩個方面。
(1)基于密碼構建可信身份體系,并將身份與數據進行連接。數據快速流轉,使得數據與人員、設備、應用等數據使用主體之間的相互關系由靜態綁定轉變為動態變化,導致數據權責關系復雜,組織難以清晰地梳理數據與使用主體、傳輸線路、載體環境、安全策略之間的關系。
利用密碼服務平臺提供的數字證書構建數據使用主體的統一可信身份,通過數字簽名服務實現主體與數據的綁定,詳細記錄數據流轉及使用情況,構建起數據全局視圖,支撐數據監測能力,便于組織開展體系化的數據安全風險聯防聯控;基于密碼標簽可以對數據進行分類分級的標識,有助于數據識別能力建設,結合數據流轉記錄,可以針對具體業務場景,將數據、操作和使用主體進行關聯,設計細粒度管控的安全防護措施,實現數據安全風險的精準管控。
(2)基于密碼提供覆蓋數據全生命周期的密碼防護能力。一是將加密和認證操作嵌入數據業務流程中,提供細粒度的密碼策略和密鑰管理方案,面向云、大數據平臺、傳感器終端等新型計算環境防護需求,確保數據的機密性、完整性和防濫用等基本要求。二是從靜態數據密碼防護向動態數據密碼防護擴展。面向數據流通場景防護需求,加大安全多方計算、區塊鏈等新型密碼防護手段,更好地滿足隱私保護需求和數據安全自由流動需求,讓數據得以合法利用。
3.3 數據安全標準
標準是數據安全相關法律法規落地的重要延伸,對推動數據安全防護體系建設具有基礎性和引領性作用。全國信息安全標準化技術委員會已發布數十項與數據安全和個人信息保護相關的國家標準,標準中明確了密碼技術的使用要求。
3.4 數據安全服務
數據安全與業務緊密關聯,既要滿足安全需求,又要兼顧數據正常的應用與流轉,數據安全服務是將安全專業技術與業務系統相融合,在不影響業務正常運營的前提下,數據安全服務是滿足企業數據安全合規、防護、監測等需求的主要途徑。體系中的密碼服務平臺可以提供密鑰管理、電子簽名、時間戳、數據加解密、證書管理等通用密碼服務。
3.5 數據安全管理
開展數據安全管理工作,需要具備系統性工程視角,從組織、管理、流程、制度、技術等多個方面綜合考慮。數據安全管理主要包括組織與人員、數據安全認責策略、數據安全管理制度等。
4 發展趨勢和建議
在數字經濟蓬勃發展,經濟規模不斷創下新高的背景下,數據安全當前已經成為亟待解決的首要問題,也是產業界和學術界重點研究的領域。使用密碼的方法解決數據安全問題具有天然的優勢,一是密碼可以提供“可證明安全”的基線保障;二是密碼是目前世界上公認的,保障網絡與信息安全最有效、最可靠、最經濟的關鍵核心技術。
基于密碼技術防護數據安全在未來的主要發展方向如下文所述。
(1)數據和算力是人工智能技術開發和應用的關鍵要素,其中數據更是人工智能的基礎支撐。人工智能算法模型在開發訓練時需要海量、多樣性的高質量數據。然而,隨著人們在生產和生活場景中越來越多的敏感數據被過度收集,超出授權范圍的分析和利用,導致數據安全和隱私保護等問題已成為人工智能系統在開發和應用發展中的嚴重阻礙。針對人工智能的各個階段和各種模型,研究基于密碼的數據隱私保護方法,是密碼保護人工智能方向數據安全的重要研究趨勢。
(2)隨著數據安全的普及,實現了用戶個人隱私安全的保障以及隱私數據邊緣計算服務的發展,全同態加密算法擁有十分廣泛的發展空間和應用場景,但當前仍處于萌芽期。其主要的研究方向如下:一是計算效率提升。目前已知的全同態加密算法需要消耗大量計算資源的時間,且還達不到實用的標準。二是開展適應性選擇密文攻擊下安全性和抗泄露安全性。由于全同態加密具有延展屬性,目前大部分全同態密碼算法只滿足選擇明文攻擊安全性。三是全同態加密算法已經在安全多方計算、私有信息檢索、機密數據檢索和可搜索加密等方面得到廣泛應用,未來在數據安全和隱私保護方面的廣泛應用還需進一步探索。
(3)使用密碼技術保障數據安全,需要持續研究和優化密鑰管理的問題。云計算中多租戶模型帶來了共享密鑰、數據使用主體動態變化、頻繁申請刪除密鑰等復雜密鑰管理場景,需要研究高效密鑰管理方法;區塊鏈應用場景中分布式密鑰管理對密鑰一致性、協作性和驗證性提出了新的挑戰,仍需開展深入研究。
5 結 語
隨著數字經濟的高速發展,數據應用領域日趨復雜多樣,數據面臨的安全威脅層出不窮,對數據安全防護的效率、強度、靈活性等提出了更高的要求,密碼作為數據安全中的“安全基因”,面對不斷涌現的新需求,只有不斷推動密碼創新,提出破局思路,才能實現數據安全防護體系的持續優化。
?編輯:黃飛
?
評論