初創公司Diveplane試圖通過發布業界所謂的“第一個可驗證的孿生數據集”來解決人工智能培訓中使用的數據的隱私問題。
該公司名為GEMINAI的產品旨在幫助組織銷售,共享和分析敏感數據集,而不必擔心任何信息丟失,被盜或以其他方式濫用。
它創建的孿生數據集可以像原始數據集一樣用于數據建模和分析,但不同之處在于,它用合成數據替換了所有個人可識別信息,這些數據保持了原始數據集中包含的統計關系和細微差別。
這與其他獲取數據并僅掩蓋某些信息片段(例如姓名和社會安全號碼)的隱私技術明顯不同,從而使數據易于轉換回原始狀態。
Diveplane認為GEMINAI將幫助確保企業遵守隱私法律和合規性法規,例如《通用數據保護法規》和1996年的《健康保險攜帶與責任法案》(簡稱HIPAA)。
Diveplane首席執行官Michael Capps表示,他的公司正試圖解決AI中的一個大問題。他說,許多公司發現自己在訓練AI模型時被迫使用不準確或不完整的數據集,因為它們需要滿足嚴格的隱私要求。但是,使用不完整的數據通常意味著AI做出錯誤的決策,僅僅是因為AI沒有足夠的信息來得出正確的結論。
Capps說:“借助GEMINAI,我們通過創建可驗證的數據集的合成“雙胞胎”來消除這種風險,從而使企業無需為了隱私而犧牲AI的質量。” “ GEMINAI提供了兩全其美的方法,我們很高興將這種首創的技術推向市場。”
Diveplane表示,已經對其隱私孿生需求最受限制的行業的合成孿生數據集產生了極大的興趣。例如,醫院可以使用GEMINAI與研究組織共享“真正匿名的患者記錄”,以幫助發現新藥和新療法。
GEMINAI還可以幫助推動價值數十億美元的數據共享行業,為公司提供一種匿名信息的方式,以便例如可以將其出售給廣告商,而不會對隱私產生任何影響。
-
人工智能
+關注
關注
1797文章
47924瀏覽量
240966 -
數據集
+關注
關注
4文章
1211瀏覽量
24890
發布評論請先 登錄
相關推薦
評論