介紹
人工智能 (AI) 領域準備進入一個新的領域——機器從補充人類用戶的工具轉變?yōu)樽灾?a href="http://m.xsypw.cn/v/" target="_blank">智能代理,可以設定自己的目標,決定學習什么,決定如何學習,和更多。高度智能系統(tǒng)改變世界的潛力類似于以往工業(yè)革命帶來的變化。問題不是智能系統(tǒng)是否會繼續(xù)改變我們的生活;而是 問題是以什么方式和在什么程度上。
什么是人工智能安全工程?
AI Safety Engineering(或簡稱“AI Safety”)是一個擬議的 AI 開發(fā)框架,它將機器倫理學與心理學、經濟學、金融學和其他領域相結合,以:
擴大對機器倫理的討論,以包括狹義的、一般的和超人的智能
將最近和正在進行的人工智能倫理討論與開發(fā)具有通用智能的機器的可用工程指南、流程和標準聯(lián)系起來
針對智能系統(tǒng)中已知和潛在漏洞的來源
作為一個新興的研究領域,人工智能安全的出現(xiàn)有幾個原因。首先,人工智能的成功不僅僅以實現(xiàn)目標來衡量;成功的人工智能是以符合人類價值觀和偏好的方式實現(xiàn)目標的人工智能。回顧 60 多年的 AI 發(fā)展,我們可以看到機器目標與人類價值觀和偏好之間的不一致遲早會導致 AI 失敗。正如本系列中所探討的那樣,將這種失調作為一個關鍵漏洞是開發(fā)安全人工智能的核心。
其次,人工智能的最新進展已經開始達到人工狹義智能系統(tǒng)的邊界,這些系統(tǒng)在給定的上下文中執(zhí)行單一或狹義定義的任務。傳感器、大數(shù)據(jù)、處理,尤其是機器學習方面的進步使這些系統(tǒng)越來越像人類,并擴展了它們的能力和用途。考慮到這一點,達到人工智能的下一個層次——通用人工智能——即將到來,如果安全人工智能不是優(yōu)先考慮的潛在后果也是如此。
Safe AI 的核心是假設通用人工智能會給人類帶來風險。AI Safety 不是通過嘗試在任務或目標級別將人類價值觀和偏好傳授給機器來解決這個問題——這可能是不可能的壯舉——AI Safety 旨在:
以符合人類能力和/或
優(yōu)先考慮人類福利、合作行為和為人類服務
這樣做,我們將確保人工智能流程和目標在宏觀層面尊重人類,而不是試圖在微觀層面實現(xiàn)同樣的目標——讓機器傾向于對我們友好,作為智能核心的一部分。
作為一種工程開發(fā)理念,AI Safety 將 AI 系統(tǒng)設計視為產品設計,對產品責任的每個角度進行檢查和測試,包括使用、誤用和潛在漏洞。圖 1說明了 AI Safety 的新興原則和建議。
圖 1:AI 安全工程強調開發(fā)智能系統(tǒng),即使在遞歸自我改進的情況下也能證明它們是安全的。
在本系列中領先
AI 安全工程是一門新興學科,有很多需要研究、討論和編纂的內容。貿澤電子很高興推出這個博客系列,讓 AI 工程師了解關鍵概念并鼓勵參與其持續(xù)開發(fā):
本系列的第 2 部分重點介紹了我們從過去 60 多年的 AI 開發(fā)中學到的經驗,即 AI 失敗的原因是機器目標與人類價值觀和偏好之間的不一致。它還討論了為什么將人類價值觀和偏好傳授給機器是一個無法解決的問題,并指出了安全人工智能的必要性。
第 3 部分討論了需要 AI 安全的另一個原因:AI 的進步正在突破人工狹義智能 (ANI) 系統(tǒng)的界限,并將人工智能 (AGI) 納入視野。
第 4 部分探討了實施 AI 安全的其他挑戰(zhàn):不可預測性、不可解釋性和不可理解性。
第 5 部分描述了 AI 安全將改變工程的方式。開發(fā)深入用戶價值核心的用例和檢查情報漏洞是這里的兩個關鍵主題。
第 6 部分以關于使用“人工愚蠢”來幫助我們開發(fā)安全人工智能的討論作為結尾。限制機器能力以及理解認知偏差是這里的關鍵主題。
審核編輯hhy
-
AI
+關注
關注
88文章
34990瀏覽量
278651 -
人工智能
+關注
關注
1806文章
48980瀏覽量
248845
發(fā)布評論請先 登錄
AI玩具充電管理IC,安全精準是核心
面向AI WAN的華為解決方案釋放算網潛能 使能差異化服務

AI端側部署開發(fā)(SC171開發(fā)套件V3)
首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手
在樹莓派上設置 DeepSeek R1:2025 年離線人工智能的未來

《零基礎開發(fā)AI Agent——手把手教你用扣子做智能體》

《AI Agent應用與項目實戰(zhàn)》閱讀體驗--跟著迪哥學Agent
NVIDIA 發(fā)布保障代理式 AI 應用安全的 NIM 微服務
C2000?第2代至第3代MCU功能安全使能器遷移指南

AI即服務平臺的安全性分析
基于AI網關的智慧煤礦安全監(jiān)測應用

初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI和計算機視覺技術變革航海安全系統(tǒng)
中偉視界:礦山智能化安全生產,未戴自救器檢測AI算法助力保護作業(yè)人員安全

評論