不可預(yù)測性、不可解釋性和不可理解性
介紹
AI 研究人員開始確定工程 AI 安全的主要挑戰(zhàn),例如解決價(jià)值對(duì)齊問題作為過去 60 年 AI 失敗的主要原因。另一個(gè)暴露的現(xiàn)實(shí)是:機(jī)器越智能,人類就越無法預(yù)測、解釋和理解其影響。
不可預(yù)測性
人工智能的不可預(yù)測性是指我們無法準(zhǔn)確、一致地預(yù)測系統(tǒng)將用于實(shí)現(xiàn)其目標(biāo)的具體行動(dòng)。如果我們想象一場智能國際象棋比賽,我們可以預(yù)測 AI 會(huì)贏——如果這是它的目標(biāo)——但我們無法預(yù)測它為實(shí)現(xiàn)目標(biāo)會(huì)采取的確切動(dòng)作。這種情況下的后果并不顯著,但不可預(yù)測性隨著目標(biāo)的智能和復(fù)雜性的增加而增加。如第 2 部分所述,假設(shè) AI 的任務(wù)是治愈癌癥;從理論上講,它可以通過消滅人類來做到這一點(diǎn)。
這些臨時(shí)步驟取決于幾個(gè)因素,包括 AI 在整個(gè)過程中的交互。第 3 部分中介紹的 Microsoft 的 Tay(bot)開始根據(jù)與在線人的互動(dòng)用不恰當(dāng)?shù)脑u(píng)論激怒他人。更重要的是,低智能系統(tǒng)無法學(xué)會(huì)預(yù)測高智能系統(tǒng)做出的決定。盡管高級(jí)人工智能可以將所有可能的選擇、決策或策略理論化,但人類沒有這種能力。對(duì)于在某個(gè)領(lǐng)域比人類具有更高智能的狹窄系統(tǒng),情況可能類似,即使該系統(tǒng)總體上能力較差。
無法解釋
無法解釋指的是不可能以既可理解又準(zhǔn)確的方式解釋智能系統(tǒng)做出的決定。例如,用于批準(zhǔn)或拒絕抵押貸款的人工智能可能會(huì)使用數(shù)百萬甚至數(shù)十億個(gè)加權(quán)因素來做出決定。但當(dāng)申請(qǐng)人被拒絕時(shí),解釋會(huì)指出一兩個(gè)因素,例如“信用不良”或“薪水不足”。然而,這種解釋充其量只是對(duì)如何做出決定的簡化。這類似于糟糕的圖像壓縮,其中數(shù)據(jù)在縮小過程中丟失,即使生成的圖像在很大程度上代表了原始圖像。以類似的方式,解釋抵押貸款拒絕是基于“不良信用”而忽略了其他因素可能產(chǎn)生的影響。由此產(chǎn)生的解釋是不完整的,因此不是 100% 準(zhǔn)確。
其他因素是否一定需要解釋?他們可以。例如,在美國,涉及貸款、住房、醫(yī)療保健等的決策不能基于受保護(hù)的階層。用于批準(zhǔn)或拒絕抵押貸款的人工智能不能在決策過程中使用年齡或性別等因素,但這些數(shù)據(jù)可以成為因素。例如,如果抵押貸款公司歷來拒絕向居住在舊金山且沒有大學(xué)學(xué)位的 18-25 歲拉丁裔女性提供貸款,人工智能可能會(huì)了解到符合這些標(biāo)準(zhǔn)的申請(qǐng)人拖欠貸款的風(fēng)險(xiǎn)更高,無論是否有其他有利條件標(biāo)準(zhǔn)。在這里,不可預(yù)測性也會(huì)出現(xiàn),但這是一個(gè)很好的例子,說明為什么能夠準(zhǔn)確、完整地解釋決策很重要。
不可理解
如果抵押貸款拒絕得到完整和準(zhǔn)確的解釋,解釋是否可以理解?可理解性在某種程度上是相對(duì)于個(gè)人的;擁有金融學(xué)位或在抵押貸款行業(yè)擁有多年經(jīng)驗(yàn)的人會(huì)比沒有類似領(lǐng)域智慧的人更(或更容易)理解準(zhǔn)確和完整的解釋。也就是說,考慮到一百萬個(gè)不同加權(quán)因素的系統(tǒng)的詳細(xì)響應(yīng)對(duì)于人類來說是不可理解的,因?yàn)槲覀儧]有存儲(chǔ)容量、內(nèi)存和理解那么多相互關(guān)聯(lián)的變量的能力。
對(duì)安全人工智能的影響
不可預(yù)測性、不可解釋性和不可理解性使得實(shí)現(xiàn) 100% 安全的 AI 變得不可能,因?yàn)榧词故羌榷ǖ臉?biāo)準(zhǔn)、法律和工具也無法適當(dāng)?shù)毓膭?lì)或阻止不必要的影響。即使我們能夠預(yù)測 AI 行為,我們也無法在不限制智能或系統(tǒng)價(jià)值的情況下有效地控制行為。當(dāng)然,評(píng)估和調(diào)試 AI 故障需要易于理解的解釋,隨著機(jī)器智能的增加,這種解釋變得越來越不可能。接下來,第 5 部分探討了 AI 安全將如何影響工程領(lǐng)域。
審核編輯hhy
-
AI
+關(guān)注
關(guān)注
87文章
33923瀏覽量
274834 -
人工智能
+關(guān)注
關(guān)注
1804文章
48575瀏覽量
245824
發(fā)布評(píng)論請(qǐng)先 登錄
人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
嵌入式和人工智能究竟是什么關(guān)系?
人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

人工智能對(duì)人類的影響有哪些
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
risc-v在人工智能圖像處理應(yīng)用前景分析
名單公布!【書籍評(píng)測活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新
FPGA在人工智能中的應(yīng)用有哪些?
機(jī)器視覺和人工智能的關(guān)系與應(yīng)用
人工智能新紀(jì)元:具身智能引領(lǐng)機(jī)器人深度融入人類生活
AI人工智能機(jī)器人產(chǎn)業(yè)--政府真正應(yīng)承擔(dān)的責(zé)任與角色

評(píng)論