正文字數:3268 閱讀時長:8分鐘
這篇文章是我們對人工智能研究論文的評論的一部分,這是一系列探索人工智能最新發現的文章。
人類層面的表現。人類層面的準確性。無論是面部識別、物體檢測還是問題回答,這些術語都是你能從開發人工智能系統的公司經常聽到的。值得稱道的是,近年來出現了許多由人工智能算法驅動的偉大產品,這主要歸功于機器學習和深度學習的進步。 但是這些比較中的許多只考慮了在有限的數據集上測試深度學習算法的最終結果。這種方法會對人工智能系統產生錯誤的預期,并在它們被賦予關鍵任務時產生危險的結果。
在最近的一項研究中,一組來自德國不同組織和大學的研究人員強調了評估深度學習在處理視覺數據方面所面臨的挑戰。在他們題為《比較人類和機器感知的臭名昭著的困難》的論文中,研究人員強調了目前比較深層神經網絡和人類視覺系統的方法中存在的問題。
在他們的研究中,這位科學家進行了一系列的實驗,深入挖掘深度學習結果的表層,并將其與人類視覺系統的工作進行了比較。他們的發現提醒我們,在將人工智能與人類進行比較時,我們必須保持謹慎,即使它在相同的任務上表現出相同或更好的表現。 人類和計算機視覺的復雜性 在似乎無休止的重建人類感知能力的探索中,目前為止,目前為止,深度學習中的計算機視覺領域取得了最有利的結果。卷積神經網絡(CNN)是一種常用于計算機視覺深度學習算法的體系結構,它可以完成傳統軟件難以完成的任務。
然而,將神經網絡與人類的感知能力進行比較仍然是一個挑戰。這在一定程度上是因為我們對人類的視覺系統和大腦還有很多東西要學習的地方。深度學習系統的復雜工作方式也使問題更加復雜。深層神經網絡以非常復雜的方式工作,而這些方式往往會使它們自己的創造者感到困惑。 近年來,一個研究機構試圖評估神經網絡的內部工作原理及其在處理現實世界中情況的魯棒性。德國研究人員在他們的論文中寫道:“盡管進行了大量的研究,但比較人類和機器的感知并不簡單。”。 在科學家們的研究中,它們重點集中在三個領域來測量人類和深度神經網絡如何處理視覺數據。
神經網絡如何感知輪廓? 第一個測試涉及輪廓檢測。在這個實驗中,人類和人工智能參與者都必須說明出一幅圖像是否包含封閉輪廓線。..這里的目標是了解深度學習算法是否能夠學習閉合和開放形狀的概念,以及它們是否能夠在各種情況下檢測到它們。
你能分辨出上面哪個圖像包含一個閉合的形狀嗎? 對人類來說,一個封閉的輪廓兩側有許多開放的輪廓,這在視覺上是非常突出的。相比之下,探測封閉的等高線對 DNNs 來說可能比較困難,因為它們可能需要遠距離的等高線整合”研究人員寫道。 在實驗中,科學家們使用了ResNet-50,一種由微軟人工智能研究人員開發的流行卷積神經網絡。他們使用遷移學習在 14000 張閉合和開放輪廓圖像上調整人工智能模型。 然后,他們在各種類似訓練數據的例子上測試人工智能,并逐漸向其他方向轉移。最初的發現表明,一個訓練有素的神經網絡似乎掌握了封閉輪廓的概念。盡管該網絡是在只包含有直線形狀的數據集上訓練的,但它也可以在曲線上表現良好。 科學家們寫道:“這些結果表明,我們的模型確實學習了開放和閉合輪廓的概念,并執行了類似于人類的輪廓整合過程。”
ResNet神經網絡能夠檢測出各種開放的和封閉的輪廓圖像,盡管只訓練了直線樣本的訓練。 然而,進一步的研究表明,其他不影響人的行為的變化降低了人工智能模型結果的準確性。例如,改變線條的顏色和寬度會導致深度學習模型的精度突然下降。當形狀變大到一定尺寸時,模型似乎也很難檢測到形狀。
當看到包含不同顏色和厚度的線條的圖像,以及形狀大于訓練集的圖像時,ResNet-50 神經網絡就會掙扎。 神經網絡對對抗干擾也非常敏感,精心設計的變化是肉眼看不到,但會破壞機器學習系統的行為。
右邊的圖像經過了對抗性的干擾,也就是人類察覺不到的噪聲。對于人眼來說,這兩個圖像是相同的。但是對于神經網絡來說,它們是不同的圖像。 為了進一步研究人工智能的決策過程,科學家們使用了特征包網絡(bag-of - feature network),這是一種試圖定位有助于深度學習模型決策的數據位的技術。研究人員發現,分析證明了“確實存在一些局部特征,比如端點與短邊的結合,這些特征通常可以給出正確的類標簽。”。 機器學習能推理圖像嗎? 第二個實驗測試了深度學習算法在抽象視覺推理中的能力。實驗所用的數據是基于綜合視覺推理測試(SVRT),在這個測試中,人工智能必須回答需要理解圖片中不同形狀之間關系的問題。測試包括相同-不同的任務(例如,圖片中的兩個形狀是否相同?)以及空間任務(例如,較小的形狀是否位于較大形狀的中心?)。人類的觀察者很容易解決這些問題。
SVRT 挑戰要求參與的 AI 解決相同-不同和空間的任務。 在他們的實驗中,研究人員使用ResNet-50 測試了它在不同大小的訓練數據集上的表現。結果表明,在28000個樣本上進行微調優化的預訓練模型在相同的不同任務和空間任務上都表現良好。(之前的實驗將一個非常小的神經網絡訓練成一百萬張圖像。)隨著研究人員減少訓練樣本的數量,人工智能的性能下降,但是在相同的不同任務中下降的速度更快。
“同-異任務比空間推理任務需要更多的訓練樣本”,研究人員寫道,并補充道,“這不能作為前饋神經網絡和人類視覺系統之間存在系統性差異的證據。” 研究人員指出,人類的視覺系統天生就預先訓練過大量抽象的視覺推理任務。這使得在低數據的情況下測試深度學習模型是不公平的,而且幾乎不可能得出關于人類和人工智能的內部信息處理差異的可靠結論。 研究人員寫道:“很有可能,對這兩種任務從零開始訓練的人類視覺系統,在樣本效率方面表現出與 ResNet-50 類似的差異。”。 測量深度學習的認知差距 識別差距是視覺系統中最有趣的測試之一。考慮以下圖像,在不向下滾動的前提下,你能告訴我它是什么嗎?
下面是同一圖像的縮小視圖。毫無疑問這是只貓。如果我給你看圖像的另一部分(也許是耳朵)的特寫鏡頭,你可能有更大的機會預測圖像中的內容。我們人類需要看到一定數量的整體形狀和圖案才能識別圖像中的物體。放大得越多,刪除的特征越多,就越難區分圖像中的內容。
根據它們所包含的特征,貓圖像不同部分的特寫鏡頭會對我們的感知產生不同的影響。 深度學習系統也以特征為基礎,但它們的工作方式更為微妙。神經網絡有時會發現人眼看不到的微小特征,但即使在非常近距離放大時也能檢測到。 在最后的實驗中,研究人員試圖通過逐漸放大圖像來測量深度神經網絡的識別差距,直到人工智能模型的精度開始大幅下降。 此前的實驗表明,人的圖像識別缺口與深度神經網絡存在很大的差異。但在他們的論文中,研究人員指出,之前大多數關于神經網絡識別缺口的測試都是基于人類選擇的圖像補丁。這些斑塊有利于人類的視覺系統。 當他們在“機器選擇”的補丁上測試他們的深度學習模型時,研究人員得到的結果顯示人類和人工智能有著相似的差距。
識別間隙測試評估放大圖像如何影響人工智能的精度 研究人員寫道:“這些結果凸顯了在完全相同的基礎上測試人類和機器的重要性,以及在實驗設計中避免人類偏見的重要性。”。人和機器之間的所有條件、指令和程序都應該盡可能接近,以確保所有觀察到的差異都是由于內在不同的決策策略,而不是由于測試程序的差異。” 縮小人工智能與人類智能之間的差距 隨著我們的人工智能系統變得越來越復雜,我們將不得不開發更復雜的方法來測試它們。該領域先前的研究表明,許多用于測量計算機視覺系統精度的流行基準是誤導性的。德國研究人員的這項工作是許多嘗試測量人工智能和更好地量化人工智能和人類智能之間的區別的努力之一。他們得出的結論可以為未來的人工智能研究提供方向。
研究人員寫道:“在人類和機器的比較研究中,最主要的挑戰似乎是人類內部強烈的解釋偏見。”。“適當的分析工具和廣泛的交叉檢查(如網絡架構的變化、實驗程序的校準、泛化測試、對抗性例子和受限網絡的測試)有助于對發現的解釋合理化,并將這種內部偏見放到正確的角度。總而言之,在比較人類和機器的感知時,必須注意不要強加我們人類的系統性偏見。”
原文標題:為什么AI感知與人類感知很難直接比較?
文章出處:【微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。
-
AI
+關注
關注
87文章
33942瀏覽量
274850 -
人工智能
+關注
關注
1804文章
48582瀏覽量
245847
原文標題:為什么AI感知與人類感知很難直接比較?
文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
深度感知的應用和主要方法
溫度采集模塊在線感知環境變化
高德發布AI導航智能體:高速駕車場景下可感知車道級交通流變化

研究基于多功能離子纖維傳感器系統的物體識別和抓取的人工觸覺感知

名單公布!【書籍評測活動NO.55】AI Agent應用與項目實戰
超越人類視覺!昱感微“多維像素”多模態超級攝像頭方案產品賦能超凡感知力

如何開發精確感知手部動作?
華為智能手表WATCH GT 5 Pro可感知人類情緒發生


人形機器人感知系統的特點:多模態感知、高精度、實時性
多層感知器的基本原理
多層感知機與神經網絡的區別
浪潮基于AI的客戶感知協同優化體系獲得國際大獎
梯云物聯|AI提高物聯網感知能力:讓電梯更智能、安全!

評論