概言之,他引發(fā)的革命、對行業(yè)的翻盤和對學術圈的震蕩、還有隱患和不足都是那么的個性鮮明、棱角分明。
如果把近年來人工智能主流技術“深度學習”理解為那位116歲的長壽老奶奶(拓展閱讀:“深度學習,你就是那位116歲的長壽老奶奶”),那么當前人工智能的諸多現象就不難理解了。概言之,他引發(fā)的革命、對行業(yè)的翻盤和對學術圈的震蕩、還有隱患和不足都是那么的個性鮮明、棱角分明。
先說第一個,革命。端到端(End-to-end)是深度學習面世后最流行的一個概念。以前我們做研究,都喜歡講要深入到數據內部去,了解行業(yè)和應用領域的特點,然后才能形成好的交叉學科成果。以計算機視覺領域為例,在計算機視覺相關的任務如行人跟蹤、人臉識別、表情分析、圖像檢索等,共識的觀點是要找到最富代表性的特征,或統(tǒng)計性的或結構性的或變換空間的。
圖1童話(同化)世界前的計算機視覺領域預測模型框架:藥材對應各種特征;醫(yī)生對應于特征選擇器;藥罐對應于模型預測器;火表示可以通過集成技術(Boosting)進一步提高預測性能
于是,原本大相徑庭的行業(yè)都走到了一起,可以在統(tǒng)一的模型框架討論人工智能在各自領域中的發(fā)展了。這就是端到端帶來的同化現象,因為它將曾經對行業(yè)領域知識的依賴性或準入門檻顯著地降低了,它也導致越來越多的行業(yè)因此而更加重視人工智能的技術研發(fā)和應用。
更有甚者,干脆把依賴手工、簡單重復操作的崗位直接用自動化和人工智能程度高的機器替換了。如富士康公司就出現了“熄燈工廠”。因為這些工作不再需要人了,那燈自然也不是必需要開的了。可以預見,未來這種情況還會在更多的行業(yè)漫延。
事實上,不僅行業(yè)間的同化現象比較明顯,這一撥人工智能熱潮在學術圈也有類似的同化現象。近幾年在人工智能研究上,最明顯的特點就是頂級人工智能會議論文數量的井噴,咱大國的論文也已是占了大半壁江山。
那么,針對不同的任務,在模塊化的框架下,基本技巧是差不多的。要么是增加算力,比如多買點顯卡;要么是增加不同結構的模塊來豐富特征的多樣性;要么是改進優(yōu)化技術,來尋找更多更強的長壽老奶奶;要么是增加數據量,或虛擬的或花錢買的,以提高逼近待搜索最優(yōu)解空間的能力。
結果,以前你從事人工智能研究,可能需要打個好幾年扎實的數學、統(tǒng)計、編程基礎,現在因為這兩個原因而變得簡單、易于上手,也方便在不同研究領域進行推廣了。于是,人工智能的現狀就變?yōu)椋豪习傩找詾榈娜斯ぶ悄苁钦趧?chuàng)造一個又一個復仇聯(lián)盟者3的英雄,而實際當下很多相關的研究可能更像是穿著不同衣服、梳著不同發(fā)型的韓國美女。
圖2:大眾眼中的人工智能研究
圖3:童話(同化)世界的人工智能研究
于是,曾經十幾年前國人鮮能發(fā)表論文的人工智能頂會,現在都能見到本科生一次發(fā)很多篇的情況了。除了導師指導能力和學生創(chuàng)新能力確實有明顯增強的原因外,在一定程度上也是緣于是近年人工智能快速發(fā)展導致的知識層面上的拉平效應。
然而,如果深度學習找到的是一群具有鮮明個性的“長壽老奶奶”,那如何能形成很好的穩(wěn)定性呢?何況并不見每次都能找到這些老奶奶。這一情況通過跟蹤相關文獻能看出些端倪。在同化世界之前,多數文獻報道實驗的時候會有反應一致性的均值和反應波動的標準偏差結果,以此說明模型或方法的穩(wěn)定性。
而近年來相關的不少文獻在這一塊的報道比例明顯少了不少。是因為數據規(guī)模太大,算力再強也沒法保證計算效率嗎?我想這里面多少還是有統(tǒng)計穩(wěn)定性的原因。最后但卻是最重要的,可解釋性。
從統(tǒng)計上來看,可解釋性是力求尋找相同概念事物的共性或規(guī)律,常通過歸納總結獲得。既然如此,那對模型的穩(wěn)定性就得有高的期望。然而,如果預測模型追求的是個例,那就可能難以形成穩(wěn)定的、有效的可解釋性。
其實,人和機器的區(qū)別之一,不就是人會經常犯些錯誤嗎?自然界也是如此。所以,他才會在物種的發(fā)展和延續(xù)中呈現了一種演化現象,并非一味地在向前進化。所謂之,退步原本是向前。也許,童話(同化)世界后的人工智能,應該多研究下會犯錯誤的機器或模型。
-
人工智能
+關注
關注
1806文章
48987瀏覽量
249042 -
深度學習
+關注
關注
73文章
5560瀏覽量
122762
原文標題:童話(同化)世界的人工智能
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論