摘要:這篇論文提出了一種非手工設計的基于啟發式搜索算法在解空間搜索候選智能體的工程方法,該解空間由人工智能智能體在仿生學基礎上建模而形成。通過和以元學習為代表的人工設計方法以及以神經架構芯片為代表的仿生學方法進行比較表明,該方法更加有望實現通用人工智能,并且和認知神經科學有更好的交互作用。同時,該工程方法基于一個理論假設即最終的學習算法在確定的場景中是穩定的,并且可以泛化到不同的場景中。本文初步地討論了理論層面,并提出了該理論和不動點定理在數學上的可能聯系,但目前僅僅是個猜想。
鑒于當前認知神經科學和人工智能工程所遇到的困難,華為2012實驗室的研究人員提出了一種新的通用人工智能工程方法:使用學習算法的穩定性作為在特定場景中的適合度函數的啟發式搜索方法。論文將其方法與人工設計方法、仿生學方法進行了對比,結果表明該方法更加有望實現通用人工智能,并且和認知神經科學有更好的交互作用。
作者指出雖然可以直接在這篇論文中提出其工程方法,但為了剛好地解釋這個方法的必要性和可行性,以及使無相關背景的讀者能更好地理解,因此介紹當前的主流人工智能工程方法的背景,并指出其中面臨的挑戰,以及這些挑戰對實現通用人工智能的阻礙是很有必要的。
因此,這篇論文只介紹了該方法的一般過程和方法論并忽略了進一步的細節,并且只對方法論做了粗略的分類。該論文首先介紹了認知神經科學的現狀,然后討論了兩種主流的工程方法:以元學習為代表的人工設計方法,和以神經架構芯片為代表的仿生學方法。
1.1認知神經科學的研究現狀
為了闡明當前人工智能工程方法的局限性來源和它們與認知神經科學的聯系,作者首先了介紹了認知神經科學的研究現狀。
目前,認知神經科學在人類大腦微結構(主要是神經元和突觸)上的研究已經比較全面,對其中的化學過程和電學性質都得出了清晰的結論。對于神經元,spiking模型是其中最重要的特征。而對于神經突觸,由STDP和LTDP描述的特征也得到了充分的研究。
然而,在大腦宏觀結構和其智能功能性上的研究仍然處于早期階段,目前對于人類大腦智能的機制仍未得到任何重要的結論。此外,在這個領域的主流研究方法也受到質疑。基于MRI影像的方法在目前的神經科學中是最重要的研究方法之一。在EricJonas和K.P.Cording的論文中,他們討論了基于MRI的方法是否可以用于分析電子芯片的理論[1],以此表明該方法無法從微觀行為特征得到關于宏觀功能性結構的結論。
該論文還揭示了認知神經科學研究如果沒有程式化的理論指導,無疑將很難研究諸如人類大腦這樣的復雜組織。因此,雖然認知神經科學啟發了人工智能的研究,但它同樣非常需要來自人工智能的研究以指導其研究方向,即它們可以互相促進。
簡言之,當前的認知神經科學無法為人工智能工程(無論是當前還是可預見的將來)提供有價值的啟發。類似地,認知神經科學自身仍將處于成果匱乏的局面。
1.2人工設計方法
人工設計方法一般指的是元學習。元學習是一個很寬泛的概念,因為它還只處于早期發展階段,其中有很多種工程方法,但只有少數幾種的研究目標和這篇論文所定義的人工智能是一致的。其中包括了:基于梯度預測的方法[2]、基于損失預測的方法和基于LSTM的更新方法[4]。
這些方法由深度學習、強化學習和其它傳統的神經網絡學習算法導出。在這些傳統學習算法中,反向傳播算法和策略梯度算法都獨立于神經網絡,并在網絡之外更新網絡連接權重,因此這和這篇論文的人工智能定義不一致。雖然上述的元學習方法和傳統神經網絡學習方法的建模方法是類似的,但它們還包括了在網絡結構中更新網絡連接權重并將其作為學習的目標,從而其研究對象和這篇論文所定義的人工智能是一致的。
然而,這些方法在人工設計上是完全獨立的。人類大腦擁有幾百億個神經元,平均每兩個神經元之間有超過100個神經連接。上述的當前認知神經科學對于大腦的結構和功能得到的結論還是很初級的,基本上不能提供認識通用人工智能的決定性啟發。同時,人類大腦在自然選擇中已經經過了幾百萬年的進化。即使人工設計方法在人類環境中不是最優的解決方案,它們也是近似最優的。還可以進一步推斷出,即使通用人工智能的實現并不是基于100%模仿人類大腦認知機制,至少該結構將擁有近似的復雜度。從以上討論中作者得出,目前實現通用人工智能的方法等價于在一個巨大的搜索空間中利用非常有限的先驗知識尋找近似最優解。如果依靠人工探索,很難想像在可預見的未來內能找到正確的神經網絡架構和學習算法。
當前這些方法生成的人工智能系統的實際性能在多樣性和魯棒性上仍遠遠落后于人類智能。依賴人工設計的另一個后果是無法與認知神經科學進行交互并互相促進發展。上述方法中,無論是微觀神經元特征、宏觀網絡結構,甚至網絡的更新算法都和認知神經科學的研究相去甚遠。
1.3仿生學方法
仿生學方法以神經架構芯片為代表,例如IBM的TrueNorth芯片[5],其使用了電子元件以部分地模擬人類大腦的生物學特征(比如spiking模型、神經元突觸的可塑性,等等)。然而,由于對人類大腦的認知神經科學理解的限制,這些模擬仍然處于微觀層次,而不包含人類大腦神經網絡的宏觀結構。即使在微觀結構,對神經元和其中連接的模擬也不能說是完整的。就是說,某些對于智能產生的關鍵特征可能被忽視了。
由于仿生學方法追求真實地模仿人類大腦的生物學特征,可視其為相對于人工設計方法的另一個極端。然而,這類方法的最大問題是它無法和認知神經科學進行交互,因為它完全單向地依賴于認知神經科學研究的結果。
2本文使用的方法
鑒于在1.1節中所提到的當前認知神經科學和人工智能工程所遇到的困難,本文提出了一種新的通用人工智能工程方法:使用學習算法的穩定性作為在特定場景中的適合度函數(fitnessfunction)的啟發式搜索方法。
2.2模型
本文中使用的方法基于啟發式搜索算法,這是一種在解空間中使用的優化算法,用于加速逼近最優解的搜索過程,其中以遺傳算法(由J.D.Bagley提出)為代表[6]。此外,類似的算法還包括粒子群優化算法、模擬退火算法、蟻群優化算法等等。
雖然它們都屬于同一類算法,但都各有其不同的應用領域。其中,模擬退火算法和蟻群優化算法可以通過將為解決的問題映射到空間相關的問題中,并進行搜索找到最優解,所以它們更適合空間相關的問題。本文中的方法的目標是搜索人工智能智能體,其問題特征并不和空間直接相關,因此上述這些算法并不適用。而遺傳算法和粒子群優化算法通過建模解決問題,然后通過適合度函數評估候選解。因此,它們更適合用于本文方法所能解決的問題。關于遺傳算法或粒子群優化算法還是其它類似算法的使用,本文并沒有限制于工程需要或實驗結果的層面。下圖以遺傳算法為例,描述了這種算法的工作流程:
圖1:遺傳算法的工作流程:問題建模;隨機生成初始群體;場景模擬;評估個體適應性并分級;表現最好的個體是否達到需求;是,輸出結果;否,進行選擇,交叉或突變操作以生成新的群體。
本文中提出的啟發式搜索算法主要由三部分構成:問題建模、適合度函數定義和適合度函數的輸入(場景模擬)。
本文提出的方法基于問題導向建模的啟發式搜索算法和適應性評估(例如遺傳算法或粒子群優化算法)。因此,整個工作流程和圖1所示的很類似。在建模方面,該方法使用了全連接神經網絡模型,以及認知神經科學中關于神經網絡微結構特征的先驗知識以模擬智能體;在適合度函數方面,作者主要測試了智能體在確定場景中執行任務的可重復性和穩定性。以相同的遺傳算法為例,本論文中的方法的完整工作流程如下圖所示,以圖1的每一步的具體實現目標為對照:
-
問題建模:全連接神經網絡結構和微結構特征的one-hot編碼字符串;
-
隨機生成初始群體:連接權重的隨機初始化和微結構特征編碼的隨機初始化;
-
場景模擬:智能體行為和任務模擬的環境;
-
表現最好的個體是否達到需求:智能體是否能可重復地和穩定地執行任務?
圖4:本文方法的完整流程
論文:AHeuristicSearchAlgorithmUsingtheStabilityofLearningAlgorithmsastheFitnessFunctioninCertainScenarios:AnArtificialGeneralIntelligenceEngineeringApproach
-
華為
+關注
關注
216文章
35084瀏覽量
255276 -
人工智能
+關注
關注
1805文章
48833瀏覽量
247340 -
神經
+關注
關注
0文章
46瀏覽量
12631
原文標題:啟發式搜索:華為提出通用人工智能工程方法
文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
混合啟發式算法在汽車調度中的應用
大家來討論一下這樣一個簡單的局部搜索算法
一種無回溯的最長前綴匹配搜索算法
深層次分類中候選類別搜索算法

激光散亂點云K最近鄰搜索算法
單規格一刀切矩形排樣的啟發式搜索算法

基于網頁排名算法面向論文索引排名的啟發式方法
基于并行搜索和快速插入的算法
一種路徑過濾性搜索算法

評論