遇見薩曼莎(Samantha)。她是你來自2025年的貼心助手。她可以幫你整理郵件、設置您的會議以及雜貨訂單。她會畫畫和寫詩。她是你最好的朋友。她是電影《她》里的人工智能,這也是我們可以想象Siri會把我們的生活改變成怎樣的動人。
現在,大小型高科技公司都在競相使這成為現實。你看看新聞就會聽說過這些行話:AI、機器學習、深度學習、神經網絡、自然語言處理。
也許這一切都有點疑惑。因此,以下是關于這些概念的基本知識,以及它們之間是如何關聯的。
什么是人工智能(AI)?
簡單地說,AI是試圖讓計算機變得智能,甚至比人類更聰明。這是讓電腦擁有類人類的行為、思維過程和推理能力。
有兩種人工智能:
狹義的AI(弱AI)
這種AI只專注于一種狹義的任務。現在我們的身邊已經處處都是弱AI了。它已經在國際象棋,電視競賽節目《危險邊緣》,還有最近的圍棋比賽中擊敗了我們人類。
像Siri和Cortana這樣的數字助手可以給我們提供天氣信息以及在路上自動駕駛汽車。但是,它們有很大的局限性。自動駕駛汽車不會下國際象棋。Siri也無法讀取和刪除不重要的郵件。弱AI有一個狹隘的范圍:它不能超越最先為其設置的功能。
Cortana就是一個弱AI的例子
通用AI(強AI)
下面我們進入科幻小說的王國。薩曼莎毫無疑問被定義成一個強AI。她可以學到新的東西,并修改自己的代碼庫。她可以在國際象棋和開車上都打敗人類。
AI的分析
現在我們知道通用AI是我們的終極目標,那么我們怎么才能實現它呢?這里列出5個需要精通的領域:
感知:像我們人類一樣,一臺電腦也需要五官來與世界進行互動。但它并不僅僅局限于這五個方面。它可以有人不具備的感覺。透視眼?聲納探測?所有的可能。
自然語言處理(NLP):超越感知世界,AI需要懂得解釋語言和寫字。他們需要解析句子和理解它們之間的細微差別、口音和含義。同一個句子根據上下文不同可以有不同的含義,所以這個任務的難度是眾所周知的。
知識表達:既然它可以感知到東西 - 物體,人,概念,詞語和數學符號 - 它需要一種方式來表示它們大腦中的世界。
推理:一旦它通過其感官收集到數據并和概念連起來,它就可以使用該數據來按照邏輯解決問題。例如,一個象棋軟件檢測到棋盤上的棋子走動,就可以計算出應對的策略。
規劃和導航:要想做到真正像人類一樣,AI不僅要像人類一樣思考。還應該在我們中間生活。因此,研究人員的一個大問題就是幫助人工智能在三維世界中移動和規劃最佳路徑。自主意識的交通工具必須做好這一點,因為一個錯誤就會出人命。
新加坡***乘坐自動駕駛汽車兜風。圖片來源:Kenji Soon, MCI 。
你可以看到這些方面是如何在一起協調工作的,諸如機器視覺,它是利用成像和圖像分析來解決問題。舉個例子,Facebook解析你上傳到社交網絡上的照片來建議你應該標記誰,并且這已相當的準確。
自動駕駛汽車也許是目前最復雜的機器視覺處理任務了。它需要認清路標,遵守車道,注意車輛、物體和人。它在能見度惡劣的天氣條件下,不管白天黑夜,是在破舊的路上還是全新的路上,都要能正常工作。
實現工具
這些概念并不是新的。他們早在1956年就在達特矛斯會議(Dartmouth Conferences)上被提出,這次會議是人工智能領域的開創性事件。
讓技術跟上我們的想象要花幾十年的時間,我們似乎也馬上就要最終站在AI革命的風口浪尖上,隨著更多的風險資本投資,更多的大型科技企業投入到AI的研發中來,我們在日常的生活越來越多地使用到AI。
促進AI崛起的重要因素包括摩爾定律,這讓我們可以在更小、更高效的芯片上注入更多的計算能力。計算能力到達一定程度后,AI就將會變得既實用又劃算。
谷歌在貓的識別上取得重大突破。圖片來源:zbeads
大數據是導致AI崛起的另一個趨勢:當谷歌在2012年為神經網絡輸入了海量的數據之后,取得了突破性進展,這其中包括1000萬張YouTube的視頻劇照。
其結果是,神經網絡在沒人教它的情況下學會了辨識貓,取得了75%的準確率。沒有這1000萬個視頻資料庫是不可能實現的。
當機器會學習
現在,讓我們理清幾個常常容易相互混淆的概念。機器學習是一個專注于從數據里學習insights并利用它們來預言世界的AI技術。
決策樹算法。 圖片來源:Wikipedia
機器學習已經用算法實現了。一個任務是通過一系列算法來完成的。這種算法的例子包括決策樹學習和關聯規則學習。
機器學習算法使整個世界閃耀了起來,但是,它只是人工神經網絡,一個由我們大腦的神經如何運作而得到啟發的技術。
它甚至進入了流行文化:在喜劇系列《硅谷》中,創業公司Pied Piper就是在神經網絡上運行其壓縮服務。
視頻:https://youtu.be/E2YcOV5C2x4
這里有一個簡單的解釋:神經網絡是由好幾層的神經元組成的。輸入被傳遞到第一層上。單個神經元接收輸入,給每個輸入值一個權重值,并在這個權重值的基礎上產生一個輸出。
輸出從第一層被傳遞到第二層來進行處理,以此類推。最終的輸出就這樣生成了。
然后,奇跡就發生了。運行網絡的人定義了“正確”的最終輸出應該是什么。每次數據通過網絡傳遞,最終的結果都是與“正確”的值比較,每次它都會調整權重值直至其創建正確的最終輸出。這個網絡實際上是在進行自我訓練。
舉個例子,這個人造大腦可以學習如何從照片中識別椅子。隨著時間的推移,它會學會什么是椅子的特性,來提高他們識別出椅子的概率。
Facebook的AI負責人Yann LeCun用類推法來解釋神經網絡:
模式識別系統就像個一端帶有攝像頭的黑盒子,在頂部有一個綠燈和一個紅燈,前面則有一大堆的旋鈕。學習算法就是試圖調整旋鈕,當在鏡頭前是一條狗時,使紅燈亮起;當鏡頭前有一輛汽車的時候,使綠燈亮起。
在你給機器展示一只狗的時候。就把紅燈亮起,不要做任何事情。如果它是暗的,就調整旋鈕使燈光變亮。如果綠色指示燈亮起,調整旋鈕,使其變暗。然后,顯示汽車的時候,調整旋鈕使紅燈變暗,綠燈變亮。
如果你展示了很多汽車和狗的案例,而你每次都是不斷一點點地調整旋鈕,最終,機器每一次都會得到正確的答案。
圖片來源:a16z
現在我們來談談深度學習,這是一套簡單的訓練多層人工神經網絡的方法。它已被證明從數據中識別圖案是特別有效的。不論何時媒體談到神經網絡,很可能指的都是深度學習。
關于機器學習和深度學習的一個偉大解釋:How Does Your Phone Know This Is A Dog?
深度學習對于AI的促進作用是顯而易見的。它現在在軟件行業之外的許多行業都已經使用。
Facebook M,一個人工智能驅動的虛擬助手,正在使用深度學習來幫助用戶完成各種任務-包括做研究、預訂機票以及買咖啡等。
谷歌正在使用一個名為RankBrain的深度學習系統來過濾搜索結果,來和更多的傳統搜索結果進行比較。據彭博社描述:
該系統每天幫谷歌處理15%的之前系統沒有遇到過的查詢請求。它善于處理模棱兩可的查詢請求,比如“在食物鏈頂端的消費者怎么稱呼?”
該系統現在已經是谷歌搜索結果的第三大信號,位居反鏈接和內容之后。
神經網絡可以識別貓?這就是深度學習。
從Siri到薩曼莎
深度學習可能是建立更智能、更類人類AI的一個關鍵拼圖。
谷歌掃描貓的大腦需要1.6萬臺計算機處理器來運行。擊敗圍棋世界冠軍李世石的程序AlphaGo,運行在48個處理器上。在未來,神經網絡能在廉價的移動電話上運行。
深度學習可以提高AI的各個方面,從自然語言處理到機器視覺,可以看成是一個能夠提高計算機學習能力的更好的一個大腦。
它可以提高虛擬助手例如Siri或谷歌處理不熟悉請求的能力。它可以處理視頻和生成總結內容的短片。
或許有一天它還會贏得奧斯卡獎,誰知道呢?
現在,大小型高科技公司都在競相使這成為現實。你看看新聞就會聽說過這些行話:AI、機器學習、深度學習、神經網絡、自然語言處理。
也許這一切都有點疑惑。因此,以下是關于這些概念的基本知識,以及它們之間是如何關聯的。
什么是人工智能(AI)?
簡單地說,AI是試圖讓計算機變得智能,甚至比人類更聰明。這是讓電腦擁有類人類的行為、思維過程和推理能力。
有兩種人工智能:
狹義的AI(弱AI)
這種AI只專注于一種狹義的任務。現在我們的身邊已經處處都是弱AI了。它已經在國際象棋,電視競賽節目《危險邊緣》,還有最近的圍棋比賽中擊敗了我們人類。
像Siri和Cortana這樣的數字助手可以給我們提供天氣信息以及在路上自動駕駛汽車。但是,它們有很大的局限性。自動駕駛汽車不會下國際象棋。Siri也無法讀取和刪除不重要的郵件。弱AI有一個狹隘的范圍:它不能超越最先為其設置的功能。
Cortana就是一個弱AI的例子
通用AI(強AI)
下面我們進入科幻小說的王國。薩曼莎毫無疑問被定義成一個強AI。她可以學到新的東西,并修改自己的代碼庫。她可以在國際象棋和開車上都打敗人類。
AI的分析
現在我們知道通用AI是我們的終極目標,那么我們怎么才能實現它呢?這里列出5個需要精通的領域:
感知:像我們人類一樣,一臺電腦也需要五官來與世界進行互動。但它并不僅僅局限于這五個方面。它可以有人不具備的感覺。透視眼?聲納探測?所有的可能。
自然語言處理(NLP):超越感知世界,AI需要懂得解釋語言和寫字。他們需要解析句子和理解它們之間的細微差別、口音和含義。同一個句子根據上下文不同可以有不同的含義,所以這個任務的難度是眾所周知的。
知識表達:既然它可以感知到東西 - 物體,人,概念,詞語和數學符號 - 它需要一種方式來表示它們大腦中的世界。
推理:一旦它通過其感官收集到數據并和概念連起來,它就可以使用該數據來按照邏輯解決問題。例如,一個象棋軟件檢測到棋盤上的棋子走動,就可以計算出應對的策略。
規劃和導航:要想做到真正像人類一樣,AI不僅要像人類一樣思考。還應該在我們中間生活。因此,研究人員的一個大問題就是幫助人工智能在三維世界中移動和規劃最佳路徑。自主意識的交通工具必須做好這一點,因為一個錯誤就會出人命。
新加坡***乘坐自動駕駛汽車兜風。圖片來源:Kenji Soon, MCI 。
你可以看到這些方面是如何在一起協調工作的,諸如機器視覺,它是利用成像和圖像分析來解決問題。舉個例子,Facebook解析你上傳到社交網絡上的照片來建議你應該標記誰,并且這已相當的準確。
自動駕駛汽車也許是目前最復雜的機器視覺處理任務了。它需要認清路標,遵守車道,注意車輛、物體和人。它在能見度惡劣的天氣條件下,不管白天黑夜,是在破舊的路上還是全新的路上,都要能正常工作。
實現工具
這些概念并不是新的。他們早在1956年就在達特矛斯會議(Dartmouth Conferences)上被提出,這次會議是人工智能領域的開創性事件。
讓技術跟上我們的想象要花幾十年的時間,我們似乎也馬上就要最終站在AI革命的風口浪尖上,隨著更多的風險資本投資,更多的大型科技企業投入到AI的研發中來,我們在日常的生活越來越多地使用到AI。
促進AI崛起的重要因素包括摩爾定律,這讓我們可以在更小、更高效的芯片上注入更多的計算能力。計算能力到達一定程度后,AI就將會變得既實用又劃算。
谷歌在貓的識別上取得重大突破。圖片來源:zbeads
大數據是導致AI崛起的另一個趨勢:當谷歌在2012年為神經網絡輸入了海量的數據之后,取得了突破性進展,這其中包括1000萬張YouTube的視頻劇照。
其結果是,神經網絡在沒人教它的情況下學會了辨識貓,取得了75%的準確率。沒有這1000萬個視頻資料庫是不可能實現的。
當機器會學習
現在,讓我們理清幾個常常容易相互混淆的概念。機器學習是一個專注于從數據里學習insights并利用它們來預言世界的AI技術。
決策樹算法。 圖片來源:Wikipedia
機器學習已經用算法實現了。一個任務是通過一系列算法來完成的。這種算法的例子包括決策樹學習和關聯規則學習。
機器學習算法使整個世界閃耀了起來,但是,它只是人工神經網絡,一個由我們大腦的神經如何運作而得到啟發的技術。
它甚至進入了流行文化:在喜劇系列《硅谷》中,創業公司Pied Piper就是在神經網絡上運行其壓縮服務。
視頻:https://youtu.be/E2YcOV5C2x4
這里有一個簡單的解釋:神經網絡是由好幾層的神經元組成的。輸入被傳遞到第一層上。單個神經元接收輸入,給每個輸入值一個權重值,并在這個權重值的基礎上產生一個輸出。
輸出從第一層被傳遞到第二層來進行處理,以此類推。最終的輸出就這樣生成了。
然后,奇跡就發生了。運行網絡的人定義了“正確”的最終輸出應該是什么。每次數據通過網絡傳遞,最終的結果都是與“正確”的值比較,每次它都會調整權重值直至其創建正確的最終輸出。這個網絡實際上是在進行自我訓練。
舉個例子,這個人造大腦可以學習如何從照片中識別椅子。隨著時間的推移,它會學會什么是椅子的特性,來提高他們識別出椅子的概率。
Facebook的AI負責人Yann LeCun用類推法來解釋神經網絡:
模式識別系統就像個一端帶有攝像頭的黑盒子,在頂部有一個綠燈和一個紅燈,前面則有一大堆的旋鈕。學習算法就是試圖調整旋鈕,當在鏡頭前是一條狗時,使紅燈亮起;當鏡頭前有一輛汽車的時候,使綠燈亮起。
在你給機器展示一只狗的時候。就把紅燈亮起,不要做任何事情。如果它是暗的,就調整旋鈕使燈光變亮。如果綠色指示燈亮起,調整旋鈕,使其變暗。然后,顯示汽車的時候,調整旋鈕使紅燈變暗,綠燈變亮。
如果你展示了很多汽車和狗的案例,而你每次都是不斷一點點地調整旋鈕,最終,機器每一次都會得到正確的答案。
圖片來源:a16z
現在我們來談談深度學習,這是一套簡單的訓練多層人工神經網絡的方法。它已被證明從數據中識別圖案是特別有效的。不論何時媒體談到神經網絡,很可能指的都是深度學習。
關于機器學習和深度學習的一個偉大解釋:How Does Your Phone Know This Is A Dog?
深度學習對于AI的促進作用是顯而易見的。它現在在軟件行業之外的許多行業都已經使用。
Facebook M,一個人工智能驅動的虛擬助手,正在使用深度學習來幫助用戶完成各種任務-包括做研究、預訂機票以及買咖啡等。
谷歌正在使用一個名為RankBrain的深度學習系統來過濾搜索結果,來和更多的傳統搜索結果進行比較。據彭博社描述:
該系統每天幫谷歌處理15%的之前系統沒有遇到過的查詢請求。它善于處理模棱兩可的查詢請求,比如“在食物鏈頂端的消費者怎么稱呼?”
該系統現在已經是谷歌搜索結果的第三大信號,位居反鏈接和內容之后。
神經網絡可以識別貓?這就是深度學習。
從Siri到薩曼莎
深度學習可能是建立更智能、更類人類AI的一個關鍵拼圖。
谷歌掃描貓的大腦需要1.6萬臺計算機處理器來運行。擊敗圍棋世界冠軍李世石的程序AlphaGo,運行在48個處理器上。在未來,神經網絡能在廉價的移動電話上運行。
深度學習可以提高AI的各個方面,從自然語言處理到機器視覺,可以看成是一個能夠提高計算機學習能力的更好的一個大腦。
它可以提高虛擬助手例如Siri或谷歌處理不熟悉請求的能力。它可以處理視頻和生成總結內容的短片。
或許有一天它還會贏得奧斯卡獎,誰知道呢?
評論