不久之前,人們還常說(shuō),計(jì)算機(jī)視覺(jué)的辨別能力尚不如一歲大的孩子。
如今看來(lái),這句話要改寫(xiě)了。
計(jì)算機(jī)不僅能和大多數(shù)成年人一樣識(shí)別圖片中的物體,在馬路上駕駛汽車(chē)的安全性還高過(guò) 16 歲的青少年。
更神奇的是,如今的計(jì)算機(jī)不再是被動(dòng)按照指令識(shí)別和駕駛,而是像自然界的生命由數(shù)百萬(wàn)年前開(kāi)始進(jìn)化那樣,自主地從經(jīng)驗(yàn)中學(xué)習(xí)。
是數(shù)據(jù)的井噴促成了這一技術(shù)進(jìn)步。如果說(shuō)數(shù)據(jù)是新時(shí)代的石油,那么學(xué)習(xí)算法就是從中提取信息的煉油廠;信息積累成知識(shí);知識(shí)深化成理解;理解演變?yōu)橹腔邸?/p>
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它根植于數(shù)學(xué)、計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué)。深度網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)習(xí),就像嬰兒了解周?chē)澜缒菢樱瑥谋犻_(kāi)眼睛開(kāi)始,慢慢獲得駕馭新環(huán)境所需的技能。
深度學(xué)習(xí)的起源可以追溯到 20 世紀(jì) 50 年代人工智能的誕生。關(guān)于如何構(gòu)建人工智能,當(dāng)時(shí)存在兩種不同的觀點(diǎn):
一種觀點(diǎn)主張基于邏輯和計(jì)算機(jī)程序,曾主宰人工智能的研究和應(yīng)用數(shù)十年;
另一種觀點(diǎn)則主張直接從數(shù)據(jù)中學(xué)習(xí),經(jīng)歷了更長(zhǎng)時(shí)間的摸索才逐漸成熟。
如今,計(jì)算機(jī)能力日趨強(qiáng)大,數(shù)據(jù)資源也變得龐大且豐富,使用學(xué)習(xí)算法解決問(wèn)題比以前更快、更準(zhǔn)確,也更高效。
此外,同樣的學(xué)習(xí)算法還能用來(lái)解決許多不同的難題,這遠(yuǎn)比為每個(gè)問(wèn)題編寫(xiě)不同的程序更加節(jié)省人力。
01
汽車(chē)新生態(tài):無(wú)人駕駛將全面走入人們生活
在 2005 年美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(以下簡(jiǎn)稱(chēng) DARPA)舉辦的自動(dòng)駕駛挑戰(zhàn)賽中,一輛由斯坦福大學(xué)塞巴斯蒂安 · 特隆(Sebastian Thrun)實(shí)驗(yàn)室開(kāi)發(fā)的自動(dòng)駕駛汽車(chē) Stanley 最終贏得了 200 萬(wàn)美元現(xiàn)金大獎(jiǎng)。團(tuán)隊(duì)利用了機(jī)器學(xué)習(xí)技術(shù)教它如何自主地在加利福尼亞州的沙漠中穿行。
132 英里的賽道中有若干狹窄的隧道和急轉(zhuǎn)彎,還包括啤酒瓶道(Beer Bottle Pass),這是一段蜿蜒曲折的山路,兩側(cè)分別是碎石遍布的陡坡和斷壁。
特隆并沒(méi)有遵循傳統(tǒng)的 AI 方法,即通過(guò)編寫(xiě)計(jì)算機(jī)程序來(lái)應(yīng)付各種偶發(fā)事件,而是在沙漠中駕駛 Stanley,讓汽車(chē)根據(jù)視覺(jué)和距離傳感器的感應(yīng)輸入,學(xué)習(xí)如何像人一樣駕駛。
上圖為啤酒瓶道,圖中遠(yuǎn)處的一輛卡車(chē)正要爬坡。圖片來(lái)源:DARPA。
特隆后來(lái)參與創(chuàng)立了高科技項(xiàng)目重點(diǎn)實(shí)驗(yàn)室 Google X,并開(kāi)始了進(jìn)一步研究自動(dòng)駕駛汽車(chē)技術(shù)的計(jì)劃。
谷歌的自動(dòng)駕駛汽車(chē)自此開(kāi)始,在舊金山灣區(qū)累積了 350 萬(wàn)英里的車(chē)程。優(yōu)步(Uber)已經(jīng)在匹茲堡投放了一批自動(dòng)駕駛汽車(chē)。
蘋(píng)果也步入自動(dòng)駕駛領(lǐng)域,以擴(kuò)大其操作系統(tǒng)控制的產(chǎn)品范圍,并希望能夠再現(xiàn)它在手機(jī)市場(chǎng)上的輝煌。
2017 年,英特爾以 153 億美元的價(jià)格收購(gòu)了 Mobileye,它是一家專(zhuān)門(mén)為自動(dòng)駕駛汽車(chē)研發(fā)傳感器和計(jì)算機(jī)視覺(jué)的公司。在價(jià)值數(shù)萬(wàn)億美元的交通運(yùn)輸領(lǐng)域,參與的各方都下了極高的賭注。
雖然目前自動(dòng)駕駛汽車(chē)仍面臨很多監(jiān)管和法律層面的障礙,但這一技術(shù)一旦開(kāi)始普及,我們就將迎來(lái)一個(gè)嶄新的世界。
02
兩個(gè)圣杯:自然語(yǔ)言翻譯與語(yǔ)音識(shí)別
深度學(xué)習(xí)快速改變格局的一個(gè)例子是它對(duì)語(yǔ)言翻譯的影響。語(yǔ)言翻譯是人工智能的一只圣杯,因?yàn)樗蕾?lài)于理解句子的能力。
谷歌最近推出了基于深度學(xué)習(xí)的最新版谷歌翻譯(Google Translate),代表了自然語(yǔ)言翻譯質(zhì)量的重大飛躍。幾乎一夜之間,語(yǔ)言翻譯就從零散雜亂的拼湊短語(yǔ),升級(jí)到了語(yǔ)意完整的句子。
人工智能的另一只圣杯是語(yǔ)音識(shí)別。不久之前,計(jì)算機(jī)的獨(dú)立語(yǔ)音識(shí)別應(yīng)用領(lǐng)域還很有限,如機(jī)票預(yù)訂。而如今,限制已不復(fù)存在。
2012 年,一名來(lái)自多倫多大學(xué)的實(shí)習(xí)生在微軟研究院(Microsoft Research)的一個(gè)夏季研究項(xiàng)目中,讓微軟的語(yǔ)音識(shí)別系統(tǒng)性能得到了顯著的提升。
2016 年,微軟的一個(gè)團(tuán)隊(duì)宣布,他們開(kāi)發(fā)的一個(gè)擁有 120 層的深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)在多人語(yǔ)音識(shí)別基準(zhǔn)測(cè)試中達(dá)到了與人類(lèi)相當(dāng)?shù)乃健?/p>
圖為微軟首席研究官里克 · 拉希德(Rick Rashid)在 2012 年 10 月 25 日于中國(guó)天津舉行的一場(chǎng)活動(dòng)中,使用深度學(xué)習(xí)進(jìn)行了自動(dòng)語(yǔ)音識(shí)別的現(xiàn)場(chǎng)演示。
03
AI 醫(yī)療:醫(yī)學(xué)診斷將更加準(zhǔn)確
深入皮膚
隨著機(jī)器學(xué)習(xí)的成熟并被應(yīng)用于可獲取大數(shù)據(jù)的許多其他問(wèn)題,服務(wù)行業(yè)和其相關(guān)職業(yè)也將發(fā)生轉(zhuǎn)變。基于數(shù)百萬(wàn)患者病情記錄的醫(yī)學(xué)診斷將變得更加準(zhǔn)確。
最近的一項(xiàng)研究將深度學(xué)習(xí)運(yùn)用到了囊括超過(guò) 2000 種不同疾病的 13 萬(wàn)張皮膚病學(xué)圖像中,這個(gè)醫(yī)學(xué)數(shù)據(jù)庫(kù)是以前的 10 倍大。
該研究的網(wǎng)絡(luò)被訓(xùn)練用于診斷“測(cè)試集”(testset,它從未見(jiàn)過(guò)的新圖像集)中的各種疾病。它在新圖像上的診斷表現(xiàn)與 21 位皮膚科專(zhuān)家的結(jié)論基本一致,甚至在某些情況下還要更準(zhǔn)確。
深入癌癥
如果專(zhuān)家在轉(zhuǎn)移性乳腺癌的淋巴結(jié)活檢切片圖像上判斷錯(cuò)誤,就有可能導(dǎo)致致命的后果。這是一種深度學(xué)習(xí)擅長(zhǎng)的模式識(shí)別問(wèn)題。
實(shí)際上,一個(gè)經(jīng)過(guò)大量結(jié)論清晰的切片數(shù)據(jù)訓(xùn)練出來(lái)的深度學(xué)習(xí)網(wǎng)絡(luò)能達(dá)到 0.925 的準(zhǔn)確度,還不錯(cuò),但還不及人類(lèi)專(zhuān)家在同一測(cè)試集上達(dá)到的 0.966。
然而,把深度學(xué)習(xí)與人類(lèi)專(zhuān)家的預(yù)測(cè)結(jié)合起來(lái),準(zhǔn)確度達(dá)到了 0.995,幾近完美。
04
金融科技:利用數(shù)據(jù)和算法獲取最佳回報(bào)
紐約證券交易所超過(guò) 75% 的交易都是自動(dòng)完成的,高頻交易能在幾分之一秒內(nèi)進(jìn)出倉(cāng)位。如果你不用為每筆交易支付費(fèi)用,那么即使是很小的優(yōu)勢(shì)也能帶來(lái)巨額利潤(rùn)。
更長(zhǎng)時(shí)間范圍內(nèi)的算法交易會(huì)考慮到基于大數(shù)據(jù)的長(zhǎng)期趨勢(shì)。深度學(xué)習(xí)在賺錢(qián)和提高利潤(rùn)方面做得越來(lái)越好。
預(yù)測(cè)金融市場(chǎng),問(wèn)題在于數(shù)據(jù)嘈雜,條件不穩(wěn)定—— 一場(chǎng)選舉或國(guó)際沖突可能會(huì)導(dǎo)致投資者心態(tài)在一夜之間發(fā)生變化。這意味著用來(lái)預(yù)測(cè)今天股票價(jià)值的算法可能到明天就不準(zhǔn)了。
圖為延遲 vs 頭寸持有時(shí)間。在線機(jī)器學(xué)習(xí)正在推動(dòng)算法交易,它比傳統(tǒng)的長(zhǎng)期投資策略更快速,比股票市場(chǎng)中的高頻交易更加慎重。許多不同類(lèi)型的機(jī)器學(xué)習(xí)算法被組合運(yùn)用以獲得最佳回。
早在 20 世紀(jì) 80 年代,我還在為摩根士丹利的股票交易神經(jīng)網(wǎng)絡(luò)模型提供咨詢時(shí),遇到了專(zhuān)門(mén)設(shè)計(jì)并行計(jì)算機(jī)的計(jì)算機(jī)科學(xué)家大衛(wèi) · 肖(David Shaw)。
哥倫比亞大學(xué)學(xué)術(shù)休假期間,肖曾在自動(dòng)化交易早期擔(dān)任量化分析師,隨后他在華爾街創(chuàng)立了自己的投資管理公司德劭集團(tuán)(The D. E. Shaw Group),現(xiàn)在他已經(jīng)是億萬(wàn)富翁了。
德劭集團(tuán)非常成功,但仍然遜于另一家對(duì)沖基金文藝復(fù)興科技公司(Renaissance Technologies)。這家基金是由杰出的數(shù)學(xué)家、紐約州立大學(xué)石溪分校數(shù)學(xué)系前主任詹姆斯 · 西蒙斯(James Simons)創(chuàng)立的。僅 2016 年,西蒙斯就掙了 16 億美元,這還算不上他最好的一年。
更廣泛的金融服務(wù)正在金融科技(fintech)的大背景下發(fā)生大規(guī)模轉(zhuǎn)型。諸如區(qū)塊鏈這樣的信息技術(shù)—— 一種安全的互聯(lián)網(wǎng)記賬方式,取代了金融交易的中間商——正在接受小規(guī)模的測(cè)試,但它很快就會(huì)擾亂價(jià)值數(shù)萬(wàn)億美元的金融市場(chǎng)。
機(jī)器學(xué)習(xí)正在被用于改進(jìn)貸款信用評(píng)估,準(zhǔn)確地提供業(yè)務(wù)和財(cái)務(wù)信息,在社交媒體上獲取預(yù)測(cè)市場(chǎng)趨勢(shì)的信號(hào),并為金融交易提供生物識(shí)別安全服務(wù)。誰(shuí)擁有最多的數(shù)據(jù),誰(shuí)就是贏家,而世界上充斥著財(cái)務(wù)數(shù)據(jù)。
05
德州撲克:當(dāng)機(jī)器智能學(xué)會(huì)了虛張聲勢(shì)
一對(duì)一無(wú)限注德州撲克是最受歡迎的撲克玩法之一,常見(jiàn)于賭場(chǎng),無(wú)限注投注方式則通常出現(xiàn)在世界撲克系列賽(World Series of Poker)的主賽事中。
撲克很有挑戰(zhàn)性,因?yàn)榕c國(guó)際象棋玩家可以獲得相同的信息不同,撲克玩家的信息不完整,而且在最高級(jí)別的比賽中,詐唬、欺騙的技巧和拿到的牌一樣重要。
數(shù)學(xué)家約翰 · 馮 · 諾依曼(John von Neumann)創(chuàng)立了數(shù)學(xué)博弈理論,也是數(shù)字計(jì)算機(jī)之父,他就對(duì)撲克特別著迷。
他說(shuō)過(guò):“現(xiàn)實(shí)生活包括虛張聲勢(shì),一點(diǎn)欺騙手段,以及自問(wèn)另一個(gè)人會(huì)怎么評(píng)判我做事的意圖。這就是我理論中博弈的內(nèi)涵。”
撲克是一種博弈,反映了經(jīng)過(guò)進(jìn)化精煉過(guò)的人類(lèi)智能的一部分。一個(gè)名為“DeepStack”的深度學(xué)習(xí)網(wǎng)絡(luò)和 33 名職業(yè)撲克選手進(jìn)行了 44852 場(chǎng)比賽。
令撲克專(zhuān)家震驚的是,它以相當(dāng)大的優(yōu)勢(shì),一個(gè)標(biāo)準(zhǔn)差,擊敗了最出色的撲克玩家,同時(shí)以四個(gè)標(biāo)準(zhǔn)差在整體上擊敗了全部 33 名玩家——多么巨大的差距。
如果這一成就能復(fù)制到其他基于不完全信息、需要人來(lái)做判斷的重要領(lǐng)域,比如政治學(xué)和國(guó)際關(guān)系,其影響可能是極其深遠(yuǎn)的。
圖為一對(duì)一無(wú)限注德州撲克,強(qiáng)勢(shì)手牌。DeepStack 已經(jīng)掌握了如何在高籌碼撲克中虛張聲勢(shì),以大比分優(yōu)勢(shì)擊敗職業(yè)撲克玩家。
06
弗林效應(yīng):深度學(xué)習(xí)讓人類(lèi)更加智能
在圍棋上大勝人類(lèi)的 AlphaGo 有智力嗎?除了“意識(shí)”這個(gè)主題,關(guān)于智力的文章比心理學(xué)中任何其他主題都要多得多,這兩個(gè)概念都很難界定。
自 20 世紀(jì) 30 年代以來(lái),心理學(xué)家就對(duì)流體智力和晶體智力進(jìn)行了區(qū)分——流體智力能夠?qū)⑿聴l件中的推理和模式識(shí)別用于解決新問(wèn)題,而不依賴(lài)于以前的知識(shí);
晶體智力則依賴(lài)于先前的知識(shí),也是標(biāo)準(zhǔn)智商測(cè)試(即 IQ 測(cè)試)的對(duì)象。流體智力遵循一種拋物線式發(fā)展軌跡,在成年早期達(dá)到高峰,并隨著年齡的增長(zhǎng)逐漸下降;
而晶體智力會(huì)隨年齡的增長(zhǎng),緩慢漸進(jìn)式地提高,直至暮年。AlphaGo 只在一個(gè)相當(dāng)狹窄的領(lǐng)域同時(shí)展現(xiàn)出了晶體智力和流體智力,但在這個(gè)領(lǐng)域,它表現(xiàn)出了令人驚訝的創(chuàng)造力。
專(zhuān)業(yè)知識(shí)的獲取也是基于在狹窄領(lǐng)域的學(xué)習(xí)。我們都是語(yǔ)言領(lǐng)域的專(zhuān)家,每天都在使用語(yǔ)言。
AlphaGo 使用的強(qiáng)化學(xué)習(xí)算法可以被用來(lái)解決許多問(wèn)題。這種形式的學(xué)習(xí)只取決于在一系列動(dòng)作結(jié)束時(shí)給予獲勝者的獎(jiǎng)勵(lì),這似乎和提前做出更好的決策相矛盾。
結(jié)合了許多強(qiáng)大的深度學(xué)習(xí)網(wǎng)絡(luò),就會(huì)生成許多領(lǐng)域相關(guān)的智能。而且事實(shí)上,已經(jīng)出現(xiàn)了與領(lǐng)域相關(guān)的不同類(lèi)型智能,例如社會(huì)、情感、機(jī)械和建筑等的案例。
智力測(cè)試測(cè)量的一般因素(general factor,簡(jiǎn)稱(chēng) g 因素)與這些不同類(lèi)型相關(guān)。我們有理由認(rèn)真審視 IQ 測(cè)試。自 20 世紀(jì) 30 年代首次測(cè)試智力以來(lái),全人類(lèi)平均的 IQ 分?jǐn)?shù)每 10 年會(huì)上升三個(gè)點(diǎn),這一趨勢(shì)被稱(chēng)為“弗林效應(yīng)”(Flynn effect)。
環(huán)境會(huì)影響基因調(diào)控,從而影響大腦內(nèi)在的連接,行為也會(huì)隨之發(fā)生變化。隨著人類(lèi)越來(lái)越多地生活在人造環(huán)境中,大腦正在以某種超越自然進(jìn)化軌道的方式被塑造。
在更長(zhǎng)的時(shí)間內(nèi),人類(lèi)是否能一直都在變得更聰明?智商增長(zhǎng)會(huì)持續(xù)多久?
用電腦玩國(guó)際象棋、西洋雙陸棋和圍棋的人數(shù)自計(jì)算機(jī)程序達(dá)到冠軍級(jí)別后一直在穩(wěn)步增加,而機(jī)器也強(qiáng)化了人類(lèi)玩家的智能。
深度學(xué)習(xí)提升的將不僅僅是科學(xué)研究人員的智能,還包括所有行業(yè)從業(yè)人員的智能。
07
回到未來(lái):當(dāng)人類(lèi)智能遇到人工智能
有兩個(gè)相互交織的主題:人類(lèi)智能是如何進(jìn)化的,以及人工智能會(huì)如何演變。
這兩種智能之間的巨大差異在于,人類(lèi)智能的進(jìn)化經(jīng)歷了數(shù)百萬(wàn)年的時(shí)間,而人工智能在最近幾十年才發(fā)展起來(lái)。
盡管對(duì)于文化演變來(lái)說(shuō),這個(gè)速度仍然是快得出奇,但是過(guò)于謹(jǐn)小慎微可能并不是個(gè)正確的選擇。
深度學(xué)習(xí)在近期取得的突破,并不是你從新聞報(bào)道中讀到的那種一夜成功。
從基于符號(hào)、邏輯和規(guī)則的人工智能向基于大數(shù)據(jù)和學(xué)習(xí)算法的深度學(xué)習(xí)網(wǎng)絡(luò)的轉(zhuǎn)變,其背后的故事通常并不為人所熟知。
-
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
9文章
1709瀏覽量
46784 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134647 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
790文章
14323瀏覽量
170707
原文標(biāo)題:美國(guó)「四院院士」為你實(shí)力科普深度學(xué)習(xí)
文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
低空物流:無(wú)人機(jī)開(kāi)啟未來(lái)配送新篇章

什么是低速無(wú)人駕駛,讓你一分鐘秒懂 #無(wú)人駕駛 #5g無(wú)人駕駛 #低速無(wú)人駕駛
無(wú)人駕駛技術(shù)未來(lái)在哪里?低速才是突破口

無(wú)人駕駛解決方案包含哪些方面?感知、決策與控制

易控智駕發(fā)布礦山無(wú)人駕駛應(yīng)用落地成果
DeepSeek眼中的礦山無(wú)人駕駛
為什么聊自動(dòng)駕駛的越來(lái)越多,聊無(wú)人駕駛的越來(lái)越少?

小馬智行第六代無(wú)人駕駛Robotaxi亮相香港國(guó)際機(jī)場(chǎng)
測(cè)速雷達(dá)與無(wú)人駕駛技術(shù)的結(jié)合 測(cè)速雷達(dá)故障排除技巧
Waymo在洛杉磯全面開(kāi)放無(wú)人駕駛出租車(chē)服務(wù)
UWB模塊如何助力無(wú)人駕駛技術(shù)
特斯拉推出無(wú)人駕駛Model Y
文遠(yuǎn)知行獲加州無(wú)人駕駛汽車(chē)載人測(cè)試許可
馬斯克稱(chēng):通用因技術(shù)未成熟放棄無(wú)人駕駛
5G賦能車(chē)聯(lián)網(wǎng),無(wú)人駕駛引領(lǐng)未來(lái)出行

評(píng)論