日前,在《自然》雜志醫(yī)學(xué)版上報道了一則谷歌AI團隊的最新人工智能研究成果——預(yù)測肺癌。
通過一套卷積神經(jīng)網(wǎng)絡(luò)算法,谷歌 AI 部門建立了一種端到端的分析方法,僅從CT圖像就可以預(yù)測肺癌的風(fēng)險。
在 6716個測試病例中,這套人工智能系統(tǒng)能夠以 94% 的準(zhǔn)確率發(fā)現(xiàn)極小的惡性肺結(jié)節(jié),打敗了6名放射專家(并非普通醫(yī)生)。
在無先前 CT 掃描圖像的情況下,該系統(tǒng)的表現(xiàn)超越所有 6 位放射醫(yī)學(xué)專家。而在有先前 CT 掃描圖像的情況下,兩者表現(xiàn)不相上下。
而參與測試的 6 位放射專家,有平均 8 年( 4 年到 20 年)的讀片經(jīng)驗。
相比“傳統(tǒng)”射科醫(yī)生的行醫(yī)方法,醫(yī)生必須審查數(shù)百個單獨的2D 掃描切片以發(fā)現(xiàn)問題,而腫瘤可能會很微小導(dǎo)致難以察覺,這種新的機器學(xué)習(xí)算法則可以分析高通量的 3D 肺部圖像,不僅可以對整體腫瘤進(jìn)行預(yù)測,還可以通過肺結(jié)節(jié)識別細(xì)微的惡性組織。再加上先前的掃描數(shù)據(jù)對比,就可以用來評估肺結(jié)節(jié)的生長速度。
相關(guān)論文共同作者,美國西北大學(xué)醫(yī)學(xué)院 Mozziyar Etemadi 博士表示,3D 檢測早期肺癌的能力比人眼檢測 2D 圖像要敏感得多。事實上,新系統(tǒng)在技術(shù)上可以納入 4D 范疇,因為它不僅僅是一次 CT 掃描,而是包括了當(dāng)前和先前共計兩次的掃描,所以可以檢測出肺結(jié)節(jié)隨時間的生長變化。
2019 年 5 月 7 日,Lily Peng 在 2019 年開發(fā)者大會上稱,他們研發(fā)的人工智能技術(shù)可以比醫(yī)生早一年查出肺癌,使患者存活的概率提升 40% 。
毫無疑問,通過谷歌的這項技術(shù),可以造福更很多人。在 2015 年,中國肺癌的發(fā)病和死亡例數(shù)分別達(dá) 73萬 和 61 萬,發(fā)病率和死亡率非常接近,其主要原因是臨床診斷病例多已為晚期,失去了手術(shù)機會。
然而,或許有一天我們分享不到這份成果。對于華為中興事件的反思,面對美國接下來可能在各方面實施的技術(shù)封鎖,中國人工智能的發(fā)展還需要再加把勁。
我國AI進(jìn)展——算法的錯位缺失
我們以前討論電腦或者移動終端時,離不開硬件、軟件和應(yīng)用的范疇。討論人工智能時,同樣離不開硬件、算法和數(shù)據(jù)這三個要素。
簡單來說,中美人工智能發(fā)展在硬件上的差距,遠(yuǎn)沒有在算法的差距來得大。
計算機硬件技術(shù)的發(fā)展一直伴隨著通用性和專用性的矛盾,通用的設(shè)計普適性強,但對于某一類特殊計算,性能就會打折扣,如果做個比喻的話,就是瑞士軍刀和菜刀的區(qū)別,也可謂術(shù)業(yè)有專攻。
在這樣的背景下,人們開始研發(fā)用于神經(jīng)網(wǎng)絡(luò)算法和機器學(xué)習(xí)的專用芯片。
如今,以通用圖形處理器(GPGPU)為基礎(chǔ)的NVIDA在深度學(xué)習(xí)市場占有一席之地,谷歌憑借16年發(fā)布的張量處理器(TPU)成為后起之秀。
通過與自家的人工智能開發(fā)系統(tǒng)TensorFlow相結(jié)合,谷歌也形成了一套完整的人工智能開發(fā)環(huán)境。
國內(nèi)人工智能芯片創(chuàng)新同樣非常活躍,在人工智能芯片的競賽中與國外不相上下。其中的明星企業(yè)就是最近兩年來被反復(fù)提及的獨角獸公司“寒武紀(jì)”,取名借用地質(zhì)學(xué)“寒武紀(jì)”時代的概念,比喻即將到來的人工智能大爆發(fā)時代。
寒武紀(jì)Cambricon-1H8
此外,百度深度學(xué)習(xí)實驗室前主任余凱創(chuàng)立的地平線也同樣值得關(guān)注。一年多時間就完成了Intel和SK領(lǐng)投的兩輪過億融資。
但是無論是寒武紀(jì)還是地平線,都還無法和美國企業(yè)完全抗衡,美國不僅有NVIDIA和谷歌,還有英特爾、微軟和IBM等一批大企業(yè)每年將巨資投向人工智能領(lǐng)域。
至于另一大要素——數(shù)據(jù),鑒于中國龐大的互聯(lián)網(wǎng)人口,深度學(xué)習(xí)所需要的大數(shù)據(jù)則可以由國內(nèi)用戶提供。
人工智能發(fā)展所需的三個要素中,算法是目前我們最薄弱的一環(huán)。不論是前面提到的谷歌AI卷積神經(jīng)網(wǎng)絡(luò)測癌算法,或是NVIDIA此前大火的GauGAN畫圖,都證明了美國企業(yè)的領(lǐng)先,而我國在這方面的發(fā)展屬于相對滯后的。
在2019年長江商學(xué)院和清華大學(xué)公布的兩份報告中,均指出了中國人工智能發(fā)展基礎(chǔ)薄弱。
長江商學(xué)院人工智能與制度研究中心主任許成鋼教授對記者表示,在人工智能領(lǐng)域,中國發(fā)表的論文總數(shù)雖然超過了美國,卻在深度學(xué)習(xí)、機器人流程自動化、以及包括推理學(xué)習(xí)等在內(nèi)的其他領(lǐng)域,從發(fā)表總數(shù)和引用率方面,與美國的差距顯著。
對有高質(zhì)量、高影響力的千級論文(是指每一篇論文被引用的數(shù)字超過了1000次),中國與美國差距巨大,中國只有個別的論文影響力能達(dá)到這個水平。
為什么中國很多論文從來不被引用?許成剛認(rèn)為的癥結(jié)之一在于我國科研機構(gòu)只注重數(shù)量,不注重深度。 “我個人分析,在中國體制內(nèi)大學(xué)有一個SCI現(xiàn)象,即就是教授的水平高低,或者職稱評定,就是看教授發(fā)了多少篇SCI文章(美國科學(xué)資訊研究所采用的期刊文獻(xiàn)檢索工具),不管你這篇文章到底有多大的影響力。”
知乎一篇相關(guān)問答下也不難看到,論文換湯不換藥的做法幾乎已成為除頂級機構(gòu)之外相當(dāng)普遍的做法。
這也導(dǎo)致了我國空有4倍于英國的論文發(fā)表數(shù)量,然而論文影響力竟反而不如英國的結(jié)果。
同時,幾乎93%的中國研究者使用人工智能開源軟件包,這也是美國的機構(gòu)開發(fā)提供的。中美兩國人工智能研究者使用最多的軟件庫就是前面提到的Google TensorFlow。在2018年初,中美研究人員對此的關(guān)注人數(shù),分別達(dá)到將近9000人和約7000人。
整體上中、美AI研究者關(guān)注美國機構(gòu)開發(fā)的開源AI軟件包的數(shù)字,相當(dāng)于他們關(guān)注中國機構(gòu)開放的軟件包數(shù)字的20幾倍。這表明中國研究者在基本算法方面,對美國開源軟件包的嚴(yán)重依賴。
新智元創(chuàng)始人楊靜18年曾對《環(huán)球時報》記者表示,人工智能平臺分硬件和軟件,核心技術(shù)一直掌握在西方手里,比如芯片技術(shù)。此外,中國沒有主流開源框架也是很可怕的,深度學(xué)習(xí)、強化學(xué)習(xí)等算法的研究也落后于西方。
在牛津大學(xué)最新完成的一份報告《解碼中國AI夢》里,作者也得出了相同的結(jié)論。除了數(shù)據(jù),中國在硬件、人才、算法和產(chǎn)業(yè)等方面,仍然落后于美國。但編寫這份報告的Jeffery Ding仍表示, “我認(rèn)為AI是中國第一個真正有機會制定游戲規(guī)則的技術(shù)領(lǐng)域。”
實際上,正是由于中國龐大的互聯(lián)網(wǎng)人口,提供了強大的數(shù)據(jù)基礎(chǔ),在市場的導(dǎo)向之下才使得我國的人工智能更偏重具體應(yīng)用。對此,IDC公司在一份報告中稱:“數(shù)據(jù)或許不會出現(xiàn)在資產(chǎn)負(fù)債表上,但數(shù)據(jù)是一個公司最寶貴的無形資產(chǎn)。中國初創(chuàng)企業(yè)尤其懂得如何利用海量數(shù)據(jù)打造雙贏的商業(yè)生態(tài)。”
人工智能競賽終將走向人才競爭
科技競爭的本質(zhì)最終還是人才的競爭,美國人工智能相關(guān)的從業(yè)人員和公司數(shù)量現(xiàn)在也遙遙領(lǐng)先。
2012年前,中國活躍的人工智能創(chuàng)業(yè)公司還要多于美國,但是在2012年卻被美國反超,美國與人工智能有關(guān)的企業(yè)數(shù)量遠(yuǎn)超中國。
據(jù)《中國人工智能指數(shù)2018》分析,美國的人工智能工程師遠(yuǎn)比中國多。
據(jù)領(lǐng)英(LinkedIn)人才數(shù)據(jù)庫顯示,中國的AI人才總數(shù)為5萬人,而美國的AI人才總數(shù)為83萬人。美國AI人才總數(shù)是中國的16.5倍之多。并且,中國人工智能領(lǐng)域工作10年以上的人才不到39%,相比之下,美國超過71%的人工智能領(lǐng)域的人工作了10年以上。
來源:長江商學(xué)院《中國人工智能指數(shù)報告》
“在中國,人工智能是更年輕的行業(yè),而在美國雖然領(lǐng)域是年輕的,但是里面的多數(shù)人并不年輕,是有充分經(jīng)驗的。”許成剛說。
人才分布方面,中國在智能交通/自動駕駛,智能/精準(zhǔn)營銷, 硬件/GPU/智能芯片需求比例要多于美國,但美國在算法、機器學(xué)習(xí)的方面,美國不但人才的比例比中國大,人才總數(shù)也是中國的20多倍。
來源:清華大學(xué)中國人工智能發(fā)展報告2018
但隨著美國對外開放的收縮,也給了很多海外的技術(shù)型人才回國發(fā)展的機會。
實際上,早在2017 年 12 月美國發(fā)表的“國家安全戰(zhàn)略”中便公開表示:將限制 世界上所有去美國學(xué)習(xí)STEM 專業(yè)(科學(xué)、技術(shù)、工程、數(shù)學(xué))的留學(xué)生簽證。
根據(jù)南華早報的說法,在美國 363341 名中國學(xué)生中,約有 36% 在 STEM 領(lǐng)域?qū)W習(xí)。
這次美方設(shè)置的障礙,可能將會給更多在美國的中國留學(xué)生,在美尋求工作的中國人帶來危機和恐懼。
站在人工智能角逐的角度來看,美國反而在這方面有點自縛手腳的意思。
澎湃新聞:美國埃默里大學(xué)涉嫌歧視華人教授
但五矩認(rèn)為,最為關(guān)鍵的一環(huán)還是在于國內(nèi)要加強對于基礎(chǔ)教育的重視和投入。
“我關(guān)心教育不是關(guān)心華為,是關(guān)心我們國家。如果不重視教育,實際上我們會重返貧窮的。”5月26日晚間,華為創(chuàng)始人、CEO任正非在央視《面對面》節(jié)目中說道,因為這個社會最終要走向人工智能的。
在任正非看來,能與基礎(chǔ)研究相提并論的是基礎(chǔ)教育。他認(rèn)為,我國目前基礎(chǔ)研究方面水平不夠,和基礎(chǔ)教育跟不上直接相關(guān)。為此,他曾自費請權(quán)威機構(gòu)的專家進(jìn)行中國基礎(chǔ)教育狀況的調(diào)查研究。
評論