近年來,人工智能(AI)依靠深度學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等技術(shù)突破與落地應(yīng)用,不斷顛覆著人類的既有認(rèn)知——AlphaGo 通過自我強(qiáng)化學(xué)習(xí)擊敗了人類的頂尖圍棋選手;而近日 Alphafold 更是破解了一項(xiàng)過去 50 年生物學(xué)領(lǐng)域的重大挑戰(zhàn)——蛋白質(zhì)分子折疊問題。
自 1956 年 AI 的概念首次被提出后,AI 至今已有 60 多年的發(fā)展史。如今,隨著相關(guān)理論和技術(shù)的不斷革新,AI 在數(shù)據(jù)、算力和算法“三要素”的支撐下越來越多地走進(jìn)我們的日常生活,比如我們常見的語音識(shí)別、人臉識(shí)別和機(jī)器翻譯等,都已經(jīng)在手機(jī)、電腦等智能設(shè)備上有所應(yīng)用。
但是,這一系列驚喜的背后,卻是大多數(shù) AI 在語言理解、視覺場(chǎng)景理解、決策分析等方面的舉步維艱:這些技術(shù)依然主要集中在感知層面,即用 AI 模擬人類的聽覺、視覺等感知能力,卻無法解決推理、規(guī)劃、聯(lián)想、創(chuàng)作等復(fù)雜的認(rèn)知智能化任務(wù)。當(dāng)前的 AI 缺少信息進(jìn)入“大腦”后的加工、理解和思考等,做的只是相對(duì)簡(jiǎn)單的比對(duì)和識(shí)別,僅僅停留在“感知”階段,而非“認(rèn)知”,以感知智能技術(shù)為主的 AI 還與人類智能相差甚遠(yuǎn)。
究其原因在于,AI 正面臨著制約其向前發(fā)展的瓶頸問題:大規(guī)模常識(shí)知識(shí)庫與基于認(rèn)知的邏輯推理。而基于知識(shí)圖譜、認(rèn)知推理、邏輯表達(dá)的認(rèn)知圖譜,則被越來越多的國內(nèi)外學(xué)者和產(chǎn)業(yè)領(lǐng)袖認(rèn)為是“目前可以突破這一技術(shù)瓶頸的可行解決方案之一”。
目前,人工智能的發(fā)展經(jīng)歷了從表示、計(jì)算到感知兩個(gè)階段,下一個(gè)階段的核心是認(rèn)知。早在 2016 年,中國科學(xué)院院士、清華大學(xué)人工智能研究院院長(zhǎng)張鈸就提出了第三代 AI 體系的雛形,并于 2018 年底正式公開第三代 AI 的理論框架體系,其核心思想為:建立可解釋、魯棒性的 AI 理論和方法;發(fā)展安全、可靠、可信及可擴(kuò)展的 AI 技術(shù);推動(dòng) AI 創(chuàng)新應(yīng)用。
2019 年,圖靈獎(jiǎng)得主約書亞·本吉奧(Yoshua Bengio)在 NeurIPS 大會(huì)上也指出,深度學(xué)習(xí)應(yīng)該以感知為主向,向基于認(rèn)知的邏輯推理和知識(shí)表達(dá)的方向發(fā)展,這個(gè)思想和張鈸院士提出的第三代 AI 的思路不謀而合。
圖 | AI 的發(fā)展階段
如今,第三代 AI 的理念在國內(nèi)外獲得廣泛影響力。業(yè)內(nèi)普遍認(rèn)為,認(rèn)知智能將是進(jìn)一步釋放人工智能產(chǎn)能的關(guān)鍵。而認(rèn)知圖譜是實(shí)現(xiàn)認(rèn)知智能技術(shù)突破的關(guān)鍵,不僅可以讓機(jī)器理解數(shù)據(jù)本質(zhì),還可以讓機(jī)器解釋現(xiàn)象本質(zhì)。
認(rèn)知圖譜:實(shí)現(xiàn)認(rèn)知智能的關(guān)鍵
機(jī)器認(rèn)知智能的發(fā)展過程本質(zhì)上是人類腦力不斷解放的過程,是人工智能的最高階段。但是,讓機(jī)器具備認(rèn)知智能,其核心就是讓機(jī)器具備理解和解釋能力。這種能力的實(shí)現(xiàn)與大規(guī)模、結(jié)構(gòu)化的背景知識(shí)是密不可分的。
盡管目前的智能系統(tǒng)在感知方面已經(jīng)達(dá)到甚至超越人類水平,但在魯棒性、可解釋性、安全可靠等方面還存在很多不足。比如,模型魯棒性差,難以與準(zhǔn)確性共生;模型可解釋性差,對(duì)于可靠性要求高的任務(wù)很難勝任;缺乏積累知識(shí)的能力,也沒能和人類已有的知識(shí)體系進(jìn)行很好的關(guān)聯(lián),缺乏可靠的推理方法。
認(rèn)知圖譜旨在結(jié)合認(rèn)知心理學(xué)、腦科學(xué)和人類知識(shí)等,研發(fā)融合知識(shí)圖譜、認(rèn)知推理、邏輯表達(dá)的新一代認(rèn)知引擎,支持大規(guī)模知識(shí)的表示、獲取、推理與計(jì)算的基礎(chǔ)理論和方法,實(shí)現(xiàn)人工智能從感知智能向認(rèn)知智能的演進(jìn),建立可解釋、魯棒性的認(rèn)知智能。
作為一種實(shí)現(xiàn)機(jī)器認(rèn)知智能的底層支撐手段,認(rèn)知圖譜在電商平臺(tái)、智慧城市、司法行業(yè)、金融行業(yè)、安防行業(yè)、大數(shù)據(jù)的精準(zhǔn)與精細(xì)分析、智慧搜索、智能推薦、智能解釋、自然人機(jī)交互等方面具有極為重要的作用。
認(rèn)知圖譜的歷程發(fā)展可以追溯到語義網(wǎng)絡(luò)(Semantic Network)。1968 年,M. Ross Quillian 在研究人類長(zhǎng)期記憶模型時(shí),描述了人類長(zhǎng)期記憶的一般結(jié)構(gòu)模型,認(rèn)為記憶由概念之間的聯(lián)系來實(shí)現(xiàn),并存儲(chǔ)在復(fù)雜的網(wǎng)絡(luò)中,并基于此提出了語義網(wǎng)絡(luò)的概念。
同年,專家系統(tǒng)之父、圖靈獎(jiǎng)得主愛德華·費(fèi)根鮑姆(Edward Feigenbaum)等人研發(fā)出了世界首個(gè)專家系統(tǒng) DENDRAL。專家系統(tǒng)是早期 AI 的一個(gè)重要分支,它可以看作是一類具有專門知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能程序系統(tǒng),一般采用 AI 中的知識(shí)表示和知識(shí)推理技術(shù)來模擬通常由領(lǐng)域?qū)<也拍芙鉀Q的復(fù)雜問題。
1998 年,萬維網(wǎng)之父、ACM 圖靈獎(jiǎng)獲得者蒂姆·伯納斯-李(Tim Berners-Lee)爵士也提出了語義網(wǎng)的概念,其核心理念是通過給萬維網(wǎng)上的文檔(如:HTML 文檔、XML 文檔)添加能被計(jì)算機(jī)理解的語義“元數(shù)據(jù)”(Meta Data),使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介,即用知識(shí)表示互聯(lián)網(wǎng),建立常識(shí)知識(shí)庫。
2006 年,蒂姆·伯納斯-李提出鏈接數(shù)據(jù)(Linked Data)的概念,表示數(shù)據(jù)不僅僅發(fā)布于語義網(wǎng)中,還要建立起數(shù)據(jù)之間的鏈接,從而形成一張巨大的鏈接數(shù)據(jù)網(wǎng),其目的是構(gòu)建一張計(jì)算機(jī)能理解的語義數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò),從而在此之上構(gòu)建更智能的應(yīng)用。
2012 年,Google 的阿米特·辛格爾(Amit Singhal)等人介紹了知識(shí)圖譜(Knowledge Graph)的概念。知識(shí)圖譜以語義網(wǎng)絡(luò)的結(jié)構(gòu)化方式描述客觀世界中概念、實(shí)體、事件以及它們之間的關(guān)系,相對(duì)于傳統(tǒng)的本體和語義網(wǎng)絡(luò)而言,實(shí)體覆蓋率更高,語義關(guān)系也更加復(fù)雜而全面。
圖 | 認(rèn)知圖譜的演化歷程(來源:報(bào)告《人工智能之認(rèn)知圖譜》)
但是,要讓機(jī)器具備認(rèn)知智能,其核心就是讓機(jī)器具備理解和解釋能力,這種能力的實(shí)現(xiàn)與大規(guī)模、結(jié)構(gòu)化的背景知識(shí)是密不可分的。2020 年,清華大學(xué)計(jì)算機(jī)系教授、系副主任唐杰在“人工智能下一個(gè)十年”報(bào)告中,結(jié)合認(rèn)知科學(xué)和計(jì)算機(jī)理論,提出了一個(gè)實(shí)現(xiàn)認(rèn)知智能的可行思路,即“認(rèn)知圖譜 = 知識(shí)圖譜 + 認(rèn)知推理 + 邏輯表達(dá)”,并希望利用知識(shí)表示、推理和決策,以及人的認(rèn)知來解決復(fù)雜問題。
這個(gè)思路的基本思想是結(jié)合認(rèn)知科學(xué)中的雙通道理論:人腦的認(rèn)知系統(tǒng)中存在兩個(gè)系統(tǒng),即 System 1 和 System 2。System 1 是一個(gè)直覺系統(tǒng),它可以通過人對(duì)相關(guān)信息的直覺匹配尋找答案,非常快速、簡(jiǎn)單;而 System 2 是一個(gè)分析系統(tǒng),它通過一定的推理、邏輯找到答案。比如,回答一個(gè)具體問題:2003 年在洛杉磯 Quality 咖啡館拍過電影的導(dǎo)演是誰?
要回答這一問題,首先需要 System 1 找到相關(guān)的影片,然后 System 2 做出決策,如果是標(biāo)準(zhǔn)答案,就結(jié)束整個(gè)推理過程;如果不是,而相應(yīng)的信息又有用,就把它作為一個(gè)有用信息提供給 System 1,System 1 繼續(xù)做知識(shí)擴(kuò)展,System 2 則再次做出決策,直到找到最終答案。
由此可見,認(rèn)知圖譜的核心是以實(shí)現(xiàn)融合知識(shí)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)相結(jié)合的知識(shí)表示和推理的認(rèn)知引擎為目標(biāo),研究支持魯棒可解釋人工智能的大規(guī)模知識(shí)的表示、獲取、推理與計(jì)算的基礎(chǔ)理論和方法;建設(shè)包含語言知識(shí)、常識(shí)知識(shí)、世界知識(shí)、認(rèn)知知識(shí)的大規(guī)模知識(shí)圖譜以及典型行業(yè)知識(shí)庫,建成知識(shí)計(jì)算服務(wù)平臺(tái)。
機(jī)遇與挑戰(zhàn)并存
近年來,雖然 AI 已經(jīng)取得了快速發(fā)展,但如何將深度學(xué)習(xí)與大規(guī)模常識(shí)知識(shí)結(jié)合起來,實(shí)現(xiàn)認(rèn)知推理與邏輯表達(dá),還面臨著很大挑戰(zhàn)。
研發(fā)融合常識(shí)知識(shí)圖譜、認(rèn)知推理和邏輯表達(dá)等核心技術(shù)的認(rèn)知圖譜將成為實(shí)現(xiàn)下一代 AI 技術(shù)突破的關(guān)鍵,實(shí)現(xiàn)以認(rèn)知圖譜作為底層數(shù)據(jù)支撐,具有推理、具有可解釋性、具有認(rèn)知的新一代 AI,是 AI 領(lǐng)域下一個(gè) 10 年重要的發(fā)展方向,也是一個(gè)機(jī)遇與挑戰(zhàn)并存的發(fā)展方向。
眾所周知,技術(shù)的突破與發(fā)展離不開來自人才的持續(xù)創(chuàng)新,科技競(jìng)爭(zhēng)歸根結(jié)底也是人才的競(jìng)爭(zhēng)。那么,放眼中國乃至全世界,認(rèn)知圖譜領(lǐng)域的人才在哪里?
近日,清華大學(xué)人工智能研究院、北京智源人工智能研究院、清華-中國工程院知識(shí)智能聯(lián)合研究中心、阿里集團(tuán)-新零售智能引擎事業(yè)群聯(lián)合發(fā)布了《人工智能之認(rèn)知圖譜》(Research Report of Cognitive Graph)報(bào)告(文末福利,免費(fèi)下載完整版報(bào)告)。該報(bào)告依托 AMiner 平臺(tái),對(duì)技術(shù)領(lǐng)先的國家、機(jī)構(gòu)和學(xué)者,以及認(rèn)知圖譜相關(guān)領(lǐng)域的技術(shù)發(fā)展趨勢(shì)、技術(shù)創(chuàng)新熱點(diǎn)等進(jìn)行了詳細(xì)分析。
數(shù)據(jù)顯示,全球范圍內(nèi)認(rèn)知圖譜相關(guān)領(lǐng)域的學(xué)者主要集中在北美、歐洲和亞洲。美國的高水平學(xué)者數(shù)量在全球位居首位,其次是中國,第三是英國。
其中,中美兩國的高水平學(xué)者數(shù)量遠(yuǎn)高于其他國家,在認(rèn)知圖譜相關(guān)領(lǐng)域具有較強(qiáng)的發(fā)展?jié)摿ΑV袊m然僅次于美國,但是高水平學(xué)者數(shù)量約是美國的一半,相差較大。
圖 | h-index TOP 5000 全球?qū)W者的國家統(tǒng)計(jì)前 10 名
而國內(nèi)認(rèn)知圖譜相關(guān)領(lǐng)域?qū)W者主要分布在中國的經(jīng)濟(jì)和政治發(fā)達(dá)地區(qū),包括京津冀、長(zhǎng)江三角洲、珠江三角洲、香港、臺(tái)灣等地區(qū),中部、西部和東北地區(qū)的學(xué)者則相對(duì)較少。
具體而言,北京、上海和江蘇的認(rèn)知圖譜相關(guān)領(lǐng)域?qū)W者數(shù)排名前三位,分別為 129、45 和 36。(參考 h-index 作為篩選條件,選擇 TOP 5000 全球?qū)W者以地圖形式展示和分析學(xué)者的地區(qū)分布,其中顏色越紅、圓圈越大,表示人才越集中。)
圖 | h-index TOP 5000 中國學(xué)者的省市統(tǒng)計(jì)前 10 名
而且,美國在認(rèn)知圖譜相關(guān)領(lǐng)域的論文發(fā)表量和總被引頻次、高水平學(xué)者數(shù)量均位居世界前列。中國雖然在論文發(fā)表量和高水平學(xué)者數(shù)量方面僅次于美國,但與美國差距較大,并且論文總被引頻次要低于英國和德國,在全球排名第四。
圖 | 論文總被引頻次排名前 10 的國家
此外,報(bào)告還基于 AMiner 平臺(tái)將學(xué)者流入和流出數(shù)量之和作為篩選條件,統(tǒng)計(jì)了認(rèn)知圖譜相關(guān)領(lǐng)域的全球?qū)W者在2009年—2020年間的流動(dòng)數(shù)量排名前 10 的國家。
數(shù)據(jù)顯示,美國、加拿大、法國的學(xué)者流入數(shù)量大于流出數(shù)量,而中國、英國、德國、意大利、印度、日本、西班牙的學(xué)者流出數(shù)量大于流入數(shù)量。
圖 | 全球認(rèn)知圖譜領(lǐng)域?qū)W者的流動(dòng)情況(來源:報(bào)告《人工智能之認(rèn)知圖譜》)
由此看出,中國近 10 年來的學(xué)者流動(dòng)較為頻繁,這與中國制定的出國培養(yǎng)、人才引進(jìn)等相關(guān)人才政策不無關(guān)系。隨著經(jīng)濟(jì)全球化深入發(fā)展,科技人才的跨國流動(dòng)更加頻繁,各國對(duì)科技人才的爭(zhēng)奪更加激烈。
那么,國內(nèi)認(rèn)知圖譜相關(guān)領(lǐng)域的學(xué)者分布情況又如何呢?
數(shù)據(jù)顯示,北京是學(xué)者流入和流出數(shù)量都很高的城市,比其他城市高出較多,這可能與北京的高校和科研院所數(shù)量較多有一定關(guān)系。此外,北京、香港、上海、哈爾濱的學(xué)者流出數(shù)量高于流入數(shù)量,而武漢、南京、西安、杭州、廣州、合肥的學(xué)者流入數(shù)量高于流出數(shù)量。北京、香港、上海的學(xué)者流失與這三個(gè)城市的高校數(shù)量較多、供求關(guān)系不平衡、人才競(jìng)爭(zhēng)力和生活壓力較大不無關(guān)聯(lián),而哈爾濱的地域環(huán)境造成了一定的學(xué)者流失。針對(duì)學(xué)者凈流入數(shù)量為正值的這幾個(gè)城市,通過調(diào)研相關(guān)資料,可以發(fā)現(xiàn)這些地方在積極推行人才引進(jìn)政策,包括落戶、房補(bǔ)、薪酬等方面均制定了相應(yīng)的優(yōu)惠措施。
圖 | 中國認(rèn)知圖譜領(lǐng)域?qū)W者的流動(dòng)情況(來源:報(bào)告《人工智能之認(rèn)知圖譜》)
以上分析表明,在下一代 AI 的機(jī)遇與挑戰(zhàn)下,中國相關(guān)部門需要重視并采取相關(guān)措施,讓中國學(xué)者在重視論文數(shù)量的同時(shí),也要提升論文質(zhì)量,同時(shí)也要加快高水平科技人才隊(duì)伍的建設(shè),一方
針對(duì)國際新局勢(shì)從政策、資金、資源等多個(gè)方面加快本土培養(yǎng),另一方面加大力度引進(jìn)國外重要機(jī)構(gòu)的杰出學(xué)者,改善人才結(jié)構(gòu),加速認(rèn)知圖譜領(lǐng)域的技術(shù)發(fā)展。
未來 10 年,具有推理、具有可解釋性、具有認(rèn)知的新一代 AI,是 AI 領(lǐng)域的下一個(gè)重要發(fā)展方向,而研發(fā)融合常識(shí)知識(shí)圖譜、認(rèn)知推理和邏輯表達(dá)等核心技術(shù)的認(rèn)知圖譜將成為實(shí)現(xiàn)下一代 AI 技術(shù)突破的關(guān)鍵,但歸根結(jié)底還要依靠相關(guān)人才基于不懈努力做出的創(chuàng)新。
責(zé)任編輯:xj
-
AI
+關(guān)注
關(guān)注
87文章
32054瀏覽量
270957 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1702瀏覽量
46188 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5523瀏覽量
121727
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
第三代半導(dǎo)體器件封裝:挑戰(zhàn)與機(jī)遇并存

EE-230:第三代SHARC系列處理器上的代碼疊加

第三代半導(dǎo)體廠商加速出海
第三代半導(dǎo)體對(duì)防震基座需求前景?

第三代半導(dǎo)體產(chǎn)業(yè)高速發(fā)展
第三代半導(dǎo)體的優(yōu)勢(shì)和應(yīng)用
在第三代C2000器件上實(shí)現(xiàn)EEPROM的模擬操作

TCL推出第三代藝術(shù)電視A300系列
第三代半導(dǎo)體市場(chǎng)規(guī)模持續(xù)增長(zhǎng),2024慕尼黑上海電子展提供產(chǎn)業(yè)發(fā)展探討平臺(tái)

2024北京(國際)第三代半導(dǎo)體創(chuàng)新發(fā)展論壇即將召開

高通推出第三代驍龍7+移動(dòng)平臺(tái)
高通推出第三代驍龍7+移動(dòng)平臺(tái)
為什么說第三代驍龍8s恰逢其時(shí)?

評(píng)論