近年來,人工智能技術(shù)(AI)一直是各行各業(yè)的討論焦點,與物聯(lián)網(wǎng)、分布式數(shù)據(jù)庫、5G、自然語言處理等等熱詞一同涌現(xiàn)在時代的浪潮前沿。然而,當(dāng)各行各業(yè)關(guān)注于這些時代熱詞,探索研發(fā)新的AI場景時,卻常常忽視了最成熟也很重要的AI技術(shù)——知識圖譜。
或許你說不出知識圖譜的具體定義,但其實處于信息時代的我們早已離不開它。當(dāng)你打開百度,搜索某個字怎么念,或者今年高考的高校錄取分?jǐn)?shù)線,其結(jié)果的聯(lián)想就來自于知識圖譜的構(gòu)建;當(dāng)你打開淘寶或者今日頭條,其中按照你的興趣愛好定制的個性化推薦內(nèi)容,背后也是知識圖譜在發(fā)揮作用……
而現(xiàn)在,互聯(lián)網(wǎng)巨頭們重新認(rèn)識到在數(shù)據(jù)之上的知識的重要,紛紛在知識圖譜上暗暗較勁。
在百度新春內(nèi)部演講中,李彥宏說,“知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智能當(dāng)中非常基礎(chǔ)的構(gòu)件,也是我們相對于其他任何一家公司的優(yōu)勢所在?!痹贏I World 世界人工智能大會上,百度副總裁、AI技術(shù)平臺體系(AIG)總負(fù)責(zé)人王海峰也避開萬眾矚目的眾多熱詞,將重心聚焦于知識圖譜上。
除了百度,谷歌、阿里、華為等玩家也在積極部署知識圖譜。谷歌將語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬件產(chǎn)品均接入谷歌知識圖譜,以構(gòu)建更大的知識網(wǎng)絡(luò),阿里也利用自己的電商優(yōu)勢捕獲海量數(shù)據(jù)形成更有效的用戶畫像并入自己的知識網(wǎng)絡(luò),并聯(lián)合清華大學(xué)、中科院等機(jī)構(gòu)組建高級知識圖譜研究團(tuán)隊……
那究竟知識圖譜是什么?它又與人工智能有著怎樣的聯(lián)系呢?
中文知識圖譜(Chinese Knowledge Graph) ,最早起源于Google Knowledge Graph。Knowledge Graph是在2012年由谷歌提出的,用于增強(qiáng)其搜索引擎功能的知識庫。
知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò)。其結(jié)點代表實體(entity)或者概念(concept),邊代表實體/概念之間的各種語義關(guān)系。知識圖譜是一種結(jié)構(gòu)化的語義知識庫,其基本組成單位是“實體-關(guān)系-實體”的三元組,以及實體及其相關(guān)屬性-值對,通過實體間的關(guān)系構(gòu)成網(wǎng)狀的知識結(jié)構(gòu),每一個節(jié)點均為實體,實體具有屬性-值對,同時實體與實體之間通過關(guān)系相互連接,構(gòu)成一個特定領(lǐng)域的知識網(wǎng)絡(luò)。
簡而言之,知識圖譜就是通過不同知識的關(guān)聯(lián)性而形成的網(wǎng)狀的知識結(jié)構(gòu)。形成知識圖譜的過程實際上就是加工信息、建立認(rèn)知、理解所應(yīng)用的領(lǐng)域的過程。人類證實因為有了獲取知識、形成知識的能力才可以不斷進(jìn)步;同樣,知識是人工智能的基石,知識圖譜對于人工智能的價值也正是在于它可以讓機(jī)器具備認(rèn)知能力。
另外,知識對于AI的價值,王海峰的總結(jié)是,兩者結(jié)合可以正循環(huán):“有了知識的人工智能會變得更強(qiáng)大,可以做更多的事情。反過來,因為更強(qiáng)大的人工智能,可以幫我們更好地從客觀世界中去挖掘、獲取和沉淀知識,這些知識和人工智能系統(tǒng)形成正循環(huán),兩者共同進(jìn)步?!?/p>
更具體而言,知識圖譜可以說是AI應(yīng)用行業(yè)的先決條件。目前,人工智能已受到各行各業(yè)的關(guān)注,不只是BAT在戰(zhàn)略投資人工智能,金融、汽車、零售、娛樂、制造等等行業(yè)都在積極擁抱人工智能技術(shù)。然而,人工智能要在行業(yè)中得到應(yīng)用,首先必須要對行業(yè)建立起認(rèn)知,只有真正理解了行業(yè)和場景,才能實現(xiàn)智能化。也就是說,只有建立了行業(yè)知識圖譜,才能給出行業(yè)AI方案。
例如在金融行業(yè)。眾所周知,金融是百度最先商用的AI場景,正如李彥宏曾說:“金融的數(shù)據(jù)化本質(zhì),加上業(yè)務(wù)規(guī)則清晰,使它成為人工智能最佳的應(yīng)用場景。”金融的知識相對垂直,因此也非常適合與知識圖譜技術(shù)結(jié)合。在五年前,百度就已將知識圖譜應(yīng)用在股票領(lǐng)域,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關(guān)系,以及股票與股票之間的關(guān)系,在股票領(lǐng)域首創(chuàng)知識圖譜,實現(xiàn)智能選股。不只是百度金融(現(xiàn)度小滿)在應(yīng)用知識圖譜,整個金融行業(yè)都在將知識圖譜應(yīng)用在個人征信、貸款風(fēng)控、保險銷售、保險策劃、金融指數(shù)、反欺詐、客戶管理管理、智能客服等領(lǐng)域,出現(xiàn)了不少提供金融AI技術(shù)或者是金融知識圖譜服務(wù)的創(chuàng)業(yè)公司,百度金融(現(xiàn)度小滿)也一直在積極地推進(jìn)智能金融科技的開放,包括金融知識圖譜的開放。
除了金融領(lǐng)域,咨詢也是知識圖譜應(yīng)用的典型場景。
隨著內(nèi)容創(chuàng)作進(jìn)入自媒體時代,目前內(nèi)容分發(fā)信息流日益流行,而信息流的基礎(chǔ)就是個性化推薦技術(shù)。要做好個性化推薦技術(shù)只需做好兩點:一個是理解用戶的閱讀興趣;另一個是理解資訊內(nèi)容。然而兩點要做到都不容易,理解用戶的前提是足夠多的用戶興趣數(shù)據(jù),理解內(nèi)容的前提則是知識圖譜,平臺必須要有一定的“認(rèn)知”才知道不同內(nèi)容意味著什么,適合哪些興趣的用戶,而不是簡單的關(guān)鍵詞匹配。
舉個例子,一個文章內(nèi)容是馬云最新演講解讀,是將其推薦給電商行業(yè)人士,還是希望獲得成功的年輕人,還是李彥宏等企業(yè)家們?每個人都可能感興趣,如何推薦就要結(jié)合對內(nèi)容的認(rèn)知,以及對用戶興趣以及當(dāng)前場景的理解,這時知識圖譜就派上用場了。特別是在視頻領(lǐng)域,要理解內(nèi)容不是靠文字識別,而是要靠機(jī)器視覺技術(shù),對內(nèi)容本身的理解難度更高,知識圖譜在這時則顯得更為重要。
現(xiàn)在,今日頭條、百度、一點資訊、搜狐、網(wǎng)易、企鵝、UC、微博等等都在做信息流。百度世界大會上宣布百度信息流月活超過6億,相比去年5月剛推出時日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個成果,與知識圖譜的優(yōu)勢密不可分。
王海峰在演講中也指出,“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,要想為這個行業(yè)提供更好的服務(wù),就需要對這個行業(yè)進(jìn)行定制化,要有行業(yè)知識,這時候就需要在通用知識圖譜的基礎(chǔ)上,有相應(yīng)的行業(yè)知識圖譜,進(jìn)而幫助這個行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級。”
從王海峰的邏輯,我們窺見一條未來人工智能走向應(yīng)用的必經(jīng)之路:
機(jī)器通過人工智能技術(shù)與用戶的互動,從中獲取數(shù)據(jù)、優(yōu)化算法,更重要的是構(gòu)建和完善知識圖譜,認(rèn)知和理解世界,進(jìn)而服務(wù)于這個世界,讓人類的生活更加美好。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48820瀏覽量
247280 -
自然語言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14052 -
知識圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
7949
發(fā)布評論請先 登錄
評論