5月19日-20日,2018全球人工智能技術(shù)大會(huì)(GAITC)在北京國家會(huì)議中心隆重舉辦,全球業(yè)界頂尖領(lǐng)袖在此匯聚,圍繞AI熱點(diǎn),分享AI領(lǐng)域最新洞見,引領(lǐng)年度行業(yè)發(fā)展風(fēng)向標(biāo)。
深知無限人工智能研究院首席科學(xué)家漢斯?烏思克爾特院士(Prof. Dr. Hans Uszkoreit)擔(dān)任本次大會(huì)主席。
以下內(nèi)容為漢斯?烏思克爾特院士演講摘要:
?工業(yè)4.0智能工廠的3個(gè)層級(jí):
智慧工廠
智慧運(yùn)營服務(wù)
智能支持服務(wù)
?智能工廠核心點(diǎn)
第一,網(wǎng)絡(luò)物理系統(tǒng),包括傳感器、行動(dòng)體、處理器,都和物聯(lián)網(wǎng)相連。通過數(shù)據(jù)的輸入,我們可以進(jìn)行很多的學(xué)習(xí),并對(duì)圖片進(jìn)行很多的翻譯和理解,還可以進(jìn)行相關(guān)的推理,進(jìn)行快速的迭代和自動(dòng)化。
第二,在工業(yè)4.0中,還有很重要的一點(diǎn):Digital Twin技術(shù)--具有歷史/記憶的產(chǎn)品(或部件)的數(shù)字模型。Digital Twin主要是來自于語義產(chǎn)品記憶,在這個(gè)理念中,我們認(rèn)為所有的部件都應(yīng)該在自己的機(jī)器上有一個(gè)Digital Twin。一開始建立的模型并不是非常好,它們是使用一些結(jié)構(gòu)化的語言以及模型,同時(shí),人們也可以將自己的語言輸入到Digital Twin之中。通過Digital Twin,我們的機(jī)器可以為人所用,也可以被機(jī)器自己使用。
第三,柔性產(chǎn)品驅(qū)動(dòng)的生產(chǎn)配置。比如我們的產(chǎn)品會(huì)告訴我們的機(jī)器它下一步需要做什么樣的步驟,比如去年到哪一個(gè)生產(chǎn)點(diǎn)進(jìn)行怎么樣的加工。所以我希望我們整個(gè)的系統(tǒng)是柔性并且非常靈活的,而不是非常僵硬的。
第四,智能自動(dòng)化機(jī)器人以及人機(jī)協(xié)同。
第五,基于AI的流程優(yōu)化 - 預(yù)測(cè)資源利用率。我們可以使用預(yù)測(cè)性的資源,不光是預(yù)測(cè)性的維護(hù),而且可以預(yù)測(cè)我們的能源使用、物料使用,可以預(yù)測(cè)所有和生產(chǎn)相關(guān)的資源。
這些都是通過我們與現(xiàn)實(shí)生產(chǎn)得到的學(xué)習(xí)結(jié)論。在DFKI,我們和很多工廠進(jìn)行了合作,希望可以把我們的技術(shù)和想法放到這些工廠里進(jìn)行實(shí)踐。
?智能運(yùn)營服務(wù)
智能工廠的外層是智能運(yùn)營服務(wù),現(xiàn)在已經(jīng)有了智能出行、智能物流、智能大樓、智能產(chǎn)品、智能電網(wǎng),這些就是智能工廠外層的一些設(shè)施,他們會(huì)和生產(chǎn)密切相關(guān)。對(duì)于運(yùn)行服務(wù)而言,它的重點(diǎn)和智能工廠或者智能手工生產(chǎn)是相當(dāng)?shù)摹?/p>
?智能支持服務(wù)
智能工廠的第三層——智能支持服務(wù),我認(rèn)為對(duì)于工廠而言,最重要的東西并不在工廠之內(nèi),很多在工廠工作的人覺得工廠或者產(chǎn)品是最重要的,但其實(shí)并非如此。產(chǎn)品的最終消費(fèi)者是最重要的,以及供應(yīng)商等,如果我的供應(yīng)商對(duì)我停止供應(yīng),工廠會(huì)停產(chǎn),還有投資人、監(jiān)管者、技術(shù)提供商、服務(wù)合作伙伴等等都非常重要。
同時(shí),語言也是至關(guān)重要的。我們需要從所有工廠以外的地方獲取很多的數(shù)據(jù),并把這些數(shù)據(jù)應(yīng)用于我們的工廠,比如進(jìn)行產(chǎn)品研發(fā)、產(chǎn)品升級(jí)、生產(chǎn)計(jì)劃,比如我們希望看消費(fèi)者需要的功能有哪些,消費(fèi)者的理想定價(jià)是怎樣的,還需要看我們從供應(yīng)商那里可以得到什么,因?yàn)槿绻麤]有供應(yīng)商,我們無法進(jìn)行生產(chǎn)。
在這里有很多非結(jié)構(gòu)性數(shù)據(jù),智能工廠的第三層到第一層是相互貫穿的,一方面我們需要翻譯很多的數(shù)據(jù)、語言,理解很多來自于不同行動(dòng)體或者合作伙伴的數(shù)據(jù),另一方面我們也會(huì)把數(shù)據(jù)發(fā)給合作伙伴(如供應(yīng)商),需要發(fā)給他們很多數(shù)據(jù)告訴他們我們所需要的規(guī)格是什么樣的,所以整個(gè)的結(jié)構(gòu)非常復(fù)雜。通過這樣的合作可以獲得智能產(chǎn)品管理、智能客戶關(guān)系管理、智能產(chǎn)品經(jīng)理、智能投資者管理、智能監(jiān)管者管理、智能市場(chǎng)調(diào)查等等。
如何從外部獲得數(shù)據(jù)?有很多數(shù)據(jù)都來自于合作伙伴的數(shù)字內(nèi)容,包括投資人、政府等等。我們?cè)谕獠康臄?shù)據(jù),需要使用媒體、社交媒體、開放知識(shí)、開放數(shù)據(jù)。
例如:
①去年,大眾因?yàn)楣?yīng)商出現(xiàn)了一些問題,他們并沒有及時(shí)獲得警告,而大眾花費(fèi)了14個(gè)月來尋找替代供應(yīng)商。
②我們之前在一個(gè)項(xiàng)目上可以和西門子合作,他們當(dāng)時(shí)有19萬多的直接供應(yīng)商,還有數(shù)百萬的間接供應(yīng)商。我們希望能夠用我們的技術(shù)幫助他們,例如系統(tǒng)找出一些早期的預(yù)警信號(hào)。
知識(shí)圖譜
我們是整個(gè)開放數(shù)據(jù)庫,我們希望做一個(gè)橋梁連接公有和私有的知識(shí)庫,希望能夠在整個(gè)知識(shí)領(lǐng)域中,包括不同的百科網(wǎng)站(如維基百科)或者其他的知識(shí)管理項(xiàng)目中,把它們和工廠的私有知識(shí)庫連接起來,這樣就能以知識(shí)圖譜的方式構(gòu)建這個(gè)大橋。比如說Google、必應(yīng)、百度等不同類型的知識(shí)圖譜。為了把內(nèi)部和外部的知識(shí)庫聯(lián)系在一起,通常會(huì)構(gòu)建一個(gè)公司內(nèi)部的知識(shí)圖譜,這樣才會(huì)有更多的可能。
維基百科非常龐大,是一個(gè)巨大的數(shù)據(jù)庫。但維基百科所有的印刷版,公開發(fā)行的只有這么多,這也是我們?yōu)槭裁聪胝嬲龑?shí)現(xiàn)線上瀏覽或者查詢。因?yàn)槿绻耆甲龃蛴“娴?,?duì)于語音學(xué)家或者知識(shí)領(lǐng)域的專家來說,很難實(shí)現(xiàn)突破。如果我們想做一些搜索和檢索會(huì)非常困難,并且有些知識(shí)是沒有辦法轉(zhuǎn)化為知識(shí)圖譜的。
我從Google的系統(tǒng)中截取了一個(gè)關(guān)于藝術(shù)領(lǐng)域的例子。由Google的知識(shí)圖譜所提供,并不是來自于某一個(gè)單一的文檔,而是一個(gè)結(jié)合。
針對(duì)大數(shù)據(jù)的NLP技術(shù)
?自然語言理解存在的2個(gè)問題
語言模糊性
同樣的句子,在一些語境下可能會(huì)有不同理解,比如某一個(gè)詞語、某一個(gè)句子可以有不同的解讀。比如“放”這個(gè)詞,如果去字典上查有很多不同的理解,或者時(shí)光如梭的英文也有不同的理解。人們對(duì)于解讀同一件事情的方式是千千萬萬的,大家都有不同的解讀,所以對(duì)于語言的解讀和翻譯非常困難。
我們?cè)?008年做過一個(gè)研究,微軟買入了Powerset這個(gè)公司,其實(shí)可以用不同的詞語,比如說買入、收購或者其他的詞語,它可能只是用了非常模糊的詞,但我們知道他們是全資收購了,甚至是吞并。不同的詞語可以表達(dá)出相同的意思。對(duì)人們來說,他們可以想出不同類型的詞語,比如社交媒體上的人或者記者可能會(huì)根據(jù)自己的內(nèi)容表達(dá)選擇一個(gè)最佳的詞語,但對(duì)于機(jī)器學(xué)習(xí)來說比較困難。
我們需要打造出一套基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)、神經(jīng)元學(xué)習(xí),而且整個(gè)的潛力和挑戰(zhàn)都是前所未有的。如果我們學(xué)習(xí)了這些詞組,比如A收購B,我們需要讓機(jī)器理解,他究竟是獲得了某一個(gè)東西,還是真的收購了某一家公司。所以我們必須從這些句子中提取相應(yīng)的信息。比如說它的價(jià)格、涉及到的公司,我們需要提取出正確關(guān)鍵的詞組。而且我們需要高亮出最關(guān)鍵的信息,還有一些簡(jiǎn)單的信息,簡(jiǎn)單的信息可以忽略不計(jì),因?yàn)樗赡軙?huì)有變化。所以我們?cè)诜治稣Z料時(shí),我們會(huì)用綠色標(biāo)注出最重要的信息是我們想讓機(jī)器去學(xué)習(xí)的。
超級(jí)學(xué)習(xí)技術(shù)
我們還會(huì)根據(jù)神經(jīng)原的組成部分進(jìn)行具體的語義解析,我們會(huì)提取信息做語義的篩選。因?yàn)榭赡芤痪湓捓铮f微軟投資了Powerset這家公司,他用了投資這個(gè)詞,但我們還要對(duì)整個(gè)信息做一些篩選和解讀。這樣才能把非結(jié)構(gòu)化的信息真正的結(jié)構(gòu)化。
我們之前也發(fā)表了很多的文獻(xiàn)和相應(yīng)的專利,我們也在很多行業(yè)的應(yīng)用上有所推廣,目前也在中國有一些合作的項(xiàng)目。我們還在不斷地更新、改進(jìn),現(xiàn)在也可以識(shí)別中文。同時(shí)我們也希望能夠覆蓋更多的語言。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47867瀏覽量
240750 -
工業(yè)4.0
+關(guān)注
關(guān)注
48文章
2019瀏覽量
118962 -
自然語言
+關(guān)注
關(guān)注
1文章
291瀏覽量
13410
原文標(biāo)題:2018GAITC演講實(shí)錄 | 漢斯?烏思克爾特:工業(yè)應(yīng)用的自然語言理解和結(jié)構(gòu)化知識(shí)
文章出處:【微信號(hào):CAAI-1981,微信公眾號(hào):中國人工智能學(xué)會(huì)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論