人工智能擊敗人類這個(gè)話題在今天已經(jīng)沒什么新鮮感了。28年前《終結(jié)者2》上映時(shí),天網(wǎng)和終結(jié)者代表的人工智能還是遙遠(yuǎn)未來撒到現(xiàn)實(shí)中的水滴:電影中計(jì)算機(jī)科學(xué)家偷師終結(jié)者從40年后帶來的芯片,能做的工作就是在設(shè)計(jì)一種全新結(jié)構(gòu)的處理器芯片,也就是說還是在尋求算力的突破。以現(xiàn)在計(jì)算機(jī)科學(xué)的眼光來看,離人工智能的距離實(shí)在有點(diǎn)遠(yuǎn)。
不過也不能難為作為編劇的詹姆斯·卡梅隆。《終結(jié)者2》之前沒幾年的1986年,美國國家科學(xué)基金會(huì)創(chuàng)建的大學(xué)骨干網(wǎng)NSFNET作為未來互聯(lián)網(wǎng)的基礎(chǔ)剛剛誕生,1990年才正式商用。1991年影片上映那年,萬維網(wǎng)之父蒂姆·伯納斯-李剛剛在歐洲核子研究中心寫出HTTP協(xié)議的最初版本,離真的WWW全球網(wǎng)絡(luò)大范圍進(jìn)入民用至少還要5年時(shí)間左右。
于是,至少在《終結(jié)者2》中,依然看不到任何互聯(lián)網(wǎng)的影子,離基于云計(jì)算和網(wǎng)絡(luò)的現(xiàn)代人工智能那就更遠(yuǎn)了。
這30年,其實(shí)是人類世界其實(shí)發(fā)生巨大變化的30年。在互聯(lián)網(wǎng)變成日常生活的一部分之后,人工智能看起來也正在往這個(gè)趨勢發(fā)展。每一個(gè)手機(jī)應(yīng)用和服務(wù)似乎都有點(diǎn)人工智能的成分,每個(gè)公司的宣發(fā)似乎都在說人工智能的布局和未來。
實(shí)際上,人工智能現(xiàn)在的意思,比它剛剛誕生時(shí)要更大一些。當(dāng)年的人工智能更多的是指像終結(jié)者這樣的高級的、通用的、完全模擬人類意識的強(qiáng)人工智能,而如今的人工智能有了更多自動(dòng)化、自主學(xué)習(xí)方面的微觀涵義。
但這并不是說AI變得不重要了,恰恰相反,被擴(kuò)展了含義的人工智能正在深入整個(gè)IT行業(yè),并且在不斷創(chuàng)造全新的場景和價(jià)值。聯(lián)想也是重要的參與者,并且正在學(xué)術(shù)和應(yīng)用領(lǐng)域取得突破。
就在剛剛過去的9月,聯(lián)想集團(tuán)旗下推進(jìn)技術(shù)未來發(fā)展的聯(lián)想研究院,在人工智能領(lǐng)域剛剛?cè)〉萌?xiàng)大獎(jiǎng):
“自動(dòng)自然語言理解”算法獲獎(jiǎng):讓人工智能來訓(xùn)練人工智能
9月初結(jié)束的2019世界人工智能大會(huì)(WAIC)黑客馬拉松中,來自聯(lián)想研究院人工智能實(shí)驗(yàn)室智能算力平臺組的參賽團(tuán)隊(duì),在自動(dòng)自然語言理解(AutoNLP)賽道中首秀即獲得了決賽二等獎(jiǎng) (第二名)的戰(zhàn)績。
本次AutoNLP比賽要求參賽隊(duì)伍在不同內(nèi)容主題、不同語言的混合字符、文本集里,不借助任何離線或在線算力優(yōu)勢,進(jìn)行代碼設(shè)計(jì),并在規(guī)定時(shí)間內(nèi)完成全自動(dòng)文本分類。這其中存在著不少的挑戰(zhàn),比如單樣本長度和數(shù)據(jù)集樣本量差異巨大;任務(wù)的類別數(shù)不定,且類別間可能極度不均衡,不同類樣本比率可能達(dá)到數(shù)千比一;對系統(tǒng)泛化能力要求極高等。
聯(lián)想研究院提交的方案是自動(dòng)化機(jī)器學(xué)習(xí)應(yīng)用于自然語言理解,方案采取了輕量級元學(xué)習(xí)思路下的自動(dòng)化深度學(xué)習(xí)框架。方案具有通用性和自適應(yīng)性,基于數(shù)據(jù)特征和任務(wù)元特征來進(jìn)行自動(dòng)學(xué)習(xí),避免在測試任務(wù)上的過擬合。
簡單的說,此次獲獎(jiǎng)的算法所在的自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)是人工智能發(fā)展的新階段,它可以讓缺乏資源的公司和團(tuán)體可以以更低的門檻、甚至零門檻設(shè)計(jì)自然語言識別機(jī)器學(xué)習(xí)算法,從長遠(yuǎn)戰(zhàn)略意義上說,自動(dòng)化機(jī)器學(xué)習(xí)是邁向強(qiáng)人工智能的必經(jīng)階段,是人工智能研究重要的戰(zhàn)略高地。
全國知識圖譜大賽第一名:讓AI讀懂人類世界的關(guān)鍵
同樣是在9月初,聯(lián)想研究院人工智能團(tuán)隊(duì)在全國知識圖譜與計(jì)算大會(huì)上取得了“人物關(guān)系抽取比賽”的第一名,以及“短文本實(shí)體鏈指比賽”的第二名。
所謂的知識圖譜,就是讓計(jì)算機(jī)理解人類詞匯、語句中的邏輯和知識性練習(xí)。舉例來說,想讓AI給你介紹一款新電腦,AI就必須知道這款電腦的參數(shù)、性能、售價(jià)、周邊知識等等在內(nèi)的所有聯(lián)系,這就是知識圖譜。完成這樣的訓(xùn)練,你問任何一個(gè)和產(chǎn)品有關(guān)的問題,AI都能給正確的答案。
當(dāng)然了,實(shí)際應(yīng)用的大多數(shù),可能都比介紹產(chǎn)品這樣的案例要更復(fù)雜。聯(lián)想研究院此次獲獎(jiǎng)的人物關(guān)系抽取比賽,就是讓計(jì)算機(jī)讀懂人類的社會(huì)結(jié)構(gòu)。
此次的人物關(guān)系抽取比賽任務(wù)包含35個(gè)類別,包括夫妻,長輩,晚輩,同輩,其他親戚;以及老師、學(xué)生,戀人,朋友等。人物類型非常多元,包括歷史名人、政治人物、娛樂明星、小說人物等,還包括部分外國人物。
算法可以實(shí)現(xiàn)的效果就是,AI讀到“賈玲師從相聲表演藝術(shù)家馮鞏”這句話,就知道他們是師徒的關(guān)系。
而短文本實(shí)體鏈指比賽,則是要求對于給定的一個(gè)中文短文本(如搜索Query、微博、用戶對話內(nèi)容、文章標(biāo)題等),識別出其中的實(shí)體,并與給定知識庫中的對應(yīng)實(shí)體進(jìn)行關(guān)聯(lián)。ERL整個(gè)過程包括實(shí)體識別和實(shí)體鏈指兩個(gè)子任務(wù)。
比如看到一條新聞“比特幣吸粉無數(shù),但央行的心另有所屬|(zhì)界面新聞 · jmedia”之后,可以輸出“比特幣、央行、界面新聞”這幾個(gè)有價(jià)值的知識實(shí)體詞匯。
簡單地說,理解人物關(guān)系和知識的結(jié)構(gòu),同樣是人工智能未來發(fā)展的重要工具和方向。
副語言語音屬性評測國際第一:讓AI讀懂人類的話里有話
在9月底閉幕的國際語音盛會(huì)Interspeech2019上,聯(lián)想研究院AI Lab語音團(tuán)隊(duì)和昆山杜克大學(xué)的DKU-LENOVO聯(lián)合系統(tǒng)在今年的副語言語音屬性評測中(ComParE2019,The Interspeech 2019 Computational Paralinguistics ChallengE )奪得冠軍。
ComParE是Interspeech系統(tǒng)評測之一,從2009開始已經(jīng)連續(xù)舉辦十年,在語音領(lǐng)域?qū)儆谥亓考壴u測。語音是語言的聲音表現(xiàn)形式,不僅包含了語言語義信息,同時(shí)也傳達(dá)了說話人、語種、性別、年齡、情感、信道、嗓音、病理、生理、心理等多種豐富的副語言語音屬性信息。
ComParE的目的就是根據(jù)語音信號,識別或檢測各類副語言語音屬性,比如情感識別、哭聲檢測、嗓音病理識別、方言語種識別等,每年都會(huì)有不同任務(wù)。今年參賽單位有20多家,包括Idiap Research Institute、CMU、慕尼黑大學(xué)、***清華大學(xué)等眾多知名研究機(jī)構(gòu)。
DUK-LENOVO系統(tǒng)參加了鯨魚叫聲檢測項(xiàng)目,主辦方提供部分包含鯨魚叫聲的語音作為訓(xùn)練數(shù)據(jù),大家在共同的測試集上檢測聲音信號中是否包含鯨魚叫聲。通過采用數(shù)據(jù)擴(kuò)展、多特征融合以及基于Fish vector的deep embedding技術(shù),DKU-LENOVO提交系統(tǒng)在測試集上達(dá)到94.8%的正確率,顯著優(yōu)于官方提供的86.6%的基線和其他單位系統(tǒng),穩(wěn)居第一。
這三項(xiàng)人工智能領(lǐng)域的大獎(jiǎng)只是聯(lián)想研究院和人工智能團(tuán)隊(duì)取得成績的一小部分。實(shí)際上過去一年多,團(tuán)隊(duì)已經(jīng)獲得了超過14個(gè)全球性人工智能競賽的大獎(jiǎng)和最佳論文,顯示了極高的算法水平和開發(fā)管理能力
而聯(lián)想研究院人工智能團(tuán)隊(duì)的成果,早已開始為公司運(yùn)營提升效能,改進(jìn)運(yùn)營水平,擴(kuò)大盈利空間。舉例來說,聯(lián)想的工廠生產(chǎn)、售后維修保障、公司內(nèi)部運(yùn)營都已經(jīng)部署了聯(lián)想研究院自行開發(fā)的AI技術(shù)。而且下一步,聯(lián)想作為中國智能制造的使能者與賦能者,這些AI解決方案正在為其他行業(yè)與公司提供變革的力量。
-
聯(lián)想
+關(guān)注
關(guān)注
3文章
2619瀏覽量
62929 -
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240335 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8441瀏覽量
133094
發(fā)布評論請先 登錄
相關(guān)推薦
評論