在過去的一年,F(xiàn)acebook經(jīng)歷了很多波折和困難,但是在研究方面依舊涌現(xiàn)出了很多高質(zhì)量的工作。近日,F(xiàn)acebook發(fā)文總結(jié)了去年在長期研究項(xiàng)目、高性能工具開發(fā)和平臺(tái)開發(fā)以及AI的實(shí)際應(yīng)用等各個(gè)方面的工作。
隨著研究和工程實(shí)踐的深入,實(shí)現(xiàn)了更強(qiáng)大的智能系統(tǒng)、更優(yōu)秀的開源工具、更穩(wěn)定高效的開源平臺(tái),諸多的研究論文和模型代碼為深度學(xué)習(xí)研究做出了眾多貢獻(xiàn)。同時(shí),還將AI應(yīng)用到了醫(yī)學(xué)和社會(huì)生活等領(lǐng)域,讓技術(shù)真正造福人類。那么,就讓我們一起看下這些工作都有哪些吧!
基于半監(jiān)督和無監(jiān)督學(xué)習(xí)的先進(jìn)AI技術(shù)
實(shí)現(xiàn)人類水平的人工智能是每個(gè)從業(yè)者和研究人員最終的目標(biāo)。在過去的一年,F(xiàn)acebook的研究人員利用更少的數(shù)據(jù)實(shí)現(xiàn)了更復(fù)雜的功能,讓人工智能的目標(biāo)又近了一步。目前大多數(shù)機(jī)器學(xué)習(xí)都基于大量標(biāo)記數(shù)據(jù)通過監(jiān)督學(xué)習(xí)的方式來實(shí)現(xiàn)特定的任務(wù),但耗時(shí)的數(shù)據(jù)標(biāo)記工作極大地限制了技術(shù)的發(fā)展。所以如何充分釋放半監(jiān)督和無監(jiān)督學(xué)習(xí)的潛力,減少智能系統(tǒng)對(duì)于數(shù)據(jù)量的需求至關(guān)重要。在多語言理解和翻譯系統(tǒng)中,研究人員提出一種新的方法,基于無監(jiān)督數(shù)據(jù)實(shí)現(xiàn)自然機(jī)器翻譯模型自動(dòng)訓(xùn)練遷移,并達(dá)到了與監(jiān)督數(shù)據(jù)相比擬的效果。通過減少對(duì)于大規(guī)模標(biāo)記數(shù)據(jù)的依賴,這一系統(tǒng)打開了向更多語言遷移的技術(shù)大門,甚至可以用于像烏爾都語一樣標(biāo)記數(shù)據(jù)十分有限的語言。
多種語言的二維詞向量嵌入空間可以通過簡單的變換實(shí)現(xiàn)匹配。
此外,對(duì)于數(shù)據(jù)集資源有限的語言來說,需要用多種技術(shù)手段來實(shí)現(xiàn)。使用多語言模型融合同一語系多種方言間的相似性。通過多種技術(shù)的綜合,研究人員在自動(dòng)翻譯系統(tǒng)中成功的新增了24種語言。同時(shí)在與紐約大學(xué)的合作中,在MutilNLI數(shù)據(jù)集中新增了14中語言,將有效助力自然語言理解的研究進(jìn)程。同時(shí),還發(fā)布了跨語言推理數(shù)據(jù)集XNLI,其中包括了烏爾都語和斯瓦希里語兩種小語種。利用半監(jiān)督和非監(jiān)督的方式有效減少了對(duì)于監(jiān)督訓(xùn)練數(shù)據(jù)的需求。研究人員還探索了數(shù)據(jù)監(jiān)督的方式,結(jié)合監(jiān)督和非監(jiān)督數(shù)據(jù),通過數(shù)據(jù)蒸餾的方法實(shí)現(xiàn)半監(jiān)督學(xué)習(xí)。另外值得一提的是,研究人員探索了基于圖像標(biāo)簽的圖像識(shí)別系統(tǒng),創(chuàng)造性的利用現(xiàn)存的、非傳統(tǒng)標(biāo)注的數(shù)據(jù)生成了大規(guī)模的自標(biāo)記訓(xùn)練數(shù)據(jù)集,其中包括了35億張來自Instagram的圖像。用戶為照片標(biāo)記的標(biāo)簽可以為圖像提供更為豐富的信息,將現(xiàn)存的圖像轉(zhuǎn)變?yōu)槿醣O(jiān)督數(shù)據(jù)樣本。結(jié)果表明,這些手段不僅有效地提升了基于圖像的任務(wù)表現(xiàn),更將圖像識(shí)別模型的準(zhǔn)確率推高了1%。
圖像標(biāo)簽可幫助計(jì)算機(jī)學(xué)習(xí)到比通常分類更為細(xì)的子分類信息,并補(bǔ)充圖中元素的信息。
加速AI研究產(chǎn)品化進(jìn)程
AI作為一種基礎(chǔ)能力已經(jīng)在產(chǎn)品的方方面面得到體現(xiàn)。2018年Facebook最主要的工作也集中在如何將AI方面的研究成果盡可能的產(chǎn)品化并部署到系統(tǒng)中,主要體現(xiàn)在PyTroch平臺(tái)和一系列工具的開發(fā)上。PyTroch自2018年發(fā)布以來已經(jīng)躍居為GitHub上增長第二的開源項(xiàng)目。其靈活的接口對(duì)于研究AI研究的快速迭代十分友好,同時(shí)開源的框架設(shè)計(jì)有助平臺(tái)包容并蓄快速迭代和發(fā)展。隨著代碼體系的不斷完善,今年發(fā)布的PyTorch1.0實(shí)現(xiàn)了產(chǎn)品級(jí)別的框架,涵蓋了從原型研究到服務(wù)部署的全套流程。
包括Google、微軟和英偉達(dá)在內(nèi)的大廠以及Fast.ai、Udacity等教育機(jī)構(gòu)都在使用PyTorch來實(shí)現(xiàn)研究、產(chǎn)品開發(fā)和教育過程。近日,發(fā)布完整版的PyTorch1.0涵蓋了混合前端的新特性,可以在圖模式和eager模式下無縫切換,同時(shí)改進(jìn)了分布式訓(xùn)練流程,為高性能研究用戶提供了純cpp的編程接口。
研究人員也基于PyTorch開發(fā)了包括 QNNPACK 、FBGEMM等工具庫,使得移動(dòng)端和服務(wù)器更容易地運(yùn)行最新的AI模型。
同時(shí)開發(fā)了PyText,加速了自然語言處理的研究發(fā)展。
在強(qiáng)化學(xué)習(xí)方面,F(xiàn)acebook開發(fā)了Horizon框架,利用強(qiáng)化學(xué)習(xí)在大規(guī)模生成系統(tǒng)中進(jìn)行優(yōu)化。它吸收了研究領(lǐng)域大量使用的基于決策的方式,并應(yīng)用于十億級(jí)別的數(shù)據(jù)集上。在部署了這套框架后,使得優(yōu)化視頻流和信息流更為高效。這套工具的開源搭建了強(qiáng)化學(xué)習(xí)研究和產(chǎn)品化之間的橋梁。
Horizon的流程圖解。首先對(duì)系統(tǒng)中的數(shù)據(jù)進(jìn)行預(yù)處理,隨后離線訓(xùn)練模型測(cè)量、最后對(duì)策略進(jìn)行部署和測(cè)試,并循環(huán)改進(jìn)整個(gè)流程。
為了加速機(jī)器學(xué)習(xí)的運(yùn)算過程,另一個(gè)稱為Glow的開源項(xiàng)目銜接了不同的編譯器、硬件平臺(tái)和深度學(xué)習(xí)框架,通過與廠家合作開發(fā),在Intel,Cadence, Esperanto, Marvell,Qualcomm 等平臺(tái)上實(shí)現(xiàn)了高效的加速。
作為Open Computer Project的一部分,F(xiàn)acebook還推出了面向工業(yè)界機(jī)器學(xué)習(xí)用戶的Big Basin v2。
在VR/AR方面,研究人員結(jié)合深度學(xué)習(xí)進(jìn)行了更深入的研究,在DeepFocus項(xiàng)目中發(fā)布了數(shù)據(jù)和模型。利用深度學(xué)習(xí)算法渲染出VR中的真實(shí)場(chǎng)景,包括了變焦多焦距和光場(chǎng)效果的智能渲染等。
用AI造福人類
將技術(shù)廣泛應(yīng)用于改善人類生活的方方面面是每個(gè)技術(shù)從業(yè)者的追求。Facebook在過去一年——利用音頻視覺描述技術(shù)幫助視覺障礙的人,同時(shí)基于跨語言的自然語言處理和文本分析預(yù)測(cè)用戶的自殺傾向,及時(shí)拯救更多的人。
同時(shí),研究人員還利用AI迅速精確地計(jì)量自然災(zāi)害地區(qū)的受損狀況。為災(zāi)難救援、受損評(píng)估和災(zāi)后重建提供了高效準(zhǔn)確定量的手段。
此外通過機(jī)器學(xué)習(xí)技術(shù),研究人員還開發(fā)出了Rosetta系統(tǒng),用于檢測(cè)圖像和視頻中的文本信息,并能在多種語言間進(jìn)行語義的合規(guī)性檢查,大大減少了人工成本以及不良言論的出現(xiàn)和傳播。
Rosetta文本檢測(cè)的兩步架構(gòu)
最后在醫(yī)學(xué)影像方面,fastMRI項(xiàng)目加速了核磁共振影像的檢測(cè)速度,加速了深度學(xué)習(xí)技術(shù)向醫(yī)學(xué)領(lǐng)域的遷移和發(fā)展。項(xiàng)目不僅發(fā)布了充足的數(shù)據(jù)集,同時(shí)也開源了基本模型供來自世界各地的研究人員學(xué)習(xí)改進(jìn)。
核磁共振的原始數(shù)據(jù)和重建后膝蓋圖像
過去的一年里,研究人員還改進(jìn)了Getafix, predictive test selection, SapFix, Sapienz, and Spiral等等一系列系統(tǒng),提高了SLAM和AI in Marketplace等技術(shù)在產(chǎn)品中的應(yīng)用,并發(fā)表了一系列研究成果,包括了著名的wav2letter++, 結(jié)合多詞的表示, 以及multilingual embeddings, 和audio processing等工作。
在新的一年里,更加扎實(shí)的工作和研究將在基礎(chǔ)設(shè)施研究、高精尖應(yīng)用和AI造福社會(huì)等方面展開。希望2019,F(xiàn)acebook能帶來更多優(yōu)秀的研究成果和高效的開源工具,推動(dòng)AI技術(shù)更好發(fā)展。
-
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
525瀏覽量
38783 -
人工智能
+關(guān)注
關(guān)注
1803文章
48381瀏覽量
244431 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1307瀏覽量
24875
原文標(biāo)題:別人家的盤點(diǎn) | Facebook 2018 AI研究全回顧
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
直播回顧 技術(shù)解答 | 思瑞浦AI服務(wù)器應(yīng)用方案

全志AIOT系列芯片助力AI玩具百花齊放
中軟國際攜手華為推出政務(wù)AI全棧解決方案
MWC 2025 | 廣和通發(fā)布全矩陣AI解決方案“星云”系列,創(chuàng)新變革端側(cè)AI

評(píng)論