隨著移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速普及,全球數(shù)據(jù)總量呈指數(shù)級增長。據(jù)雷鋒網(wǎng)統(tǒng)計,我們每天創(chuàng)造約2.3萬億GB數(shù)據(jù)。
過去,人們對海量數(shù)據(jù)無從下手。隨著大數(shù)據(jù)與人工智能、云計算、物聯(lián)網(wǎng)、區(qū)塊鏈等前沿技術(shù)的緊密融合以及硬件基礎(chǔ)設(shè)施的快速發(fā)展,這些新興技術(shù)為數(shù)據(jù)增值提供了強有力保障,由此帶來了巨大商業(yè)應用價值,并逐漸成為各國搶占下一步發(fā)展機遇的戰(zhàn)略性技術(shù)。
最近,美國政府啟動了大數(shù)據(jù)研究計劃,致力于提升大數(shù)據(jù)分析算法和系統(tǒng)的效率;同時,日本對信息產(chǎn)業(yè)提出新的戰(zhàn)略規(guī)劃,將大數(shù)據(jù)作為重點發(fā)展的科技領(lǐng)域,著重強調(diào)數(shù)據(jù)采集與分析;近年來,我國大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展。中國信通院在2018年發(fā)布的《大數(shù)據(jù)白皮書》進一步調(diào)動了全國各地發(fā)展大數(shù)據(jù)的積極性,各行各業(yè)開始利用大數(shù)據(jù)進行智能升級轉(zhuǎn)型。
在大數(shù)據(jù)技術(shù)中,數(shù)據(jù)分析逐漸成為其核心技術(shù),包括對數(shù)據(jù)處理的實時性成為工業(yè)界的主要需求。當前,各種數(shù)據(jù)分析技術(shù)層出不窮。其中,最為引人關(guān)注的當屬深度學習技術(shù)。
一、深度學習是最好的方法之一
深度學習仍是目前大數(shù)據(jù)處理與分析的最好方法之一。
深度學習擅于發(fā)掘多維數(shù)據(jù)中錯綜復雜的關(guān)系。基于大數(shù)據(jù)的深度學習算法在計算機視覺、自然語言處理以及信息檢索等多個領(lǐng)域不斷刷新著記錄。
在這個數(shù)據(jù)為王的時代,深度學習中的監(jiān)督/半監(jiān)督學習與數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量等有很大關(guān)系,因此數(shù)據(jù)標注是在現(xiàn)實場景中提升模型性能的最直接有效的方法。
但由于傳統(tǒng)的數(shù)據(jù)集數(shù)量/質(zhì)量有限,在解決新的問題或是想要獲得更好的效果時,往往需要進行額外的數(shù)據(jù)標注。因此,對于數(shù)據(jù)要求不那么高的半監(jiān)督/弱監(jiān)督學習一直是視覺大數(shù)據(jù)處理中的熱點問題。同時,當使用某數(shù)據(jù)集訓練了一個很好的模型,但在實際應用時,往往由于“領(lǐng)域鴻溝”(domain gap)的存在,模型性能大幅度下降,遷移學習是這一問題的常用解決思路。
此外,由于移動設(shè)備或物聯(lián)網(wǎng)設(shè)備的存儲和計算資源有限,無法像服務器一樣輕松地運行訓練好的模型,限制了深度學習技術(shù)在大數(shù)據(jù)領(lǐng)域的應用落地,針對此問題,目前有效的解決方案包括模型壓縮、計算加速。
生成對抗網(wǎng)絡Generative Adversarial Networks (GANs)的提出,為神經(jīng)網(wǎng)絡添加了一個新的分支。該網(wǎng)絡結(jié)構(gòu)能極大提高圖像生成的質(zhì)量,進一步推動了計算機視覺領(lǐng)域的發(fā)展。
近幾年,計算機視覺正在向視頻理解領(lǐng)域延伸,而視頻比圖像多了一維時序信息,如何有效建模并利用這一時序信息是處理這類問題的關(guān)鍵。
深度強化學習是大數(shù)據(jù)時代的另一研究熱點,強化學習是主體通過與外部環(huán)境交互來進行學習的過程。目前已經(jīng)取得了實質(zhì)性的突破,2017年DeepMind公司的提出的AlphaGo Zero通過自我博弈的強化深度學習算法進行訓練,經(jīng)過3天的學習,以100:0的成績超越了AlphaGo Lee的實力(以4:1戰(zhàn)勝李世石的版本),21天后達到了AlphaGo Master的水平,并在40天內(nèi)超過了所有之前的版本。
自2017年以來,AutoML(Automated machine learning)迅速興起,AutoML試圖將特征提取、模型優(yōu)化、參數(shù)調(diào)節(jié)等重要步驟進行自動化地學習,使得機器學習模型無需人工干預即可被應用。但目前其在搜索效率、實際應用等方面有待進一步探索。
二、計算機視覺
計算機視覺是人工智能領(lǐng)域最為成熟的技術(shù)之一,其主旨在于利用計算機模擬人類視覺,是人工智能中的‘看’,進而為后續(xù)的應用目標提供判別信息。計算機視覺研究和應用非常廣泛,近幾年取得了快速的發(fā)展,其應用已經(jīng)在政府、金融、互聯(lián)網(wǎng)等行業(yè)市場率先落地。
此外,利用大數(shù)據(jù)可以對實體經(jīng)濟行業(yè)進行市場需求分析,優(yōu)化生產(chǎn)流程、供應鏈與物流能源管理,以及提供智能客戶服務等。雖然大數(shù)據(jù)已經(jīng)服務于眾多行業(yè),但是在實際應用中還有很多局限,仍舊有很多問題沒有解決。
近年來,國家對人工智能行業(yè)的大力支持為計算機視覺的發(fā)展提供了有利環(huán)境,極大促進了計算機視覺的商業(yè)化落地。目前我國共有100余家計算機視覺企業(yè),涉獵身份認證、安防影像、醫(yī)療影像等眾多領(lǐng)域。
目前CV公司比較集中的技術(shù)賽道有:人臉識別、自動駕駛、醫(yī)療圖像等,目前商業(yè)化落地最快的仍是人臉識別及其業(yè)務相關(guān)的一些技術(shù)。
縱觀計算機視覺發(fā)展,可以看到中國與西方國家的演進路線的不同。國際上前沿的技術(shù)主要集中在深度學習的基礎(chǔ)研究層面,而中國的計算機視覺技術(shù)更傾向于產(chǎn)業(yè)落地。經(jīng)過多年的沉淀,中國已經(jīng)在人才、數(shù)據(jù)、場景和政策層面做了比較多的儲備,為中國計算機視覺技術(shù)的發(fā)展提供了豐沃的土壤。
尤其是在應用方面。計算機視覺領(lǐng)域一定要通過落地應用才能更好推動學術(shù)的發(fā)展,而中國在這方面具有巨大的優(yōu)勢。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137798 -
深度學習
+關(guān)注
關(guān)注
73文章
5515瀏覽量
121552
發(fā)布評論請先 登錄
相關(guān)推薦
評論