在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文解析圖像識別技術(shù)的發(fā)展趨勢

電子工程師 ? 來源:陳翠 ? 2019-03-23 09:45 ? 次閱讀

圖像識別技術(shù)的背景

移動互聯(lián)網(wǎng)、智能手機以及社交網(wǎng)絡(luò)的發(fā)展帶來了海量圖片信息,根據(jù)BI五月份的文章,Instagram每天圖片上傳量約為6000萬張;今年2月份WhatsApp每天的圖片發(fā)送量為5億張;國內(nèi)的微信朋友圈也是以圖片分享為驅(qū)動。不受地域和語言限制的圖片逐漸取代了繁瑣而微妙的文字,成為了傳詞達意的主要媒介。圖片成為互聯(lián)網(wǎng)信息交流主要媒介的原因主要在于兩點:

第一,從用戶讀取信息的習(xí)慣來看,相比于文字,圖片能夠為用戶提供更加生動、容易理解、有趣及更具藝術(shù)感的信息;

第二,從圖片來源來看,智能手機為我們帶來方便的拍攝和截屏手段,幫助我們更快的用圖片來采集和記錄信息。

但伴隨著圖片成為互聯(lián)網(wǎng)中的主要信息載體,難題隨之出現(xiàn)。當(dāng)信息由文字記載時,我們可以通過關(guān)鍵詞搜索輕易找到所需內(nèi)容并進行任意編輯,而當(dāng)信息是由圖片記載時,我們卻無法對圖片中的內(nèi)容進行檢索,從而影響了我們從圖片中找到關(guān)鍵內(nèi)容的效率。圖片給我們帶來了快捷的信息記錄和分享方式,卻降低了我們的信息檢索效率。在這個環(huán)境下,計算機的圖像識別技術(shù)就顯得尤為重要。

圖像識別是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。識別過程包括圖像預(yù)處理、圖像分割、特征提取和判斷匹配。簡單來說,圖像識別就是計算機如何像人一樣讀懂圖片的內(nèi)容。借助圖像識別技術(shù),我們不僅可以通過圖片搜索更快的獲取信息,還可以產(chǎn)生一種新的與外部世界交互的方式,甚至?xí)屚獠渴澜绺又悄艿倪\行。百度李彥宏在2011年提到“全新的讀圖時代已經(jīng)來臨”,現(xiàn)在隨著圖形識別技術(shù)的不斷進步,越來越多的科技公司開始涉及圖形識別領(lǐng)域,這標(biāo)志著讀圖時代正式到來,并且將引領(lǐng)我們進入更加智能的未來。

圖像識別的初級階段——娛樂化、工具化

在這個階段,用戶主要是借助圖像識別技術(shù)來滿足某些娛樂化需求。例如,百度魔圖的“大咖配”功能可以幫助用戶找到與其長相最匹配的明星,百度的圖片搜索可以找到相似的圖片;Facebook研發(fā)了根據(jù)相片進行人臉匹配的DeepFace;雅虎收購的圖像識別公司IQ Engine開發(fā)的Glow可以通過圖像識別自動生成照片的標(biāo)簽以幫助用戶管理手機上的照片;國內(nèi)專注于圖像識別的創(chuàng)業(yè)公司曠視科技成立了VisionHacker游戲工作室,借助圖形識別技術(shù)研發(fā)移動端的體感游戲;創(chuàng)視新科技通過圖像識別技術(shù)研發(fā)機器視覺表面檢測系統(tǒng)。

這個階段還有一個非常重要的細分領(lǐng)域——OCR(Optical Character Recognition,光學(xué)字符識別),是指光學(xué)設(shè)備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程,就是計算機對文字的閱讀。語言和文字是我們獲取信息最基本、最重要的途徑。在比特世界,我們可以借助互聯(lián)網(wǎng)和計算機輕松的獲取和處理文字。但一旦文字以圖片的形式表現(xiàn)出來,就對我們獲取和處理文字平添了很多麻煩。這一方面表現(xiàn)為數(shù)字世界中由于特定原因被存儲稱圖片格式的文字;另一方面是我們在現(xiàn)實生活中看到的所有物理形態(tài)的文字。所以我們需要借助OCR技術(shù)將這些文字和信息提取出來。在這方面,國內(nèi)產(chǎn)品包括百度的涂書筆記和百度翻譯等;而谷歌借助經(jīng)過DistBelief 訓(xùn)練的大型分布式神經(jīng)網(wǎng)絡(luò),對于Google 街景圖庫的上千萬門牌號的識別率超過90%,每天可識別百萬門牌號。

在這個階段,圖像識別技術(shù)僅作為我們的輔助工具存在,為我們自身的人類視覺提供了強有力的輔助和增強,帶給了我們一種全新的與外部世界進行交互的方式。我們可以通過搜索找到圖片中的關(guān)鍵信息;可以隨手拍下一件陌生物體而迅速找到與之相關(guān)的各類信息;可以將潛在搭訕對象拍下提前去她的社交網(wǎng)絡(luò)了解一番;也可以將人臉識別作為主要的身份認證方式……這些應(yīng)用雖然看起來很普通,但當(dāng)圖像識別技術(shù)滲透到我們行為習(xí)慣的方方面面時,我們就相當(dāng)于把一部分視力外包給了機器,就像我們已經(jīng)把部分記憶外包給了搜索引擎一樣。

這將極大改善我們與外部世界的交互方式,此前我們利用科技工具探尋外部世界的流程是這樣:人眼捕捉目標(biāo)信息、大腦將信息進行分析、轉(zhuǎn)化成機器可以理解的關(guān)鍵詞、與機器交互獲得結(jié)果。而當(dāng)圖像識別技術(shù)賦予了機器“眼睛”之后,這個過程就可以簡化為:人眼借助機器捕捉目標(biāo)信息、機器和互聯(lián)網(wǎng)直接對信息進行分析并返回結(jié)果。圖像識別使攝像頭成為解密信息的鑰匙,我們僅需把攝像頭對準(zhǔn)某一未知事物,就能得到預(yù)想的答案。就像百度科學(xué)家余凱所說,攝像頭成為連接人和世界信息的重要入口之一。

圖像識別的高級階段——擁有視覺的機器

上文提到,目前的圖像識別技術(shù)是作為一個工具來幫助我們與外部世界進行交互,只為我們自身的視覺提供了一個輔助作用,所有的行動還需我們自己完成。而當(dāng)機器真正具有了視覺之后,它們完全有可能代替我們?nèi)ネ瓿蛇@些行動。目前的圖像識別應(yīng)用就像是盲人的導(dǎo)盲犬,在盲人行動時為其指引方向;而未來的圖像識別技術(shù)將會同其他人工智能技術(shù)融合在一起成為盲人的全職管家,不需要盲人進行任何行動,而是由這個管家?guī)椭渫瓿伤惺虑?。舉個例子,如果圖像識別是一個工具,就如同我們在駕駛汽車時佩戴谷歌眼鏡,它將外部信息進行分析后傳遞給我們,我們再依據(jù)這些信息做出行駛決策;而如果將圖像識別利用在機器視覺和人工智能上,這就如同谷歌的無人駕駛汽車,機器不僅可以對外部信息進行獲取和分析,還全權(quán)負責(zé)所有的行駛活動,讓我們得到完全解放。

《人工智能:一種現(xiàn)代方法》中提到,在人工智能中,感知是通過解釋傳感器的響應(yīng)而為機器提供它們所處的世界的信息,其中它們與人類共有的感知形態(tài)包括視覺、聽覺和觸覺,而視覺最為重要,因為視覺是一切行動的基礎(chǔ)。在一次論壇上百度IDL的余凱院長問大家,你覺得哪種感覺最重要?沒有人能很快作答,后來余凱院長換了個提問方式,如果要放棄一種感覺,你最不愿意放棄的是那一種?這時大家都回答是視覺。Chris Frith在《心智的構(gòu)建》中提到,我們對世界的感知不是直接的,而是依賴于“無意識推理”,也就是說在我們能感知物體之前,大腦必須依據(jù)到達感官的信息來推斷這個物體可能是什么,這構(gòu)成了人類最重要的預(yù)判和處理突發(fā)時間的能力。而視覺是這個過程中最及時和準(zhǔn)確的信息獲取渠道,人類感覺信息中的80%都是視覺信息。機器視覺之于人工智能的意義就是視覺之于人類的意義,而決定著機器視覺的就是圖像識別技術(shù)。

更重要的是,在某些應(yīng)用場景,機器視覺比人類的生理視覺更具優(yōu)勢,它更加準(zhǔn)確、客觀和穩(wěn)定。人類視覺有著天然的局限,我們看起來能立刻且毫無費力的感知世界,而且似乎也能詳細生動的感知整個視覺場景,但這只是一個錯覺,只有投射到眼球中心的視覺場景的中間部分,我們才能詳細而色彩鮮明的看清楚。偏離中間大約10度的位置,神經(jīng)細胞更加分散并且智能探知光和陰影。也就是說,在我們視覺世界的邊緣是無色、模糊的。因此,我們才會存在“變化盲視”,才會在經(jīng)歷著多樣事物發(fā)生時,僅僅關(guān)注其中一樣,而忽視了其他樣事物的發(fā)生,而且不知道它們的發(fā)生。而機器在這方面就有著更多的優(yōu)勢,它們能夠發(fā)現(xiàn)和記錄視力所及范圍內(nèi)發(fā)生的所有事情。拿應(yīng)用最廣的視頻監(jiān)控來說,傳統(tǒng)監(jiān)控需要有人在電視墻前時刻保持高度警惕,然后再通過自己對視頻的判斷來得出結(jié)論,但這往往會因為人的疲勞、視覺局限和注意力分散等原因影響監(jiān)控效果。但有了成熟的圖像識別技術(shù)之后,再加以人工智能的支持,計算機就可以自行對視頻進行分析和判斷,發(fā)現(xiàn)異常情況直接報警,帶來了更高的效率和準(zhǔn)確度;在反恐領(lǐng)域,借助機器的人臉識別技術(shù)也要遠遠優(yōu)于人的主觀判斷。

許多科技巨頭也開始了在圖像識別和人工智能領(lǐng)域的布局,F(xiàn)acebook簽下的人工智能專家Yann LeCun最重大的成就就是在圖像識別領(lǐng)域,其提出的LeNet為代表的卷積神經(jīng)網(wǎng)絡(luò),在應(yīng)用到各種不同的圖像識別任務(wù)時都取得了不錯效果,被認為是通用圖像識別系統(tǒng)的代表之一;Google 借助模擬神經(jīng)網(wǎng)絡(luò)“DistBelief”通過對數(shù)百萬份YouTube 視頻的學(xué)習(xí)自行掌握了貓的關(guān)鍵特征,這是機器在沒有人幫助的情況下自己讀懂了貓的概念。值得一提的是,負責(zé)這個項目的Andrew NG已經(jīng)轉(zhuǎn)投百度領(lǐng)導(dǎo)百度研究院,其一個重要的研究方向就是人工智能和圖像識別。這也能看出國內(nèi)科技公司對圖像識別技術(shù)以及人工智能技術(shù)的重視程度。

圖像識別技術(shù),連接著機器和這個一無所知的世界,幫助它越發(fā)了解這個世界,并最終代替我們完成更多的任務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    526

    瀏覽量

    38966
  • 圖像識別技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    30

    瀏覽量

    6315

原文標(biāo)題:圖像識別技術(shù)的應(yīng)用及發(fā)展趨勢

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    數(shù)字圖像與視頻壓縮編碼技術(shù)發(fā)展趨勢

    數(shù)字圖像與視頻壓縮編碼技術(shù)發(fā)展趨勢 隨著網(wǎng)絡(luò)和終端的發(fā)展,億萬的圖像與視頻聚集在起,這將是研究云壓縮
    發(fā)表于 09-25 16:11

    基于DSP的快速紙幣圖像識別技術(shù)研究

    技術(shù),并根據(jù)具體系統(tǒng)特性對現(xiàn)有的識別算法進行分析、優(yōu)化和改進,以最終形成具有創(chuàng)新性、實用性和快速性特點的算法。這算法的研究與實現(xiàn),對于推動圖像識別
    發(fā)表于 11-05 14:43

    新興的半導(dǎo)體技術(shù)發(fā)展趨勢

    /編譯楊碩王家農(nóng)在網(wǎng)絡(luò)無處不在、IP無處不在和無縫移動連接的總趨勢下,國際半導(dǎo)體技術(shù)路線圖(ITRS)項目組在他們的15年半導(dǎo)體技術(shù)發(fā)展預(yù)測中認為,隨著
    發(fā)表于 07-24 08:21

    CMOS圖像傳感器的現(xiàn)狀和發(fā)展趨勢

    CMOS圖像傳感器的現(xiàn)狀和發(fā)展趨勢
    發(fā)表于 01-23 16:25

    談?wù)劯咚貱MOS圖像傳感器及發(fā)展趨勢

    談?wù)劯咚貱MOS圖像傳感器及發(fā)展趨勢
    發(fā)表于 06-03 06:04

    簡單介紹圖像識別技術(shù)在各類行業(yè)的應(yīng)用

    其實對于圖像識別技術(shù),大家已經(jīng)不陌生,人臉識別、虹膜識別、指紋識別等都屬于這個范疇,但是圖像識別
    的頭像 發(fā)表于 01-23 11:26 ?3.5w次閱讀

    讀懂圖像識別,真的前景不可限量?

    圖像識別技術(shù)人工智能 圖像識別技術(shù)是人工智能的個重要領(lǐng)域。它是指對圖像進行對象
    發(fā)表于 08-21 17:25 ?845次閱讀

    圖像識別技術(shù) 推動智能科技時代發(fā)展

    隨著圖像識別技術(shù)的不斷發(fā)展和應(yīng)用,圖像識別概念,我相信大家都有所了解,知道它是什么,簡單來件,就是對圖像進行
    的頭像 發(fā)表于 06-18 10:22 ?3830次閱讀

    AI圖像識別技術(shù)的原理解析

    伴隨著圖像處理技術(shù)的飛速發(fā)展,推動了圖像識別技術(shù)的產(chǎn)生和發(fā)展,并逐漸成為人工智能領(lǐng)域中重要的組成
    發(fā)表于 07-17 09:54 ?3.5w次閱讀

    圖像識別技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用

    隨著計算機技術(shù)的進步,以圖像識別為代表的人工智能技術(shù)得以迅速發(fā)展并被廣泛用于航空、醫(yī)學(xué)等多個領(lǐng)域。今天,圖像識別
    發(fā)表于 03-19 15:02 ?5680次閱讀

    圖像識別技術(shù)原理 深度學(xué)習(xí)的圖像識別應(yīng)用研究

      圖像識別是人工智能領(lǐng)域的個重要方向。經(jīng)過多年的研究,圖像識別技術(shù)取得了定的研究進展。圖像識別
    發(fā)表于 07-19 10:27 ?4次下載

    圖像識別技術(shù)原理 圖像識別技術(shù)的應(yīng)用領(lǐng)域

    圖像識別技術(shù)種通過計算機對圖像進行分析和理解的技術(shù)。它借助計算機視覺、模式識別、人工智能等相
    的頭像 發(fā)表于 02-02 11:01 ?3726次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領(lǐng)域的個重要分支。 圖像識別概述 1.1 定義 圖像識別
    的頭像 發(fā)表于 07-16 10:44 ?1918次閱讀

    圖像識別技術(shù)的原理是什么

    圖像識別技術(shù)種利用計算機視覺和機器學(xué)習(xí)技術(shù)圖像進行分析和理解的技術(shù)。它可以幫助計算機
    的頭像 發(fā)表于 07-16 10:46 ?2412次閱讀

    圖像識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    、引言 圖像識別技術(shù)種利用計算機視覺技術(shù)圖像進行分析和處理的
    的頭像 發(fā)表于 07-16 10:48 ?1956次閱讀
    主站蜘蛛池模板: 免费毛片网站在线观看 | 国产精品7m凸凹视频分类大全 | 黄色一区二区三区 | 性色视频在线观看 | 欧美三级在线观看黄 | 色网站在线播放 | 亚洲操操操| 亚洲一级色片 | 天天干天天干天天干天天 | 97精品伊人久久大香线蕉 | 亚洲 欧美 91 | 欧美极品在线视频 | 亚洲人在线 | 欧美黑人换爱交换乱理伦片 | 天天影视欧美综合在线观看 | 国产哺乳期奶水avav | 欧美黑人换爱交换乱理伦片 | 日操夜操 | 天天操天天干天搞天天射 | 热re久久精品国产99热 | 免费人成观看在线网 | 夜夜爱夜夜操 | 天堂在线观看免费视频 | 亚洲资源最新版在线观看 | 欧美freesex10一13| 狠狠操天天 | 超黄视频在线观看 | 88xx成人永久免费观看 | 免费视频在线视频观看1 | 亚洲啪啪免费视频 | 成人亚洲电影 | 成人亚洲欧美在线电影www色 | 国产午夜毛片v一区二区三区 | 91色在线播放 | 午夜网站免费版在线观看 | 国产精品国产主播在线观看 | 热re66久久精品国产99热 | 欧美一级日韩在线观看 | 久久成人综合 | 被公侵犯肉体中文字幕一区二区 | 男女网站在线观看 |