說(shuō)起圖像識(shí)別,人類(lèi)的這一能力非常突出。圖形刺激作用于感覺(jué)器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過(guò)的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過(guò)程叫做圖像再認(rèn)。在圖像識(shí)別中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息。只有通過(guò)存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過(guò)程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。
計(jì)算機(jī)圖像識(shí)別技術(shù),是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。圖像識(shí)別所研究的問(wèn)題,是如何使用計(jì)算機(jī)代替人類(lèi)去自動(dòng)處理大量的物理信息,解決人類(lèi)所無(wú)法識(shí)別或者識(shí)別過(guò)于耗費(fèi)資源的問(wèn)題,從而很大程度上解放人類(lèi)的勞動(dòng)力。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像識(shí)別技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對(duì)圖像識(shí)別時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像識(shí)別過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
為了編制模擬人類(lèi)圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識(shí)別模型,例如模板匹配模型。這種模型認(rèn)為識(shí)別某個(gè)圖像,必須在過(guò)去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的刺激如果能和大腦中的模板相匹配,這個(gè)圖像也就被識(shí)別了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識(shí)別,有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。這種模型認(rèn)為在長(zhǎng)時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無(wú)數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來(lái)的“相似性”就可作為原型,拿它來(lái)檢驗(yàn)所要識(shí)別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識(shí)別了。但是,這種模型沒(méi)有說(shuō)明人是怎樣對(duì)相似的刺激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識(shí)別模型。
-
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
526瀏覽量
38996 -
人工智能
+關(guān)注
關(guān)注
1805文章
48873瀏覽量
247710
原文標(biāo)題:【技術(shù)知識(shí)】什么是圖像識(shí)別技術(shù)?
文章出處:【微信號(hào):jingzhenglizixun,微信公眾號(hào):機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于DSP的快速紙幣圖像識(shí)別技術(shù)研究
圖像識(shí)別模組(包括PCB圖、圖像識(shí)別模組源代碼)
基于DSP的快速紙幣圖像識(shí)別技術(shù)研究

評(píng)論