ICR技術(shù)簡介
一、智能字符識(shí)別(ICR)技術(shù)的源由
紙和筆是人類迄今為止使用最廣泛、表達(dá)最方便的信息描述方式,手寫是一種自然的、大家都熟悉的記錄方式。計(jì)算機(jī)信息系統(tǒng)的出現(xiàn),使人們可以存儲(chǔ)和處理大量的計(jì)算機(jī)文本數(shù)據(jù),但這也不能替代人們使用筆在紙上的自然書寫習(xí)慣。人們用紙和筆書寫的信息,計(jì)算機(jī)系統(tǒng)不能識(shí)別,不能在計(jì)算機(jī)系統(tǒng)內(nèi)應(yīng)用,智能字符識(shí)別(ICR)技術(shù)就是解決將手寫體字符轉(zhuǎn)換成計(jì)算機(jī)可以識(shí)別的計(jì)算機(jī)字符的技術(shù)。
二、智能字符識(shí)別(ICR)技術(shù)的分類
從識(shí)別的手寫體字符的來源來分,智能字符識(shí)別(ICR)技術(shù)又分為兩類:靜態(tài)ICR識(shí)別和動(dòng)態(tài)ICR識(shí)別。
靜態(tài)ICR技術(shù),識(shí)別的手寫體原始文稿通過光電掃描儀等輸入設(shè)備轉(zhuǎn)換成原始的二維圖象信號(hào),可以是灰度圖象(grayscaleimage)或二值圖象(binaryimage),他處理的數(shù)據(jù)被稱為靜態(tài)數(shù)據(jù)。
動(dòng)態(tài)ICR技術(shù),接受的手寫信息是一些列以時(shí)序排列的二維筆跡坐標(biāo)信息,包括運(yùn)筆時(shí)間、筆畫順序、筆畫坐標(biāo)等,他處理的數(shù)所被稱為動(dòng)態(tài)數(shù)據(jù)。
動(dòng)態(tài)ICR技術(shù)比靜態(tài)ICR技術(shù)的識(shí)別率要高。動(dòng)態(tài)信息比之靜態(tài)信息的優(yōu)點(diǎn)在于:動(dòng)態(tài)數(shù)據(jù)保存了靜態(tài)數(shù)據(jù)丟失的關(guān)于筆跡的動(dòng)態(tài)信息(如運(yùn)筆順序),而動(dòng)態(tài)信息是提高識(shí)別率的重要因素;同時(shí)識(shí)別靜態(tài)信息時(shí)不能有效地區(qū)分出紙上的字符信息和其它信息(如書寫方格和輔助線等),而動(dòng)態(tài)數(shù)據(jù)直接就是手寫字符信息,所以不會(huì)產(chǎn)生混淆。
三、影響識(shí)別率的因素
識(shí)別率是ICR技術(shù)研究的重要環(huán)節(jié),影響識(shí)別率的因素也是ICR技術(shù)研究中的難點(diǎn),目前影響識(shí)別率的因素主要有以下幾個(gè)方面:
1.筆順問題
由于不同人具有不同的書寫習(xí)慣,筆劃的書寫順序經(jīng)常發(fā)生變化,因此,單純通過串匹配進(jìn)行識(shí)別難以達(dá)到理想效果。對(duì)漢字進(jìn)行描述時(shí),僅僅采用一維串也就顯得不夠,必須利用一些二維方法來描述,從而又極大地增加了匹配的難度。
2.連筆問題
一般人寫字時(shí)都不會(huì)一筆一劃地書寫,為了節(jié)省時(shí)間,連筆字是自然而然的事情,一些行書連筆甚至完全脫離了楷書的框架。從實(shí)用角度講,連筆問題比筆順問題具有更重要的意義。對(duì)于結(jié)構(gòu)識(shí)別而言,連筆一方面使筆劃種類大大增加,甚至達(dá)到難以歸納的程度;另一方面,連筆又使得筆段抽取難度大增,因?yàn)檫B筆會(huì)增加一些冗余筆段,連筆造成的畸變又會(huì)使筆段方向嚴(yán)重離散。
3.相似字區(qū)分
漢字種類繁多,很多漢字彼此之間非常相似,例如“己、已、巳”三個(gè)字相差只在細(xì)微之間。手寫漢字的變形十分嚴(yán)重,怎樣能使識(shí)別系統(tǒng)抓住微小的差別,目前還是一個(gè)非常值得研究的問題。
4.對(duì)抗干擾能力的要求
抗干擾能力,也稱為魯棒性,對(duì)于手寫識(shí)別系統(tǒng)的性能是非常重要的。書寫時(shí)候,筆劃的畸變、丟失,多余筆段(如筆鋒)的插入,字的傾斜,部件間相對(duì)位置、大小的變化,這些都是經(jīng)常發(fā)生的現(xiàn)象。對(duì)于結(jié)構(gòu)識(shí)別來說,會(huì)造成基元提取和識(shí)別的錯(cuò)誤。要想取得好的性能,必須對(duì)傳統(tǒng)識(shí)別方法進(jìn)行改進(jìn),增強(qiáng)其魯棒性,從而增加實(shí)用性。
四、ICR的發(fā)展歷史
ICR的發(fā)展歷史可以追溯到本世紀(jì)50年代,伴隨著手寫板硬件(一種捕捉筆尖軌跡的數(shù)字化儀)的出現(xiàn),人們開始研究手寫字符識(shí)別技術(shù)。到80年代后期,手寫字符識(shí)別技術(shù)的研究已經(jīng)朝著實(shí)用的方向努力,特別是英文,已經(jīng)開始研究完全無限制的整句識(shí)別技術(shù)。
ICR漢字識(shí)別技術(shù)相對(duì)起步較晚。1981年,IBM公司E.F.Yhap等推出了第一套較為成熟的ICR漢字識(shí)別系統(tǒng)。當(dāng)時(shí)對(duì)920個(gè)漢字的實(shí)驗(yàn)結(jié)果時(shí)正確率91.1%,對(duì)2260個(gè)測試,識(shí)別率為79.9%(第一次使用)。書寫者要求使用工整楷書。
國內(nèi)蒙恬科技公司是最早從事漢字識(shí)別技術(shù)研究、開發(fā)、生產(chǎn)的公司之一,在1991年,就正式推出手寫漢字識(shí)別系統(tǒng)。
中科院在1988年提出利用筆段為基元的聯(lián)機(jī)手寫漢字識(shí)別技術(shù)。由于對(duì)整個(gè)字形進(jìn)行采樣后分析,在識(shí)別速度上不如按筆順采樣計(jì)算識(shí)別快。
目前,國外一些大公司也開始注意ICR漢字識(shí)別這一領(lǐng)域。Motolora、Microsoft、Apple等大公司均已經(jīng)投資于該方向的研究。
五、優(yōu)士通ICR技術(shù)的應(yīng)用
優(yōu)士通技術(shù)主要是紙筆數(shù)字化應(yīng)用技術(shù),他必然會(huì)用到ICR技術(shù),以建立紙筆手寫與計(jì)算機(jī)信息之間的有效橋梁。優(yōu)士通技術(shù)采用的是動(dòng)態(tài)ICR技術(shù),可以對(duì)漢字進(jìn)地有效的識(shí)別。通過設(shè)置識(shí)別區(qū)域、識(shí)別格式等,有效進(jìn)行識(shí)別預(yù)定義,并結(jié)合動(dòng)態(tài)ICR技術(shù)的動(dòng)態(tài)數(shù)據(jù),優(yōu)士通ICR技術(shù)可以進(jìn)行有效的漢字識(shí)別。
隨著優(yōu)士通技術(shù)的不斷發(fā)展,優(yōu)士通對(duì)ICR技術(shù)的采用及研究也將不斷進(jìn)步和完善!
評(píng)論