在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OCR識別技術(shù)

新機器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀

在爬蟲對驗證碼進行破解時,經(jīng)常需要對圖片中的文字內(nèi)容進行識別,這時就需要用到OCR技術(shù)了,那么 OCR識別技術(shù)是如何實現(xiàn)對文字內(nèi)容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學字符識別技術(shù),實質(zhì)屬于計算機輸入技術(shù)。OCR通過利用光學技術(shù)與計算機技術(shù)對圖片、紙張、物體等處的文本內(nèi)容進行分析識別,并讀取轉(zhuǎn)換成計算機和人類都能理解接受的格式。

OCR主要可以分為手寫體識別和印刷體識別。

由于印刷體都是計算機自助生成再進行輸出,通常較為規(guī)律,因此較手寫體識別來說要更簡單。而手寫體由于往往會帶有個人特色,每個人的風格不盡相同,由于其千人千面的特性,手寫體識別也成了OCR界一直想攻克的難關(guān)。當然,除了手寫體與印刷體外,OCR也可以根據(jù)識別內(nèi)容來分類。例如按語言分類,要識別的內(nèi)容將可能包括漢語、英語、日語、法語等,而如果僅滿足國人需求,要識別的內(nèi)容就可能會包括漢字、英文字母、阿拉伯數(shù)字、標點符號等。

通常根據(jù)要識別的內(nèi)容不同,識別的難度也不同。比如僅識別阿拉伯數(shù)字,只需能識別出0-9,而英文字母則需要識別52個字符(僅考慮大小寫),而中文識別則會高達數(shù)千個,且由于漢字的結(jié)構(gòu)偏旁較為復雜,要將這些字符都準確識別出來會使難度系數(shù)直線上升。一個典型的OCR技術(shù)處理流程如下圖所示:

圖:來源于網(wǎng)絡(luò)

其中,圖像預處理通常為能使圖像中的文字更明顯便于識別,會對圖像的成像問題進行修正,通常是基于數(shù)字圖像處理和傳統(tǒng)機器學習等方法對圖像進行操作。

常見的圖像預處理包括幾何變換(透視、翻轉(zhuǎn)、旋轉(zhuǎn)、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強、光線矯正、灰度化、二值化等。其中,在對付驗證碼時常用的灰度化、二值化處理對于內(nèi)容較為簡單的文本信息有增強作用,但對復雜背景的內(nèi)容處理效果就會收效甚微。

文字檢測,顧名思義是對圖片中存在的文字內(nèi)容進行檢測,檢測內(nèi)容包括文本所在的位置、范圍、布局、數(shù)量等,通常也包括整體版面分析和文字行檢測等。部分OCR軟件為了保證檢測范圍的準確性,還會套用圖像檢測的方法,對圖像中的文本區(qū)域進行框選,并像下圖所示將框選與待識別區(qū)域交由令用戶進行校驗確認。

圖:某OCR軟件識別界面

文本檢測完成后,建立在其基礎(chǔ)之上的文本識別將會對選定的文本內(nèi)容進行識別,并將圖像中的字符轉(zhuǎn)化為可供人類和計算機識別的文本信息。文本信息主要需要解決的問題是每個字符是什么。

對于識別后輸出的文本通常需要再次核對驗證以確保其準確率,即文本校正,通常也被認為屬于文字檢測的環(huán)節(jié)。當識別的內(nèi)容是由詞庫中的詞匯構(gòu)成時就稱之為有詞典識別,反之則稱為無詞典識別。在整個處理流程過程中,對識別準確率影響最大的步驟就是文本檢測與文本識別。相比一般文本,通常對OCR技術(shù)的評測會從最終識別率、識別速度、版面理解正確率、版面還原滿意度4方面來作為依據(jù)。

OCR識別技術(shù)對于手寫體識別目前尚在發(fā)展階段,而對于印刷體識別的技術(shù)已經(jīng)發(fā)展的較為純熟。而且,對于印刷體識別的應(yīng)用劃分可能遠比你我想象的更為細致。例如用于對人身份進行核查驗證的證件OCR識別、用于移動支付綁卡的銀行卡OCR識別、用于存儲管理名片的名片OCR識別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識別、用于銀行、金融、電信機構(gòu)的票據(jù)OCR識別、用于交通安全的車輛OCR識別等。

OCR技術(shù)的出現(xiàn)無疑提升了工作效率,也改變了我們的生活。

參考文獻:

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    160

    瀏覽量

    16733

原文標題:文字識別界的“拍立得”——OCR識別技術(shù)

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    OCR技術(shù)如何實現(xiàn)鐵路集裝箱號的自動識別

    在鐵路物流運輸中,集裝箱號的快速準確識別是提升效率的關(guān)鍵環(huán)節(jié)。通過先進的OCR(光學字符識別技術(shù),結(jié)合計算機視覺與深度學習方法,可以實現(xiàn)鐵路集裝箱號的高效、可靠
    的頭像 發(fā)表于 06-13 10:32 ?114次閱讀

    OCR技術(shù)vs傳統(tǒng)識別:哪種更適合火車集裝箱識別

    在鐵路物流領(lǐng)域,集裝箱箱號識別是提升運輸效率的關(guān)鍵環(huán)節(jié)。隨著計算機視覺技術(shù)的發(fā)展,OCR識別與傳統(tǒng)識別
    的頭像 發(fā)表于 06-11 10:54 ?137次閱讀

    明治案例 | 150個/分鐘!電阻【OCR識別】+【尺寸測量】一步到位

    真實案例——看明治傳感如何用一個視覺傳感器,同時搞定電阻的尺寸測量和OCR識別,讓質(zhì)檢效率翻倍,成本直降!場景需求希望在同一工位完成尺寸測量與OCR識別,減少設(shè)備占
    的頭像 發(fā)表于 06-10 07:33 ?118次閱讀
    明治案例 | 150個/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】+【尺寸測量】一步到位

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr
    發(fā)表于 05-28 06:46

    rfid技術(shù)是如何應(yīng)用在集裝箱自動識別的呢?

    在現(xiàn)代集裝箱物流管理中,快速、準確地識別集裝箱號碼是提升港口、堆場和海關(guān)運作效率的關(guān)鍵。隨著技術(shù)的發(fā)展,RFID(射頻識別技術(shù)OCR視覺
    的頭像 發(fā)表于 04-18 10:13 ?210次閱讀
    rfid<b class='flag-5'>技術(shù)</b>是如何應(yīng)用在集裝箱自動<b class='flag-5'>識別</b>的呢?

    大模型預標注和自動化標注在OCR標注場景的應(yīng)用

    OCR,即光學字符識別,簡單來說就是利用光學設(shè)備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學字符
    的頭像 發(fā)表于 04-15 15:18 ?302次閱讀

    阿普奇視覺控制器AK7在OCR識別場景中的應(yīng)用

    在實際工業(yè)生產(chǎn)中,OCR(光學字符識別技術(shù)的應(yīng)用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領(lǐng)域幫助企業(yè)完成產(chǎn)品編碼、生產(chǎn)日期、批號等字符信息自動識別,對于避免因出現(xiàn)瑕疵、錯漏
    的頭像 發(fā)表于 03-20 11:44 ?185次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>場景中的應(yīng)用

    漢王科技CES展示創(chuàng)新技術(shù),共觸未來智能交互

    獨特的磁容觸控技術(shù),為用戶帶來了更加流暢、精準的交互體驗。同時,漢王科技還推出了Penstar海外電紙本品牌,展示了其在電子紙技術(shù)領(lǐng)域的最新成果。 此外,漢王科技還帶來了數(shù)字簽批、手寫&OCR
    的頭像 發(fā)表于 01-08 15:08 ?621次閱讀

    ElfBoard開源項目|車牌識別項目技術(shù)文檔

    車牌識別項目基于百度智能云平臺,旨在利用其強大的OCR服務(wù)實現(xiàn)車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實現(xiàn)車牌識別應(yīng)用。這個開源
    的頭像 發(fā)表于 12-06 10:30 ?601次閱讀
    ElfBoard開源項目|車牌<b class='flag-5'>識別</b>項目<b class='flag-5'>技術(shù)</b>文檔

    明治案例 | 【OCR識別+條碼讀取】一步到位,印刷品質(zhì)的智能守護者

    在某大型印刷企業(yè)的生產(chǎn)線上,印刷機需要完成大量的條碼印刷任務(wù)。為了確保條碼的準確性和可讀性,需要在設(shè)備上安裝傳感器進行條碼印刷的讀碼和OCR識別檢測。1、傳感器需要準確識別條碼中的信息,并將其與預設(shè)
    的頭像 發(fā)表于 10-22 08:02 ?688次閱讀
    明治案例 | 【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>+條碼讀取】一步到位,印刷品質(zhì)的智能守護者

    光學字符識別是什么的一種技術(shù)

    光學字符識別(Optical Character Recognition,簡稱OCR)是一種將文本資料轉(zhuǎn)換為計算機可編輯和可搜索的數(shù)據(jù)格式的技術(shù)。這項技術(shù)廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、
    的頭像 發(fā)表于 09-10 15:48 ?1050次閱讀

    光學識別技術(shù)的工作原理是什么?

    光學識別技術(shù)(Optical Character Recognition,簡稱OCR)是一種將圖像中的文字信息轉(zhuǎn)換成可編輯和可搜索的文本數(shù)據(jù)的技術(shù)。它廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、自動
    的頭像 發(fā)表于 09-10 15:46 ?1313次閱讀

    光學識別字符是自動識別技術(shù)

    光學識別字符(Optical Character Recognition,簡稱OCR)是一種自動識別技術(shù),它能夠?qū)⒏鞣N類型文檔(如掃描的紙質(zhì)文檔、PDF文件或數(shù)字相機拍攝的圖片)中的文
    的頭像 發(fā)表于 09-10 15:43 ?795次閱讀

    明治案例 | PE編織袋【大視野】【OCR識別

    OCR識別技術(shù)OCR識別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進的圖像處理
    的頭像 發(fā)表于 08-13 08:25 ?739次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】
    主站蜘蛛池模板: 就去色综合 | 午夜视频福利在线观看 | 日韩欧免费一区二区三区 | 一级片观看 | 欧美色人阁 | 人人干在线观看 | 日本三级全黄 | 四虎影院久久 | 免费观看成人毛片 | 狠狠色噜噜狠狠狠狠奇米777 | 欧美高清性色生活 | 久久综合免费视频 | 国模大胆一区二区三区 | 天天干天天碰 | 美女露出扒开尿口让男人桶 | 亚洲国产欧美日韩一区二区三区 | 久操视频在线免费观看 | 哟交小u女国产精品视频 | 色噜噜成人综合网站 | 大又大又粗又爽又黄毛片女人 | 亚洲天天看 | 天天做天天爽 | 日本一区二区三区在线网 | 国产成人mv在线观看入口视频 | 男男扒开后菊惩罚 | 久久国产成人午夜aⅴ影院 久久国产福利 | 欧美色爱综合 | 最刺激黄a大片免费观看 | 亚洲综合区图片小说区 | 日韩美aaa特级毛片 日韩美a一级毛片 | 在线成人精品国产区免费 | 免费观看黄色网 | 给我一个可以看片的www日本 | 亚洲天堂ww | 亚洲成人在线电影 | 午夜影院一级片 | 人人干视频在线观看 | 四虎在线播放免费永久视频 | 四虎亚洲国产成人久久精品 | 男啪女视频免费观看网站 | 一级特黄aaa大片免色 |