資料介紹
軟件簡介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以無縫訪問光學(xué)字符識(shí)別
獲取預(yù)訓(xùn)練模型
使用兩階段方法在 docTR 中實(shí)現(xiàn)端到端 OCR:文本檢測(定位單詞),然后文本識(shí)別(識(shí)別單詞中的所有字符)。因此,可以從可用實(shí)現(xiàn)列表中選擇用于文本檢測的架構(gòu)和用于文本識(shí)別的架構(gòu)。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
讀取文件
可以從 PDF 或圖像解釋文檔:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默認(rèn)的預(yù)訓(xùn)練模型為例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安裝
安裝 docTR 需要 Python 3.6(或更高版本)和?pip。
由于使用了?weasyprint,如果沒有運(yùn)行在 Linux 系統(tǒng)之上,將需要額外的依賴項(xiàng)。
對(duì)于 macOS 用戶,可以按如下方式安裝它們:
brew install cairo pango gdk-pixbuf libffi
對(duì)于 Windows 用戶,這些依賴項(xiàng)包含在 GTK 中。
最新版本
pip install python-doctr
- 樹洞OCR文字識(shí)別跨平臺(tái)的OCR小工具
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于殘差連接的改進(jìn)端到端文本識(shí)別網(wǎng)絡(luò)結(jié)構(gòu) 6次下載
- 基于LSTM的流式文檔結(jié)構(gòu)識(shí)別方法 7次下載
- 膠囊網(wǎng)絡(luò)在短文本多種意圖識(shí)別的應(yīng)用及研究 10次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類器的垃圾文本過濾模型 43次下載
- 基于神經(jīng)網(wǎng)絡(luò)的中文文本蘊(yùn)含識(shí)別模型 7次下載
- 新型中文旅游文本命名實(shí)體識(shí)別設(shè)計(jì)方案 24次下載
- 使用數(shù)字識(shí)別和AI實(shí)現(xiàn)OCR的資料合集 20次下載
- OCR文字識(shí)別視覺檢測系統(tǒng)應(yīng)用程序免費(fèi)下載 25次下載
- API-Shop-OCR-營業(yè)執(zhí)照識(shí)別API接口Python調(diào)用示例代碼說明 6次下載
- 基于文本分類計(jì)數(shù)識(shí)別平臺(tái)設(shè)計(jì)(JAVA實(shí)現(xiàn)) 11次下載
- 串口屏技術(shù)文檔—文本限值提示如何修改為英文 14次下載
- 免費(fèi)版文字識(shí)別系統(tǒng) TH-OCR SDK11.0 0次下載
- 光學(xué)識(shí)別字符是自動(dòng)識(shí)別技術(shù)嗎 511次閱讀
- 光學(xué)識(shí)別的過程包含哪些 450次閱讀
- 基于OpenVINO+OpenCV的OCR處理流程化實(shí)現(xiàn) 779次閱讀
- 可以提取圖像文本的5大Python庫 3028次閱讀
- Tesseract的進(jìn)階用法和最佳實(shí)踐 1378次閱讀
- OCR實(shí)戰(zhàn)教程 1034次閱讀
- 如何將PP-OCRv3英文識(shí)別模型部署在Corstone-300虛擬硬件平臺(tái)上 2520次閱讀
- OCR算法能較好識(shí)別水平排布的常規(guī)文本 1383次閱讀
- 如何使用Python開發(fā)截圖識(shí)別OCR的小工具 3565次閱讀
- 如何實(shí)現(xiàn)自動(dòng)識(shí)別并提取圖片中的文本內(nèi)容 1.5w次閱讀
- ocr技術(shù)是什么?新能源充電樁應(yīng)用車牌識(shí)別ocr技術(shù) 2652次閱讀
- Facebook研究人員提出了一個(gè)大規(guī)模圖像文本提取和識(shí)別系統(tǒng)——Rosetta 3369次閱讀
- 如何使用EAST文本檢測器在自然場景下檢測文本 1.1w次閱讀
- 服務(wù)器端發(fā)票識(shí)別api接口 2686次閱讀
- 基于FPGA異構(gòu)加速的OCR識(shí)別技術(shù)解析 3019次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊(cè)
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊(cè)
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論