?作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力
《超4萬6千星的開源OCR黑馬登場,PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型?本文從零開始詳細(xì)介紹整個(gè)過程。
一,什么是PP-OCRv4模型?
PP-OCRv4是PaddleOCR工具庫的PP-OCR系列模型中,當(dāng)前性能最優(yōu)的一個(gè)。它在前代模型(PP-OCRv3)的基礎(chǔ)上,針對檢測模型和識(shí)別模型進(jìn)行了數(shù)據(jù)、網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練策略等多個(gè)模塊的優(yōu)化,在多個(gè)應(yīng)用場景中,精度均有大幅提升:
中文場景,相對于PP-OCRv3中文模型提升超4%;
英文數(shù)字場景,相比于PP-OCRv3英文模型提升6%;
多語言場景(支持韓語、日語、德語、法語等80種語言),平均準(zhǔn)確率提升超8%。
PP-OCRv4是一個(gè)兩階段的OCR系統(tǒng),包含檢測模型、方向分類模型和識(shí)別模型。在檢測和識(shí)別之間添加方向分類模型,將不同角度的文本檢測框修正為水平檢測框,方便識(shí)別模型完成行文本識(shí)別。
為了適應(yīng)服務(wù)器和邊緣端不同場景的部署需求,PP-OCRv4提供兩種推理模型權(quán)重版本:
邊緣端:中英文超輕量PP-OCRv4模型(16.1M) = 檢測模型(4.7M) + 識(shí)別模型(10.0M) + 方向分類模型(1.4M)。Hmean:62.24%;ACC:70.1%。
服務(wù)器端:中英文高精度PP-OCRv4 server模型(199.4M) = 檢測模型(110M) + 識(shí)別模型(88M) + 方向分類模型(1.4M)。Hmean:82.69%;ACC:84.04%。
PP-OCRv4模型詳述鏈接:
https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/ppocr/blog/PP-OCRv4_introduction.md
PP-OCRv4模型的卓越性能使其在多個(gè)領(lǐng)域具有廣泛的應(yīng)用前景,如文檔掃描、文字提取、智能表單填寫、物流信息追蹤、文檔自動(dòng)化處理、智能服務(wù)窗口、文獻(xiàn)資料整理等等。本文將介紹使用OpenVINO?工具套件在英特爾? CPU、獨(dú)立顯卡、集成顯卡和NPU上優(yōu)化并部署飛槳PP-OCRv4模型。
PP-OCRv4模型在飛槳AIStudio星河社區(qū)范例項(xiàng)目:
https://aistudio.baidu.com/projectdetail/8770259
二,OpenVINO C# API簡介
OpenVINO C# API是一個(gè)開源的 OpenVINO? 的 .Net wrapper(包裝器)項(xiàng)目,它基于最新的OpenVINO? Runtime庫開發(fā),通過調(diào)用官方的OpenVINO? C API ,允許開發(fā)者在 .NET 和 .NET Framework 環(huán)境中使用 C# 語言調(diào)用AI模型,并實(shí)現(xiàn)AI模型在英特爾? CPU、獨(dú)立顯卡、集成顯卡、NPU上的推理加速。
OpenVINO? C# API的GitHub倉:https://github.com/guojin-yan/OpenVINO-CSharp-API
三,搭建開發(fā)環(huán)境
請參考《C# 中使用OpenVINO?:輕松集成AI模型!》完成OpenVINO C# API開發(fā)環(huán)境搭建。然后,啟動(dòng)“命令提示符”,用命令創(chuàng)建“ppocrv4_csharp”推理項(xiàng)目:
dotnet new console -o ppocrv4_csharp -f net8.0

然后,進(jìn)入“ppocrv4_csharp”目錄,使用NuGet安裝OpenVINO? C# API,命令如下:
dotnet add package OpenVINO.CSharp.API dotnet add package OpenVINO.runtime.win dotnet add package OpenVINO.CSharp.API.Extensions.OpenCvSharp dotnet add package OpenVINO.CSharp.API.Extensions.PaddleOCR
最后,安裝OpenCvSharp 4.9.0版:???????
dotnet add package OpenCvSharp4 --version 4.9.0.20240103 dotnet add package OpenCvSharp4.runtime.win --version 4.9.0.20240103
完成PP-OCRv4的OpenVINO? C# API開發(fā)環(huán)境安裝。
四,編寫C# PP-OCRv4推理程序
PP-OCRv4的范例程序已開源,請將代碼倉克隆到本地:
git clone https://github.com/guojin-yan/PaddleOCR-OpenVINO-CSharp.git
接著,將“在線模型識(shí)別”范例代碼拷貝到Program.cs中,如下所示:
最后,在VS Code中運(yùn)行該代碼,結(jié)果如下所示:
五,總結(jié)
使用OpenVINO C# API可以直接讀入PP-OCRv4模型(無需轉(zhuǎn)換),并能方便快捷的將PP-OCRv4模型用C#代碼部署在英特爾? CPU、獨(dú)立顯卡、集成顯卡、NPU等硬件上。
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內(nèi)容請關(guān)注“算力魔方?”!
?審核編輯 黃宇
-
API
+關(guān)注
關(guān)注
2文章
1566瀏覽量
63693 -
AI
+關(guān)注
關(guān)注
88文章
34657瀏覽量
276548 -
OpenVINO
+關(guān)注
關(guān)注
0文章
114瀏覽量
442
發(fā)布評論請先 登錄
C#集成OpenVINO?:簡化AI模型部署

基于C#和OpenVINO?在英特爾獨(dú)立顯卡上部署PP-TinyPose模型
如何使用OpenVINO C++ API部署FastSAM模型

使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

使用OpenVINO? 部署PaddleSeg模型庫中的DeepLabV3+模型

基于OpenVINO? 的飛槳版 PGNet 實(shí)現(xiàn)案例
基于OpenVINO?工具包部署飛槳PP-Human的全流程
基于OpenVINO Python API部署RT-DETR模型

基于OpenVINO C++ API部署RT-DETR模型

基于OpenVINO C# API部署RT-DETR模型

用OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測模型

C#中使用OpenVINO?:輕松集成AI模型!

基于算力魔方與PP-OCRv5的OpenVINO智能文檔識(shí)別方案

評論