在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在dify中搭建OCR智能體

perfxlab ? 來源:澎峰科技 ? 2025-06-27 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OCR 智能體應(yīng)用背景

企業(yè)在日常運(yùn)營中面臨合同、票據(jù)、手寫筆記等多種文檔的處理需求,這些文檔常以圖片或掃描件形式存在,文字提取困難,嚴(yán)重制約數(shù)字化管理效率。

為解決上述問題,本文介紹一套簡單高效的解決方案:通過 dify 工作流快速搭建 OCR 智能體,進(jìn)行文字識(shí)別。

先來看一下搭建好的工作流使用流程:用戶上傳待識(shí)別的圖片或文檔,工作流會(huì)調(diào)用本地部署的 OCR 服務(wù)完成識(shí)別工作,并將提取的內(nèi)容轉(zhuǎn)換成 Markdown 文檔。

OCR 智能體搭建流程

step1:本地部署 dify

因?yàn)槲覀円ㄟ^工作流的方式使用 OCR 服務(wù),因此需要現(xiàn)在本地完成 dify 的部署,部署流程相對簡單,直接參考 dify 官方文檔(https://github.com/langgenius/dify)即可,推薦使用 docker 進(jìn)行部署。

step2:在 dify 插件市場中,安裝澎峰科技“OCR 識(shí)別服務(wù)”插件

本文中介紹的 OCR 工具,我們已發(fā)布到 dify 的插件市場,源代碼可在 github 項(xiàng)目主頁(https://github.com/PerfXLab/dify-plugin-ocr-service)找到,要在 dify 中使用該工具,只需在插件市場中搜索“OCR”并安裝該插件即可:

step3:在 dify 中搭建工作流,并引入 OCR 工具

1.在 dify 中“創(chuàng)建空白應(yīng)用”,選擇“工作流”

2.對工作流進(jìn)行編排:

開始節(jié)點(diǎn)中加入“file”字段

“OCR 轉(zhuǎn) Markdown 工具”節(jié)點(diǎn)中填入相關(guān)信息

其中,“上傳文件”中填入“開始”節(jié)點(diǎn)輸出的內(nèi)容,OCR 接口地址填入本地搭建的 OCR 服務(wù),OCR 服務(wù)本地搭建將在下一步驟中介紹- “結(jié)束”節(jié)點(diǎn)中填入上一節(jié)點(diǎn)輸出的文件

step4:在本地搭建 OCR 服務(wù)

目前 OCR 任務(wù)主流實(shí)現(xiàn)方案有兩種:使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型或多模態(tài)大模型進(jìn)行處理,前者識(shí)別速度快、消耗資源少,而后者識(shí)別精度和魯棒性更好,但對算力要求較高。本文介紹一種基于卷積神經(jīng)網(wǎng)絡(luò)的方案,利用第三方工具快速在本地運(yùn)行。

搭建流程:

1.安裝第三方OCR服務(wù):pip install marker-pdf[full]

2.安裝API服務(wù):pip install -U uvicorn fastapi python-multipart

3.啟動(dòng)OCR服務(wù):marker_server --host 0.0.0.0 --port 8001

完成上述操作后,即可使用 dify 工作流進(jìn)行 OCR 識(shí)別服務(wù)。

私有化部署方案:澎峰科技大模型一體機(jī)

前述方案采用的輕量化模型,優(yōu)勢在于資源消耗低,在 CPU 環(huán)境下即可流暢運(yùn)行。然而,對于金融、法律等領(lǐng)域中,部分文檔的識(shí)別精準(zhǔn)度和版面還原度有更高要求的場景,采用多模態(tài)大模型進(jìn)行處理會(huì)是更優(yōu)選擇。多模態(tài)大模型雖然能帶來更高的識(shí)別精度與魯棒性,但其對算力資源的要求也相應(yīng)更高。

為滿足企業(yè)對高性能、數(shù)據(jù)私有化的需求,澎峰科技推出DeepFusion 系列 AI 一體機(jī),為企業(yè)智能化轉(zhuǎn)型提供一站式本地化部署解決方案。

該方案深度融合了業(yè)界領(lǐng)先的 DeepSeek、Qwen 等系列大模型,確保企業(yè)數(shù)據(jù)在本地處理,安全無虞,完美適配復(fù)雜的辦公自動(dòng)化、數(shù)據(jù)分析與智能客服等場景。

旗艦性能,應(yīng)對復(fù)雜需求:目前已發(fā)布的 DeepFusion DF110、DF210 一體機(jī),支持部署 DeepSeek 滿血版、Qwen3-235B 等尖端大模型,推理性能強(qiáng)勁,能夠從容應(yīng)對最復(fù)雜的辦公需求。

高性價(jià)比,賦能中小企業(yè):我們深知,高效的AI應(yīng)用同樣可以在中小規(guī)模模型上實(shí)現(xiàn)。為此,澎峰科技推出了 DeepFusion DF50 一體機(jī)。該機(jī)型針對 30B 及以下規(guī)模的高效模型進(jìn)行了深度推理優(yōu)化,實(shí)現(xiàn)了卓越性能與高性價(jià)比的平衡,旨在助力更多中小企業(yè)輕松實(shí)現(xiàn) AI 轉(zhuǎn)型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    288

    瀏覽量

    11021
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    16754
  • 澎峰科技
    +關(guān)注

    關(guān)注

    0

    文章

    71

    瀏覽量

    3366

原文標(biāo)題:使用澎峰科技OCR識(shí)別服務(wù)插件,在dify中搭建OCR智能體

文章出處:【微信號(hào):perfxlab,微信公眾號(hào):perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    告別“人工智障”:工業(yè)AI智能的進(jìn)化三定律

    文章主要講述了工業(yè)AI智能在工業(yè)生產(chǎn)中的應(yīng)用,如智能在焊接、生產(chǎn)過程的自動(dòng)化,以及如何通過AI智能
    的頭像 發(fā)表于 06-09 10:47 ?142次閱讀
    告別“人工智障”:工業(yè)AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>的進(jìn)化三定律

    Dify攜手亞馬遜云科技加速全球企業(yè)生成式AI應(yīng)用規(guī)?;涞?/a>

    簡單易用的AI應(yīng)用開發(fā)平臺(tái)Dify通過深度集成亞馬遜云科技的生成式AI技術(shù)與云服務(wù),在保障性能、合規(guī)與全球交付的基礎(chǔ)上,顯著降低企業(yè)在生成式AI應(yīng)用開發(fā)的技術(shù)門檻和部署成本。此外,依托亞馬遜云
    的頭像 發(fā)表于 06-07 16:00 ?251次閱讀

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr識(shí)別訓(xùn)練數(shù)據(jù)集 請問訓(xùn)練id是?
    發(fā)表于 05-28 06:46

    手把手教你Coze智能搭建,讓智能設(shè)備秒變天氣預(yù)報(bào)小助手

    ?今天,就跟著我們一起,從0到1搭建一個(gè)專屬的天氣預(yù)報(bào)Coze小助手吧!搭建視頻1、登陸Coze官網(wǎng)訪問Coze官網(wǎng)有兩種便捷方式:一是在搜索引擎輸入“扣子”,然
    的頭像 發(fā)表于 04-07 18:06 ?1865次閱讀
    手把手教你Coze<b class='flag-5'>智能</b><b class='flag-5'>體</b><b class='flag-5'>搭建</b>,讓<b class='flag-5'>智能</b>設(shè)備秒變天氣預(yù)報(bào)小助手

    學(xué)習(xí)智能開發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí),這本書太及時(shí)了,非常想看看。
    發(fā)表于 03-27 15:48

    阿普奇視覺控制器AK7在OCR識(shí)別場景的應(yīng)用

    影響產(chǎn)品口碑有著重要作用。隨著一些復(fù)雜字符組合出現(xiàn),印刷工藝調(diào)整,字符印刷材質(zhì)變更,為了保證字符識(shí)別的準(zhǔn)確率,行業(yè)內(nèi)采用更多新的機(jī)器視覺技術(shù)以完成對產(chǎn)品字符高精度、高效率、高穩(wěn)定的實(shí)時(shí)檢測。 在最新的OCR檢測技術(shù)應(yīng)用,
    的頭像 發(fā)表于 03-20 11:44 ?203次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b>識(shí)別場景<b class='flag-5'>中</b>的應(yīng)用

    瀾舟智搭:企業(yè)級智能Agent搭建平臺(tái)

    、客服等多個(gè)領(lǐng)域,且支持輕量化的本地私有化部署,滿足企業(yè)多樣化的需求。 瀾舟智搭以其流程化、組件化以及高度智能化的搭建方式,賦予了企業(yè)用戶極大的靈活性。用戶可以根據(jù)自身業(yè)務(wù)需求,快速搭建出貼合實(shí)際的
    的頭像 發(fā)表于 02-19 14:36 ?517次閱讀

    請問如何在量產(chǎn)中對智能DAC或AFE的NVM進(jìn)行編程?

    我在設(shè)計(jì)中使用了智能 DAC,最終 PCB 上沒有板載控制器。如何在設(shè)計(jì)的量產(chǎn)過程智能 DAC 的初始 NVM 值進(jìn)行編程?
    發(fā)表于 11-26 06:55

    利用OpenVINO搭建本地智能流水線

    智能 AI Agent 作為大模型的衍生應(yīng)用,具有對任務(wù)的理解、規(guī)劃與行動(dòng)能力。它可以通過將一個(gè)復(fù)雜的用戶請求拆分成不同的子任務(wù),并依次調(diào)用外部工具來解決這些任務(wù),并將其中每個(gè)任務(wù)步驟的執(zhí)行結(jié)果,按預(yù)先規(guī)劃的邏輯串聯(lián)起來,從而達(dá)成最終的目的。
    的頭像 發(fā)表于 10-25 16:01 ?652次閱讀

    何在運(yùn)放外圍搭建電路抑制零漂?

    如題,運(yùn)放處理電路,輸入為零,輸出不為零,如何在運(yùn)放外圍搭建電路抑制零漂,謝謝~
    發(fā)表于 09-20 06:21

    如何搭建智能制造工廠

     搭建智能制造工廠是一個(gè)復(fù)雜而系統(tǒng)的工程,需要從多個(gè)方面入手,包括規(guī)劃與設(shè)計(jì)、基礎(chǔ)設(shè)施建設(shè)、系統(tǒng)集成與測試、上線與試運(yùn)行以及持續(xù)優(yōu)化與升級等階段。以下是一個(gè)詳細(xì)的搭建智能制造工廠的步驟
    的頭像 發(fā)表于 09-15 14:17 ?1121次閱讀

    明治案例 | PE編織袋【大視野】【OCR識(shí)別】

    OCR識(shí)別技術(shù)OCR識(shí)別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進(jìn)的圖像處理技術(shù),自動(dòng)、高效地識(shí)別并轉(zhuǎn)換圖像的文字信息為可編輯的文本數(shù)據(jù)。這一技術(shù)的應(yīng)用確保了生產(chǎn)數(shù)據(jù)的準(zhǔn)確性和實(shí)時(shí)性,為生
    的頭像 發(fā)表于 08-13 08:25 ?748次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b>識(shí)別】

    工業(yè)一機(jī)在智能分揀的應(yīng)用

    工業(yè)一機(jī)在智能分揀系統(tǒng)的應(yīng)用是物流行業(yè)自動(dòng)化和智能化升級的重要組成部分。這些設(shè)備通常具備高性能計(jì)算能力、穩(wěn)定性和耐用性,能夠在復(fù)雜和苛刻的工業(yè)環(huán)境
    的頭像 發(fā)表于 07-15 15:25 ?638次閱讀
    工業(yè)一<b class='flag-5'>體</b>機(jī)在<b class='flag-5'>智能</b>分揀<b class='flag-5'>中</b>的應(yīng)用

    Dify中使用PerfXCloud大模型推理服務(wù)

    近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型調(diào)用服務(wù),用戶可在Dify構(gòu)建出更加經(jīng)濟(jì)、高效的LLM應(yīng)用。
    的頭像 發(fā)表于 07-15 09:28 ?2539次閱讀
    在<b class='flag-5'>Dify</b>中使用PerfXCloud大模型推理服務(wù)
    主站蜘蛛池模板: 综合免费一区二区三区 | 国产天美 | 国产三级a三级三级天天 | 黄色视屏免费在线观看 | 一级视频在线 | 黄色的网站在线观看 | 四虎最新免费观看网址 | 日日夜夜爽 | 激情五月婷婷色 | 国产精品美女免费视频观看 | 国产一二三区在线观看 | 女人张开腿 让男人桶个爽 免费观看 | 国产精品一级毛片不收费 | 日本理论在线观看被窝网 | 狠狠操天天| 天堂网www最新版在线资源 | 成人美女隐私免费 | 五月天婷婷丁香中文在线观看 | 国产精品大片天天看片 | 免费看男女下面日出水视频 | 欧美久操 | 九九福利视频 | 四虎影院观看视频 | 日韩一区二区三区在线 | 波多野吉衣一区二区三区在线观看 | 美女扒开尿口让男人桶 | 色国产精品 | 午夜小视频在线 | 午夜在线播放视频在线观看视频 | 天堂网在线最新版www中文网 | 99久热| 操碰人人| 清冷双性被cao的合不拢腿 | 5g影院午夜伴侣 | 在线观看网址你懂得 | 2020国产v亚洲v天堂高清 | 亚洲精品一区二区中文 | 五月情网 | 日韩啪啪电影 | 尤物视频黄 | 欧美伊人|