在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用FastDeploy在英特爾CPU和獨立顯卡上端到端高效部署AI模型

英特爾物聯(lián)網 ? 來源:英特爾物聯(lián)網 ? 作者:王一凡 ? 2022-12-20 11:27 ? 次閱讀

作者:英特爾物聯(lián)網創(chuàng)新大使王一凡

1.1產業(yè)實踐中部署 AI 模型的痛點

1.1.1部署 AI 模型的典型流程

對于來自于千行百業(yè),打算將 AI 模型集成到自己的主線產品中,解決本行痛點的 AI 開發(fā)者來說,部署 AI 模型,或者說將 AI 模型集成到自己產品中去的典型步驟(以計算機視覺應用為例)有:

采集圖像&圖像解碼

數(shù)據(jù)預處理

執(zhí)行 AI 推理計算

推理結果后處理

將后處理結果集成到業(yè)務流程

22441786-7f88-11ed-8abf-dac502259ad0.png

1.1.2端到端的 AI 性能

當 AI 開發(fā)者將 AI 模型集成到業(yè)務流程后,不太關心 AI 模型在 AI 推理硬件上單純的推理速度,而是關心包含圖像解碼、數(shù)據(jù)預處理和后處理的端到端的 AI 性能。

227580b4-7f88-11ed-8abf-dac502259ad0.png

在產業(yè)實踐中,我們發(fā)現(xiàn)不僅 AI 推理硬件和對應推理引擎(例如:OpenVINO Runtime)對于端到端的性能影響大,數(shù)據(jù)預處理和后處理代碼是否高效對于端到端的性能影響也大。

CPU 上預處理操作融合優(yōu)化為例,經過優(yōu)化后的前處理代碼,可以使得 AI 端到端性能得到較大提升。

22965212-7f88-11ed-8abf-dac502259ad0.png

數(shù)據(jù)來源:感謝 FastDeploy 團隊完成測試并提供數(shù)據(jù)

結論:優(yōu)秀且高效的前后處理代碼,可以明顯提高端到端的 AI 性能!

1.1.3部署 AI 模型的難點和痛點

在產業(yè)實踐中,在某個任務上當前最優(yōu)的 SOTA 模型的很有可能與部署相關的文檔和范例代碼不完整,AI 開發(fā)者需要通過閱讀 SOTA 模型源代碼來手動編寫模型的前后處理代碼,這導致:

01耗時耗力

閱讀 SOTA 模型源代碼來理解模型的前后處理,提高了部署模型的技術門檻。另外,手動編寫前后處理代碼,也需要更多的測試工作來消除 bug。

02精度隱患

手動或借助網上開源但未經過實踐驗證過的前后處理代碼,會有精度隱患,即當前對于某些圖片精度很好,但對于另外的圖片精度就下降。筆者就遇到過類似問題,原因在于調用了一個 GitHub 上下載的 NMS()函數(shù),這個函數(shù)對代碼倉提供的范例模型有效,但對于筆者使用的模型恰恰就出現(xiàn)丟失檢測對象的問題。

03優(yōu)化困難

解決了精度問題后,下一步就是通過多線程、模型壓縮、Batch 優(yōu)化等軟件技術進一步提升端到端的 AI 性能,節(jié)約硬件采購成本。這些軟件技術對于計算機專業(yè)的工程師不算挑戰(zhàn),但對于千行百業(yè)中非計算機專業(yè)的工程師,卻無形中建立起了一道極高的門檻。

為了賦能千行百業(yè)的工程師,高效便捷的將 AI 模型集成到自己的產品中去,急需一個專門面向 AI 模型部署的軟件工具。

1.2FastDeploy 簡介

FastDeploy是一款全場景、易用靈活、極致高效的 AI 推理部署工具。提供開箱即用云邊端部署體驗, 支持超過150+Text,Vision,Speech 和跨模態(tài)模型,并實現(xiàn)端到端的推理性能優(yōu)化。包括圖像分類、物體檢測、圖像分割、人臉檢測、人臉識別、關鍵點檢測、摳圖、OCR、NLP、TTS 等任務,滿足開發(fā)者多場景、多硬件、多平臺的產業(yè)部署需求。

22d4f40e-7f88-11ed-8abf-dac502259ad0.png

FastDeploy 項目鏈接:

https://github.com/PaddlePaddle/FastDeploy

1.3英特爾獨立顯卡簡介

英特爾在2021年的構架日上發(fā)布了獨立顯卡產品路線圖,OpenVINO 從2022.2版本開始支持 AI 模型在英特爾獨立顯卡上做 AI 推理計算。

23000f9a-7f88-11ed-8abf-dac502259ad0.png

當前已經可以購買的消費類獨立顯卡是英特爾銳炫獨立顯卡A7系列,并已發(fā)布在獨立顯卡上做 AI 推理計算的范例程序。

23a2b9fc-7f88-11ed-8abf-dac502259ad0.png

1.4使用 FastDeploy

在英特爾 CPU 和獨立顯卡上

部署模型的步驟

1.4.1搭建 FastDeploy 開發(fā)環(huán)境

當前 FastDeploy 最新的 Release 版本是1.0.1,一行命令即可完成 FastDeploy 的安裝:

 pip install fastdeploy-python –f https://www.paddlepaddle.org.cn/whl/fastdeploy.html

向右滑動查看完整代碼

1.4.2下載模型和測試圖片

FastDeploy 支持的 PaddleSeg 預訓練模型下載地址:

https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/segmentation/paddleseg

測試圖片下載地址:

https://paddleseg.bj.bcebos.com/dygraph/demo/cityscapes_demo.png

使用命令,下載模型和測試圖片:

圖片:
wget https://paddleseg.bj.bcebos.com/dygraph/demo/cityscapes_demo.png
模型:
wget https://github.com/PaddlePaddle/FastDeploy/tree/develop/examples/vision/segmentation/paddleseg

向右滑動查看完整代碼

1.4.3三行代碼完成在英特爾 CPU 上的模型部署

基于 FastDeploy,只需三行代碼即可完成在英特爾 CPU上的模型部署,并獲得經過后處理的推理結果。

import fastdeploy as fd
import cv2
# 讀取圖片
im = cv2.imread("cityscapes_demo.png")
# 加載飛槳PaddleSeg模型
model = fd.vision.segmentation.PaddleSegModel(“model.pdmodel”, “model.pdiparams”,“deploy.yaml”)
# 預測結果
result = model.predict(im)
print(result)

向右滑動查看完整代碼

將推理結果 print 出來,如下圖所示,經過 FastDeploy 完成的 AI 推理計算,拿到的是經過后處理的結果,可以直接將該結果傳給業(yè)務處理流程

23c82e94-7f88-11ed-8abf-dac502259ad0.png

1.4.4

使用 RuntimeOption 將 AI 推理硬件

切換英特爾獨立顯卡

在上述三行代碼的基礎上,只需要使用RuntimeOption將AI推理硬件切換為英特爾獨立顯卡,完成代碼如下所示:

import fastdeploy as fd
import cv2
# 讀取圖片
im = cv2.imread("cityscapes_demo.png")
h, w, c = im.shape
# 通過RuntimeOption配置后端
option = fd.RuntimeOption()
option.use_openvino_backend()
option.set_openvino_device("GPU.1")
# 固定模型的輸入形狀
option.set_openvino_shape_info({"x": [1,c,h,w]})
# 加載飛槳PaddleSeg模型
model = fd.vision.segmentation.PaddleSegModel(“model.pdmodel”, “model.pdiparams”,“deploy.yaml”, 
                       runtime_option=option)               
# 預測結果
result = model.predict(im)

向右滑動查看完整代碼

set_openvino_device()中字符串填寫“GPU.1”是根據(jù)英特爾獨立顯卡在操作系統(tǒng)的中設備名稱,如下圖所示:

23f432aa-7f88-11ed-8abf-dac502259ad0.png

當前,在英特爾獨立顯卡上做 AI 推理,需要注意的問題有:

需要固定模型輸入節(jié)點的形狀(Shape)

英特爾 GPU 上支持的算子數(shù)量與 CPU 并不一致,在部署 PPYOLE 時,如若全采用 GPU 執(zhí)行,會出現(xiàn)如下提示

241047c4-7f88-11ed-8abf-dac502259ad0.png

這是需要將推理硬件設置為異構方式

option.set_openvino_device("HETERO:GPU.1,CPU")

向右滑動查看完整代碼

到此,使用 FastDeploy 在英特爾 CPU 和獨立顯卡上部署AI模型的工作全部完成。

1.5總結

面對千行百業(yè)中部署 AI 模型的挑戰(zhàn),F(xiàn)astDeploy 工具很好的保證了部署 AI 模型的精度,以及端到端 AI 性能問題,也提高了部署端工作的效率。通過 RuntimeOption,將 FastDeploy 的推理后端設置為 OpenVINO,可以非常便捷將 AI 模型部署在英特爾 CPU、集成顯卡和獨立顯卡上。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10177

    瀏覽量

    174043
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11049

    瀏覽量

    216143
  • 顯卡
    +關注

    關注

    16

    文章

    2503

    瀏覽量

    69236
  • AI
    AI
    +關注

    關注

    88

    文章

    34421

    瀏覽量

    275731

原文標題:使用FastDeploy在英特爾CPU和獨立顯卡上端到端高效部署AI模型 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網,微信公眾號:英特爾物聯(lián)網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    基于C#和OpenVINO?英特爾獨立顯卡部署PP-TinyPose模型

    和 OpenVINO,將 PP-TinyPose 模型部署英特爾獨立顯卡上。 1.1 PP-
    的頭像 發(fā)表于 11-18 18:27 ?2949次閱讀

    英特爾CPU部署Qwen 1.8B模型的過程

    本文介紹了英特爾 13 代酷睿 CPU i5 - 13490F 設備上部署 Qwen 1.8B 模型的過程,你需要至少 16GB 內存的機
    的頭像 發(fā)表于 01-12 10:28 ?3372次閱讀

    部署成本顯著降低!英特爾助陣高效AI算力一體機方案

    3月27日,英特爾舉辦了名為“‘至’繪未來,銳炫來襲”的創(chuàng)新解決方案研討會,與生態(tài)伙伴共同分享最新AI算力一體機方案。該方案基于英特爾?至強? W處理器和多個英特爾銳炫?
    的頭像 發(fā)表于 03-29 16:29 ?1079次閱讀
    <b class='flag-5'>部署</b>成本顯著降低!<b class='flag-5'>英特爾</b>助陣<b class='flag-5'>高效</b><b class='flag-5'>AI</b>算力一體機方案

    英特爾?獨立顯卡與OpenVINO?工具套件結合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發(fā)表于 03-05 06:56

    英特爾高清顯卡4600幫助

    和NVIDIA GTX 960M。顯示器的色溫配置為R-75,G-75,B-75(每個的最大設置為100)。英特爾高清顯卡4600可以選擇“默認RGB”,“限制RGB”或“全RGB”。此外,還有一個啟用或禁用
    發(fā)表于 10-26 14:53

    介紹英特爾?分布式OpenVINO?工具包

    性能。 英特爾?OpenlandOpen?管理軟件包包括英特爾?深度學習部署工具包(英特爾?DLDT)。適用于Linux *的OpenVINO?工具包的
    發(fā)表于 07-26 06:45

    英特爾進軍顯卡市場,預計2020年推出獨立GPU

    英特爾CPU的地位已經難以撼動,尤其是電腦,可以說是稱霸已久,但是GPU方面卻沒有占據(jù)領
    的頭像 發(fā)表于 06-13 11:05 ?3627次閱讀

    英特爾推出了英特爾銳炬Xe MAX獨立顯卡

    英特爾推出了英特爾銳炬 Xe MAX 獨立顯卡,該顯卡專為輕薄型筆記本電腦設計,現(xiàn)已通過合作伙伴問世。
    的頭像 發(fā)表于 11-01 12:15 ?9030次閱讀

    英特爾宣布首款獨立顯卡 意味著英特爾加入 GPU 戰(zhàn)局

    據(jù)中國臺灣經濟日報報道,芯片大廠英特爾的獨顯芯片上市,該公司宣布了首款 Iris Xe Max 獨立顯卡,用于超便攜式筆記本電腦和筆記本電腦。 原本 AMD 處理器(
    的頭像 發(fā)表于 11-03 11:58 ?2811次閱讀

    英特爾推出面向OEM市場的入門級Xe獨立顯卡

    磨蹭了一年之后,英特爾終于出貨了新一代的獨立顯卡也就是DG1,型號為Iris Xe MAX,當時英特爾表示這款
    的頭像 發(fā)表于 01-27 10:39 ?2137次閱讀

    低門檻AI部署工具FastDeploy開源!

    為了解決AI部署落地難題,我們發(fā)起了FastDeploy項目。FastDeploy針對產業(yè)落地場景中的重要AI
    的頭像 發(fā)表于 11-08 14:28 ?2310次閱讀

    NGC 上玩轉新一代推理部署工具 FastDeploy,幾行代碼搞定 AI 部署

    模型,并提供開箱即用的云邊部署體驗,實現(xiàn) AI 模型
    的頭像 發(fā)表于 12-13 19:50 ?1551次閱讀

    英特爾獨立顯卡部署YOLOv5 v7.0版實時實例分割模型

    本文將介紹基于 OpenVINO 英特爾獨立顯卡部署 YOLOv5 實時實例分割
    的頭像 發(fā)表于 12-20 11:32 ?4903次閱讀

    英特爾聚焦AI座艙

    Weast表示,30 TOPS、60TOPS可能也有AI語音功能,但模型并非部署側,而是部署
    的頭像 發(fā)表于 10-30 16:26 ?411次閱讀

    使用PyTorch英特爾獨立顯卡上訓練模型

    《PyTorch 2.5重磅更新:性能優(yōu)化+新特性》中的一個新特性就是:正式支持英特爾獨立顯卡上訓練模型!
    的頭像 發(fā)表于 11-01 14:21 ?1916次閱讀
    使用PyTorch<b class='flag-5'>在</b><b class='flag-5'>英特爾</b><b class='flag-5'>獨立</b><b class='flag-5'>顯卡</b>上訓練<b class='flag-5'>模型</b>
    主站蜘蛛池模板: 超级乱淫小黄文小说 | 一级特黄高清完整大片 | 黄色网址视频在线观看 | 伊人久久成人爱综合网 | 酒色成人网 | 国产一级特黄aaaa大片野外 | 日本v片免费一区二区三区 日本www.色 日本wwwwww | 成人看的一级毛片 | 亚洲人成电影在线小说网色 | 男人视频在线 | 一级毛毛片毛片毛片毛片在线看 | 黄色工厂在线播放 | 免费可以看黄的视频 s色 | 午夜影视免费观看 | 免费的日本网站 | 亚洲综合精品一区二区三区中文 | 五月天精品在线 | 亚洲人成电影在线 | 一级毛片黄色片 | 丁香婷婷社区 | 免费人成网址在线观看国内 | 九九九国产在线 | 色资源窝窝全色 | 日本高清一区二区三区不卡免费 | 又黄又爽又猛午夜性色播在线播放 | 成人a毛片免费全部播放 | 久久国产精品自在自线 | 国产又爽又黄又粗又大 | 国产伦精品一区二区三区在线观看 | 婷婷色在线 | 亚洲视频在线一区二区三区 | 色94色欧美一区 | 久久香蕉精品视频 | 免费观看一级特黄欧美大片 | 国产精品福利午夜一级毛片 | 国产日本特黄特色大片免费视频 | 精品免费久久久久久成人影院 | 亚洲电影一区二区三区 | 国产亚洲一区二区三区啪 | 国产精品怡红院永久免费 | 天天操天天摸天天碰 |