深度學習YOLOv3 模型設計的基本思想

1. 簡介

參考源于產業實踐的開源深度學習平臺飛槳PaddlePaddle 的《零基礎實踐深度學習》?的《目標檢測YOLOv3》

根據以上資料，簡化和重新梳理 YOLOv3 模型設計的基本思想

2. 基礎概念

2.1. 邊界框（bounding box）

目標檢測通常使用邊界框（bounding box，bbox）來表示物體的位置

邊界框是正好能包含物體的矩形框

通常有兩種格式來表示邊界框的位置：

圖片坐標的原點在左上角，x軸向右為正方向，y軸向下為正方向

在檢測任務中，訓練數據集的標簽里會給出目標物體真實邊界框所對應的(x1,y1,x2,y2)

這樣的邊界框也被稱為真實框（ground truth box）

在預測過程中，模型會對目標物體可能出現的位置進行預測

由模型預測出的邊界框則稱為預測框（predic tion box），如上圖所示

2.2. 錨框（Anchor box）

錨框與物體邊界框不同，是由人們假想出來的一種框

先設定好錨框的大小和形狀，再以圖像上某一個點為中心畫出矩形框

如圖中藍色框所示，其中錨框A1跟人像區域非常接近

在目標檢測任務中，通常會以某種規則在圖片上生成一系列錨框，將這些錨框當成可能的候選區域

模型對這些候選區域是否包含物體進行預測，如果包含目標物體，則還需要進一步預測出物體所屬的類別

還有更為重要的一點是，由于錨框位置是固定的，它不大可能剛好跟物體邊界框重合

所以需要在錨框的基礎上進行微調以形成能準確描述物體位置的預測框，模型需要預測出微調的幅度

在訓練過程中，模型通過學習不斷的調整參數

最終能學會如何判別出錨框所代表的候選區域是否包含物體，如果包含物體的話，物體屬于哪個類別，以及物體邊界框相對于錨框位置需要調整的幅度

2.3. 交并比（loU）

如何衡量這三個錨框跟真實框之間的關系呢？

在檢測任務中，使用交并比（Intersection of Union，IoU）作為衡量指標

這一概念來源于數學中的集合，用來描述兩個集合A和B之間的關系

為了直觀的展示交并比的大小跟重合程度之間的關系
下圖示意了不同交并比下兩個框之間的相對位置關系，從 IoU = 0.95 到 IoU = 0

3. 訓練思想

1.按一定規則在圖片上產生一系列的候選區域

2.根據這些候選區域與真實框之間的位置關系對候選區域進行標注正負樣本

跟真實框足夠接近的那些候選區域會被標注為正樣本，同時將真實框的位置作為正樣本的位置目標

偏離真實框較大的那些候選區域則會被標注為負樣本，負樣本不需要預測位置或者類別

3.使用卷積神經網絡提取圖片特征 C

4.使用卷積神經網絡關聯圖片特征C 對應候選區域的位置和類別進行預測，形成特征圖P

5.將網絡預測值和標簽值進行比較，就可以建立起損失函數

將每個預測框就看成是一個樣本，根據真實框相對它的位置和類別進行了標注而獲得標簽值

3. 產生候選區域

3.1. 生成錨框

將原始圖片劃分成m×n個區域，即均分切塊

如原始圖片高度H=640, 寬度W=480，如果選擇小塊區域的尺寸為32×32

則m和n分別為：m=H/32=20，n=W/32=15

將原始圖像分成了20行15列小方塊區域

3.2. 生成預測框

錨框的位置都是固定好的，不可能剛好跟物體邊界框重合

需要在錨框的基礎上進行位置的微調以生成預測框

預測框相對于錨框會有不同的?中心位置和?大小

3.2.1. 預測框中心位置坐標

因此由上面公式計算出來的預測框的中心點總是落在第十行第四列的小區域內部

3.2.2. 預測框大小

錨框的大小是預先設定好的，在模型中可以當作是超參數

3.2.3. 求解預測框

3.3. 標注候選區域

每個區域可以產生3種不同形狀的錨框，每個錨框都是一個可能的候選區域

K=m×n×3=20×15×3=900個錨

對這些候選區域需要了解如下幾件事情：

?錨框是否包含物體，這可以看成是一個二分類問題，使用標簽objectness來表示

當錨框包含了物體時，objectness=1，表示錨框屬于正類

當錨框不包含物體時，objectness=0，表示錨框屬于負類

?如果錨框包含了物體，那么它對應的預測框的中心位置和大小應該是多少

?如果錨框包含了物體，那么具體類別是什么，這里使用變量label來表示其所屬類別的標簽

YOLOv3算法設置了一個IoU閾值 iou_threshold

當預測框的objectness不為1，但是其與某個真實框的IoU大于iou_threshold時，就將其objectness標簽設置為 -1，不參與損失函數的計算

所有其他的預測框，其objectness標簽均設置為0，表示負類

4. 卷積神經網絡提取特征

通過連續使用多層卷積和池化等操作，能得到語義含義更加豐富的特征圖

在檢測問題中，也使用卷積神經網絡逐層提取圖像特征

通過最終的輸出特征圖來表示物體位置和類別等信息

4.1. 骨干網絡

YOLOv3算法使用的骨干網絡是 Darknet53

在檢測任務中，將圖中C0后面的平均池化、全連接層和Softmax去掉，保留從輸入到C0部分的網絡結構，作為檢測模型的基礎網絡結構，也稱為骨干網絡

YOLOv3模型會在骨干網絡的基礎上，再添加檢測相關的網絡模塊

這里將上圖中特征 C0、C1、C2 所表示的輸出數據取出

指定輸入數據的形狀是 [1,3,640,640] 的話

查看它們的形狀分別是 C2 [1,256,80,80]，C1 [1,512,40,40] 和 C0 [1,1024,20,20]

4.2. 根據輸出特征圖計算預測框位置和類別

對于一個預測框，網絡需要輸出(5+N)個實數來表示它是否包含物體、位置和形狀尺寸以及屬于N個類別的概率

由于在每個小方塊區域都生成了k kk個預測框

則所有預測框一共需要網絡輸出的預測值數目是：[k(5+N)]×m×n]

還有更重要的一點是網絡輸出必須要能區分出小方塊區域的位置來

不能直接將特征圖連接一個輸出大小為k(5+N)]×m×n 的全連接層

需要的是建立輸出特征圖與預測框之間的關聯

現在觀察特征，經過多次卷積核池化之后，其步幅 stride=32

640×480大小的輸入圖片變成了20×15的特征圖

而小方塊區域的數目正好是20×15

也就是說可以讓特征圖上每個像素點分別跟原圖上一個小方塊區域對應

這也是為什么最開始將小方塊區域的尺寸設置為32的原因

這樣可以巧妙的將小方塊區域跟特征圖上的像素點對應起來，解決了空間位置的對應關系

骨干網絡的輸出?特征C，再對特征C進行多次卷積以得到跟預測框相關的?特征圖P

實際中，這幾個尺寸可以隨著任務數據分布的不同而調整

只要保證特征圖輸出尺寸（控制卷積核和下采樣）和輸出層尺寸（控制小方塊區域的大?。┫嗤纯?/p>

5. 損失函數

5.1. 三種類型

是否包含目標物體的損失函數，通過pred_objectness和label_objectness計算

loss_obj = paddle.nn.fucntional.binary_cross_entropy_with_logits(pred_objectness, label_objectness)

二值交叉熵：

對m個樣本的損失函數求和然后除以m:

物體位置的損失函數，通過pred_location和label_location計算

loss_location_x = paddle.nn.fucntional.binary_cross_entropy_with_logits(pred_location_x, label_location_x)
loss_location_y = paddle.nn.fucntional.binary_cross_entropy_with_logits(pred_location_y, label_location_y)
loss_location_w = paddle.abs(pred_location_w - label_location_w)
loss_location_h = paddle.abs(pred_location_h - label_location_h)
loss_location = loss_location_x + loss_location_y + loss_location_w + loss_location_h

物體類別的損失函數，通過pred_classification和label_classification計算

loss_obj = paddle.nn.fucntional.binary_cross_entropy_with_logits(pred_classification, label_classification)

5.2. 三種尺度

目前計算損失函數是在特征圖P0的基礎上進行的，它的步幅stride=32

特征圖的尺寸比較小，像素點數目比較少，每個像素點的感受野很大，具有非常豐富的高層級語義信息，可能比較容易檢測到較大的目標

為了能夠檢測到尺寸較小的那些目標，需要在尺寸較大的特征圖上面建立預測輸出

如果在C2或者C1這種層級的特征圖上直接產生預測輸出

可能面臨新的問題，它們沒有經過充分的特征提取，像素點包含的語義信息不夠豐富，有可能難以提取到有效的特征模式

在目標檢測中，解決這一問題的方式是，將高層級的特征圖尺寸放大之后跟低層級的特征圖進行融合

得到的新特征圖既能包含豐富的語義信息，又具有較多的像素點，能夠描述更加精細的結構

在每個區域的中心位置產生3個錨框，在3個層級的特征圖上產生錨框的大小分別為

P2[(10×13),(16×30),(33×23)]，P1[(30×61),(62×45),(59× 119)]，P0[(116 × 90), (156 × 198), (373 × 326]

越往后的特征圖上用到的錨框尺寸也越大，能捕捉到大尺寸目標的信息

越往前的特征圖上錨框尺寸越小，能捕捉到小尺寸目標的信息

5.3. 總的損失函數

輸入圖片經過特征提取得到三個層級的輸出特征圖P0(stride=32)、P1(stride=16)和P2(stride=8)

相應的分別使用不同大小的小方塊區域去生成對應的錨框和預測框，并對這些錨框進行標注

?P0層級特征圖，對應著使用32×32大小的小方塊，在每個區域中心生成大小分別為 [116,90], [156,198], [373,326] 的三種錨框

?P1層級特征圖，對應著使用16×16大小的小方塊，在每個區域中心生成大小分別為 [30,61], [62,45], [59,119] 的三種錨框

?P2層級特征圖，對應著使用 8 × 8 大小的小方塊，在每個區域中心生成大小分別為 [10,13], [16,30], [33,23 ] 的三種錨框

將三個層級的特征圖與對應錨框之間的標簽關聯起來，并建立損失函數，總的損失函數等于三個層級的損失函數相加

通過極小化損失函數，可以開啟端到端的訓練過程

6. 非極大值抑制

預測過程可以分為兩步：

1.通過網絡輸出計算出預測框位置和所屬類別的得分

2.使用非極大值抑制來消除重疊較大的預測框

計算結果會在每個小方塊區域上生成多個預測框，而這些預測框中很多都有較大的重合度

因此需要消除重疊較大的冗余檢測框

基本思想是，如果有多個預測框都對應同一個物體，則只選出得分最高的那個預測框，剩下的預測框被丟棄掉

如果兩個預測框的類別一樣，而且位置重合度比較大，則可以認為是在預測同一個目標

選出某個類別得分最高的預測框，然后看其余預測框跟它的IoU大于閾值，就把這些預測框給丟棄掉

這里IoU的閾值是超參數，需要提前設置，YOLOv3模型里面設置的是0.5

即丟棄與得分最高的預測框IoU較高的預測框

編輯：黃飛

閱讀全文

神經網絡(98386) 神經網絡(98386)
網絡模塊(9223) 網絡模塊(9223)
函數(61200) 函數(61200)
深度學習(119798) 深度學習(119798)

設計的基本思想，就是盡可能利用“芯片”性能

這樣的設計基本沒有考慮到要復用和修理的問題，用壞了就再買新的——是這種設計的基本思想。你想真的拿成品中的“牛屎片”來做些別的設計嗎？

2017-06-20 10:28:48

1357

基于YOLOv3的紅綠燈檢測識別（Python源碼可直接運行）

基于YOLOv3的訓練好的權重，不需要自己重新訓練，只需要調用yolov3.weights，可以做到視頻或圖片中紅綠燈的檢測識別。

2019-09-18 15:43:40

4606

Yolov5算法解讀

中，這幾個模型的結構基本一樣，不同的是depth_multiple模型深度和width_multiple模型寬度這兩個參數。 yolov5主要分為輸入端，backbone，Neck，和head

2023-05-17 16:38:53

3585

YOLOV3怎么移植到nt9852x開發板

剛剛接觸到移植yolov3，移植都需要哪寫準備？我在網站上搜索，沒有太多流程上的介紹，網絡上更多是寒武紀，華為芯片，對于聯詠的移植特少

2022-10-31 08:38:08

YOLOv3的darknet模型先轉為caffe模型后再轉為fp32bmodel，模型輸出和原始模型輸出存在偏差是怎么回事？

YOLOv3的darknet模型先轉為caffe模型后再轉為fp32bmodel，模型輸出和原始模型輸出存在偏差？

2023-09-19 06:26:10

YOLOv5網絡結構解析

1、YOLOv5 網絡結構解析　　YOLOv5針對不同大?。╪， s， m， l， x）的網絡整體架構都是一樣的，只不過會在每個子模塊中采用不同的深度和寬度，　　分別應對yaml文件中

2022-10-31 16:30:17

yolov3 GPU加速 AI 目標檢測

回復后獲取yolov4測試demo程序：鏈接：https://pan.baidu.com/s/1XavCXSIOYaukCzER7eZQ3g提取碼：[hide] 3icg [/hide]

2021-05-10 22:49:23

yolov5s_v6.1_3output.torchscript.pt模型auto_cali一鍵量化工具執行報錯的原因？

下圖附件 ps: 直接用算法腳本下載yolov5s_v6.1_3output.torchscript.pt然后執行 ./gen_int8bmodel_nntc.sh BM1684 可以得到量化模型請問我的操作步驟中問題在哪

2023-09-18 08:01:25

yolov5-face的pt模型是怎樣轉為onnx模型的

yolov5-face的pt模型是怎樣轉為onnx模型的？有哪些轉換步驟？

2022-02-21 07:19:37

yolov5模型onnx轉bmodel無法識別出結果如何解決？

問題描述： 1. yolov5模型pt轉bmodel可以識別出結果。（轉化成功，結果正確） 2. yolov5模型pt轉onnx轉bmodel可以無法識別出結果。（轉化成功，結果沒有）配置： 1.

2023-09-15 07:30:45

yolov7 onnx模型在NPU上太慢了怎么解決？

我將 yolov7tiny.pt（yolov7-tiny 模型）轉換為具有 uint8 權重的 yolov7tiny.onnx，然后在 i.MX 8M Plus NPU 上運行

2023-04-04 06:13:12

深度學習模型是如何創建的？

具有深度學習模型的嵌入式系統應用程序帶來了巨大的好處。深度學習嵌入式系統已經改變了各個行業的企業和組織。深度學習模型可以幫助實現工業流程自動化，進行實時分析以做出決策，甚至可以預測預警。這些AI

2021-10-27 06:34:15

深度學習存在哪些問題？

深度學習常用模型有哪些？深度學習常用軟件工具及平臺有哪些？深度學習存在哪些問題？

2021-10-14 08:20:47

深度融合模型的特點

深度融合模型的特點，背景深度學習模型在訓練完成之后，部署并應用在生產環境的這一步至關重要，畢竟訓練出來的模型不能只接受一些公開數據集和榜單的檢驗，還需要在真正的業務場景下創造價值，不能只是為了PR而

2021-07-16 06:08:20

CV之YOLOv3：深度學習之計算機視覺神經網絡Yolov3-5clessses訓練自己的數據集全程記錄

CV之YOLOv3：深度學習之計算機視覺神經網絡Yolov3-5clessses訓練自己的數據集全程記錄

2018-12-24 11:51:47

DIY人臉跟蹤電風扇送女朋友(三)

`下面要重點介紹一下深度學習技術以及yolov3目標檢測網絡深度學習技術：深度學習技術實際上是從早期的人工神經網絡發展而來的。本質上就是用一個函數去擬合輸入（圖片）到結果（目標框）的映射。因為函數

2020-10-01 14:40:09

Mali GPU支持tensorflow或者caffe等深度學習模型嗎

Mali GPU 支持tensorflow或者caffe等深度學習模型嗎？好像caffe2go和tensorflow lit可以部署到ARM，但不知道是否支持在GPU運行？我希望把訓練

2022-09-16 14:13:01

PID控制算法的基本思想是什么

常用的控制算法有哪幾種？PID控制算法的基本思想是什么？

2021-12-21 07:26:40

PID控制算法的基本思想是什么？PID控制算法是如何形成的？

常用的控制算法有哪幾種？各自有什么特點？PID控制算法的基本思想是什么？PID控制算法是如何形成的？

2021-06-30 06:04:40

labview+yolov4+tensorflow+openvion深度學習

/1XavCXSIOYaukCzER7eZQ3g提取碼：[hide] 3icg [/hide]隨著機器學習，深度學習的發展，很多人眼很難去直接量化的特征，深度學習可以搞定，這就是深度學習帶給我們的優點和前所未有的吸引力。很多特征

2021-05-10 22:33:46

labview測試tensorflow深度學習SSD模型識別物體

安裝labview2019 vision，自帶深度學習推理工具，支持tensorflow模型。配置好python下tensorflow環境配置好object_detection API下載SSD模型

2020-08-16 17:21:38

labview調用深度學習tensorflow模型非常簡單，附上源碼和模型

]`labview調用高性能YOLOV5：http://t.elecfans.com/c1659.html 讓你的CPU也可以運行最新深度學習模型labview調用高性能Tensorflow+YOLOV4：http://t.elecfans.com/c1553.html 讓你的GPU也可以運行最新深度學習模型

2021-06-03 16:38:25

labview調用yolo 目標檢測速度太慢？yolov4：速度和精度的完美結合，性能和精度碾壓yolov3

gpu加速），labview調用openvino優化深度學習模型（cpu加速），以及labview調用yolov4深度學習模型（gpu加速）3個模塊的內容，另外還有海量工業實際項目數據集提供給學員。如需

2021-01-05 09:22:02

【EASY EAI Nano人工智能開發套件試用體驗】RKNN YOLOV5 例程測試及橫向對比

。另一個工具是 RKNN-Toolkits，這是一組轉換模型工具，可以用于將常見的深度學習模型轉換為 RKNN 支持的模型格式。RKNN-Toolkits 提供了一些腳本和 API，可以方便地將 Caffe

2023-05-31 21:49:42

【KV260視覺入門套件試用體驗】KV260部署yolov3實現車輛和行人檢測

Ubuntu Desktop 20.04.3 LTS，因為版本的不同后面在進行量化和編譯的文件也是不通用的具體的原因這里亦不做展開。此次分享僅講述如何實現在KV260上部署yolov3以及其他模型部署的方法

2023-08-08 14:29:10

【愛芯派 Pro 開發板試用體驗】yolov8模型轉換

嘗試將最新的yolov8模型轉換為愛芯派的模型。環境準備準備Docker環境首先自己在任意機器上準備好docker環境，詳細步驟見官網。 Docker 鏡像文件準備 yolo8 模型，并轉

2023-11-20 12:19:32

【愛芯派 Pro 開發板試用體驗】使用yolov5s模型（官方）

【愛芯派 Pro 開發板試用體驗】+使用yolov5s模型（官方）配置好基本環境如果沒有連接上網絡的，可以看博主寫的上一篇怎么連接網絡 apt update apt install

2023-11-13 11:04:14

【愛芯派 Pro 開發板試用體驗】部署愛芯派官方YOLOV5模型

/s/1CCu-oKw8jUEg2s3PEhTa4g?pwd=xq9f ），直接下載下來使用。因為本文需要部署人臉識別模型，所以下載了yolov

2023-12-12 22:58:48

【米爾FZ3深度學習計算卡試用體驗】在自定義的Ai系統上跑深度學習推理模型

`上一次試用將DPU成功移植在了FZ3開發板上，并將DNNDK開發套件安裝在了自定義的AI系統上，并通過相關指令驗證了已經安裝成功，現在根據xilinx官方提供的模型跑深度學習推理模型。本次驗證

2020-12-19 11:23:36

【米爾百度大腦EdgeBoard邊緣AI計算盒試用連載】III. 板載深度學習DEMO-detection測試-上(ZMJ)

mobilenet-ssd-640 3. vgg-ssd 4. yolov32.目標檢測detection測試在目標檢測模型中，經測試使用YOLOV3的效果最好，不過需要將模型參數threshold參數0.3改為0.4

2021-04-02 19:56:41

【飛凌嵌入式OKMX8MP-C 開發板試用體驗】OpenCV-DNN移植&使用體驗(基于YOLOV3模型識別物體)

); cvDestroyWindow("video"); }實際上效果不如直接用V4L2庫轉為MJPEG的效果好，OpenCV有意思的應用是圖像處理和人工智能識別，這里我參考了飛凌文檔提供的，基于YOLOV3模型

2022-02-21 00:22:42

一種專門用于檢測小目標的框架Dilated Module

2和Tiny YOLOv3，但是低于YOLOv3：在DOTA數據集上的比較：不同網絡的速度的比較：可以看到，模型速度和Tiny YOLOv3相當，準確率大大超過Tiny YOLOv3，僅僅比YOLOv3略低。原作者：ronghuaiyang

2022-11-04 11:14:00

人工智能AI-卷積神經網絡LabVIEW之Yolov3+tensorflow深度學習有用嗎？

介紹：人工智能AI到來，工業上很多學員不了解C#中labview中如何調用tensorflow進行深度學習模型的訓練和調用，推出一整套完整的簡易學的視頻課程，使學員能在沒有任何深度學習理論基礎，不懂

2020-11-27 11:19:37

什么是深度學習？使用FPGA進行深度學習的好處？

什么是深度學習為了解釋深度學習，有必要了解神經網絡。神經網絡是一種模擬人腦的神經元和神經網絡的計算模型。作為具體示例，讓我們考慮一個輸入圖像并識別圖像中對象類別的示例。這個例子對應機器學習中的分類

2023-02-17 16:56:59

使用YOLOv3訓練BDD100K數據集之開始訓練

（三）使用YOLOv3訓練BDD100K數據集之開始訓練

2020-05-12 13:38:55

全志V853 NPU開發之Demo使用說明

可以看到這里選擇了 yolov3 會出現 yolov3-model 這個選項，這個選項是提供一個測試使用的模型到系統中，文件較大，如果編譯打包出現錯誤請參閱【FAQ 常見問題 - V853】查看或

2024-01-08 10:04:25

全志V853 在 NPU 轉換 YOLO V3 模型

版的 yolov3 模型包含兩個文件，分別是權重文件 yolov3.weights 和模型結構描述文件 yolov3.cfg 這里兩個都需要下載。下載完畢后放到配置好 NPU 開發工具的環境內。打開模型結構描述文件

2022-12-19 10:36:26

全網唯一一套基于人工智能LabVIEW深度學習基礎必修課操作員可以學會的傳統視覺

？顯然，越早學習和掌握這一技術的人才越有優勢。為此，開設“AI基礎系列課程”，涵蓋 LabVIEW傳統視覺基礎、tensorflow、Yolov3、神經棒以及人臉識別登錄節目“AI發現”，讓我們跟著

2020-10-12 14:21:34

基于RK3399pro開發板的YOLOV3開發與實現

yolov3 rknn模型　　1.下載附件解壓到PC Linux系統上（Windows， Mac不支持預編譯）用于轉化模型（也可以在板子上轉模型，但不推薦，速度慢且不支持預編譯）　　2.進入

2022-04-02 17:05:56

多棒主動模式怎樣才能在yolov3運行呢

如何在RK1808MO上部署yolov3多棒主動模式呢？多棒主動模式怎樣才能在yolov3運行呢？

2022-02-16 06:50:32

如何使用MATLAB幫助相關人員執行深度學習任務

MATLAB支持的模型有哪些呢？如何使用MATLAB幫助相關人員執行深度學習任務呢？

2021-11-22 07:48:19

如何在RKNN上開發并運行一種yolov3 rknn模型呢

如何在RKNN上開發并運行一種yolov3 rknn模型呢？其程序代碼該怎樣去實現呢？

2022-02-15 07:57:46

實戰視覺圖像處理：LabVIEW二值化結果顯示與對比

和部署深度學習模型，并配備相關案例視頻以及源碼。【課程詳情】【課程亮點】1、人工智能深度學習環境安裝2、Tensorflow訓練、導出模型、評估模型3、Yolov3算法的強大之處為什么只看一次【適用人群

2020-12-09 14:53:37

怎樣使用PyTorch Hub去加載YOLOv5模型

圖像會自動傳輸到正確的模型設備。靜音輸出模型可以靜默加載_verbose=False：輸入通道要加載具有 4 個輸入通道而不是默認的 3 個輸入通道的預訓練 YOLOv5s 模型：在這種情況下，模型將由

2022-07-22 16:02:42

無法使用MYRIAD在OpenVINO trade中運行YOLOv7自定義模型怎么解決？

無法確定如何將 YOLOv7 模型的重量（.pt 文件）轉換為OpenVINO?中間表示（IR）并推斷有 MYRIAD 的 IR。分辨率轉換使用此 GitHub* 存儲庫

2023-08-15 08:29:57

機器學習簡介與經典機器學習算法人才培養

應用Transformer概念與基本方法介紹Transformer在圖像領域的應用章節目標：掌握小樣本學習、Transformer等前沿方法和基本思想，了解小樣本學習、Transformer等在實際場景下的應用。No.3

2022-04-28 18:56:07

計算機視覺神經網絡資料全集

CV之YOLOv3：深度學習之計算機視覺神經網絡Yolov3-5clessses訓練自己的數據集全程記錄(第二次)——Jason niu

2018-12-24 11:52:25

計算機解題的基本思想方法和步驟

計算機解題的基本思想方法和步驟。是對要解決一個問題或要完成一項任務所采取的方法和步驟的描述，包括需要什么數據（輸入什么數據、輸出什么結果）、采用什么結構、使用什么語句以及如何安排這些語句等。通常使用自然語言、結構化流程圖、偽代碼等來描述算法。

2020-11-02 06:15:48

請問k210能加載多個模型嗎？

如題。目前k210已經跑了一個YOLOv3的人臉檢測模型，我想再跑一個人臉識別的模型，可以嗎？

2023-09-14 08:58:34

遷移學習

基于特征的遷移學習基于分類器適配的遷移學習章節目標：掌握遷移學習的思想與基本形式，了解傳統遷移學習的基本方法，對比各種方法的優缺點，掌握遷移學習的適用范圍。四、深度遷移學習介紹深度遷移學習概述基于距離

2022-04-21 15:15:11

龍哥手把手教你學視覺-深度學習YOLOV5篇

的前提下，使用labview訓練和部署深度學習模型，并配備相關案例視頻。課程目錄1.安裝anaconda3并配置yolov5虛擬環境21'2.安裝pytorch和yolov5依賴環境22'3.手動方式

2021-09-03 09:39:28

FDTD算法基本思想

FDTD算法是K.S.Yee于1966年提出的、直接對麥克斯韋方程作差分處理、來解決電磁脈沖在電磁介質中傳播和反射問題的算法。基本思想是：FDTD計算域空間節點采用Yee元胞的方法，同時電

2010-08-13 10:16:53

8313

1.1 深度學習的基本思想(1)#神經網絡

神經網絡深度學習

未來加油dz發布于 2023-05-16 18:36:59

1.1 深度學習的基本思想(2)#神經網絡

神經網絡深度學習

未來加油dz發布于 2023-05-16 18:37:32

圖像處理基本思想和算法研究

圖像處理的基本思想還是要立足于圖像本身，要深度到圖像內部結構中，思維要靈活。圖像處理是一個非常大的概念，圖像處理不等于人臉識別，也不等于模式識別。所謂圖像處理，就是用計算機對圖像進行分析，以達到所需結果的技術，又稱影像處理。

2018-01-12 18:13:30

2119

模型驅動深度學習的標準流程與學習方法解析

模型驅動的深度學習方法近年來，深度學習在人工智能領域一系列困難問題上取得了突破性成功應用。

2018-01-24 11:30:13

4608

深度學習之機器視覺詳解：網絡壓縮、視覺問答、可視化、風格遷移等

本系列文章旨在直觀系統地梳理深度學習各領域常見概念與基本思想，使讀者對深度學習的重要概念與思想有一直觀理解，做到“知其然，又知其所以然”，從而降低后續理解論文及實際應用的難度。

2018-04-02 00:16:33

9069

根據美團“猜你喜歡”來深度學習排序模型實踐

本文將主要介紹深度學習模型在美團平臺推薦排序場景下的應用和探索。

2018-04-02 09:35:24

6070

基于深度學習模型的點云目標檢測及ROS實現

近年來，隨著深度學習在圖像視覺領域的發展，一類基于單純的深度學習模型的點云目標檢測方法被提出和應用，本文將詳細介紹其中一種模型——SqueezeSeg，并且使用ROS實現該模型的實時目標檢測。

2018-11-05 16:47:29

17181

深度學習模型小型化處理的五種方法

現在深度學習模型開始走向應用，因此我們需要把深度學習網絡和模型部署到一些硬件上，而現有一些模型的參數量由于過大，會導致在一些硬件上的運行速度很慢，所以我們需要對深度學習模型進行小型化處理。

2020-01-28 17:40:00

3658

晶心科技和Deeplite攜手合作高度優化深度學習模型解決方案

晶心科技今日宣布將攜手合作，在基于AndeStar? V5架構的晶心RISC-V CPU核心上配置高度優化的深度學習模型，使AI深度學習模型變得更輕巧、快速和節能。

2019-12-31 16:30:11

1002

基于YOLOV3算法的視頻監控目標檢測方法

由于監控中的行人檢測存在背景復雜，目標尺度和姿態多樣性及人與周圍物體互相遮擋的問題，造成YOLOV3對部分目標檢測不準確，會產生誤檢、漏檢或重復檢測的情況。因此，在YOLO3的網絡基礎上，利用

2021-03-31 14:22:38

基于神經網絡的、改進的YOLOv3目標檢測算法

針對復雜交通場景中的小尺度車輛檢測問題，提出改進的 YOLOV3目標檢測方法（ S-YOLOV3）。使用Resnet網絡優化YoLo巧3的 Darknet53特征提取結構，采用特征金字塔網絡獲取目標

2021-04-01 11:43:23

深度模型中的優化與學習課件下載

2021-04-07 16:21:01

工業零件圖像的改進YOLOv3目標識別算法

為準確識別工業圖像中的目標零件，提出一種改進的YOLOⅤ3目標識別算法。結合K- means聚類與粒子群優化算法進行錨框計算，以降低初始點對聚類結果的影響，加快算法收斂速度。同時在 YOLOV3網絡

2021-05-19 15:06:38

基于YOLOv3的嵌入式設備視頻目標檢測算法

深度神經網絡在目標檢測領域具有優異的檢測性能，但其結構復雜、計算量大，難以在嵌入式設備上進行髙性能的實時目標檢測。針對該問題，提出一種基于 YOLOV3的目標檢測算法。采用半精度推理策略提高YOLO

2021-05-28 14:05:52

什么？不用GPU也能加速你的YOLOv3深度學習模型

解決煩惱，讓你的深度學習模型效率“一節更比七節強”！ Neural Magic是專門研究深度學習的稀疏方法的公司，這次他們發布了教程：用recipe稀疏化YOLOv3。聽起來有點意思啊，讓我們來看看是怎么實現的~ 稀疏化的YOLOv3 稀疏化的YOLOv3使用剪枝（prune）和量化（qua

2021-06-10 15:33:02

1975

基于YOLOv3等的機械臂藥盒智能抓取方法

基于YOLOv3等的機械臂藥盒智能抓取方法

2021-06-23 15:43:25

海思AI芯片學習（十）將yolov3 darknet模型轉換為caffemodel

海思35xx系列的nnie硬件引擎只支持caffe1.x模型。所以任何使用其它框架訓練出來的算法模型想要在nnie上進行推理必須先要將其轉換成caffe...

2022-01-26 19:09:24

移植深度學習算法模型到海思AI芯片

本文大致介紹將深度學習算法模型移植到海思AI芯片的總體流程和一些需要注意的細節。海思芯片移植深度學習算法模型，大致分為模型轉換，...

2022-01-26 19:42:35

Yolov3&Yolov4核心基礎知識

Yolov3是目標檢測Yolo系列非常非常經典的算法，不過很多同學拿到Yolov3或者Yolov4的cfg文件時，并不知道如何直觀的可視化查看網絡結構。如果純粹看cfg里面的內容，肯定會一臉懵逼。

2022-04-06 10:42:41

1811

關于YOLOU中模型的測試

整個算法完全是以YOLOv5的框架進行，主要包括的目標檢測算法有：YOLOv3、YOLOv4、YOLOv5、YOLOv5-Lite、YOLOv6、YOLOv7、YOLOX以及YOLOX-Lite。

2022-08-16 10:24:27

557

基于MobileNet的多目標跟蹤深度學習算法

針對深度學習算法在多目標跟蹤中的實時性問題, 提出一種基于MobileNet的多目標跟蹤算法. 借助于MobileNet深度可分離卷積能夠對深度網絡模型進行壓縮的原理, 將YOLOv3主干網絡替換

2022-11-09 10:23:30

736

在C++中使用OpenVINO工具包部署YOLOv5模型

下載并轉換YOLOv5預訓練模型的詳細步驟，請參考：《基于OpenVINO?2022.2和蝰蛇峽谷優化并部署YOLOv5模型》，本文所使用的OpenVINO是2022.3 LTS版。

2023-02-15 16:53:56

2073

大模型為什么是深度學習的未來？

與傳統機器學習相比，深度學習是從數據中學習，而大模型則是通過使用大量的模型來訓練數據。深度學習可以處理任何類型的數據，例如圖片、文本等等；但是這些數據很難用機器完成。大模型可以訓練更多類別、多個級別的模型，因此可以處理更廣泛的類型。另外：在使用大模型時，可能需要一個更全面或復雜的數學和數值計算的支持。

2023-02-16 11:32:37

1605

淺析基于改進YOLOv5的輸電線路走廊滑坡災害識別

本文以YOLOv5網絡模型為基礎，提出一種改進YOLOv5（YOLOv5-BC）深度學習滑坡災害識別方法，將原有的PANet層替換為BiFPN結構，提高網絡多層特征融合能力

2023-05-17 17:50:37

860

AI愛克斯開發板上使用OpenVINO加速YOLOv8目標檢測模型

《在AI愛克斯開發板上用OpenVINO加速YOLOv8分類模型》介紹了在AI愛克斯開發板上使用OpenVINO 開發套件部署并測評YOLOv8的分類模型，本文將介紹在AI愛克斯開發板上使用OpenVINO加速YOLOv8目標檢測模型。

2023-05-26 11:03:18

662

YOLOv7訓練自己的數據集包括哪些

? YOLOv7訓練自己的數據集整個過程主要包括：環境安裝—制作數據集—模型訓練—模型測試—模型推理一、準備深度學習環境本人的筆記本電腦系統是：Windows10 首先下載YOLOv7的代碼

2023-05-29 15:18:02

557

基于深度學習的點云分割的方法介紹

　　摘要：點云分割是點云數據理解中的一個關鍵技術，但傳統算法無法進行實時語義分割。近年來深度學習被應用在點云分割上并取得了重要進展。綜述了近四年來基于深度學習的點云分割的最新工作，按基本思想分為

2023-07-20 15:23:59

三種主流模型部署框架YOLOv8推理演示

深度學習模型部署有OpenVINO、ONNXRUNTIME、TensorRT三個主流框架，均支持Python與C++的SDK使用。對YOLOv5~YOLOv8的系列模型，均可以通過C++推理實現模型

2023-08-06 11:39:17

1677

深度學習框架是什么？深度學習框架有哪些？

深度學習框架是什么？深度學習框架有哪些？? 深度學習框架是一種軟件工具，它可以幫助開發者輕松快速地構建和訓練深度神經網絡模型。與手動編寫代碼相比，深度學習框架可以大大減少開發和調試的時間和精力，并提

2023-08-17 16:03:09

1589

深度學習框架和深度學習算法教程

了基于神經網絡的機器學習方法。深度學習算法可以分為兩大類：監督學習和無監督學習。監督學習的基本任務是訓練模型去學習輸入數據的特征和其對應的標簽，然后用于新數據的預測。而無監督學習通常用于聚類、降維和生成模型等任務中

2023-08-17 16:11:26

638

使用OpenVINO優化并部署訓練好的YOLOv7模型

在《英特爾銳炫顯卡+ oneAPI 和 OpenVINO 實現英特爾視頻 AI 計算盒訓推一體-上篇》一文中，我們詳細介紹基于英特爾獨立顯卡搭建 YOLOv7 模型的訓練環境，并完成了 YOLOv7 模型訓練，獲得了最佳精度的模型權重。

2023-08-25 11:08:58

819

基于YOLOv8的自定義醫學圖像分割

YOLOv8是一種令人驚嘆的分割模型；它易于訓練、測試和部署。在本教程中，我們將學習如何在自定義數據集上使用YOLOv8。但在此之前，我想告訴你為什么在存在其他優秀的分割模型時應該使用YOLOv8呢？

2023-12-20 10:51:46

328

如何基于深度學習模型訓練實現圓檢測與圓心位置預測

Hello大家好，今天給大家分享一下如何基于深度學習模型訓練實現圓檢測與圓心位置預測，主要是通過對YOLOv8姿態評估模型在自定義的數據集上訓練，生成一個自定義的圓檢測與圓心定位預測模型

2023-12-21 10:50:05

529

如何基于深度學習模型訓練實現工件切割點位置預測

Hello大家好，今天給大家分享一下如何基于深度學習模型訓練實現工件切割點位置預測，主要是通過對YOLOv8姿態評估模型在自定義的數據集上訓練，生成一個工件切割分離點預測模型

2023-12-22 11:07:46

259

深入淺出Yolov3和Yolov4

Yolov3是目標檢測Yolo系列非常非常經典的算法，不過很多同學拿到Yolov3或者Yolov4的cfg文件時，并不知道如何直觀的可視化查看網絡結構。

2024-01-11 10:42:13

160

已全部加載完成

搜索歷史

深度學習YOLOv3 模型設計的基本思想

評論