在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種不同于雙線性插值的上采樣方法

電子工程師 ? 來源:lp ? 2019-04-08 14:47 ? 次閱讀

今天為大家推薦一篇 CVPR2019 關(guān)于語義分割的文章 Decoders Matter for Semantic Segmentation: Data-Dependent Decoding Enables Flexible Feature Aggregation,該文章提出了一種不同于雙線性插值的上采樣方法,能夠更好的建立每個像素之間預(yù)測的相關(guān)性。得益于這個強(qiáng)大的上采樣方法,模型能夠減少對特征圖分辨率的依賴,能極大的減少運(yùn)算量。該工作在 PASCAL VOC 數(shù)據(jù)集上達(dá)到了 88.1% 的 mIOU,超過了 DeeplabV3 + 的同時只有其 30% 的計算量。

論文傳送門:https://arxiv.org/abs/1903.02120

1. Introduction

在之前的語義分割方法中,雙線性插值通常作為其最后一步來還原特征圖的分辨率,由于非線性差值不能建立起每個像素的預(yù)測之間的關(guān)系,因此為了得到精細(xì)的結(jié)果,對特征圖的分辨率要求較高,同時帶來了巨額的計算量。

為了解決這個問題,本工作提出了Data-dependent Up-sampling (DUpsample),能夠減少上采樣操作對特征圖分辨率的依賴,大量的減少計算量。同時得益于 DUpsample, Encoder 中的 low-level feature 能夠以更小的運(yùn)算量與 Decoder 中的 high-level feature 進(jìn)行融合,模型結(jié)構(gòu)如下所示:

我們可以看到,該網(wǎng)絡(luò)將傳統(tǒng)的非線性插值替換成 DUpsample,同時在 feature fuse 方面,不同于之前方法將 Decoder 中的特征上采樣與 Encoder 特征融合,本工作將 Encoder 中的特征下采樣與 Decoder 融合,大大減少了計算量 ,這都得益于 DUpsample。

2. Our Approach

之前的語義分割方法使用下列公式來得到最終的損失:

其中 Loss 通常為交叉熵?fù)p失,F(xiàn) 為特征圖,Y 為 ground truth,由于雙線性插值過于簡單,對特征圖 F 的分辨率較高,因此引入了大量的計算。一個重要的發(fā)現(xiàn)是語義分割輸入圖像的 label Y 并不是 i.i.d 的,所以 Y 可以被壓縮成 Y′,我們令, 并將 Y 劃分成的子窗口,每個子窗口的大小為 r×r,接著我們將每個子窗口拉伸成向量,其中,隨即我們將向量 v 壓縮成低維向量 x,我們使用線性投影來完成,最后,我們有:其中,用來將 v 壓縮成 x,為 reconstruction matrix, v′為重建后的 v,我們可以用壓縮后的向量 x 組合成 Y′.

矩陣 P 和矩陣 W 可以通過最小化下列式子得到:

我們可以使用梯度下降,或者在正交約束的條件下使用 PCA 求解。

使用壓縮后的 Y′為目標(biāo),我們可以使用下列損失函數(shù)來預(yù)訓(xùn)練網(wǎng)絡(luò):

另一種直接的方法是在 Y 空間計算 loss,也就是并非將 Y 壓縮到 Y′, 我們可以將 F 使用 W(上面預(yù)訓(xùn)練得到的)上采樣然后計算損失,公式如下:

其中以兩倍為例,DUpsample 的操作如下圖所示:

我們可以用 1X1 卷積來完成上述的權(quán)重與特征相乘的過程。但是當(dāng)我們將這個模塊嵌入到網(wǎng)絡(luò)時會遇到優(yōu)化問題。因此我們使用 softmax with temperature 函數(shù)來解決這個問題:

我們發(fā)現(xiàn) T 可以使用梯度下降學(xué)習(xí)得到,這樣減少了調(diào)試的麻煩。

有大量的工作說明,與 low-level features 結(jié)合可以顯著的提升分割的精度,其做法如下:

f 是在上采樣之后的卷積操作,其計算量依賴于特征圖的空間大小,這樣做會顯著增加計算量。得益于 DUpsample,我們可以使用下列操作來減少計算量:

這樣做不僅保證了在低分辨率下的有效性,而且減少了計算量,同時允許任意 level feature 的融合。

只有使用了 DUpsample,上述操作才變得可行,否則語義分割的精度會被雙線性插值限制。

3. Experiments

本次實驗使用以下兩種數(shù)據(jù)集:PASCAL VOC 2012 和 PASCAL Context benchmark。我們使用 ResNet-50 或 Xception-50 作為我們的 backbone,具體訓(xùn)練細(xì)節(jié)詳見論文。

首先我們設(shè)計實驗說明雙線性插值的上限遠(yuǎn)遠(yuǎn)低于 DUpsample。首先我們搭建一個簡易網(wǎng)絡(luò)實現(xiàn) auto-encoder,其中上采樣方式分別使用雙線性插值與 DUpsample, 輸入分別為 ground_truth,得到下表中的 mIOU*,這個指標(biāo)代表上采樣方法的上限。同時我們使用 ResNet50 作為主干網(wǎng)絡(luò),輸入為 raw image 去實現(xiàn)語義分割,得到下表中的 mIOU:

通過上表我們可以發(fā)現(xiàn):

1) 在相同條件下,DUpsampling 效果優(yōu)于 bilinear

2)DUpsampling 在 output_stride=32 的情況下效果與 bilinear 在 output_stride=16 的情況下結(jié)果相當(dāng)。

接下來我們設(shè)計實驗說明融合不同的 low-level 特征對結(jié)果的影響,如下表所示:

值得說明的是,并不是所有與 low-level feature 的融合都會提升結(jié)果,例如 conv1_3,因為其結(jié)果不夠魯棒。因此和什么 low-level feature 相結(jié)合對語義分割的結(jié)果有很大的影響。

接下來我們設(shè)計實驗與雙線性插值進(jìn)行比較:

可以看到我們的方法優(yōu)于傳統(tǒng)的雙線性插值上采樣方法。同時我們驗證了不同的 softmax 對結(jié)果的影響,在沒有使用 softmax with tenperature 的情況下只有 69.81 的 mIOU(這里沒設(shè)置消融實驗有些疑惑,感覺不同的 softmax 對實驗結(jié)果影響挺大的)。

最后將我們的方法與最新的模型進(jìn)行比較,結(jié)果如下(分別為 PASCAL VOC 與 PASCAL context):

我們的方法在只用 deeplabv3+ 30% 的計算量的情況下,超越了當(dāng)前所有的方法。

總的來說,我覺得這個論文提出的想法很有趣,是一篇很有 insight 的論文。

由于論文現(xiàn)在還沒有開源,筆者嘗試實現(xiàn)了一下 DUpsample 的操作和網(wǎng)絡(luò):

https://github.com/LinZhuoChen/DUpsampling。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4374

    瀏覽量

    64407
  • 梯度
    +關(guān)注

    關(guān)注

    0

    文章

    30

    瀏覽量

    10475
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25321

原文標(biāo)題:Decoders對于語義分割的重要性 | CVPR 2019

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是線性插值線性插值雙線性插值在BMS開發(fā)中的應(yīng)用

    線性插值法(linear interpolation),是指使用連接兩個已知量的直線來確定在這兩個已知量之間的個未知量的方法
    的頭像 發(fā)表于 12-24 10:44 ?1.3w次閱讀
    什么是<b class='flag-5'>線性插值</b>?<b class='flag-5'>一</b>維<b class='flag-5'>線性插值</b>和<b class='flag-5'>雙線性插值</b>在BMS開發(fā)中的應(yīng)用

    線性插值

    在求解線性插值的時候,我先把個數(shù)組分成兩個,再求的時候,有時候出結(jié)果,有時候不出結(jié)果,求指教
    發(fā)表于 11-08 22:04

    雙線性插值法的C語言程序!幫幫忙!拜托各位了!

    在DSP6000開發(fā)平臺上用C語言實現(xiàn)雙線性插值法,實現(xiàn)對圖像的縮放效果的改進(jìn)。
    發(fā)表于 04-20 18:52

    一種基于FPGA的實時視頻圖像處理算法研究與實現(xiàn)

    針對視頻的輸出顯示要求,重點(diǎn)介紹了基于雙線性插值算法的實現(xiàn)。ModelSim的仿真結(jié)果表明,該算法符合多屏幕顯示系統(tǒng)的要求。關(guān)鍵詞 視頻監(jiān)控;視頻圖像處理;雙線性插值;FPGA;多屏幕
    發(fā)表于 06-28 07:06

    基于FPGA的線性插值-

    ,并且做除法會消耗大量的資源。 本文提出一種基于查找法實現(xiàn)線性插值的算法,不需要利用除法實現(xiàn)線性插值。 2,方法原理 由當(dāng)D是A,B的中點(diǎn)時,可以求出D的坐標(biāo)為: x\' = (x1
    發(fā)表于 11-20 23:10

    雙線性變換法設(shè)計數(shù)字Butterworth和Chebyshe

    雙線性變換法設(shè)計IIR濾波器、實驗?zāi)康?、了解兩工程最常用的變換方法:脈沖響應(yīng)不變法和雙線性
    發(fā)表于 05-10 10:00 ?77次下載

    一種改進(jìn)的線性圖像算法

    針對傳統(tǒng)的雙線性插值法在對圖像進(jìn)行后會不可避免的產(chǎn)生邊緣模糊的問題,提出了一種改進(jìn)的線性插值法,該算法首先把待
    發(fā)表于 08-20 12:01 ?29次下載

    基于Matlab的雙線性插值算法在圖像旋轉(zhuǎn)中的應(yīng)用

    MATLAB雙線性插值圖像處理的算法,讀者可以自行參考。
    發(fā)表于 05-04 16:04 ?1次下載

    基于最優(yōu)移位雙線性插值的圖像縮放旋轉(zhuǎn)硬件加速研究

    基于最優(yōu)移位雙線性插值的圖像縮放旋轉(zhuǎn)硬件加速研究_丁家隆
    發(fā)表于 01-08 15:15 ?10次下載

    基于雙線性插值的圖像縮放在GPU的實現(xiàn)

    基于雙線性插值的圖像縮放在GPU的實現(xiàn)
    發(fā)表于 01-08 14:47 ?0次下載

    基于AIS線性插值的綜合方法

    在實時視景顯示中,為了使目標(biāo)的運(yùn)動軌跡平滑,針對傳統(tǒng)AIS線性插值的弊端,本文提出一種綜合考慮目標(biāo)的航速、航向等運(yùn)行信息的方法,該
    發(fā)表于 11-13 17:20 ?13次下載
    基于AIS<b class='flag-5'>線性插值</b>的綜合<b class='flag-5'>插</b><b class='flag-5'>值</b><b class='flag-5'>方法</b>

    在FPGA如何實現(xiàn)雙線性插值的計算

    雙線性插值顧名思義是線性插值Pro,為了說明白什么是雙線性插值,首先得先從線性插值說起。那么什么又是線性呢?
    發(fā)表于 08-09 17:33 ?4775次閱讀

    一種線性插值隨機(jī)對偶平均優(yōu)化方法

    樣本不滿足獨(dú)立同分布會使梯度估計在迭代過程中存在偏差,且最優(yōu)的個體收斂界在噪聲的干擾下無法確定。為此,提出一種線性插值隨機(jī)對偶平均(DA)優(yōu)化方法。給出DA方法收斂性的證明,在梯度估計
    發(fā)表于 05-25 16:20 ?4次下載

    雙線性插值算法的講解

    雙線性插值中,我們現(xiàn)在找x0', y0'所在位置旁邊的四個點(diǎn),再根據(jù)這四個點(diǎn)與(x0',y0')距離的關(guān)系得到權(quán)重,最后計算出目標(biāo)圖像中(x,y)點(diǎn)的像素
    的頭像 發(fā)表于 09-19 10:25 ?3653次閱讀

    基于FPGA的圖像旋轉(zhuǎn)和雙線性插值算法設(shè)計

    今天開源個FPGA圖像處理相關(guān)的項目:圖像旋轉(zhuǎn)。圖像旋轉(zhuǎn)算法本身非常簡單,但是如果想讓旋轉(zhuǎn)之后的圖像更加完整、平滑,還需要進(jìn)行雙線性插值處理,因此整個算法FPGA實現(xiàn)起來還是有定難度的。
    的頭像 發(fā)表于 09-04 16:52 ?2469次閱讀
    基于FPGA的圖像旋轉(zhuǎn)和<b class='flag-5'>雙線性插值</b>算法設(shè)計
    主站蜘蛛池模板: 国产精品一区二区三区免费视频 | 不卡一区二区在线观看 | 午夜男人天堂 | 六月丁香深爱六月综合激情 | 97se亚洲综合 | 天天干天天操天天透 | 加勒比精品久久一区二区三区 | 午夜影视网站 | 亚洲国产精品久久精品怡红院 | 日韩欧美一区二区三区不卡视频 | 日本吻胸抓胸激烈视频网站 | 511韩国理论片在线观看 | 日本a级片视频 | 好爽好紧好大的免费视频国产 | 亚洲午夜小视频 | 亚洲爱爱图片 | 日日噜噜夜夜狠狠tv视频免费 | 日韩一级特黄 | 天天夜约| 被公侵犯肉体中文字幕一区二区 | 日本黄色短视频 | 天天做天天做天天综合网 | 亚洲第一色在线 | 日日噜噜噜夜夜爽爽狠狠图片 | 天天做天天爽天天谢 | 成人午夜性视频欧美成人 | 两性色午夜视频免费网 | 国产一区二区在线不卡 | 长腿丝袜美女被啪啪 | 777kkk亚洲综合欧美色老头 | 老色99久久九九精品尤物 | 午夜免费福利片观看 | 中文字幕777 | 国产又粗又大又爽又免费 | 欧美三页 | 国产亚洲欧美一区二区 | 黄蓉h肉辣文大全 | 福利视频亚洲 | 777奇米影视笫四色88me久久综合 | 国产三级影院 | 久久就是精品 |