91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于圖像修復(fù)詳細(xì)解析全局和局部一致性的圖像補(bǔ)全

中科院長(zhǎng)春光機(jī)所 ? 來(lái)源:AI公園 ? 作者:Chu-Tak Li ? 2021-04-25 14:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

全局一致讓圖像補(bǔ)全的內(nèi)容契合上下文,局部一致性讓紋理更加真實(shí)。

這里只是對(duì)我們之前所學(xué)內(nèi)容的一個(gè)簡(jiǎn)單回顧。

對(duì)于圖像修復(fù),填充像素的紋理細(xì)節(jié)是很重要的。有效的像素和填充的像素應(yīng)該是一致的,填充的圖像應(yīng)該看起來(lái)真實(shí)。

粗略的說(shuō),研究者采用逐像素的重建損失(即L2損失)來(lái)確保我們可以用“正確”的結(jié)構(gòu)來(lái)填補(bǔ)缺失的部分。另一方面,GAN損失(即對(duì)抗損失)和/或[紋理?yè)p失]應(yīng)用于獲得具有更清晰的生成像素紋理細(xì)節(jié)的填充圖像。

86c2640c-a554-11eb-aece-12bb97331649.png

圖1,一個(gè)例子來(lái)說(shuō)明為圖像修復(fù)任務(wù)生成新的片段的需求。

對(duì)于基于patch的方法,一個(gè)很大的假設(shè)是我們相信我們可以在缺失區(qū)域之外找到相似的patch,這些相似的補(bǔ)丁將有助于填充缺失區(qū)域。這個(gè)假設(shè)對(duì)于自然場(chǎng)景可能是正確的,因?yàn)樘炜蘸筒萜涸谝粋€(gè)圖像中可能有許多相似的patch。如果缺失區(qū)域之外沒(méi)有任何類似的patch,就像圖1中所示的人臉圖像修復(fù)的情況。在這種情況下,我們找不到眼睛的patch來(lái)填補(bǔ)相應(yīng)的缺失部分。因此,魯棒的修復(fù)算法應(yīng)該能夠生成新的片段。

現(xiàn)有的基于GAN的修復(fù)方法利用一個(gè)鑒別器(對(duì)抗損失)來(lái)增強(qiáng)填充區(qū)域的銳度,將填充區(qū)域輸入到鑒別器(即欺騙鑒別器)。有些人可能會(huì)在預(yù)訓(xùn)練的網(wǎng)絡(luò)中比較缺失區(qū)域內(nèi)部和外部的局部神經(jīng)響應(yīng),以確保缺失區(qū)域內(nèi)部和外部的局部小塊的紋理細(xì)節(jié)相似。如果我們同時(shí)考慮圖像的局部和全局信息來(lái)加強(qiáng)局部和全局一致性呢?我們會(huì)得到更好的完整圖像嗎?讓我們看看。

dd9b2c415e79130a8a90436ea607b41c.png

圖2,上下文編碼器神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

如何處理高分辨率圖像?我們之前已經(jīng)討論過(guò)第一種基于GAN的修復(fù)方法,上下文編碼器。他們假設(shè)測(cè)試圖像總是128×128和一個(gè)64×64中心缺失的洞。然后,我們還在上一篇文章中介紹了上下文編碼器的改進(jìn)版本,稱為Multi-Scale Neural Patch Synthesis。他們提出了一種多尺度的方法來(lái)處理測(cè)試圖像,最大的分辨率為512×512,中心缺失的孔為256×256。簡(jiǎn)而言之,他們采用了三種不同尺度的圖像網(wǎng)絡(luò),即128×128、256×256和512×512。因此,速度是他們提出的方法的瓶頸。使用Titan X GPU填充512×512的圖像大約需要1分鐘。這是個(gè)有趣的問(wèn)題!我們?nèi)绾翁幚砀叻直媛蕡D像,只需一個(gè)單一的的網(wǎng)絡(luò)?給你幾秒鐘的思考時(shí)間,你可能會(huì)從圖2所示的架構(gòu)中發(fā)現(xiàn)一些提示(注意中間層)。一個(gè)快速的解決方案是去掉中間的全連接層,并采用全卷積網(wǎng)絡(luò)!你很快就會(huì)知道怎么做,為什么要這樣做!

介紹

現(xiàn)有的方法大多假設(shè)可以找到相似的圖像patch來(lái)填補(bǔ)同一幅圖像中缺失的部分。這種情況并不總是適用于圖像修復(fù),見(jiàn)圖1。更準(zhǔn)確地說(shuō),我們應(yīng)該看整個(gè)圖像,了解它的上下文,然后根據(jù)它的上下文來(lái)填補(bǔ)缺失的部分。

如果使用全連接層,輸入圖像的大小必須是固定的。因此,網(wǎng)絡(luò)不能處理不同分辨率的測(cè)試圖像?;叵胍幌拢耆B接的層完全連接了兩層之間的所有神經(jīng)元,因此它對(duì)前一層輸出大小的變化很敏感,測(cè)試圖像的大小必須固定。另一方面,對(duì)于卷積層,神經(jīng)元之間沒(méi)有全連接。更小的輸入特征映射將導(dǎo)致更小的輸出特征映射。所以,如果一個(gè)網(wǎng)絡(luò)只由卷積層組成,它就可以處理不同大小的輸入圖像。我們稱這種網(wǎng)絡(luò)為全卷積網(wǎng)絡(luò)(FCNs)。

方案

采用膨脹卷積代替全連接層,這樣我們?nèi)匀豢梢岳斫鈭D像的上下文,構(gòu)建一個(gè)全卷積網(wǎng)絡(luò)(Fully Convolutional Network, FCN)來(lái)處理不同大小的圖像。

使用兩個(gè)鑒別器來(lái)保證完成(填充)圖像的局部和全局一致性。一個(gè)鑒別器在全局意義上看整個(gè)圖像,而一個(gè)在局部意義上看被填充區(qū)域周圍的子圖像。

使用簡(jiǎn)單的后處理。有時(shí)很明顯可以看出生成的像素和有效像素之間的區(qū)別。為了進(jìn)一步提高圖像的視覺(jué)質(zhì)量,本文采用了兩種傳統(tǒng)的方法,即Fast Marching method和Poisson image blend。這兩種技術(shù)超出了本文的范圍。之后,在一定程度上將后處理步驟以細(xì)化網(wǎng)絡(luò)的形式嵌入到網(wǎng)絡(luò)中。我們將在后面的文章中討論它。

貢獻(xiàn)

提出一種全卷積的網(wǎng)絡(luò)擴(kuò)展卷積圖像修復(fù)。它允許我們?cè)诓皇褂萌B接的層的情況下理解圖像的上下文,因此訓(xùn)練過(guò)的網(wǎng)絡(luò)可以用于不同大小的圖像。這個(gè)架構(gòu)實(shí)際上是后來(lái)基于深度學(xué)習(xí)的圖像修復(fù)方法的基礎(chǔ)。這就是為什么我認(rèn)為這篇文章是圖像修復(fù)的一個(gè)里程碑。

建議使用兩個(gè)判別器(一個(gè)局部的和一個(gè)全局的)。多尺度鑒別器似乎可以在不同尺度上提供較好的完整圖像紋理細(xì)節(jié)。

強(qiáng)調(diào)圖像修復(fù)任務(wù)中產(chǎn)生新片段的重要性。實(shí)際上,訓(xùn)練數(shù)據(jù)是非常重要的。簡(jiǎn)單地說(shuō),你不能生成你以前沒(méi)見(jiàn)過(guò)的東西。

方法

23cde22ddb2a6fe927bad6a65ddd06d7.png

圖3,提出方法的結(jié)構(gòu)

圖3顯示了提出的方法的網(wǎng)絡(luò)架構(gòu)。它由三個(gè)網(wǎng)絡(luò)組成,分別是Completion網(wǎng)絡(luò)(即生成器,既用于訓(xùn)練又用于測(cè)試)、局部鑒別器和全局鑒別器(用于剛訓(xùn)練時(shí)作為輔助網(wǎng)絡(luò)用于學(xué)習(xí))??焖倩仡櫼幌逻@個(gè)GAN框架。Generator負(fù)責(zé)補(bǔ)全圖像以欺騙discriminator,而discriminator負(fù)責(zé)將完整圖像與真實(shí)圖像區(qū)分開(kāi)來(lái)。

CNNs中的膨脹卷積

膨脹卷積的概念對(duì)于讀者理解本文的網(wǎng)絡(luò)設(shè)計(jì)是很重要的。所以,我想盡力為那些不熟悉膨脹卷積的讀者解釋一下。對(duì)于非常了解它的讀者,也請(qǐng)快速回顧一下。

8ec4650026be64f8c470958ef264d46b.png

圖4,標(biāo)準(zhǔn)卷積和膨脹卷積的圖解

在論文中,作者用了半頁(yè)的篇幅來(lái)描述cnn、標(biāo)準(zhǔn)卷積和擴(kuò)張卷積。并給出了相應(yīng)的卷積方程供參考。我需要澄清一點(diǎn),膨脹卷積并不是本文作者提出的,他們是將其用于圖像修復(fù)。

這里,我想用一個(gè)簡(jiǎn)單的圖來(lái)說(shuō)明標(biāo)準(zhǔn)卷積和膨脹卷積的區(qū)別。

圖4(a)是帶有3×3 kernel, stride=1, padding=1,膨脹率=1的標(biāo)準(zhǔn)卷積層。這種情況的設(shè)置中,8×8輸入給出8×8的輸出,每個(gè)相鄰的9個(gè)位置在輸出中貢獻(xiàn)一個(gè)元素。

圖4(b)也是一個(gè)標(biāo)準(zhǔn)的卷積層。這次我們使用5×5 kernel,stride=1, padding=2(為了保持相同的輸入和輸出大小)和膨脹率=1。在這種情況下,每個(gè)相鄰的25個(gè)位置對(duì)輸出的每個(gè)元素都有貢獻(xiàn)。這意味著對(duì)于輸出的每個(gè)值,我們必須更多地考慮(查看)輸入。我們通常指更大的感受野。對(duì)于一個(gè)大的感受野,更多的來(lái)自遙遠(yuǎn)空間位置的特征將被考慮進(jìn)去,在輸出時(shí)給出每個(gè)值。

然而,對(duì)于圖4(b)中的情況,我們使用一個(gè)更大的kernel (5×5)來(lái)獲得更大的感受野。這意味著需要學(xué)習(xí)更多的參數(shù)(3×3=9,而5×5=25)。有沒(méi)有辦法在不增加更多參數(shù)的情況下增加感受野?答案是膨脹卷積。

圖4(c)是一個(gè)膨脹卷積層,使用3×3 kernel, stride=1, padding=2,膨脹率=2。當(dāng)比較圖4(b)和(c)中的kernel的覆蓋時(shí),我們可以看到它們都覆蓋了輸入處的5×5局部空間區(qū)域。3×3的kernel可以通過(guò)跳過(guò)連續(xù)的空間位置來(lái)獲得5×5 kernel的感受野。跳躍的step是由膨脹率決定的。例如,一個(gè)3×3內(nèi)核的膨脹率=2給出5×5感受野,一個(gè)3×3核的膨脹率=3給出一個(gè)7×7的感受野,以此類推。顯然,膨脹卷積通過(guò)跳過(guò)連續(xù)的空間位置來(lái)增加感受野,而不需要添加額外的參數(shù)。這樣做的優(yōu)點(diǎn)是,我們有更大的感受野,同時(shí)有相同數(shù)量的參數(shù)。缺點(diǎn)是我們會(huì)跳過(guò)一些位置(我們可能會(huì)因此丟失一些信息)。

為什么要用膨脹卷積?

在回顧了膨脹卷積的概念之后,我將討論為什么作者在他們的模型中使用膨脹卷積。你們中的一些人可能已經(jīng)猜到原因了。

如前所述,了解整個(gè)圖像的上下文對(duì)于圖像修復(fù)的任務(wù)是重要的。以前的方法使用全連接層作為中間層,以便理解上下文。記住,標(biāo)準(zhǔn)卷積層在局部區(qū)域執(zhí)行卷積,而全連接層則完全連接所有的神經(jīng)元(即每個(gè)輸出值取決于所有的輸入值)。然而,全連接層限制了輸入圖像的大小,并引入了更多的可學(xué)習(xí)參數(shù)。

為了解決這些限制,我們使用膨脹卷積來(lái)構(gòu)建一個(gè)全卷積的網(wǎng)絡(luò),允許不同大小的輸入。另一方面,通過(guò)調(diào)整標(biāo)準(zhǔn)kernel(通常是3×3)的膨脹率,我們可以在不同的層次上擁有更大的感受野,以幫助理解整個(gè)圖像的上下文。

ff7e1307aebc01881d03635d3afa43ee.png

圖5,不同大小的感受野的影響。

圖5是一個(gè)展示膨脹卷積的有用性的例子。你可能認(rèn)為(a)是帶有3×3核(較小的感受野)的標(biāo)準(zhǔn)卷積,(b)是帶有3×3核且擴(kuò)張率≥2(較大的感受野)的膨脹卷積。位置p1和p2在孔內(nèi)區(qū)域,p1靠近邊界,p2大致在中心點(diǎn)。對(duì)于(a),可以看到p1位置的感受野(影響區(qū)域)可以覆蓋有效區(qū)域。這意味著可以使用有效像素來(lái)填充位置p1的像素。另一方面,p2位置的感受野不能覆蓋有效區(qū)域,因此不能使用有效區(qū)域的信息進(jìn)行生成。

對(duì)于(b),我們使用膨脹卷積來(lái)增加感受野。這一次,兩個(gè)位置的感受野都可以覆蓋有效區(qū)域。讀者現(xiàn)在可以認(rèn)識(shí)到擴(kuò)張卷積的有效性了。

Completion網(wǎng)絡(luò)

讓我們回到Completion 網(wǎng)絡(luò)的結(jié)構(gòu),如圖3所示。

3530ea7ee88d9d0d15a8182c79b9e052.png

表1,Completion網(wǎng)絡(luò)結(jié)構(gòu)。,每個(gè)卷積層后面都是ReLU,除了最后一個(gè)后面是Sigmoid

Completion 網(wǎng)絡(luò)是一個(gè)全卷積的網(wǎng)絡(luò),接受不同大小的輸入圖像。該網(wǎng)絡(luò)對(duì)輸入進(jìn)行2次2倍的下采樣。這意味著,如果輸入是256×256,中間層的輸入大小是64×64。為了充分利用有效像素,保證像素精度,我們用有效像素替換孔區(qū)域以外的像素。

上下文判別器

讓我們來(lái)談?wù)劸植亢腿峙袆e器。沒(méi)有什么特別的,就像單個(gè)判別器的情況一樣。唯一的不同是這次我們有兩個(gè)。

07b107b0272cab8079b6d24f142bfd9b.png

表2,局部和全局鑒別器的結(jié)構(gòu),F(xiàn)C代表全連接層,連接層(c)的最終FC后面是Sigmoid

局部和全局判別器的架構(gòu)基本相同。全局判別器的輸入圖像大小為256×256(整個(gè)圖像,用于全局一致性),而局部判別器的輸入為128×128,圍繞缺失區(qū)域的中心,用于局部一致性。

需要注意的一點(diǎn)是,在訓(xùn)練過(guò)程中,總有一個(gè)區(qū)域是缺失的。在測(cè)試過(guò)程中,圖像中可能存在多個(gè)缺失區(qū)域。除此之外,對(duì)于local discriminator,由于真實(shí)圖像沒(méi)有填充區(qū)域,所以對(duì)真實(shí)圖像采用128×128 patch的隨機(jī)選擇。

訓(xùn)練策略和損失函數(shù)

與之前一樣,使用兩個(gè)損失函數(shù)來(lái)訓(xùn)練網(wǎng)絡(luò),即L2損失和對(duì)抗損失(GAN損失)。

d5ed709ddb09d404f9d49f92df55f333.png

C(x, M_c)將completion網(wǎng)絡(luò)表示為函數(shù)。x是輸入圖像,M_c是表示缺失區(qū)域的二進(jìn)制掩碼。缺失區(qū)域?yàn)?,外部區(qū)域?yàn)?。你可以看到L2損失是在缺失區(qū)域內(nèi)計(jì)算的。注意,補(bǔ)全的圖像的外部區(qū)域的像素直接被有效像素替換。

f149b6ac49a8097021d9445be443e6bc.png

D(x, M_d)將兩個(gè)鑒別器表示為一個(gè)函數(shù)。M_d是一個(gè)隨機(jī)掩碼,用于為局部判別器隨機(jī)選擇一個(gè)圖像patch。這是一個(gè)標(biāo)準(zhǔn)的GAN損失。我們希望該判別器不能區(qū)分完整的圖像和真實(shí)的圖像,從而得到具有真實(shí)紋理細(xì)節(jié)的完整圖像。

df8ac4e156bd236a4a8f8fa52692dafa.png

這是訓(xùn)練網(wǎng)絡(luò)的聯(lián)合損失函數(shù)。alpha是一個(gè)加權(quán)超參數(shù),以平衡L2損失和GAN損失。

6afffd60f0835b967be2c0c9004ce2e9.png

作者將他們的訓(xùn)練分為三個(gè)階段。i) 訓(xùn)練僅帶L2損失的completion網(wǎng)絡(luò),迭代次數(shù)為T(mén)_C。ii) 修正completion網(wǎng)絡(luò),使用GAN損失訓(xùn)練判別器進(jìn)行T_D迭代。iii) 交替訓(xùn)練completion網(wǎng)絡(luò)和判別器,直到訓(xùn)練結(jié)束。

對(duì)于穩(wěn)定訓(xùn)練,除completion網(wǎng)絡(luò)的最后一層和判別器外,所有卷積層都采用批處理歸一化(BN)。

為了生成訓(xùn)練數(shù)據(jù),他們隨機(jī)地將圖像的最小邊緣大小調(diào)整到[256,384]像素范圍。然后,他們隨機(jī)截取256×256圖像補(bǔ)丁作為輸入圖像。對(duì)于掩模圖像,隨機(jī)生成一個(gè)區(qū)域,每個(gè)邊的范圍為[96,128]。

簡(jiǎn)單的后處理:如前所述,作者還采用了傳統(tǒng)的Fast Marching方法,隨后采用泊松圖像混合,進(jìn)一步提高完成圖像的視覺(jué)質(zhì)量。

實(shí)驗(yàn)

作者使用Places2數(shù)據(jù)集中的8097967張訓(xùn)練圖像訓(xùn)練他們的網(wǎng)絡(luò)。聯(lián)合損失函數(shù)中的alpha加權(quán)超參數(shù)設(shè)置為0.0004,batch大小為96。

本文中,completion網(wǎng)絡(luò)訓(xùn)練為T(mén)_C = 90000次迭代,訓(xùn)練判別器T_D = 10,000次迭代,最后聯(lián)合訓(xùn)練所有網(wǎng)絡(luò)400,000次迭代。他們聲稱,整個(gè)訓(xùn)練過(guò)程在一臺(tái)4個(gè)k80 GPU的電腦上大約需要2個(gè)月的時(shí)間。

91449e11caf8471664152013a9c2323f.png

表3,所提出方法的用時(shí)

他們使用Intel Core i7-5960X 3.00 GHz 8核CPU和NVIDIA GeForce TITAN X GPU對(duì)CPU和GPU進(jìn)行評(píng)估。實(shí)際上,速度相當(dāng)快,只需半秒多一點(diǎn)就可以完成1024×1024的一張圖片。

aaa41d3dbd3833beba0be36a2ec22060.png

圖6,和已有方法的對(duì)比

圖6顯示了與一些現(xiàn)有方法的比較??偟膩?lái)說(shuō),基于patch的方法可以用局部一致的圖像patch來(lái)完成,但可能不會(huì)是全局一致的。最近的基于GAN的方法,上下文編碼器(第5行),傾向于給出模糊的完整圖像。該方法提供了局部和全局一致的完整圖像。

6cb26e7d69916932ac39cce7c22527d3.png

圖7,和上下文編碼器的對(duì)比,在同樣的數(shù)據(jù)集上訓(xùn)練填補(bǔ)中心缺失孔洞

為了與最先進(jìn)的基于GAN的修復(fù)方法進(jìn)行比較,作者進(jìn)行了中心區(qū)域補(bǔ)全,結(jié)果如圖7所示。可以看出,CE對(duì)于中心區(qū)域補(bǔ)全的性能優(yōu)于任意區(qū)域補(bǔ)全(圖6)。在我看來(lái),CE與本文方法在圖7中具有相似的性能。讀者可以放大看其中的差異。

20fde37cd94845882ec07aa7615975ca.png

圖8,不同判別器的效果

作者對(duì)這兩種判別器進(jìn)行了消融研究。從圖8(b)和(c)可以看出,當(dāng)不使用局部判別器時(shí),補(bǔ)全的區(qū)域看起來(lái)更加模糊。另一方面,對(duì)于(d),如果只使用局部判別器,我們可以得到良好的局部一致紋理細(xì)節(jié),但不能保證全局一致性。對(duì)于(e)中的full方法,我們獲得了局部和全局一致的結(jié)果。

26982d89229105d171b8fe04f2958b38.png

圖9,簡(jiǎn)單后處理的結(jié)果

圖9顯示了簡(jiǎn)單后處理的效果。對(duì)于圖9(b),我們可以很容易地觀察到邊界。

46947a6ddea6750ba2f8c8ff06a5a5dc.png

圖10,使用不同的數(shù)據(jù)集的修復(fù)結(jié)果

圖10顯示了在不同數(shù)據(jù)集上訓(xùn)練的模型的修復(fù)結(jié)果。注意,Places2包含了大約800萬(wàn)張不同場(chǎng)景的訓(xùn)練圖像,而ImageNet包含了100萬(wàn)張用于目標(biāo)分類的訓(xùn)練圖像。我們可以看到,在Places2上訓(xùn)練模型的結(jié)果比在ImageNet上訓(xùn)練的結(jié)果稍好一些。

7ea1eed967350b087437a89e81360e31.png

圖11,用提出的方法來(lái)做目標(biāo)移除的例子

圖像修復(fù)的一個(gè)潛在應(yīng)用是物體移除。圖11顯示了使用所提方法刪除目標(biāo)的一些例子。

1f7b12ad905639c2f1227cc719a51829.png

圖12,更多特定數(shù)據(jù)集的結(jié)果

本文的作者還考慮了域特定的圖像修復(fù)。他們?cè)贑elebA數(shù)據(jù)集和CMP Facade數(shù)據(jù)集上微調(diào)了他們的預(yù)訓(xùn)練模型,這兩個(gè)數(shù)據(jù)集分別由202599和606張圖像組成。他們使用了Places2數(shù)據(jù)集上的預(yù)訓(xùn)練模型。對(duì)于新的數(shù)據(jù)集,他們從無(wú)到有訓(xùn)練判別器,然后進(jìn)行completion網(wǎng)絡(luò)和判別器交替訓(xùn)練。

圖12顯示了本文方法對(duì)特定領(lǐng)域圖像的修復(fù)結(jié)果。對(duì)于面部修復(fù),該方法能夠生成眼睛和嘴等新的片段。對(duì)于立面的修復(fù),本文提出的方法還能夠生成與整個(gè)圖像局部和全局一致的窗口等片段。

作者還對(duì)完整的面部圖像進(jìn)行了用戶研究。結(jié)果表明,在10個(gè)用戶中,使用該方法得到的77.0%的完整人臉被視為真實(shí)人臉。另一方面,96.5%的真實(shí)面孔可以被這10個(gè)用戶正確識(shí)別。

限制和討論

以下是作者對(duì)其局限性和未來(lái)發(fā)展方向的幾點(diǎn)看法。

84bb8cf27f502e2eb6fa004ccb42d4fe.png

圖13,失敗的例子 i) mask在圖像的邊緣 ii) 復(fù)雜的場(chǎng)景

對(duì)于圖13左側(cè)的情況,我們可以看到缺失的部分位于上方圖像的邊框。作者聲稱,在這種情況下,可以從鄰近位置借用的信息更少,因此基于GAN的方法(第3行和第4行)比傳統(tǒng)的基于patch的方法(第2行)表現(xiàn)更差。另一個(gè)原因是這個(gè)例子是自然場(chǎng)景,所以基于patch的方法可以很好地工作。

對(duì)于圖13右側(cè)的例子,場(chǎng)景要復(fù)雜得多。根據(jù)這個(gè)mask,我們想要移除一個(gè)人,我們需要填充一些建筑的細(xì)節(jié)來(lái)完成這個(gè)復(fù)雜的場(chǎng)景。在這種情況下,所有的方法都不能正常工作。因此,在復(fù)雜的場(chǎng)景中填補(bǔ)缺失的部分仍然是的挑戰(zhàn)。

3b30bf7e26479e733bf4be88f5891c00.png

圖14,舉例說(shuō)明生成新片段的重要性,我們只能生成之前在訓(xùn)練中看到的內(nèi)容。

作者提供了額外的例子來(lái)強(qiáng)調(diào)另外兩點(diǎn)。i) 產(chǎn)生諸如眼睛、鼻子、嘴巴等新穎片段的重要性。ii)訓(xùn)練數(shù)據(jù)集的重要性。

對(duì)于無(wú)法找到相似的圖像patch來(lái)填補(bǔ)缺失部分的情況,基于patch的方法(第2行和第3行)無(wú)法正常工作,如圖14所示。因此,一個(gè)魯棒的修復(fù)算法必須能夠生成新的片段。

為了進(jìn)一步顯示訓(xùn)練數(shù)據(jù)集選擇的重要性,作者比較了在Places2 (General dataset, (d))和CelebA (Face dataset, (e))上訓(xùn)練的兩個(gè)模型。顯然,(d)無(wú)法用合理的面部細(xì)節(jié)來(lái)填補(bǔ)缺失的部分,因?yàn)樗窃跊](méi)有任何對(duì)齊的面部圖像的Places2上訓(xùn)練的。另一方面,(e)工作得很好,因?yàn)樗窃贑elebA上訓(xùn)練的,一個(gè)有許多對(duì)齊的人臉圖像的數(shù)據(jù)集。因此,我們只能生成我們?cè)谟?xùn)練中看到的東西。全面的修復(fù)還有很長(zhǎng)的路要走。

總結(jié)

所提議的結(jié)構(gòu)是后來(lái)大多數(shù)修復(fù)論文的基礎(chǔ)。膨脹卷積的全卷積網(wǎng)絡(luò)允許我們?cè)诓皇褂萌B接的層的情況下理解圖像的上下文,因此網(wǎng)絡(luò)可以獲取不同大小的輸入圖像。

多尺度的鑒別器(在這里我們有兩個(gè)鑒別器,實(shí)際上有些可能有三個(gè)!) 對(duì)于在不同尺度上增強(qiáng)完整圖像的紋理細(xì)節(jié)是很有用的。

當(dāng)場(chǎng)景很復(fù)雜的時(shí)候,補(bǔ)上缺失的部分仍然很有挑戰(zhàn)性。另一方面,自然場(chǎng)景是比較容易修復(fù)的。

要點(diǎn)

在這里,我想列出一些對(duì)以后的文章有用的觀點(diǎn)。

請(qǐng)記住,膨脹卷積的全卷積網(wǎng)絡(luò)是一種典型的圖像修復(fù)網(wǎng)絡(luò)結(jié)構(gòu)。它允許不同大小的輸入,并提供類似于全連接層的功能(即幫助理解圖像的上下文)。

事實(shí)上,人臉圖像的修復(fù)相對(duì)來(lái)說(shuō)比一般的圖像修復(fù)簡(jiǎn)單。這是因?yàn)槲覀兛偸窃谌四様?shù)據(jù)集上訓(xùn)練一個(gè)模型來(lái)進(jìn)行人臉圖像修復(fù),而該數(shù)據(jù)集由許多對(duì)齊的人臉圖像組成。對(duì)于一般的圖像修復(fù),我們可以訓(xùn)練一個(gè)更多樣化的數(shù)據(jù)集,如Places2,它包含來(lái)自不同類別(如城市、建筑和許多其他類別)的數(shù)百萬(wàn)張圖像。對(duì)于一個(gè)模型來(lái)說(shuō),學(xué)習(xí)生成所有具有良好視覺(jué)質(zhì)量的東西要困難得多。不管怎樣,還有很長(zhǎng)的路要走。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2209

    瀏覽量

    76835
  • patch
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    8443
  • 圖像修復(fù)
    +關(guān)注

    關(guān)注

    0

    文章

    11

    瀏覽量

    2315

原文標(biāo)題:圖像修復(fù):全局和局部的一致性補(bǔ)全

文章出處:【微信號(hào):cas-ciomp,微信公眾號(hào):中科院長(zhǎng)春光機(jī)所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    車用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究

    車用鋰離子電池機(jī)理建模與并聯(lián)模組不一致性研究
    發(fā)表于 05-16 21:02

    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性

    及稀釋程度等關(guān)鍵參數(shù)對(duì)焊層質(zhì)量有直接影響,實(shí)時(shí)監(jiān)控熔池輪廓和溫度分布可及時(shí)預(yù)警缺陷并指導(dǎo)參數(shù)優(yōu)化,以保證焊層一致性與工藝穩(wěn)定性。今天起了解堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫一致性。 堆焊簡(jiǎn)介 堆焊,又
    的頭像 發(fā)表于 04-24 17:15 ?259次閱讀
    堆焊熔池輪廓實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)工藝穩(wěn)定性與焊縫<b class='flag-5'>一致性</b>

    一致性校正與邊緣融合拼接

    電子發(fā)燒友網(wǎng)站提供《差一致性校正與邊緣融合拼接.pdf》資料免費(fèi)下載
    發(fā)表于 04-10 18:02 ?0次下載

    請(qǐng)問(wèn)如何保證多片AD1278的通道之間相位一致性?

    讀取手冊(cè),發(fā)現(xiàn)要保證多片AD1278的通道之間相位一致性需要兩點(diǎn):1、CLK一致;2、SYNC_N同時(shí)拉高。 我的情況: 1、各個(gè)AD1278的CLK來(lái)著不同的時(shí)鐘源,即分別采用10ppm
    發(fā)表于 01-14 06:02

    FCB-EV9520L光軸一致性的典范,焦距變換精準(zhǔn)如初

    索尼FCB-EV9520L出色的光軸一致性在多個(gè)應(yīng)用場(chǎng)景中展現(xiàn)出了其獨(dú)特的優(yōu)勢(shì)和價(jià)值。通過(guò)提高圖像的準(zhǔn)確、減少圖像畸變以及增強(qiáng)應(yīng)用場(chǎng)景的適應(yīng)
    的頭像 發(fā)表于 12-09 09:45 ?647次閱讀
    FCB-EV9520L光軸<b class='flag-5'>一致性</b>的典范,焦距變換精準(zhǔn)如初

    Oracle報(bào)錯(cuò)“system01.dbf需要更多的恢復(fù)來(lái)保持一致性”的數(shù)據(jù)恢復(fù)案例

    Oracle數(shù)據(jù)庫(kù)故障&分析: 臺(tái)Oracle數(shù)據(jù)庫(kù)打開(kāi)報(bào)錯(cuò),報(bào)錯(cuò)信息: “system01.dbf需要更多的恢復(fù)來(lái)保持一致性,數(shù)據(jù)庫(kù)無(wú)法打開(kāi)”。管理員聯(lián)系我們數(shù)據(jù)恢復(fù)中心尋求幫助,并提
    的頭像 發(fā)表于 11-27 13:10 ?625次閱讀
    Oracle報(bào)錯(cuò)“system01.dbf需要更多的恢復(fù)來(lái)保持<b class='flag-5'>一致性</b>”的數(shù)據(jù)恢復(fù)案例

    一致性測(cè)試系統(tǒng)的技術(shù)原理和也應(yīng)用場(chǎng)景

    一致性測(cè)試系統(tǒng)是用來(lái)檢測(cè)零部件或系統(tǒng)實(shí)現(xiàn)是否符合相關(guān)標(biāo)準(zhǔn)或規(guī)范的測(cè)試流程,其技術(shù)原理和應(yīng)用場(chǎng)景具體如下:技術(shù)原理 基本框架:協(xié)議一致性測(cè)試的理論已經(jīng)相對(duì)成熟,主要代表是ISO制定的國(guó)際標(biāo)準(zhǔn)ISO
    發(fā)表于 11-01 15:35

    異構(gòu)計(jì)算下緩存一致性的重要

    在眾多回復(fù)中,李博杰同學(xué)的回答被認(rèn)為質(zhì)量最高。他首先將緩存一致性分為兩個(gè)主要場(chǎng)景:是主機(jī)內(nèi)CPU與設(shè)備間的一致性;二是跨主機(jī)的一致性
    的頭像 發(fā)表于 10-24 17:00 ?1725次閱讀
    異構(gòu)計(jì)算下緩存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    LMK05318的ITU-T G.8262一致性測(cè)試結(jié)果

    電子發(fā)燒友網(wǎng)站提供《LMK05318的ITU-T G.8262一致性測(cè)試結(jié)果.pdf》資料免費(fèi)下載
    發(fā)表于 09-20 11:21 ?0次下載
    LMK05318的ITU-T G.8262<b class='flag-5'>一致性</b>測(cè)試結(jié)果

    TPS23882B SIFOs IEEE802.3bt 一致性測(cè)試報(bào)告

    電子發(fā)燒友網(wǎng)站提供《TPS23882B SIFOs IEEE802.3bt 一致性測(cè)試報(bào)告.pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:48 ?1次下載
    TPS23882B SIFOs IEEE802.3bt <b class='flag-5'>一致性</b>測(cè)試報(bào)告

    級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《級(jí)聯(lián)一致性和移相器校準(zhǔn)應(yīng)用手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 08-29 10:48 ?0次下載
    級(jí)聯(lián)<b class='flag-5'>一致性</b>和移相器校準(zhǔn)應(yīng)用手冊(cè)

    電感值和直流電阻的一致性如何提高?

    提高電感值和直流電阻的一致性,可以從以下幾個(gè)方面入手: 、提高電感值的一致性 優(yōu)化磁芯選擇 : 磁芯是電感器的關(guān)鍵組成部分,其材料特性和尺寸直接影響電感值。選擇具有高磁導(dǎo)率、低磁阻和穩(wěn)定性能的材料
    的頭像 發(fā)表于 08-19 15:27 ?723次閱讀

    LIN一致性測(cè)試規(guī)范2.1

    電子發(fā)燒友網(wǎng)站提供《LIN一致性測(cè)試規(guī)范2.1.pdf》資料免費(fèi)下載
    發(fā)表于 08-15 17:14 ?8次下載

    OPA569過(guò)溫信號(hào)一致性差是什么原因?qū)е碌模?/a>

    OPA569作為輸出級(jí),輸出短路的時(shí)候,OPA569溫度上升較快。 同款產(chǎn)品,均輸出短路,有些產(chǎn)品短路僅幾秒鐘就采集到OPA569的7腳的過(guò)溫信號(hào)了。而有些產(chǎn)品需要過(guò)2-3分鐘才發(fā)出過(guò)溫信號(hào)。這是什么原因呢,一致性差別太大了。
    發(fā)表于 08-08 08:14

    是德科技通過(guò)NB-IoT NTN一致性測(cè)試

    近日,知名電子測(cè)量?jī)x器制造商是德科技(Keysight Technologies, Inc.)欣然宣布,其針對(duì)3GPP Rel-17標(biāo)準(zhǔn)中關(guān)于NB-IoT NTN技術(shù)的全新一致性測(cè)試用例已順利通過(guò)
    的頭像 發(fā)表于 07-31 13:07 ?1495次閱讀
    主站蜘蛛池模板: 日日爱夜夜爱 | 人人干人人草 | 人人操天天射 | 九色国产在视频线精品视频 | 色爱区综合 | 国产色产综合色产在线观看视频 | 人人射人人射 | 天堂中文在线免费观看 | 在线天堂bt种子资源 | 国产色视频在线 | 国产成视频 | 免费在线公开视频 | 在线观看jyzzjyzz | 性欧美zoz0另类xxxx | 黄色午夜剧场 | 欧美电影一区二区三区 | 人人澡人人搞 | 国产农村妇女毛片精品久久 | 丁香五月缴情在线 | 91精品啪国产在线观看免费牛牛 | 四虎永久免费地址在线网站 | 人人福利 | 狠狠躁夜夜躁人人爽天天天天 | 色天天综合网 | 亚洲一区色 | 91av在线免费观看 | 免费精品视频在线 | 黄色网址 在线播放 | 黄网站在线观看高清免费 | 四虎在线永久免费观看 | www.91大神| 美女网站色视频 | 综合爱爱 | 在线视频亚洲色图 | 永久看免费bbbbb视频 | 孩交精品xxxx视频视频 | 色妞在线| 日本xxwwxxww视频免费丝袜 | 久久久噜噜噜久久网 | 亚洲韩国日本欧美一区二区三区 | 亚洲精品美女在线观看 |