摘要 由于事件相機具有極高的時間分辨率,其在機器人和計算機視覺方面具有很大的潛力。然而,它的異步成像機制往往會加重測量對噪聲的敏感性,給提高圖像空間分辨率帶來物理負擔。
為了恢復高質量的強度圖像,算法需要同時解決事件相機的去噪和超分辨率問題。由于事件描述了圖像亮度的變化,利用基于事件增強的圖像退化模型,可以從存在噪聲的、模糊和低分辨率的強度觀測中恢復清晰的高分辨率潛在圖像。利用稀疏學習框架,可以同時考慮事件和低分辨率強度圖像。
在此基礎上,我們提出了一種可解釋網絡,即基于事件增強的稀疏學習網絡(eSL-Net),用于從事件相機中恢復高質量圖像。在使用合成數據集進行訓練后,所提出的eSL-Net可以極大地提高7-12 dB的性能。此外,不需要額外的訓練過程,所提出的eSL-Net可以很容易地擴展到幀率與事件相同的連續幀生成任務中。
圖1 eSL-Net的算法流程示意圖以及模型效果
目前需要解決的問題
利用事件相機恢復高質量圖像應同時解決以下問題:
1)運動模糊:主動像素傳感器(APS)幀率相對較低 (≥5 ms延遲),其在記錄高速場景時,運動模糊是不可避免的。
2)圖像噪聲:熱效應或不穩定的光環境會產生大量的噪聲事件,再加上APS自身的噪聲,強度圖像的重建將陷入混合噪聲的問題。
3)低空間分辨率:目前消費級事件相機通常具有非常低的空間分辨率,這是為了平衡事件數據的空間分辨率和延遲。
本文的貢獻
1)作者結合基于事件增強的圖像退化模型以及稀疏學習框架,提出了一種可解釋網絡——基于事件增強的稀疏學習網絡eSL-Net,用于從事件相機中恢復高質量圖像。
2)作者提出了一種簡單的方法來擴展eSL-Net,以實現高幀率和高質量的視頻恢復。
3)作者為事件相機建立了一個合成數據集,其中事件數據、LR模糊圖像和HR清晰圖像。
算法原理
最后將公式運用在整個圖像的所有像素上,就可以得到一個關于[tr,t]時間間隔內的事件流、t時刻的觀測強度圖像以及tr時刻潛在清晰強度圖像三者之間的簡單模型:
在實際應用中,傳感器的非理想性以及相機與目標場景之間的相對運動會極大地降低觀測到的強度圖像Y[f]的質量,使其具有噪聲和運動模糊。此外,盡管事件相機具有極高的時間分辨率,但由于硬件設計的限制,其空間像素分辨率相對較低。考慮到這些因素,公式需要加入一些不定因素,改寫為:
圖2 eSL-Net的模型細節
受到基于深度學習的稀疏編碼方法的啟發,作者將稀疏編碼過程集成到CNN架構中,提出了一種基于事件增強的稀疏學習網絡eSL-Net,在統一的框架下解決噪聲、運動模糊和低空間分辨率的問題。
如圖2所示,eSL-Net的基本思想是將基于事件的強度圖像重建方法的更新步驟映射到由多個固定階段組成的深度網絡架構,每個階段對應于公式(9)的一次迭代,因此eSL-Net是一個可解釋的深度網絡。
當公式(9)中的系數為非負時,ISTA不受影響,則很容易發現逐元素軟閾值函數與ReLU激活函數的相等性。然后公式中的加減運算也可以看成是神經網絡的卷積運算。由公式(5)可知,
為事件的二重積分。在離散情況下,連續積分轉化為離散求和,更一般地,用加權求和卷積來代替積分。這樣,通過兩個具有合適參數的卷積層,可以將輸入的事件流轉換為近似的E。此外,卷積對事件流有一定的去噪效果。最后,迭代模塊輸出的最優稀疏編碼
與高分辨率字典Dx計算得到最終的清晰圖像。在eSL-Net中,使用卷積層和shuffle層來實現高分辨率字典Dx,因為shuffle算子對不同通道的像素進行排列,可以看作是一個線性算子。
實驗結果
作者使用NVIDIA Titan-RTX GPU在50個epoch的合成訓練數據集上訓練提出的eSL-Net,并將其與最先進的基于事件的強度重建方法進行比較,包括EDI,互補濾波器方法(CF)和manifold正則化方法(MR)。此外,為了證明其同時解決去噪、去模糊和超分辨率三個問題的能力,將其與EDI、CF和MR進行了比較,并配置了性能優良的SR網絡RCAN。
我的思考
作者用壓縮感知領域的字典和稀疏編碼的思路來設計輕量化稀疏學習網絡同時處理圖像與事件信息是一個新穎的思路,利用對稀疏編碼ɑ進行迭代優化的方式巧妙地將事件信息作用在圖像信息中,完成清晰圖像的生成,解決了運動模糊的問題。
不過針對去噪和超分辨率這兩個問題,作者在模型設計時只是簡單提了一下,說利用作用在事件流和潛在清晰圖像Dx上的卷積操作就可以實現去噪和超分辨率了,并在實驗部分用更高的PSNR和SSIM指標來驗證模型確實有超分辨率的效果,但是我認為只是單純用基于數據驅動的卷積運算來解決事件相機的去噪和超分辨率問題,還有很大的提升空間。
摘要
由于運動模糊和低空間分辨率,單運動模糊圖像(SRB)的超分辨率是一個嚴重的不適定問題。在本文中,作者利用事件數據來減輕SRB的情況,并提出了一種基于事件增強的SRB (E-SRB)算法,該算法可以從一張低分辨率的模糊圖像生成一系列清晰清晰的高分辨率圖像。
為了達到這一目的,作者設計了一個基于事件增強的圖像退化模型,同時考慮低空間分辨率、運動模糊和事件噪聲。然后,作者基于雙重稀疏學習方案構建了一個基于事件增強的稀疏學習網絡(eSL-Net++),其中事件和強度圖像都用稀疏表示建模。
此外,作者還提出了一種基于事件的shuffle-and-merge方案,將單幀SRB擴展到序列幀SRB,而無需任何額外的訓練過程。在合成數據集和真實數據集上的實驗結果表明,提出的eSL-Net++在很大程度上優于最先進的方法。
目前需要解決的問題
1)運動由模糊變清晰。事件數據嵌入的幀內信息補償了模糊低分辨率圖像中被擦除的運動和紋理信息。
2)超分辨率。當遇到運動模糊時,事件數據極高的時間分辨率保持了動態場景幀內的時間連續性。因此,類似于視頻超分辨率,即使是單個運動模糊圖像,也可以通過事件數據的時間相關性來提高超分辨率性能。
作者的貢獻
1)作者提出采用事件來提高SRB的性能,其中基于事件增強的圖像退化模型(EDM)考慮了事件噪聲、運動模糊和低空間分辨率。
2)作者提出了一種基于雙稀疏學習方案的eSL-Net++來解決E-SRB的挑戰,其中事件噪聲抑制、運動去模糊和圖像SR同時得到解決。
3)作者提出了一種嚴格的事件shuffle-and-merge方案,將eSL-Net++擴展到從單個模糊LR圖像中恢復高幀率HR視頻序列,而無需任何額外的訓練過程。
算法理論
圖3 eSL-Net++的模型流程
圖4 eSL-Net++的模型細節
實驗結果
我的思考
雖然同樣都是基于數據增強的稀疏學習模型,相比于eSL-Net,eSL-Net++主要的優化在于它不僅僅是將事件通過卷積直接作用在圖像上來迭代計算圖像的稀疏編碼ɑ,而是也將圖像作用在事件上來迭代計算事件的稀疏編碼β,通過這種相互作用的編碼方式實現兩種模態的信息相互補償,雖然最終的清晰圖像生成還是得依靠圖像的稀疏編碼ɑ,但是在圖像對事件的補償過程中同樣能夠對事件進行有效地去噪,能夠間接性提高最終清晰圖像的生成精度。 綜上,eSL-Net和eSL-Net++最值得借鑒學習的地方就是,兩者利用稀疏編碼的思想對圖像和事件進行處理的過程,需要進一步查看源碼來學習。
審核編輯:劉清
-
傳感器
+關注
關注
2553文章
51408瀏覽量
756659 -
機器人
+關注
關注
211文章
28646瀏覽量
208440 -
計算機視覺
+關注
關注
8文章
1700瀏覽量
46133 -
APS
+關注
關注
0文章
337瀏覽量
17577
原文標題:TPAMI 2023|eSL-Net++:基于事件相機的超分辨率圖像恢復
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
新手關于圖像超分辨率的問題~
序列圖像超分辨率重建算法研究
![序列<b class='flag-5'>圖像</b><b class='flag-5'>超</b><b class='flag-5'>分辨率</b>重建算法研究](https://file.elecfans.com/web2/M00/49/51/pYYBAGKhtEWAZcsDAAARbeAQXNs132.jpg)
評論