在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

視頻P圖新SOTA:推理速度快近15倍

OpenCV學堂 ? 來源:量子位 ? 作者:量子位 ? 2022-05-24 09:45 ? 次閱讀

眾所周知:視頻是可以P的。

這不,在CVPR 2022收錄的論文中,就出現了這么一個P圖神器,它可以分分鐘給你上演各種人像消失大法,不留任何痕跡。

去水印、填補缺失更是不在話下,并且各種分辨率的視頻都能hold住。

正如你所見,這個模型如此絲滑的表現讓它在兩個基準數據集上都實現了SOTA性能。

812b2f9a-daac-11ec-ba43-dac502259ad0.png

△與SOTA方法的對比

同時它的推理時間和計算復雜表現也很搶眼:

前者比此前的方法快了近15倍,可以在Titan XP GPU上以每幀0.12秒的速度處理432 × 240的視頻;后者則是在所有比較的SOTA方法中實現了最低的FLOPs分數。

如此神器,什么來頭?

改善光流法

目前很多視頻修復算法利用的都是光流法(Optical flow)。

也就是利用圖像序列中像素在時間域上的變化以及相鄰幀之間的相關性,找到上一幀跟當前幀之間存在的對應關系,從而計算出相鄰幀之間物體的運動信息

這個方法的缺點很明顯:計算量大、耗時長,也就是效率低。

為此,研究人員設計了三個可訓練模塊,分別為流完成(flow completion)、特征傳播(feature propagation)和內容幻想(content hallucination),提出了一個流引導(flow-guided)的端到端視頻修復框架:

E2FGVI。

這三個模塊與之前基于光流的方法的三個階段相對應,不過可以進行聯合優化,從而實現更高效的修復過程。

8179012a-daac-11ec-ba43-dac502259ad0.png

具體來說,對于流完成模塊,該方法直接在mask viedo中一步完成操作,而不是像此前方法采用多個復雜的步驟。

對于特征傳播模塊,與此前的像素級傳播相比,該方法中的流引導傳播過程在特征空間中借助可變形卷積進行。

通過更多可學習的采樣偏移和特征級操作,傳播模塊釋放了此前不能準確進行流估計的壓力。

對于內容幻想模塊,研究人員則提出了一種時間焦點Transformer來有效地建模空間和時間維度上的長程依賴關系。

同時該模塊還考慮了局部和非局部時間鄰域,從而獲得更具時間相關性的修復結果。

81a552fc-daac-11ec-ba43-dac502259ad0.png

作者:希望成為新基線

定量實驗:

研究人員在數據集YouTube VOS和DAVIS上進行了定量實驗,將他們的方法與之前的視頻修復方法進行了比較。

如下表所示,E2FGVI在全部四個量化指標上都遠遠超過了這些SOTA算法,能夠生成變形更少(PSNR和SSIM)、視覺上更合理(VFID)和時空一致性更佳(Ewarp)的修復視頻,驗證了該方法的優越性。

81ddb930-daac-11ec-ba43-dac502259ad0.png

此外,E2FGVI也具有最低的FLOPs值(計算復雜度),盡管訓練是在432 × 240分辨率的視頻上進行,它的HQ版本做到了支持任意分辨率。

82209444-daac-11ec-ba43-dac502259ad0.png

定性實驗:

研究人員首先選擇了三種最有代表性的方法,包括CAP、FGVC(基于光流法)和Fuseformer(入選ICCV 2021),進行對象移除(下圖前三行)和缺失補全(下圖后兩行)的效果比較。

可以發現,前三種方法很難在遮擋區域恢復出合理的細節、擦除人物也會造成模糊,但E2FGVI可以生成相對真實的紋理和結構信息。

824b6d22-daac-11ec-ba43-dac502259ad0.png

此外,它們還選用了5種方法進行了用戶研究,結果大部分人都對E2FGVI修復后的效果更滿意。

綜上,研究人員也表示,希望他們提出的方法可以成為視頻修復領域新的強大基線。

作者介紹

82ac4304-daac-11ec-ba43-dac502259ad0.png

E2FGVI由南開大學和海思合作完成。

一作Li Zhen為南開大學博士生,共同一作Lu ChengZe也來自南開。

通訊作者為南開大學計算機學院教授程明明,主要研究方向是計算機視覺和圖形學。

目前,E2FGVI的代碼已經開源,作者也提供了Colab實現,未來還將在Hugging Face給出demo。

論文地址: https://arxiv.org/abs/2204.02663

GitHub主頁: https://github.com/MCG-NKU/E2FGVI

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機視覺
    +關注

    關注

    8

    文章

    1701

    瀏覽量

    46180
  • 數據集
    +關注

    關注

    4

    文章

    1211

    瀏覽量

    24890

原文標題:CVPR 2022 | 視頻P圖新SOTA:推理速度快近15倍,任意分辨率均可上演人像消失大法

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    k230如何將yolo分類視頻推理后的視頻結果保存到本地?

    請問k230如何將yolo分類視頻推理后的視頻結果保存到本地?
    發表于 02-08 08:09

    在ARM上實現模擬視頻的實時解碼,模擬相機的速度為1080p 30fps,TVP5150能達到這個速度嗎?

    最近需要在ARM上實現模擬視頻的實時解碼,模擬相機的速度為1080p 30fps, 我在這里想咨詢一下TVP5150能達到這個速度
    發表于 12-20 07:57

    谷歌正式發布Gemini 2.0 性能提升

    2.0在關鍵基準測試中相比前代產品Gemini 1.5 Pro的性能提升了。該模型支持圖像、視頻和音頻等多種輸入與輸出形式,例如可以實現文本與圖像的混合生成以及自定義的多語言文本轉語音(TTS)內容。 此外,Gemini
    的頭像 發表于 12-12 14:22 ?467次閱讀

    FPGA和ASIC在大模型推理加速中的應用

    隨著現在AI的快速發展,使用FPGA和ASIC進行推理加速的研究也越來越多,從目前的市場來說,有些公司已經有了專門做推理的ASIC,像Groq的LPU,專門針對大語言模型的推理做了優化,因此相比GPU這種通過計算平臺,功耗更低、
    的頭像 發表于 10-29 14:12 ?942次閱讀
    FPGA和ASIC在大模型<b class='flag-5'>推理</b>加速中的應用

    6G測試速度達938Gbps,比5G速度快5000

    智能手機網絡連接速度的5000。典型的5G運行速度約為200Mbps,而在實際使用中,由于信號連接問題,其提供的速度往往遠低于100Mbps。
    的頭像 發表于 10-22 16:27 ?667次閱讀

    內存儲器的特點是速度快成本低容量小對嗎

    內存儲器,通常指的是計算機系統中的隨機存取存儲器(RAM),是計算機硬件的重要組成部分。它負責存儲計算機運行時的數據和程序,以便處理器快速訪問。內存儲器的特點包括速度快、容量相對較小,但成本并不是
    的頭像 發表于 10-14 10:05 ?929次閱讀

    Anthropic 發布Claude 3.5 Sonnet模型運行速度是Claude 3 Opus的兩

    Anthropic 發布Claude 3.5 Sonnet最新模型 新模型在推理、知識和編碼能力評估方面超越了以前的版本和競爭對手GPT 4o模型,同時其運行速度是Claude 3 Opus的兩
    的頭像 發表于 06-21 15:43 ?1034次閱讀
    Anthropic 發布Claude 3.5 Sonnet模型運行<b class='flag-5'>速度</b>是Claude 3 Opus的兩<b class='flag-5'>倍</b>

    NB81是否支持OneNet SOTA功能?應該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應該如何激活SOTA
    發表于 06-04 06:14

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內部的等效阻抗嗎,有專家
    發表于 05-17 08:13

    OpenAI全新GPT-4o能力炸場!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩,但成本僅為GPT-4 Turbo的一半,視頻、音頻功能得到
    的頭像 發表于 05-15 00:15 ?7942次閱讀

    眾鑫創展----1080P光學變焦攝像頭方案

    的編解碼質量、極低的編碼碼率。支持H.265/H.264/JPEG等多種編碼,高效編碼壓縮,操作相應速度快。產品主要應用:視頻會議機、直播攝像頭、差異化應用等眾多場景。特點:●具備優異的圖像處理能力、極高的編
    的頭像 發表于 05-11 16:34 ?546次閱讀
    眾鑫創展----1080<b class='flag-5'>P</b>十<b class='flag-5'>倍</b>光學變焦攝像頭方案

    STM32f103系列8位并口與硬件SPI驅動1.8TFT的屏幕,哪個速度快

    有沒前輩做過相關的項目,STM32f103系列 8位并口與硬件SPI 驅動1.8TFT的屏幕,哪個速度快。或者有8位并口的操作資料可以提供參考一下嗎{:1:},不懂STM32如何發送8位并口數據,我現在的數據接口是PC2-PC9
    發表于 04-17 07:31

    flash激光雷達組成及優勢

    Flash激光雷達具有無掃描裝置、成像速度快、激光功率有限、檢測距離、抗干擾能力差等優點。
    的頭像 發表于 03-28 15:44 ?1322次閱讀
    flash激光雷達組成及優勢

    指紋掛鎖方案——采用ACH512或ACM32FP4指紋芯片和88*112傳感器,指紋識別速度快,BOM成本低

    方案概述指紋掛鎖方案采用ACH512或ACM32FP4指紋芯片和88*112傳感器,指紋識別速度快,BOM成本低,非常適合掛鎖、內門鎖、箱包鎖、箱柜鎖等場景。方案特點? 主控+算法單芯片
    發表于 03-12 11:46

    Anthropic發布Claude 3,單詞處理能力是ChatGPT50

    人工智能領域的初創公司Anthropic近日宣布推出其最新型的聊天機器人——Claude 3。據公司透露,Claude 3的單詞處理能力是知名聊天機器人ChatGPT的50,單次可處理約15萬個單詞,這一突破性的進展在人工智
    的頭像 發表于 03-06 11:21 ?935次閱讀
    主站蜘蛛池模板: 欧美色网在线 | 亚洲午夜久久 | 男人天堂网在线 | 成年男人永久免费看片 | 澳门色视频 | 乱欲小说又粗又大 | 影音先锋色偷偷米奇四色 | 特级aaaaaaaaa毛片免费视频 | 亚洲香蕉毛片久久网站老妇人 | 综合久久婷婷 | 99久久综合 | 都市激情 亚洲 | 精品国产免费一区二区 | 2021天天干 | 免费恐怖片 | 亚洲第一成网站 | аⅴ天堂 在线 | 色人阁婷婷 | 特黄特色大片免费视频大全 | 69hdxxxx日本| 免费观看欧美一级片 | 黄色国产精品 | 国产成人啪精品午夜在线播放 | 日韩毛片在线影视 | 精品久久久久久久久久 | 1000部啪啪未满十八勿入 | 天天射天天爽 | 亚洲福利视频一区二区 | 久久精品国产99国产精品澳门 | 88av视频在线 | 年下系列高h文 | 欧美精品aaa久久久影院 | aaa在线| 欧美综合精品一区二区三区 | 国产精品青草久久久久福利99 | 欧美一区二区在线观看视频 | 天堂网www天堂在线网 | 中文字幕第7页 | 国产精品女仆装在线播放 | 午夜精品久久久 | 国产成年女一区二区三区 |