在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ICLR 2023 Spotlight:2D圖像轉換3D

3D視覺工坊 ? 來源:機器之心 ? 2023-02-22 14:04 ? 次閱讀

背景

利用 NeRF 提供的可微渲染算法,三維生成算法,例如 EG3D、StyleSDF,在靜態物體類別的生成上已經有了非常好的效果。但是人體相較于人臉或者 CAD 模型等類別,在外觀和幾何上有更大的復雜度,并且人體是可形變的,因此從二維圖片中學習三維人體生成仍然是非常困難的任務。研究人員在這個任務上已經有了一些嘗試,例如 ENARF-GAN、GNARF,但是受限于低效的人體表達,他們無法實現高分辨率的生成,因此生成質量也非常低。

為了解決這個問題,本文提出了高效的組合的三維人體 NeRF 表示,用以實現高分辨率的(512x256)三維人體 GAN 訓練與生成。下面將介紹本文提出的人體 NeRF 表示,以及三維人體 GAN 訓練框架。

高效的人體 NeRF 表示

本文提出的人體 NeRF 基于參數化人體模型 SMPL,它提供了方便的人體姿勢以及形狀的控制。進行 NeRF 建模時,如下圖所示,本文將人體分為 16 個部分。每一個部分對應于一個小的 NeRF 網絡進行局部的建模。在渲染每一個局部的時候,本文只需要推理局部 NeRF。這種稀疏的渲染方式,在較低的計算資源下,也可以實現原生高分辨率的渲染。

例如,渲染體型動作參數分別為的人體時,首先根據相機參數采樣光線;光線上的采樣點根據與 SMPL 模型的相對關系進行反向蒙皮操作(inverse linear blend skinning),將 posed 空間中的采樣點轉化到 canonical 空間中。接著計算 Canonical 空間的采樣點屬于某個或者某幾個局部 NeRF 的 bounding box 中,再進行 NeRF 模型的推理,得到每個采樣點對應的顏色與密度;當某個采樣點落到多個局部 NeRF 的重疊區域,則會對每個 NeRF 模型進行推理,將多個結果用 window function 進行插值;最后這些信息被用于光線的積分,得到最終的渲染圖。

6a815c24-b247-11ed-bfe3-dac502259ad0.png

三維人體 GAN 框架

基于提出的高效的人體 NeRF 表達,本文實現了三維人體 GAN 訓練框架。在每一次訓練迭代中,本文首先從數據集中采樣一個 SMPL 的參數以及相機參數,并隨機生成一個高斯噪聲 z。利用本文提出的人體 NeRF,本文可以將采樣出的參數渲染成一張二維人體圖片,作為假樣本。再利用數據集中的真實樣本,本文進行 GAN 的對抗訓練。

6a97e642-b247-11ed-bfe3-dac502259ad0.png

極度不平衡的數據集

二維人體數據集,例如 DeepFashion,通常是為二維視覺任務準備的,因此人體的姿態多樣性非常受限。為了量化不平衡的程度,本文統計了 DeepFashion 中模特臉部朝向的頻率。如下圖所示,橙色的線代表了 DeepFashion 中人臉朝向的分布,可見是極度不平衡的,對于學習三維人體表征造成了困難。為了緩解這一問題,我們提出了由人體姿態指導的采樣方式,將分布曲線拉平,如下圖中其他顏色的線所示。這可以讓訓練過程中的模型見到更多樣以及更大角度的人體圖片,從而幫助三維人體幾何的學習。我們對采樣參數進行了實驗分析,從下面的表格中可見,加上人體姿態指導的采樣方式后,雖然圖像質量(FID)會有些微下降,但是學出的三維幾何(Depth)顯著變好。

6ab2b4ae-b247-11ed-bfe3-dac502259ad0.png

6af69688-b247-11ed-bfe3-dac502259ad0.png

高質量的生成結果

下圖展示了一些 EVA3D 的生成結果,EVA3D 可以隨機采樣人體樣貌,并可控制渲染相機參數,人體姿勢以及體型。

6b06bf04-b247-11ed-bfe3-dac502259ad0.png

本文在四個大規模人體數據集上進行了實驗,分別是 DeepFashion,SHHQ,UBCFashion,AIST。該研究對比了最先進的靜態三維物體生成算法 EG3D 與 StyleSDF。同時研究者也比較了專門針對三維人生成的算法 ENARF-GAN。在指標的選擇上,本文兼顧渲染質量的評估(FID/KID)、人體控制的準確程度(PCK)以及幾何生成的質量(Depth)。如下圖所示,本文在所有數據集,所有指標上均大幅超越之前的方案。

6b3cf0d8-b247-11ed-bfe3-dac502259ad0.png

應用潛力

最后,本文也展示了 EVA3D 的一些應用潛力。首先,該研究測試了在隱空間中進行差值。如下圖所示,本文能夠在兩個三維人之間進行平滑的變化,且中間結果均保持較高的質量。此外,本文也進行了 GAN inversion 的實驗,研究者使用二維 GAN inversion 中常用的算法 Pivotal Tuning Inversion。如下面右圖所示,該方法可以較好的還原重建目標的外觀,但是幾何部分丟失了很多細節。可見,三維 GAN 的 inversion 仍然是一個很有挑戰性的任務。

6b679afe-b247-11ed-bfe3-dac502259ad0.png

結語

本文提出了首個高清三維人體 NeRF 生成算法 EVA3D,并且僅需使用二維人體圖像數據即可訓練。EVA3D 在多個大規模人體數據集上性能達到最佳,并且展現出了在下游任務上進行應用的潛力。EVA3D 的訓練與測試代碼均已經開源,歡迎大家前去試用!

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4631

    瀏覽量

    93434
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40592
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1967

    瀏覽量

    74371

原文標題:ICLR 2023 Spotlight | 2D圖像轉換3D

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何同時獲取2d圖像序列和相應的3d點云?

    如何同時獲取2d圖像序列和相應的3d點云?以上來自于谷歌翻譯以下為原文How to obtain the sequence of 2d image and corresponding
    發表于 11-13 11:25

    請問怎么才能將AD中的3D封裝庫轉換2D的封裝庫?

    請問怎么將AD中的3D封裝庫轉換2D的封裝庫
    發表于 06-05 00:35

    為什么3D2D模型不能相互轉換

    AD17.1.5軟件,3D2D模型不能相互轉換,按3可以進入3D模型,按2不可以進入
    發表于 09-20 05:35

    全球首款2D/3D視頻轉換實時處理芯片:DA8223

      Dialog半導體股份有限公司日前宣布推出全球首款2D/3D影像轉換實時處理芯片:DA8223.該芯片為包括智能手機和平板電腦等在內的各種便攜式設備提供了2D/
    發表于 12-14 09:17 ?5238次閱讀

    2D3D視頻自動轉換系統

    完成系統界面的設置及控制、顯示等功能,其DSP處理器實現圖像分割和渲染等核心算法,實現了1個高效的2D3D視頻的視頻轉換系統。2D
    發表于 03-06 14:20 ?1次下載
    <b class='flag-5'>2D</b>到<b class='flag-5'>3D</b>視頻自動<b class='flag-5'>轉換</b>系統

    如何把OpenGL中3D坐標轉換2D坐標

    在OpenGL中,一切事物都在3D空間中,但我們的屏幕坐標確實2D像素數組,OpenGL大部分工作就是把3D坐標轉換成適應屏幕的2D像素。
    的頭像 發表于 07-09 10:40 ?8652次閱讀

    微軟新AI框架可在2D圖像上生成3D圖像

    已經有不少機構在將 2D 圖像轉換3D 形式的方面進行了嘗試,包括 Facebook、Nvidia 等公司的 AI 研究實驗室,或是類似 Threedy.AI 這樣的初創公司。
    的頭像 發表于 03-07 14:23 ?3100次閱讀

    阿里研發全新3D AI算法,2D圖片搜出3D模型

    AI技術的研究正在從2D走向更高難度的3D。12月3日,記者獲悉,阿里技術團隊研發了全新3D AI算法,可基于2D圖片精準搜索出相應的
    的頭像 發表于 12-04 15:49 ?3629次閱讀

    谷歌發明的由2D圖像生成3D圖像技術解析

    谷歌發明的由2D圖像生成3D圖像的技術,利用3D估計神經網絡圖像信息的補全以及預測,融合了拍攝角
    的頭像 發表于 12-24 12:55 ?4837次閱讀
    谷歌發明的由<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>生成<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>技術解析

    3d人臉識別和2d人臉識別的區別

    首先是3d人臉識別和2d人臉識別圖像數據獲取不同。3D人臉識別是以3D攝像頭立體成像,而2D是以
    發表于 02-05 16:00 ?4.9w次閱讀

    如何直接建立2D圖像中的像素和3D點云中的點之間的對應關系

    準確描述和檢測 2D3D 關鍵點對于建立跨圖像和點云的對應關系至關重要。盡管已經提出了大量基于學習的 2D3D 局部特征描述符和
    的頭像 發表于 10-18 09:20 ?9024次閱讀

    使用Python從2D圖像進行3D重建過程詳解

    有許多不同的方法和算法可用于從2D圖像執行3D重建。選擇的方法取決于諸如輸入圖像的質量、攝像機校準信息的可用性以及重建的期望準確性和速度等因素。
    的頭像 發表于 12-05 14:07 ?3449次閱讀
    使用Python從<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>進行<b class='flag-5'>3D</b>重建過程詳解

    2D3D視覺技術的比較

    作為一個多年經驗的機器視覺工程師,我將詳細介紹2D3D視覺技術的不同特點、應用場景以及它們能夠解決的問題。在這個領域內,2D3D視覺技術是實現自動化和智能制造的關鍵技術,它們在工業
    的頭像 發表于 12-21 09:19 ?1292次閱讀

    一文了解3D視覺和2D視覺的區別

    一文了解3D視覺和2D視覺的區別 3D視覺和2D視覺是兩種不同的視覺模式,其區別主要體現在立體感、深度感和逼真度上。本文將詳細闡述這些區別,并解釋為什么
    的頭像 發表于 12-25 11:15 ?3535次閱讀

    AN-1249:使用ADV8003評估板將3D圖像轉換2D圖像

    電子發燒友網站提供《AN-1249:使用ADV8003評估板將3D圖像轉換2D圖像.pdf》資料免費下載
    發表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b><b class='flag-5'>轉換</b>成<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>
    主站蜘蛛池模板: jizz免费一区二区三区 | 在线天堂中文在线资源网 | 午夜影院在线观看 | 欧美性xxxx巨大黑人猛 | 欧美一级二级三级视频 | 特级毛片aaaa免费观看 | 四虎永久在线精品网址 | 天天躁狠狠躁狠狠躁夜夜躁 | 日韩无| 人人干在线| 亚洲欧美视频在线 | 日本久久久 | 日本欧美一区二区三区免费不卡 | 日本吻胸抓胸激烈视频网站 | 在线视频亚洲色图 | 日本一区二区三区在线观看视频 | 青青青久97在线观看香蕉 | 神马电影天堂网 | 添人人躁日日躁夜夜躁夜夜揉 | 男人的天堂久久精品激情 | 天天做.天天爱.天天综合网 | 免费人成网站线观看合集 | 国产成人亚洲日本精品 | 女69女人poren25| 欧美日韩精品乱国产 | 欧美日韩国产网站 | av2021天堂网手机版 | 国产女人和拘做受视频免费 | 视频二区在线观看 | 天天操穴 | 天天视频观看 | 国产女乱淫真高清免费视频 | 天堂色网 | 天天靠天天擦天天摸 | 青青久操视频 | 全国最大色成免费网站 | 91精品国产色综合久久不卡蜜 | 四虎地址8848最新章节 | h视频网站在线 | 狠狠色噜噜狠狠狠狠米奇7777 | 午夜精品久久久久久 |