在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

上線一周就2.1k star!單張圖像直接轉為3D模型!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-11-06 16:13 ? 次閱讀

0. 筆者個人體會

提問:給你一張2D圖像,要求獲得完整的三維模型,你會怎么做?

我第一反應是拿SolidWorks自己畫一個~

最近就看到了這樣的一項開源工作Wonder3D,可以直接從2D圖像生成3D模型,感覺很神奇。讀了讀文章,發現這項工作是基于擴散模型實現的,這里也不得不感嘆擴散模型確實在AI繪畫和圖像生成領域有無限前景。今天筆者也將帶領讀者閱讀一下這項工作,當然筆者水平有限,如果有理解不當的地方歡迎大家一起探討,共同學習。

1. 效果展示

Wonder3D僅需2~3分鐘即可從單視圖圖像重建高細節紋理網格。Wonder3D首先通過跨域擴散模型生成一致的多視法線圖與相應的彩色圖像,然后利用一種法線融合方法來實現快速和高質量的重建。這里也推薦「3D視覺工坊」新課程《徹底搞透視覺三維重建:原理剖析、代碼講解、及優化改進》。

9a83467a-7c55-11ee-939d-92fbcf53809c.png

對不同風格的圖像也都適用。

9ab04418-7c55-11ee-939d-92fbcf53809c.png

甚至對各種小動物也適用:

9ad1c6c4-7c55-11ee-939d-92fbcf53809c.png

代碼已經開源了,而且他們的官方主頁還放上了Live Demo的鏈接,感興趣的讀者可以上傳自己的圖像來嘗試,下面展示一下筆者自己的測試結果。

原始圖像:

9aff0fda-7c55-11ee-939d-92fbcf53809c.png

生成的多視角圖像:

9b1ee09e-7c55-11ee-939d-92fbcf53809c.png

2. 摘要

在這篇文章中,我們介紹了Wonder3D,一種從單視圖圖像中高效生成高保真紋理網格的新方法。基于分數蒸餾采樣(SDS)的最近方法已經顯示出從2D擴散先驗恢復3D幾何形狀的潛力,但是它們通常遭受每個形狀優化的耗時和不一致的幾何形狀。相比之下,某些作品通過快速網絡推理直接產生3D信息,但其結果通常質量較低且缺乏幾何細節。為了從整體上提高圖像到3D任務的質量、一致性和效率,我們提出了一種跨域擴散模型來生成多視圖法線貼圖和相應的彩色圖像。為了確保一致性,我們采用了一種多視圖跨域關注機制,該機制有助于跨視圖和模態的信息交換。最后,我們介紹了一種幾何感知法向融合算法,從多視圖2D表示中提取高質量的表面。我們的大量評估表明,與先前的工作相比,我們的方法實現了高質量的重建結果、魯棒的泛化以及相當好的效率。

3. 算法解析

先讓我們重新審視一下這個問題:

給定單張圖像,繪制其三維模型。

傳統方法會怎么做呢?

使用SLAM或SfM?單張圖像做初始化都不夠。

使用MVS方法?沒有多視角圖像就沒有視差圖。

用NeRF?最吃數據了,視角大一點都不行。

直接訓模型學習?思路上可以,實操起來效果非常差。

這個任務本身就非常反人類,因為只有一個視角,沒有先驗信息誰也不知道完整的三維模型長什么樣。

那怎么做呢?

這篇文章的思路很巧妙,沒有像NeRF那樣直接從2D圖像生成3D模型,而是先用擴散模型生成多個視角的2D圖像和法線圖,再融合生成3D模型。

這么做有啥好處呢?

最大的好處就是可以直接利用Stable Diffusion這種經過數十億張圖像訓練過的2D擴散模型,實際上相當于引入了非常強的先驗信息。而且法線圖可以表征物體的起伏和表面幾何信息,進而計算3D模型的高保真幾何元素。

這樣,整個任務就變為了建立一個馬爾科夫鏈,然后從中采樣顏色和法線信息的過程。

9b3eb0ea-7c55-11ee-939d-92fbcf53809c.png

其中p代表高斯噪聲,n代表法線圖,x代表RGB圖,K代表圖像數量。

不太對,擴散模型只能處理一個域,怎么出來RGB和法線兩個域了?

的確是這樣,最直觀的改動思路就是給擴散模型添加一個頭,重新訓練模型,直接輸出RGB和法線信息,這也是前兩年多任務網絡的常用做法。但是實際操作過程中會發現收斂很慢,而且泛化性差。

另一個思路是直接訓練兩個擴散模型,但這樣不光增加了計算量,還會導致性能下降。

Wonder3D的做法是設計了一個域轉換器(Domain Switcher),實際上是一個標注域信息的一維向量。域轉換器先做位置編碼,聚合時間embedding信息,再把它也輸送給擴散模型,就可以讓擴散模型同時處理兩個域的信息。

這一點可以先放一個定性對比圖來觀察:

9b6268be-7c55-11ee-939d-92fbcf53809c.png

還有問題,RGB和法線是獨立生成的,多視角的RGB圖也未必就幾何一致。

在這里,Wonder3D引入了一個注意力機制,分別處理多個時間RGB幾何不一致的問題,以及RGB和法線圖的關聯問題。

9b89c260-7c55-11ee-939d-92fbcf53809c.png

到這里,Wonder3D具體的Pipeline就出來了:

輸入一幅圖像,Wonder3D取原始圖像、CLIP產生的文本embedding、多視角相機參數,以及一個域轉換器作為條件,生成一致的多視點法線圖和彩色圖。隨后,Wonder3D借助法線融合算法,將2D表征重建為高質量的3D幾何圖形,產生高保真的紋理網格。

9bacc684-7c55-11ee-939d-92fbcf53809c.png

最后再看看這個幾何融合是怎么做的:

Wonder3D是優化神經隱式SDF場,來從匹配的RGB和法線圖中提取完整的三維信息。

剛才不是說NeRF需要稠密的圖像序列嗎?

如果直接做NeRF-SDF重建的話,誤差非常大,并且會一直累計下去。Wonder3D的做法是引入了一系列損失函數來約束優化:

9bd8ef98-7c55-11ee-939d-92fbcf53809c.png

4. 實驗

訓練數據集是LVIS子集,batch size是512,在8塊A800上訓練了3天(果然普通人還是玩不起)。從2D圖像生成3D模型的方法還是用的Instant NGP(論NeRF在各個領域的入侵haaaaa)。評估使用Google Scanned Object數據集。評估指標方面,3D重建用Chamfer Distances (CD)和Volume IoU,生成圖像質量用PSNR、SSIM、LPIPS這幾個常見指標。對比的方案也都是目前的SOTA,包括Zero123、RealFusion、Magic123、One-2-3-45、Point-E、Shap-E、SyncDreamer這些。

新視點合成對比,Zero 123缺乏多視圖一致性,SyncDreamer對輸入圖像的仰角比較敏感,但是Wonder3D生成具有語義一致性和幾何一致性的圖像。這里也推薦「3D視覺工坊」新課程《徹底搞透視覺三維重建:原理剖析、代碼講解、及優化改進》。

9bef031e-7c55-11ee-939d-92fbcf53809c.png

新視點合成的定量對比。

9c122376-7c55-11ee-939d-92fbcf53809c.png

3D重建質量的對比,Shape-E的重建結果不完整且扭曲。SyncDreamer的重建結生成圖像大致對齊,但紋理質量不好。相比之下Wonder3D實現幾何和紋理上最高的重建質量。

9c29a032-7c55-11ee-939d-92fbcf53809c.png

3D重建的定量對比。

9c650bf4-7c55-11ee-939d-92fbcf53809c.png

最后3D生成模型中各項損失函數的消融實驗,驗證損失函數的必要性:

9c88a91a-7c55-11ee-939d-92fbcf53809c.png

還是一個消融實驗,驗證多視圖幾何一致性和RGB-法線對其的注意力機制的作用:

9caa1fbe-7c55-11ee-939d-92fbcf53809c.png

5. 總結

本文為各位讀者介紹了Wonder3D,可以從單張圖像直接生成完整的三維模型,整個模型的設計思路很巧妙,而且也開源。渲染速度也達到了2~3分鐘,這項工作的應用也很廣泛,建圖、VR、AR、動畫、影視等等都可以用。感覺Wonder3D還是很神奇的,有點長見識了。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2921

    瀏覽量

    108123
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40600
  • 模型
    +關注

    關注

    1

    文章

    3372

    瀏覽量

    49299

原文標題:上線一周就2.1k star!單張圖像直接轉為3D模型!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    騰訊混元3D AI創作引擎正式發布

    的AI技術,能夠根據用戶提供的提示詞或圖片,直接生成高質量的3D模型。這功能極大地降低了3D內容創作的門檻,使得即使是缺乏專業
    的頭像 發表于 01-23 10:33 ?198次閱讀

    騰訊混元3D AI創作引擎正式上線

    近日,騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這創新性的創作工具,標志著騰訊在3D內容生成領域邁出了重要步。 混元
    的頭像 發表于 01-22 10:26 ?184次閱讀

    AN-1249:使用ADV8003評估板將3D圖像轉換成2D圖像

    電子發燒友網站提供《AN-1249:使用ADV8003評估板將3D圖像轉換成2D圖像.pdf》資料免費下載
    發表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉換成2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>

    uvled光固化3d打印技術

    說到UVLED光固化3D打印技術,那可是當下3D打印領域的股清流啊!這項技術利用紫外線和光固化樹脂來制造3D打印模型,原理簡單又高效。UV
    的頭像 發表于 12-24 13:13 ?273次閱讀
    uvled光固化<b class='flag-5'>3d</b>打印技術

    淘寶攜手Rokid上線3D購物新體驗

    ,消費者現在可以在Rokid的AR設備上輕松登錄淘寶網。在這里,他們不僅可以瀏覽到精美的3D商品模型,還能觀看生動的空間視頻,全方位了解商品的細節和特色。更重要的是,消費者可以直接在AR設備上下單購買,享受便捷、快速的購物流程。
    的頭像 發表于 11-19 11:29 ?721次閱讀

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD
    的頭像 發表于 08-07 10:13 ?450次閱讀
    安寶特產品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    安寶特產品 3D Evolution : 基于特征實現無損CAD格式轉換

    安寶特3D Evolution具有強大的3D CAD模型轉換功能,可在保留模型特征參數、注釋、約束的前提下,完成不同格式3D CAD
    的頭像 發表于 08-06 17:26 ?400次閱讀
    安寶特產品   <b class='flag-5'>3D</b> Evolution : 基于特征實現無損CAD格式轉換

    歡創播報 騰訊元寶首發3D生成應用

    1 騰訊元寶首發3D生成應用 只需張照片,便能迅速打造獨無二的3D角色。7月16日,騰訊旗下大模型應用“騰訊元寶”
    的頭像 發表于 07-18 11:39 ?853次閱讀
    歡創播報 騰訊元寶首發<b class='flag-5'>3D</b>生成應用

    裸眼3D筆記本電腦——先進的光場裸眼3D技術

    效果的用戶,這款筆記本電腦都能滿足你的需求。 、卓越的3D模型設計能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術,使用戶無需佩
    的頭像 發表于 07-16 10:04 ?678次閱讀

    烘焙vs渲染:3D模型制作中的效率與質量之爭

    3D建模和渲染領域,模型烘焙(Baking)和模型渲染(Rendering)是兩個經常被提及的概念。盡管它們都與最終圖像的生成有關,但它們在技術實現、目的、優勢和劣勢等方面存在顯著差
    的頭像 發表于 05-12 08:27 ?540次閱讀
    烘焙vs渲染:<b class='flag-5'>3D</b><b class='flag-5'>模型</b>制作中的效率與質量之爭

    ad19中3d模型不顯示?

    封裝庫導入3d模型不顯示,但導入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因導致
    發表于 04-24 13:41

    包含具有多種類型信息的3D模型

    動畫處理方式,與仿真模型對象進行交互,能直接從項目模型創建和管理進度表,以及外部項目管理軟件中導入成本項目和進度表。 SketchUp : 是款用于設計和施工的
    發表于 03-28 17:18

    Meta發布SceneScript視覺模型,高效構建室內3D模型

    Meta 表示,此模型具備創建室內 3D 模型的高效與輕便,僅需幾KB內存便能生成完整清晰的幾何圖形,同時,這些形狀數據具備可解釋性,便于用戶理解和編輯。
    的頭像 發表于 03-26 11:16 ?635次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張
    的頭像 發表于 03-22 10:30 ?966次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據預設的相機路徑創建
    的頭像 發表于 03-21 14:57 ?1127次閱讀
    主站蜘蛛池模板: 女人18毛片水多 | 精品三级在线观看 | 国产免费高清视频在线观看不卡 | 天天干夜操 | 欧美一卡二卡3卡4卡无卡六卡七卡科普 | 欧美天天性| 又黄又爽又猛午夜性色播在线播放 | 色偷偷91久久综合噜噜噜 | 日本不卡免费高清视频 | 色之综综 | 免费观看黄色在线视频 | 久久亚洲精品国产亚洲老地址 | 免费人成在线观看网站品爱网日本 | 六月丁香啪啪 | 午夜神马福利 | 香蕉久久夜色精品国产小说 | 久久久久久久久女黄 | 亚洲天天综合网 | 美女视频网站色软件免费视频 | 97午夜精品 | 国产主播一区二区 | 国产精品大全 | 伊人啪啪 | 激情五月婷婷综合网 | 在线天堂中文在线网 | 一级免费片 | 天天躁夜夜躁狠狠躁躁 | 男人的天堂黄色 | 成人久久伊人精品伊人 | 国产美女主播在线观看 | 天天干天天插天天射 | 国产日韩三级 | 天天做天天爱天天爽综合网 | 男女一级大黄 | 思思久久好好热精品国产 | 亚洲成a人片在线观看尤物 亚洲成a人片在线观看中 | 天堂亚洲网 | 中国特级毛片 | 亚洲一区免费 | 四虎欧美在线观看免费 | 成人福利在线视频 |