在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3D網格重建學習:單一角度預測物體3D結構的框架

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-03-23 16:58 ? 次閱讀

看到一張圖片,我們很容易就能猜測出圖中物體的立體模樣,但是機器能做到嗎?美國加州大學伯克利分校的研究人員就開發了一個框架,讓機器通過一張圖片就能還原出立體原型,并添加自然的紋理圖案。以下是論智對原論文的編譯,后附論文地址和實驗結果展示視頻。

我們開發了一種學習框架,能夠通過一張圖片還原圖中物體的3D形狀、攝像角度及紋理。形狀用可變形的3D網格模型表示。

上圖中有許多小鳥,即使我們是第一次看到這種圖片上二維的鳥類,我們依然能推斷出它大概的3D形狀、了解拍攝的角度、甚至能猜出從另一個角度看它會是什么樣。我們能做到這些是因為之前我們見過的鳥類能讓我們對陌生小鳥有個大致輪廓,這些知識幫助我們還原這些案例的3D結構。

在這篇文章中,我們展示了一個能根據單張圖片推斷3D表示的計算模型,如上圖所示,學習過程只需要一張標注過的2D圖像,其中包括目標對象的類別、前景掩碼和語義重點標簽

我們的目標是生成一個預測器fθ(參數化設置為一個CNN),它可以從單張照片I中推斷出目標物體的3D結構。在這個項目中我們希望將物體的形狀用3D網格表示,這種表示比其他方法(比如probabilistic volumetric grids)有更多優點,例如可對紋理進行模擬、進行相應的推理、表面水平推理和可解釋性。

我們提出的框架如下圖所示。輸入的圖像通過一個編碼器后到達由三個模塊組成的表征,它可以預測相機位置、物體形狀和花紋的參數。

用模型推斷目標物的3D表示

首先,給定一張圖像I,我們預測fθ(I)≡(M, π),網格M和相機位置π用來捕捉對象的3D結構。具體的推導過程可查看原論文。除了這些直接預測的方面,我們還學習了網格和類別水平語義重點之間的關系。當我們在規范框架中使用特定類別的網格來表示形狀時,跨實例的規律能幫助我們找到語義一致的定點位置,從而隱含地賦予這些頂點語義。

經過這一步,我們就利用一張圖片I推斷出了相應的相機位置π和形狀?V。同時,我們還通過學習實例獨立的參數。推斷出了網格定點的位置V和語義重點A·V。

從圖像集合中學習

為了訓練fθ,我們提出了一種不依賴于實際3D形狀和多角度圖像實例的監督的方法,而是從帶有稀疏關鍵點和分割掩碼的圖像集中進行學習。這種設置更加自然,并且容易獲得,特別是對會動和可變形的物體,例如鳥類或其他動物。想要獲取對象的掃描件甚至同一物體多個角度的照片是非常困難的,但對于大多數物體來說,獲取單張圖像相對更容易。

有了帶注釋的圖像集,我們通過制定一個目標函數來訓練fθ,該函數包含和實例相關的損失和先驗。具體的實例能量術語(energy terms)可以保證預測的3D結構與現有的掩碼和關鍵點一致,并且先驗知識能幫助生成一些特征,例如光滑性。由于我們從許多實例中得到了通用的預測模型fθ,那么各個種類之間的通用結構也能讓我們從中得到有意義的3D預測,即使只有一個實例。

插入圖案預測

在我們的公式中,所有復原的形狀都有著共同的3D網格結構——每種形狀都是平均形狀的變形。我們可以利用這一屬性來減少特定實例中的圖案以預測平均圖案的形狀。我們的平均形狀是個球體,它的表面圖案可以表示成一張名為Iuv的圖像,其值通過固定的UV映射映射到表面上(類似于將地球展開成平面圖)。

于是,我們將預測圖案的這個任務看作是推斷Iuv的像素值。該圖像可以被認為是屬于目標物體類別的典型外觀空間。例如,預測形狀中的特殊三角形總是會映射到Iuv中的特定區域,不管它如何變形。

將圖案參數化之后,UV圖像中每個像素的語義含義都一致,從而使預測模型更容易利用通用模式,例如鳥背和身體之間的相關性。

我們通過設置一個解碼器,將圖案預測模塊添加到框架中,該解碼器可以將潛在表示轉換成Iuv的空間向量。雖然直接用回歸計算Iuv的像素值是一種可行的方法,但這通常會導致模糊圖像的產生。相反,我們將此任務看成預測外觀流,我們不回歸Iuv像素的值,而是讓模塊輸出從原始輸入圖像復制來的像素顏色。如圖所示:

實驗過程

模型設置好后,我們選擇CUB-200-2011數據集做實驗,該數據集有6000張訓練和測試圖像,包括了200種鳥類。每張圖片都有邊界框進行標注,另外還有14個語義關鍵點標注出了位置,同時還顯示出了前景的掩碼。我們從中挑選了近300張圖像,其中每張圖的關鍵點少于或等于6個。另外預測網絡的各個模塊示意圖如圖2所示,編碼器由一個在ImageNet上預訓練的ResNet-18組成,緊接著是一個卷積層。

最終在CUB測試集上得到的重建結果如圖所示:

論文附錄和文后視頻中會有360度全景展示。

另外,我們還對目標物體的圖案進行了替換,將一張圖上的紋理替換到預測形狀上去。我們發現,即使兩個視角可能不同,由于基礎的紋理圖像在空間上是一致的,所轉換的紋理在語義上也是一致的。

除此之外,我們還在PASCAL 3D+數據集上對車和飛機做了同樣的實驗,預測的形狀通常都很正常,不過圖案會出現較多錯誤,因為汽車上有反光的地方或是訓練數據較少:

結語

我們展示了可以從單一角度預測物體3D結構的框架。雖然這項結果非常令人興奮,但是我們并沒有提出一個通用的解決方案。最后,雖然我們只能使用實例的單一視圖進行學習,但對于有多個視圖的場景來說,我們的方法可能同樣適用,并產生更好的結果。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3758

    瀏覽量

    136795
  • 3D
    3D
    +關注

    關注

    9

    文章

    2945

    瀏覽量

    109231

原文標題:讓平面變立體——特定類別3D網格重建學習

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    3D測量使用的labview框架

    這是小弟3D測量項目上的軟件框架
    發表于 06-04 14:16

    3D掃描的結構

    。幾何三剖分的原理使得計算被掃描物體表面上每個點的XYZ坐標成為可能(見圖01)。然后,獲得的點云數據用于被掃描物體表面詳細3D模型的計算構造。圖01:使用DLP? 技術的
    發表于 08-30 14:51

    3D打印的優勢

    縮短。不需要開模,可直接快速打印原型,成本大大減低。在尺寸精度上也可滿足工業級裝配要求,塑料樣件尺寸精度可達±0.1mm,金屬樣件尺寸精度可達±20μm;優點3:靈活3d打印在加工零件的
    發表于 11-10 16:15

    PYNQ框架下如何快速完成3D數據重建

    來實現基于這些約束的三維重建的完整管道。  在這個項目中,作者的目標是朝著實時生成3D視覺數據邁進步。首先,在CPU上生成3D點云,然后使用Mesh Lab可視化它。由于Mesh L
    發表于 01-07 17:25

    浩辰3D的「3D打印」你會用嗎?3D打印教程

    設計。由浩辰CAD公司研發的浩辰3D作為從產品設計到制造全流程的高端3D設計軟件,不僅能夠提供完備的2D+3D體化解決方案,還能站式集成
    發表于 05-27 19:05

    3D打印機的結構

    這是 DIY 系列的第篇,先從結構說起。細數 3D 打印機的結構不下 10 種了,各有各的優缺點。從最古老的龍門結構開始,分別列舉各自的優
    發表于 09-01 06:37

    使用結構光的3D掃描介紹

    控制、醫療、牙科和原型設計。 3D掃描是提取物體的表面和物理測量,并用數字的方式將其表示出來。這些數據被采集為個由X,Y和Z坐標(表示物體
    發表于 11-16 07:48

    從榮耀角度解讀3D識別的結構光、TOF及雙目立體成像方案

    3D Sensing在人機交互上,可實現人臉識別、設備解鎖、面部表情等應用,借助“點云深度攝像頭”的散斑結構光手機配件,榮耀V10可實現3D人臉建模、人臉識別、3D面部表情控制以及
    的頭像 發表于 12-12 11:19 ?3.1w次閱讀

    淺析3D結構光技術

    HUAWEI Mate 20 Pro采用2400萬前置攝像頭,擁有3D結構光設計,3D智能美顏,自拍清晰自然;同時支持3D人臉解鎖,帶來毫秒級解鎖體驗。
    的頭像 發表于 10-23 15:55 ?2.1w次閱讀

    3D的感知技術及實踐

    3D濾波、噪聲過濾和表面平滑 3D信號處理深度圖平滑濾波 3D信號處理深度圖的雙邊濾波 3D信號處理表面平滑(三
    的頭像 發表于 10-23 09:40 ?3448次閱讀
    <b class='flag-5'>3D</b>的感知技術及實踐

    3D視覺主要技術路徑 3D結構光技術原理

    3D傳感器作為3D視覺的眼睛,通過多個攝像頭與深度傳感器的組合能夠獲得物體三維位置及尺寸等數據,實現三維信息采集。目前3D視覺傳感器主要有雙目相機、
    發表于 11-22 21:21 ?4295次閱讀

    大規模3D重建的Power Bundle Adjustment

    BA (BA) 是個經典的計算機視覺問題,它構成了許多 3D 重建和運動結構 (SfM) 算法的核心組成部分。它指的是通過最小化非線性重投影誤差來聯合估計相機參數和
    的頭像 發表于 12-15 11:20 ?867次閱讀

    NeuralLift-360:將野外的2D照片提升為3D物體

    3D點云中生成可渲染的3D網格:使用個基于深度學習的方法來將點云轉換為可渲染的3D
    的頭像 發表于 04-16 10:02 ?2399次閱讀

    基于未知物體進行6D追蹤和3D重建的方法

    如今,計算機視覺社區已經廣泛展開了對物體姿態的 6D 追蹤和 3D 重建。本文中英偉達提出了同時對未知物體進行 6
    的頭像 發表于 07-03 11:24 ?785次閱讀
    基于未知<b class='flag-5'>物體</b>進行6<b class='flag-5'>D</b>追蹤和<b class='flag-5'>3D</b><b class='flag-5'>重建</b>的方法

    生成高質量 3D 網格,從重建到生成式 AI

    代 AI 工作流已經在生成高保真 3D 模型方面取得了巨大成功,從基于給定圖像的場景重建,到能夠為交互式體驗制作資產的生成式 AI。 這些生成的 3D 模型通常被提取成標準的三
    的頭像 發表于 08-17 19:15 ?914次閱讀
    生成高質量 <b class='flag-5'>3D</b> <b class='flag-5'>網格</b>,從<b class='flag-5'>重建</b>到生成式 AI
    主站蜘蛛池模板: 日日日日人人人夜夜夜2017 | 丁香五月缴情在线 | 啪啪网站免费看 | 18视频免费网址在线观看 | 欧美成人性高清观看 | 午夜国产理论 | 欧美伦理一区二区三区 | 黄色一级大片视频 | 国内精品久久久久久久久野战 | 美女张开腿露尿口给男人亲 | 狠狠色噜噜狠狠狠狠狠色综合久久 | 免费人成网站 | 四虎在线电影 | 激情六月丁香 | 91最新网站免费 | 日产乱码免费一卡二卡在线 | 国产成人影视 | 国产片无遮挡在线看床戏 | 人人干免费 | 夜夜爽网站 | 欧美三级黄色 | 精品福利在线视频 | 免费黄色一级片 | 国产精品第一页在线观看 | 香港三澳门三日本三级 | 综合色爱| 国产在线视频你懂的 | 亚洲综合校园春色 | 美女黄页网 | 激情伦成人综合小说 | 天天鲁天天爽天天视频 | 久久久久88色偷偷免费 | 精品精品国产高清a毛片牛牛 | 2014天堂| 久久国产精品免费专区 | 色综合久久综合欧美综合图片 | 中文字幕 亚洲一区 | 黄色一级片在线观看 | 黄视频日本 | 欧美色碰碰碰免费观看长视频 | 边做饭边被躁欧美三级小说 |