在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

牛津博士論文學(xué)習(xí)重建和分割3D物體,突破AI和機(jī)器理解的界限

工程師鄧生 ? 來源:機(jī)器之心Pro ? 作者:Bo Yang ? 2020-11-26 18:11 ? 次閱讀

讓機(jī)器擁有像人類一樣感知 3D 物體和環(huán)境的能力,是人工智能領(lǐng)域的一項(xiàng)重要課題。牛津大學(xué)計(jì)算機(jī)科學(xué)系博士生 Bo Yang 在其畢業(yè)論文中詳細(xì)解讀了如何重建和分割 3D 物體,進(jìn)而賦予機(jī)器感知 3D 環(huán)境的能力,突破了人工智能和機(jī)器理解的界限。

賦予機(jī)器像人類一樣感知三維真實(shí)世界的能力,這是人工智能領(lǐng)域的一個(gè)根本且長(zhǎng)期存在的主題。考慮到視覺輸入具有不同類型,如二維或三維傳感器獲取的圖像或點(diǎn)云,該領(lǐng)域研究中一個(gè)重要的目標(biāo)是理解三維環(huán)境的幾何結(jié)構(gòu)和語(yǔ)義。

傳統(tǒng)方法通常利用手工構(gòu)建的特征來估計(jì)物體或場(chǎng)景的形狀和語(yǔ)義。但是,這些方法難以泛化至新物體和新場(chǎng)景,也很難克服視覺遮擋的關(guān)鍵問題。

今年九月畢業(yè)于牛津大學(xué)計(jì)算機(jī)科學(xué)系的博士生 Bo Yang 在其畢業(yè)論文《Learning to Reconstruct and Segment 3D Objects》中對(duì)這一主題展開了研究。與傳統(tǒng)方法不同,作者通過在大規(guī)模真實(shí)世界的三維數(shù)據(jù)上訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)通用和魯棒表示,進(jìn)而理解場(chǎng)景以及場(chǎng)景中的物體。

總體而言,本文開發(fā)了一系列新型數(shù)據(jù)驅(qū)動(dòng)算法,以實(shí)現(xiàn)機(jī)器感知到真實(shí)世界三維環(huán)境的目的。作者表示:「本文可以說是突破了人工智能和機(jī)器理解的界限。」

這篇博士論文有 143 頁(yè),共六章。機(jī)器之心對(duì)該論文的核心內(nèi)容進(jìn)行了簡(jiǎn)要介紹,感興趣的讀者可以閱讀論文原文。

論文地址:https://arxiv.org/pdf/2010.09582.pdf

論文概述

作者在第 2 章首先回顧了以往 3D 物體重建和分割方面的研究工作,包括單視圖和多視圖 3D 物體重建、3D 點(diǎn)云分割、對(duì)抗生成網(wǎng)絡(luò)(GAN)、注意力機(jī)制以及集合上的深度學(xué)習(xí)。此外,本章最后還介紹了在單視圖 / 多視圖 3D 重建和 3D 點(diǎn)云分割方面,該研究相較于 SOTA 方法的新穎之處。

基于單視圖的 3D 物體重建

在第 3 章,作者提出以一種基于 GAN 的深度神經(jīng)架構(gòu)來從單一的深度視圖學(xué)習(xí)物體的密集 3D 形狀。作者將這種簡(jiǎn)單但有效的模型稱為 3D-RecGAN++,它將殘差連接(skip-connected)的 3D 編碼器 - 解碼器和對(duì)抗學(xué)習(xí)結(jié)合,以生成單一 2.5D 視圖條件下的完整細(xì)粒度 3D 結(jié)構(gòu)。該模型網(wǎng)絡(luò)架構(gòu)的訓(xùn)練和測(cè)試流程如下圖所示:

接著,作者利用條件對(duì)抗訓(xùn)練來細(xì)化編碼器 - 解碼器估計(jì)的 3D 形狀,其中用于 3D 形狀細(xì)化的判別器結(jié)構(gòu)示意圖如下:

最后,作者將提出的 3D-RecGAN++ 與 SOTA 方法做了對(duì)比,并進(jìn)行了控制變量研究。在合成和真實(shí)數(shù)據(jù)集上的大量實(shí)驗(yàn)結(jié)果表明,該模型性能良好。

基于多視圖的 3D 物體重建

在第 4 章,作者提出以一種新的基于注意力機(jī)制的神經(jīng)模塊來從多視圖中推理出更好的 3D 物體形狀。這種簡(jiǎn)單但高效的注意力聚合模塊被稱為 AttSets,其結(jié)構(gòu)如下圖所示。與現(xiàn)有方法相比,這種方法可以學(xué)習(xí)從不同圖像中聚合有用信息。

此外,研究者還引入了兩階段訓(xùn)練算法,以確保在給出一定數(shù)量輸入圖像的情況下,預(yù)估的 3D 形狀具有魯棒性。研究者在多個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),證明該方法能夠精確地恢復(fù)物體的 3D 形狀。

從點(diǎn)云中學(xué)習(xí)分割 3D 物體

在第五章中,研究者提出了一個(gè)新的框架來識(shí)別大規(guī)模 3D 場(chǎng)景中的所有單個(gè) 3D 物體。與現(xiàn)有的研究相比,該研究的框架能夠直接并且同時(shí)進(jìn)行檢測(cè)、分割和識(shí)別所有的目標(biāo)實(shí)例,而無需任何繁瑣的前 / 后處理步驟。研究者在多個(gè)大型實(shí)際數(shù)據(jù)集上展現(xiàn)了該方法相對(duì)于基線的性能提升。

作者介紹

本文作者 Bo Yang 現(xiàn)為香港理工大學(xué)計(jì)算機(jī)系助理教授。他本科和碩士分別畢業(yè)于北京郵電大學(xué)和香港大學(xué),然后進(jìn)入牛津大學(xué)計(jì)算機(jī)科學(xué)系攻讀博士學(xué)位,其導(dǎo)師為 Niki Trigoni 和 Andrew Markham 教授。

Bo Yang 作為一作以及合著的論文曾被《計(jì)算機(jī)視覺國(guó)際期刊》(IJCV)以及 NeurIPS 和 CVPR 等學(xué)術(shù)會(huì)議接收,谷歌學(xué)術(shù)主頁(yè)上顯示他共著有 22 篇論文,被引用數(shù)超過 400。

論文目錄如下:

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34591

    瀏覽量

    276289
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8497

    瀏覽量

    134243
  • 3D物體識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    6367
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人形機(jī)器3D 視覺路線之爭(zhēng):激光雷達(dá)、雙目和 3D - ToF 誰(shuí)更勝一籌?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)在人形機(jī)器人的設(shè)計(jì)方案中,3D 視覺技術(shù)是實(shí)現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機(jī)器人完成環(huán)境感知與建模、動(dòng)態(tài)目標(biāo)檢測(cè)與跟蹤、物體操作
    的頭像 發(fā)表于 04-15 00:14 ?2521次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級(jí)

    AI、計(jì)算機(jī)視覺技術(shù)在大眾娛樂市場(chǎng)的推廣應(yīng)用,其 3D 生成工具 Rodin(Hyper3d.ai)去年 6 月發(fā)布后迅速突破了百萬用戶量級(jí),背后技術(shù)
    的頭像 發(fā)表于 04-27 15:09 ?381次閱讀

    將應(yīng)用程序工具套件集成到Unity 3D OpenVINO?過程中遇到\"DLLNotFound異常\"錯(cuò)誤怎么解決?

    。 在機(jī)器上設(shè)置所有環(huán)境路徑,并且可以全局訪問每個(gè)依賴關(guān)系/dll。 Unity 3D 編輯器無法找到任何依賴關(guān)系,并引發(fā)DLLNotFound Exception。 項(xiàng)目可以獨(dú)立構(gòu)建和運(yùn)行。
    發(fā)表于 03-05 06:22

    騰訊混元3D AI創(chuàng)作引擎正式發(fā)布

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具將為用戶帶來前所未有的3D內(nèi)容創(chuàng)作體驗(yàn),標(biāo)志著騰訊在AI技術(shù)領(lǐng)域的又一重大
    的頭像 發(fā)表于 01-23 10:33 ?543次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI
    的頭像 發(fā)表于 01-22 10:26 ?529次閱讀

    3D打印技術(shù)在材料、工藝方面的突破

    2024年3D打印技術(shù)領(lǐng)域在新材料、新工藝和新應(yīng)用方面繼續(xù)取得突破,并呈現(xiàn)出多樣的發(fā)展態(tài)勢(shì)。工藝方面,行業(yè)更加關(guān)注極限制造能力,從2023年的無支撐3D打印到2024年的點(diǎn)熔化、鍛打印、光束整形、多
    的頭像 發(fā)表于 01-13 18:11 ?864次閱讀
    <b class='flag-5'>3D</b>打印技術(shù)在材料、工藝方面的<b class='flag-5'>突破</b>

    3D掃描技術(shù)醫(yī)療領(lǐng)域創(chuàng)新實(shí)踐,積木易搭3D掃描儀Mole助力定制個(gè)性化手臂康復(fù)輔具

    1、“3D掃描+3D打印”技術(shù)為矯形修復(fù)、醫(yī)療輔助器具定制等領(lǐng)域帶來突破性創(chuàng)新 近年來,隨著AI、大數(shù)據(jù)、3D掃描、
    的頭像 發(fā)表于 10-31 11:25 ?648次閱讀
    <b class='flag-5'>3D</b>掃描技術(shù)醫(yī)療領(lǐng)域創(chuàng)新實(shí)踐,積木易搭<b class='flag-5'>3D</b>掃描儀Mole助力定制個(gè)性化手臂康復(fù)輔具

    中興通訊攜手中國(guó)移動(dòng)推出AI裸眼3D創(chuàng)新產(chǎn)品

    產(chǎn)品憑借Neovision 3D Anytime突破性的2D轉(zhuǎn)3D技術(shù),以及5G與AI的深度融合,為消費(fèi)者帶來更加沉浸、更為豐富的裸眼
    的頭像 發(fā)表于 10-15 10:05 ?1387次閱讀

    中興通訊全場(chǎng)景AI終端應(yīng)用與裸眼3D新品亮相

    ”的產(chǎn)品戰(zhàn)略與理念,終端業(yè)務(wù)六大AI主題展示吸引了眾多關(guān)注,內(nèi)容覆蓋全球領(lǐng)先的AI裸眼3DAI同聲傳譯和方言互譯、AI安全反詐、
    的頭像 發(fā)表于 10-15 10:00 ?1443次閱讀

    3d打印機(jī)器人外殼模型ABS材料3D打印噴漆服務(wù)-CASAIM

    隨著科技的不斷發(fā)展,3D打印技術(shù)作為一種創(chuàng)新性的制造方式,正在改變我們的生活和制造業(yè)。它是一種通過逐層添加材料來構(gòu)建物體的制造方法。該技術(shù)允許我們通過CAD(計(jì)算機(jī)輔助設(shè)計(jì))軟件將數(shù)字模型轉(zhuǎn)換成實(shí)體物體
    的頭像 發(fā)表于 07-21 15:10 ?559次閱讀

    紫光展銳助力全球首款AI裸眼3D手機(jī)發(fā)布

    1.4億臺(tái),展示了該技術(shù)巨大的市場(chǎng)潛力和增長(zhǎng)空間。近日,全球首款AI裸眼3D手機(jī)——中興遠(yuǎn)航3D重磅上市。憑借微米級(jí)3D光柵技術(shù)、Neovision
    的頭像 發(fā)表于 07-15 16:00 ?1002次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)分割方法

    機(jī)器學(xué)習(xí)中,數(shù)據(jù)分割是一項(xiàng)至關(guān)重要的任務(wù),它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評(píng)估。本文將從多個(gè)方面詳細(xì)探討機(jī)器學(xué)習(xí)中數(shù)據(jù)
    的頭像 發(fā)表于 07-10 16:10 ?3059次閱讀

    Meta推出革命性3D Gen AI模型:1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容

    在科技日新月異的今天,Meta再次引領(lǐng)創(chuàng)新潮流,宣布了一項(xiàng)令人矚目的技術(shù)突破——3D Gen AI模型的誕生。這款先進(jìn)的模型以其前所未有的高效性與卓越品質(zhì),重新定義了3D內(nèi)容創(chuàng)作的邊界
    的頭像 發(fā)表于 07-04 18:12 ?1282次閱讀

    機(jī)器人視覺技術(shù)中圖像分割方法有哪些

    機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割機(jī)器人視覺技術(shù)中的一個(gè)重要環(huán)節(jié),它的目
    的頭像 發(fā)表于 07-04 11:34 ?1624次閱讀

    中興通訊與中國(guó)移動(dòng)發(fā)布全球首創(chuàng)AI裸眼3D新品,引領(lǐng)3D科技新浪潮

    在科技飛速發(fā)展的今天,裸眼3D技術(shù)以其獨(dú)特的沉浸式體驗(yàn),正逐漸成為科技領(lǐng)域的新寵。近日,全球領(lǐng)先的通訊科技企業(yè)中興通訊攜手中國(guó)移動(dòng),在備受矚目的2024MWC上海展上,發(fā)布了兩款全球首創(chuàng)的AI裸眼
    的頭像 發(fā)表于 06-28 15:32 ?1338次閱讀
    主站蜘蛛池模板: 久久国产精品免费看 | 亚洲29p| a级特黄毛片 | 最新黄色免费网站 | 一区二区精品 | 欧美日韩性猛交xxxxx免费看 | 男人天堂欧美 | 天天草综合网 | 国产精品国产三级国产在线观看 | 国产亚洲精品久久午夜 | 色偷偷888欧美精品久久久 | 大尺度视频网站久久久久久久久 | 亚洲一二三四 | 欧美成人免费全部观看天天性色 | 五月婷婷在线观看视频 | 草草操| 三级黄色在线 | 性xxxx黑人与亚洲 | 日本一区二区三区欧美在线观看 | 国产亚洲美女精品久久久久狼 | 高清视频在线观看+免费 | 婷婷影院在线综合免费视频 | 国产精品波多野结衣 | a黄网站| 第四色亚洲色图 | 免费国产午夜高清在线视频 | 狠狠干亚洲色图 | 午夜免费福利片 | 国产女人和拘做受视频免费 | 天天操天天干天天 | 四虎国产永久在线观看 | 9984四虎永久免费网站 | 人人添人人澡人人澡人人人爽 | 六月天色婷婷 | 女18poren69| 免费在线成人 | 亚洲一区免费看 | a资源在线观看 | 色老头网站久久网 | 禁漫羞羞入口 | 麒麟色欧美影院在线播放 |