在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌AI發布3D物體數據集,附帶標記邊界框、相機位姿、稀疏點云

工程師鄧生 ? 來源:量子位 ? 作者:蕭簫 ? 2020-11-13 14:28 ? 次閱讀

見過3D物體數據集,見過會動的3D物體數據集嗎?

每段動態視頻都 以目標為中心拍攝,不僅自帶標注整體的邊界框,每個視頻還附帶相機位姿和稀疏點云。

這是谷歌的開源3D物體數據集 Objectron,包含 15000份短視頻樣本,以及從五個大洲、十個國家里收集來的 400多萬張帶注釋的圖像。

谷歌認為,3D目標理解領域,缺少像2D中的ImageNet這樣的大型數據集,而Objectron數據集能在一定程度上解決這個問題。

數據集一經推出, 1.6k網友點贊。

有網友調侃,谷歌恰好在自己想“谷歌”這類數據集的時候,把它發了出來。

也有團隊前成員表示,很高興看到這樣的數據集和模型,給AR帶來進步的可能。

除此之外,谷歌還公布了用Objectron數據集訓練的針對 鞋子、椅子、杯子和相機4種類別的3D目標檢測模型。

來看看這個數據集包含什么,以及谷歌提供的3D目標檢測方案吧~ (項目地址見文末)

9類物體,對AR挺友好

目前,這個數據集中包含的3D物體樣本,包括自行車,書籍,瓶子,照相機,麥片盒子,椅子,杯子,筆記本電腦和鞋子。

當然,這個數據集,絕不僅僅只是一些以物體為中心拍攝的視頻和圖像,它具有如下特性:

注釋標簽 (3D目標立體邊界框)

用于AR數據的數據 (相機位姿、稀疏點云、二維表面)

數據預處理 (圖像格式為tf.example,視頻格式為SequenceExample)

支持通過腳本運行3D IoU指標的評估

支持通過腳本實現Tensorflow、PyTorch、JAX的數據加載及可視化,包含“Hello World”樣例

支持Apache Beam,用于處理谷歌云(Google Cloud)基礎架構上的數據集

所有可用樣本的索引,包括訓練/測試部分,便于下載

圖像部分的畫風,基本是這樣的,也標注得非常詳細:

而在視頻中,不僅有從各個角度拍攝的、以目標為中心的片段 (從左到右、從下到上):

也有不同數量的視頻類型 (一個目標、或者兩個以上的目標):

谷歌希望通過發布這個數據集,讓研究界能夠進一步突破3D目標理解領域,以及相關的如 無監督學習等方向的研究應用。

怎么用?谷歌“以身示范”

拿到數據集的第一刻,并不知道它是否好用,而且總感覺有點無從下手?

別擔心,這個數據集的訓練效果,谷歌已經替我們試過了。

看起來還不錯:

此外,谷歌將訓練好的3D目標檢測模型,也一并給了出來。 (傳送見文末)

算法主要包括兩部分,第一部分是Tensorflow的2D目標檢測模型,用來“發現物體的位置”;

第二部分則進行圖像裁剪,來估計3D物體的邊界框 (同時計算目標下一幀的2D裁剪,因此不需要運行每個幀),整體結構如下圖:

在模型的評估上,谷歌采用了 Sutherland-Hodgman多邊形裁剪算法,來計算兩個立體邊界框的交點,并計算出兩個立方體的 相交體積,最終計算出3D目標檢測模型的 IoU。

簡單來說,兩個立方體重疊體積越大,3D目標檢測模型效果就越好。

這個模型是谷歌推出的MediaPipe中的一個部分,后者是一個開源的跨平臺框架,用于構建pipeline,以處理不同形式的感知數據。

它推出的MediaPipe Objectron實時3D目標檢測模型,用移動設備 (手機)就能進行目標實時檢測 。

看, (他們玩得多歡快)實時目標檢測的效果還不錯:

其他部分3D數據集

除了谷歌推出的數據集以外,此前視覺3D目標領域,也有許多類型不同的數據集,每個數據集都有自己的特點。

例如斯坦福大學等提出的 ScanNetV2,是個室內場景數據集,而ScanNet則是個RGB-D視頻數據集,一共有21個目標類,一共1513個采集場景數據,可做語義分割和目標檢測任務。

而目前在自動駕駛領域非常熱門的 KITTI數據集,也是一個3D數據集,是目前最大的自動駕駛場景下計算機視覺的算法評測數據集,包含市區、鄉村和高速公路等場景采集的真實圖像數據。

此外,還有Waymo、SemanticKITTI、H3D等等數據集,也都用在不同的場景中。 (例如SemanticKITTI,通常被專門用于自動駕駛的3D語義分割)

無論是視頻還是圖像,這些數據集的單個樣本基本包含多個目標,使用場景上也與谷歌的Objectron有所不同。

感興趣的小伙伴們,可以通過下方傳送門,瀏覽谷歌最新的3D目標檢測數據集,以及相關模型~

Objectron數據集傳送門:

https://github.com/google-research-datasets/Objectron/

針對4種物體的3D目標檢測模型:

https://google.github.io/mediapipe/solutions/objectron

參考鏈接:

https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html

https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.html

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2918

    瀏覽量

    108065
  • 谷歌
    +關注

    關注

    27

    文章

    6203

    瀏覽量

    106090
  • AI
    AI
    +關注

    關注

    87

    文章

    31711

    瀏覽量

    270507
  • 大數據
    +關注

    關注

    64

    文章

    8910

    瀏覽量

    137844
收藏 人收藏

    評論

    相關推薦

    騰訊混元3D AI創作引擎正式發布

    近日,騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這一創新性的創作工具將為用戶帶來前所未有的3D內容創作體驗,標志著騰訊在AI技術領域的又一重大突破。 混元
    的頭像 發表于 01-23 10:33 ?189次閱讀

    騰訊混元3D AI創作引擎正式上線

    近日,騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這一創新性的創作工具,標志著騰訊在3D內容生成領域邁出了重要一步。 混元3D AI
    的頭像 發表于 01-22 10:26 ?173次閱讀

    C#通過Halcon實現3D重繪

    C# 通過 Halcon 實現 3D 重繪
    發表于 01-05 09:16 ?0次下載

    NEO推出3D X-AI芯片,AI性能飆升百倍

    近日,半導體行業的創新先鋒NEO Semiconductor震撼發布了一項革命性技術——3D X-AI芯片,這項技術旨在徹底顛覆人工智能處理領域的能效與性能邊界
    的頭像 發表于 08-21 15:45 ?707次閱讀

    深視智能3D相機2.5D模式高度差測量SOP流程

    深視智能3D相機2.5D模式高度差測量SOP流程
    的頭像 發表于 07-27 08:41 ?639次閱讀
    深視智能<b class='flag-5'>3D</b><b class='flag-5'>相機</b>2.5<b class='flag-5'>D</b>模式高度差測量SOP流程

    深視智能3D相機在軸承內徑檢測的應用

    3D相機
    深視智能科技
    發布于 :2024年07月23日 10:33:54

    紫光展銳助力全球首款AI裸眼3D手機發布

    1.4億臺,展示了該技術巨大的市場潛力和增長空間。近日,全球首款AI裸眼3D手機——中興遠航3D重磅上市。憑借微米級3D光柵技術、Neovision
    的頭像 發表于 07-15 16:00 ?763次閱讀

    中興通訊與中國移動發布全球首創AI裸眼3D新品,引領3D科技新浪潮

    在科技飛速發展的今天,裸眼3D技術以其獨特的沉浸式體驗,正逐漸成為科技領域的新寵。近日,全球領先的通訊科技企業中興通訊攜手中國移動,在備受矚目的2024MWC上海展上,發布了兩款全球首創的AI裸眼
    的頭像 發表于 06-28 15:32 ?1099次閱讀

    浪潮發布洲燭龍雙目結構光3D相機

    在科技日新月異的今天,智能制造正逐步成為推動社會發展的重要力量。近日,備受矚目的2024世界智能產業博覽會在天津盛大開幕。本次博覽會不僅匯聚了全球智能產業的精英,更見證了一項創新技術的誕生——浪潮洲旗下國器智眸公司研發的“洲燭龍雙目結構光
    的頭像 發表于 06-25 18:00 ?1231次閱讀

    奧比中光正式發布全新Gemini 330系列雙目3D相機

    4月29日,奧比中光正式發布全新Gemini 330系列雙目3D相機,首發產品包括Gemini 335、Gemini 335L兩款通用型高性能雙目3D
    的頭像 發表于 04-30 10:41 ?762次閱讀
    奧比中光正式<b class='flag-5'>發布</b>全新Gemini 330系列雙目<b class='flag-5'>3D</b><b class='flag-5'>相機</b>

    機器人3D視覺引導系統框架介紹

    通過自主開發的3D掃描儀可獲準確并且快速地獲取場景的云圖像,通過3D識別算法,可實現在對云圖中的多種目標物體進行識別和位
    發表于 04-29 09:31 ?386次閱讀
    機器人<b class='flag-5'>3D</b>視覺引導系統框架介紹

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據預設的
    的頭像 發表于 03-21 14:57 ?1111次閱讀

    基于深度學習的方法在處理3D進行缺陷分類應用

    背景部分介紹了3D應用領域中公開可訪問的數據的重要性,這些數據
    的頭像 發表于 02-22 16:16 ?1354次閱讀
    基于深度學習的方法在處理<b class='flag-5'>3D</b><b class='flag-5'>點</b><b class='flag-5'>云</b>進行缺陷分類應用
    主站蜘蛛池模板: aaaaaaa毛片 | 日韩高清特级特黄毛片 | 亚洲不卡视频 | 久草老司机 | 国内视频一区二区三区 | 男人的天堂黄色 | 久久semm亚洲国产 | 国产私密| 国产一级久久免费特黄 | 午夜精品久久久 | 国产老肥熟xxxx | 18女毛片| 午夜在线视频观看 | 亚洲黄色在线网站 | 在线观看黄a | 色之综合天天综合色天天棕色 | 2021年最热新版天堂资源中文 | 毛片在线网 | 神马午夜在线观看 | 韩国免费人成在线观看网站 | 欧美精品一区二区三区视频 | 六月婷婷在线观看 | 特黄特色大片免费视频播放 | 免费高清在线视频色yeye | 在线色| www亚洲欲色成人久久精品 | 国模吧双双大尺度炮交gogo | fc2 ppv sss级素人美女 | 国产精品天天看 | 综合精品视频 | h视频在线观看网站 | 永久免费观看黄网站 | 日本三级日产三级国产三级 | 免费污视频在线 | 国产精品久久女同磨豆腐 | 全免费a级毛片免费看不卡 全日本爽视频在线 | 亚洲综合区图片小说区 | 免费高清在线观看a网站 | 久久婷婷激情 | 国产在视频线精品视频2021 | 色一乱一伦一区一直爽 |