在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌Objectron數(shù)據(jù)集:3D目標檢測數(shù)據(jù)集及檢測方案

新機器視覺 ? 來源:新機器視覺 ? 作者:新智元 ? 2020-11-27 09:49 ? 次閱讀

谷歌人工智能實驗室近日發(fā)布 Objectron 數(shù)據(jù)集,這是一個以3D目標為中心視頻剪輯的集合,這些視頻剪輯從不同角度捕獲了較大的一組公共對象。數(shù)據(jù)集包括 15K 帶注釋的視頻剪輯,并補充了從地理多樣的樣本中收集的超過 4M 帶注釋的圖像(覆蓋五大洲的 10 個國家)。

機器學習(ML)的最新技術已經(jīng)在許多計算機視覺任務上取得了SOTA的結(jié)果,但僅僅是通過在2D照片上訓練模型而已。 在這些成功的基礎上,提高模型對 3D 物體的理解力有很大的潛力來支持更廣泛的應用場景,如增強現(xiàn)實、機器人、自動化和圖像檢索。 今年早些時候,谷歌發(fā)布了 MediaPipe Objectron,一套為移動設備設計的實時 3D 目標檢測模型,這個模型是基于一個已標注的、真實世界的 3D 數(shù)據(jù)集,可以預測物體的 3D 邊界。

然而,理解3D 中的對象仍然是一項具有挑戰(zhàn)性的任務,因為與2D 任務(例如,ImageNet、 COCO 和 Open Images)相比,缺乏大型的真實世界數(shù)據(jù)集。 為了使研究團體能夠繼續(xù)推進3D 對象理解,迫切需要發(fā)布以對象為中心的視頻數(shù)據(jù)集,這些數(shù)據(jù)集能夠捕獲更多的對象的3D 結(jié)構,同時匹配用于許多視覺任務(例如,視頻或攝像機流)的數(shù)據(jù)格式,以幫助機器學習模型的訓練和基準測試。 近期谷歌發(fā)布了 Objectron 數(shù)據(jù)集,這是一個以對象為中心的短視頻剪輯數(shù)據(jù)集,從不同的角度捕捉了一組更大的普通對象。

每個視頻剪輯都伴隨著 AR 會話元數(shù)據(jù),其中包括攝像機姿態(tài)和稀疏點云。數(shù)據(jù)還包含為每個對象手動注釋的3D 邊界,這些 bounding box 描述了對象的位置、方向和尺寸。 每個視頻剪輯都隨附有 AR 的元數(shù)據(jù),其中包括相機姿勢和稀疏點云。數(shù)據(jù)還包含每個對象的手動注釋的 3D 邊界框,用于描述對象的位置,方向和尺寸。 該數(shù)據(jù)集包括15K 注釋視頻剪輯與超過4M 注釋圖像收集的地理多樣性樣本(涵蓋10個國家橫跨五大洲)。

3D 目標檢測解決方案

除了這個數(shù)據(jù)集,谷歌還分享了一個 3D 目標檢測解決方案,可以用于4類物體:鞋子、椅子、杯子和相機。 這些模型是在 MediaPipe 中發(fā)布的,MediaPipe 是谷歌的開源框架,用于跨平臺可定制的流媒體機器學習解決方案,它同時也支持機器學習解決方案,比如設備上的實時手勢、虹膜和身體姿態(tài)跟蹤。

與之前發(fā)布的 single-stage Objectron 模型相比,這些最新版本采用了兩級架構。 第一級使用 TensorFlow 目標檢測模型來尋找物體的 2D 裁剪,第二級使用圖像裁剪來估計三維bounding box,同時計算下一幀對象的二維裁剪,使得目標檢測器不需要運行每一幀。第二階段的三維 bounding box 預測器是以83 FPS在 Adreno 650 GPU 上運行。

3D 目標檢測的評估指標

有了真實的注釋,我們就可以使用 3D IoU(intersection over union)相似性統(tǒng)計來評估 3D 目標檢測模型的性能,這是計算機視覺任務常用的指標,衡量bounding box與ground truth的接近程度。 谷歌提出了一種計算一般的面向三維空間的精確 3D IoU 的算法。 首先使用 Sutherland-Hodgman Polygon clipping 算法計算兩個盒子面之間的交點,這類似于計算機圖形學的剔除技術(frustum culling),利用所有截斷多邊形的凸包計算相交的體積。最后,通過交集的體積和兩個盒子的并集的體積計算 IoU。 谷歌表示將隨數(shù)據(jù)集一起發(fā)布評估的源代碼。

數(shù)據(jù)格式

Objectron 數(shù)據(jù)集的技術細節(jié),包括使用和教程,均可在數(shù)據(jù)集網(wǎng)站上獲得。這些數(shù)據(jù)集中的物體包括自行車、書籍、瓶子、相機、麥片盒、椅子、杯子、筆記本電腦和鞋子等,和數(shù)據(jù)集一起發(fā)布的具有以下內(nèi)容: 1.視頻序列 2.帶注釋的標簽(目標的3D 邊界框) 3.AR 元數(shù)據(jù) (如照相機姿態(tài)、點云和平面表面) 4.處理過的數(shù)據(jù)集: 混合版本的帶注釋的幀、tf.example 格式的圖像和 SequenceExample 格式的視頻 5.支持基于上面描述的度量評估的腳本 6.支持腳本將數(shù)據(jù)加載到 Tensorflow、Pytorch、Jax并且可視化數(shù)據(jù)集 除了數(shù)據(jù)集,谷歌還開放了數(shù)據(jù)管道來解析 Tensorflow、 PyTorch 和 Jax 框架中的數(shù)據(jù)集。

還提供了 colab notebook 的實例 。 通過發(fā)布這個 Objectron 數(shù)據(jù)集,谷歌希望能夠使研究團體推進三維物體幾何理解的極限。同時也希望促進新的研究和應用,如視圖合成,改進的 3D 表示和非監(jiān)督式學習等。 參考鏈接: https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+blogspot%2FgJZg+%28Google+AI+Blog%29

責任編輯:xj

原文標題:重磅!谷歌發(fā)布3D目標檢測數(shù)據(jù)集及檢測方案

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2923

    瀏覽量

    108217
  • 谷歌
    +關注

    關注

    27

    文章

    6211

    瀏覽量

    106254
  • 人工智能
    +關注

    關注

    1799

    文章

    47959

    瀏覽量

    241249

原文標題:重磅!谷歌發(fā)布3D目標檢測數(shù)據(jù)集及檢測方案

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI Cube進行yolov8n模型訓練,創(chuàng)建項目目標檢測時顯示數(shù)據(jù)目錄下存在除標注和圖片外的其他目錄如何處理?

    AI Cube進行yolov8n模型訓練 創(chuàng)建項目目標檢測時顯示數(shù)據(jù)目錄下存在除標注和圖片外的其他目錄怎么解決
    發(fā)表于 02-08 06:21

    武漢環(huán)保節(jié)能裝備3D數(shù)據(jù)掃描采集分析檢測完成

    2024年3月,公司開展三維掃描數(shù)據(jù)采集業(yè)務,成功在節(jié)能減排裝備葉片三D數(shù)據(jù)采集和檢測分析方面取得顯著成果,提供精確模型和
    的頭像 發(fā)表于 01-15 14:35 ?121次閱讀
    武漢環(huán)保節(jié)能裝備<b class='flag-5'>3D</b><b class='flag-5'>數(shù)據(jù)</b>掃描采集分析<b class='flag-5'>檢測</b>完成

    3D案例 破解細小、反光針腳檢測難題

    有效測量針腳的精準數(shù)據(jù),人工檢測不但精度達不到要求,且檢測效率低。 那該如何破解這個檢測難題? 基于三極管針腳頂部面積小,且金屬反光材質(zhì)易受多重反射光影響。光子精密選用具有微米級測量精
    的頭像 發(fā)表于 10-09 16:33 ?361次閱讀
    <b class='flag-5'>3D</b>案例 破解細小、反光針腳<b class='flag-5'>檢測</b>難題

    3D激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫檢測的應用

    在實際應用中,3D激光線掃傳感器可以集成到自動化檢測系統(tǒng)中,與機器人或自動化輸送系統(tǒng)配合,實現(xiàn)對汽車車縫的全面檢測。這些系統(tǒng)通常包括傳感器、控制軟件、數(shù)據(jù)處理單元和用戶界面,能夠自動分
    的頭像 發(fā)表于 09-14 09:00 ?605次閱讀
    <b class='flag-5'>3D</b>激光線掃輪廓傳感器在汽車行業(yè)的汽車車縫<b class='flag-5'>檢測</b>的應用

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發(fā)表于 08-07 10:13 ?471次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發(fā)布于 :2024年07月22日 16:13:45

    3D三維掃描儀的測量數(shù)據(jù)檢測和評估軟件

    ZEISSINSPECTOptical3D是蔡司旗下一款強大的三維測量數(shù)據(jù)檢測和評估軟件,原名GOMInspect。這款軟件在光學測量領域具有廣泛的應用,并且已經(jīng)成為行業(yè)標準
    的頭像 發(fā)表于 07-15 17:20 ?845次閱讀
    <b class='flag-5'>3D</b>三維掃描儀的測量<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>檢測</b>和評估軟件

    PyTorch如何訓練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓練深度學習模型時,數(shù)據(jù)是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?2247次閱讀

    蘇州吳中區(qū)多色PCB板元器件3D視覺檢測技術

    3D視覺檢測相較于2D視覺檢測,有其獨特的優(yōu)勢,不受產(chǎn)品表面對比度影響,精確檢出產(chǎn)品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2
    的頭像 發(fā)表于 06-14 15:02 ?494次閱讀
    蘇州吳中區(qū)多色PCB板元器件<b class='flag-5'>3D</b>視覺<b class='flag-5'>檢測</b>技術

    工業(yè)鏡頭在3D結(jié)構光檢測中實際應用

    工業(yè)鏡頭在3D結(jié)構光檢測中實際應用
    的頭像 發(fā)表于 06-01 08:34 ?342次閱讀
    工業(yè)鏡頭在<b class='flag-5'>3D</b>結(jié)構光<b class='flag-5'>檢測</b>中實際應用

    請問NanoEdge AI數(shù)據(jù)該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 05-28 07:27

    大陸團的3D Flash激光雷達有何優(yōu)勢?

    在這一技術革命的前沿,激光雷達成為了不可或缺的一環(huán)。而在這其中,大陸團的3D Flash激光雷達引人矚目。
    發(fā)表于 04-11 10:28 ?429次閱讀
    大陸<b class='flag-5'>集</b>團的<b class='flag-5'>3D</b> Flash激光雷達有何優(yōu)勢?

    PLC如何應用于建筑的3D打印?

    MC Pi-Prime模塊化PLC采用EtherCat作為通信協(xié)議,有助于實現(xiàn)快速的反應時間和精確的定位控制,為自動化工程師提供靈活的擴展與集成,并縮短實施時間,助力建筑行業(yè)引入3D打印。
    的頭像 發(fā)表于 03-22 10:46 ?404次閱讀
    宏<b class='flag-5'>集</b>PLC如何應用于建筑的<b class='flag-5'>3D</b>打印?

    自動駕駛車輛數(shù)據(jù)的中央控處理策略

    隨著毫米波雷達技術的演進,我們看到 4D 成像毫米波雷達的技術指標比起傳統(tǒng) 3D 毫米波雷達有了大幅的改進,包括多了一個高度維度,看得更遠,點云更密集,有更好的角分辨率,對靜止目標檢測
    發(fā)表于 03-19 14:03 ?371次閱讀
    自動駕駛車輛<b class='flag-5'>數(shù)據(jù)</b>的中央<b class='flag-5'>集</b>控處理策略

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領域頂會CVPR公布了最終的論文接收結(jié)果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2
    的頭像 發(fā)表于 02-27 16:38 ?1265次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b><b class='flag-5'>目標</b><b class='flag-5'>檢測</b>新方法QAF2<b class='flag-5'>D</b>
    主站蜘蛛池模板: 人人草在线 | 高清不卡一区 | 日本大片成人免费播放 | h视频在线免费观看 | 成人永久免费视频网站在线观看 | 特黄一级 | 9797色| 欧美爱爱帝国综合社区 | 丁香婷婷在线观看 | 免费观看影院 | 欧美3d成人动画在线 | 久久怡红院国产精品 | 特级无码毛片免费视频尤物 | 精品欧美一区二区三区 | 日本aaaaa高清免费看 | 日本不卡视频一区二区三区 | 精品国产1000部91麻豆 | 性色a| 午夜剧| 张柏芝三级无删减在线观看 | 色黄视频 | 香蕉久久高清国产精品免费 | 色多多视频官网 | ccav在线永久免费看 | 国产三级在线视频观看 | 日本人xxxxxxxx6969| 欧美一级片在线视频 | 怡红院色视频在线 | 日韩精品一区二区在线观看 | 午夜片 飘香香影院 | 亚洲禁片 | 四虎影视色费永久在线观看 | 国产v精品成人免费视频400条 | 亚洲丰满熟妇毛片在线播放 | 久色乳综合思思在线视频 | 天天射天天射 | 青草悠悠视频在线观看 | 亚洲天堂一区二区三区 | 在线观看黄色的网站 | 亚洲无线码一区在线观看 | 四虎影院永久在线 |