在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開發pipeline,在移動設備上可實時計算3D目標檢測

牽手一起夢 ? 來源:機器之心 ? 作者:佚名 ? 2020-03-13 15:41 ? 次閱讀

3月13日消息,谷歌宣布推出 MediaPipe Objectron,這是一種適用于日常物體的移動端實時3D目標檢測 pipeline,它能夠檢測 2D 圖像中的目標,并通過新創建 3D 數據集上訓練的機器學習模型來估計這些目標的姿態和大小。它在安卓、IOS 網頁等各種平臺上都能應用機器學習媒體模型,并加入了移動端試試 3D 檢測模型。目前 MediaPipe包含人臉檢測、手部檢測、頭發分割和視頻自動橫豎屏轉換等功能。

MediaPipe 是一個用于構建 pipeline 進而處理不同模態感知數據的跨平臺開源框架,Objectron 則在 MediaPipe 中實現,其能夠在移動設備上實時計算目標的定向 3D 邊界框。從單個圖像進行 3D 目標檢測。MediaPipe 可以在移動端上實時確認目標對象的位置、方向以及大小。整個模型非常精簡,速度也非常快,研究者將整套方案都開源了出來。

獲取真實的3D訓練數據

隨著依賴于 3D 傳感器(如 LIDAR)的自動駕駛行業發展普及,現在已有大量街道場景的 3D 數據,但對于日常生活中擁有更細顆粒度的目標來說,有標注的 3D 數據集就非常有限了。所以,為了解決此問題,谷歌團隊使用了 AR 會話(Session)數據開發了一種全新的數據 Pipeline。

此外,隨著 ARCore 以及 ARkit 的出現,數億體量的智能手機擁有了 AR 功能,并且能夠通過 AR 會話取獲取更多的信息,包括相機姿態、稀疏 3D 點云、光照估計以及平面區域估計。為了標記真實數據,團隊構建了一個全新的標注工具,并且與 AR 會話數據一起使用,該標注工具使標注者得以快速標記目標的 3D 邊界框。

該工具使用了分屏視圖來顯示 2D 的視頻幀,同時在其左側疊加 3D 邊界框,并在右側顯示 3D 點云,攝像機方位以及所檢測到的水平面。標注器在 3D 視圖中繪制 3D 邊界框,并通過查看 2D 視頻幀中的投影來驗證其位置。

左:帶標注的 3D 邊界框所形成的投影展示在邊界框頂部,更易于驗證標注;右:通過檢測到的目標表面以及稀疏點云數據,可以為不同的相機姿態標注真實世界中的 3D 邊界框。

AR 合成數據

之前常用的方法會根據合成數據補充真實數據,以提高預測的準確性。然而這樣的做法通常會導致質量低下、不真實的數據,且如果要執行圖像的真實感渲染,又需要更多的計算力。

研究者采用了另一種稱之為 AR 合成數據(AR Synthetic Data Generation)的方法,只要將對象放到 AR 系統的工作場景中,我們就能利用相機姿態估計、水平面檢測、光照估計生成物理上可能存在的位置及場景。這種方法能生成高質量合成數據,并無縫匹配實際背景。通過結合真實數據與 AR 合成數據,研究者能將模型的準確性提高約 10%。

3D 目標檢測的流程是什么樣的

對于 3D 目標檢測,研究者先構建了一個單階段模型 MobilePose,以預測單張 RGB 圖像中某個目標的姿態和物理大小。該模型的主干是一個編碼器-解碼器架構,其構建在 MobileNet V2 的基礎上。研究者應用了多任務學習方法,來從檢測與回歸的角度聯合預測目標的形狀,且在預測形狀的過程中,其只依賴于標注的分割圖像。

MobilePose-Shape 網絡在中間層會帶有形狀預測模塊。

在模型的訓練中,如果數據沒有標注形狀,那也是可行的。只不過借助檢測邊界框,研究者可以預測形狀中心與分布。

為了獲得邊界框的最終 3D 坐標,研究者利用了一種完善的姿態估計算法(EPnP),它可以恢復對象的 3D 邊界框,而無需知道對象維度這一先驗知識。給定 3D 邊界框,我們可以輕松計算對象的姿態和大小。

下圖顯示了網絡架構和后處理過程,該模型輕巧到可以在移動設備上實時運行(在 Adreno 650 mobile GPU 上以 26 FPS 的速度運行)。

3D 目標檢測的神經網絡架構與后處理過程。

模型的示例結果,其中左圖為估計邊界框的原始 2D 圖像,中間為帶高斯分布的目標檢測,最右邊為預測的分割 Mask。

在 MediaPipe 中進行檢測和追蹤

當模型對移動設備獲得的每一幀圖像進行計算的時候,它可能會遇到晃動的情況,這是因為每一幀對目標邊界框預測本身的模糊性造成的。為了緩解這個問題,研究者采用了檢測+追蹤的框架,這一框架近期被用于 2D 檢測和追蹤中。這個框架減少了需要在每一幀上運行網絡的要求,因此可以讓模型的檢測更為精確,同時保證在移動端上的實時性。它同時還能保持識別幀與幀之間的目標,確保預測的連貫性,減少晃動。

為了進一步提升這一 pipeline 的效率,研究者設置模型在每幾幀后再進行一次模型推理。之后,他們使用名為快速動作追蹤(instant motion tracking)和 Motion Stills 技術進行預測和追蹤。當模型提出一個新的預測時,他們會根據重疊區域對檢測結果進行合并。

為了鼓勵研究者和開發者基于這一 pipeline 進行試驗,谷歌目前已經將研究成果開源到了 MediaPipe 項目中,包括端到端的移動設備應用 demo,以及在鞋、椅子兩個分類中訓練好的模型。研究者希望這一解決方案能夠更好地幫助到社區,并產生新的方法、應用和研究成果。團隊也希望能夠擴大模型到更多類別中,進一步提升在移動端設備的性能表現。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2953

    瀏覽量

    109970
  • 谷歌
    +關注

    關注

    27

    文章

    6225

    瀏覽量

    107633
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    ?超景深3D檢測顯微鏡技術解析

    發現潛在問題。此外,其高效的成像速度也大大提升了檢測效率,為工業生產帶來了顯著的經濟效益。 上海桐爾的超景深3D檢測顯微鏡不僅在技術處于領先地位,其設計也充分考慮了用戶的實際需求。
    發表于 02-25 10:51

    SciChart 3D for WPF圖表庫

    SciChart 3D for WPF 是一個實時、高性能的 WPF 3D 圖表庫,專為金融、醫療和科學應用程序而設計。非常適合需要極致性能和豐富的交互式 3D 圖表的項目。 使用我們
    的頭像 發表于 01-23 13:49 ?506次閱讀
    SciChart <b class='flag-5'>3D</b> for WPF圖表庫

    【RA-Eco-RA4E2-64PIN-V1.0開發板試用】3D 圖形顯示

    如下圖: 3D 矩形是一個三維的圖形,要將三維圖形顯示平面顯示屏,需要進行投影計算,將三維的頂點坐標(x,y,z)轉換成二維頂點坐標(x,y) 除此之外,三維的圖形進行
    發表于 01-20 01:23

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    以及邊緣計算能力的增強,越來越多的目標檢測應用開始直接在靠近數據源的邊緣設備運行。這不僅減少了數據傳輸延遲,保護了用戶隱私,同時也減輕了云
    發表于 12-19 14:33

    CASAIM自動化檢測設備3D尺寸檢測形位公差測量設備

    隨著科技的不斷發展,自動化檢測設備正朝著高精度、高效率、自動化和柔性化的方向發展,能夠不需要人工干預的情況下完成檢測任務。CASAIM自動化檢測
    的頭像 發表于 11-20 16:22 ?469次閱讀

    中興通訊攜手中國移動推出AI裸眼3D創新產品

    全球領先的通訊科技企業中興通訊攜手中國移動2024MWC上海展上聯合發布兩款全球首創的AI裸眼3D創新產品:千元普惠的中興遠航3D手機和第二代裸眼
    的頭像 發表于 10-15 10:05 ?1367次閱讀

    湖北三維掃描儀3D掃描黑色反光件3D偏差比對尺寸檢測設備-CASAIM

    3D掃描
    中科院廣州電子
    發布于 :2024年09月26日 09:46:46

    透明塑料件噴粉3D掃描CAV全尺寸檢測逆向3D建模設計服務-CASAIM

    3D建模
    中科院廣州電子
    發布于 :2024年08月30日 10:04:53

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發表于 08-07 10:13 ?694次閱讀
    安寶特產品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    RT-Thread攜手進迭時空:共建RISC-V實時計算生態

    ScienceTechnology人工智能技術飛速發展的浪潮中,實時計算能力已成為推動諸多行業革新的關鍵驅動力。智能機器人、嵌入式系統、工業自動化、物聯網等領域,對高性能、低延遲的實時數據處理需求
    的頭像 發表于 08-06 08:35 ?763次閱讀
    RT-Thread攜手進迭時空:共建RISC-V<b class='flag-5'>實時計算</b>生態

    深視智能3D相機軸承內徑檢測的應用

    3D相機
    深視智能科技
    發布于 :2024年07月23日 10:33:54

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發布于 :2024年07月22日 16:13:45

    中興通訊與中國移動發布全球首創AI裸眼3D新品,引領3D科技新浪潮

    科技飛速發展的今天,裸眼3D技術以其獨特的沉浸式體驗,正逐漸成為科技領域的新寵。近日,全球領先的通訊科技企業中興通訊攜手中國移動備受矚目的2024MWC上海展
    的頭像 發表于 06-28 15:32 ?1313次閱讀

    【開源作品】自制一個3D打印的移動終端——T3rminal

    T3rminal是我過去幾個月一直努力開發的一個CyberDeck,并希望將其開源。 我從不同設備如Decktility、YARH和其他項目中獲得了靈感。 你可以
    發表于 06-21 13:37

    OpenCV攜奧比中光3D相機亮相CVPR 2024

    6月17日-21日,奧比中光合作伙伴OpenCV攜Orbbec 3D相機參展美國西雅圖舉辦的CVPR 2024(即IEEE國際計算機視覺與模式識別會議),讓開發者親身體驗Orbbec
    的頭像 發表于 06-21 09:38 ?937次閱讀
    主站蜘蛛池模板: 天天综合色一区二区三区 | 久久精品亚洲 | 一区二区三区四区在线不卡高清 | 萌白酱香蕉白丝护士服喷浆 | 亚洲国产欧美精品一区二区三区 | 天天天天干 | 国产精品美女在线 | 福利视频免费观看 | 手机精品视频在线观看免费 | 久操久操久操 | 免费我看视频在线观看 | 91国内在线视频 | 男人你懂的在线观看视频 | 男女网站在线观看 | 亚洲福利一区二区三区 | 奇米影视大全 | 上课被同桌摸下面做羞羞 | 男男失禁play 把尿bl | 国模吧 | 97黄网| 欧美满足你的丝袜高跟ol | 国产精品色片 | 亚洲午夜视频在线 | 天天摸天天操天天爽 | 欧美18videosex性欧美69 | 国产理论精品 | 性免费网站| 精品国产三级在线观看 | 午夜一级毛片免费视频 | 蕾丝视频在线播放 | 日本丝瓜着色视频 | 在线视频你懂得 | 色偷偷免费| 天堂在线资源最新版 | 日本h视频在线 | 国产成人影院 | wwwxx在线 | 国产亚洲午夜精品a一区二区 | 免费观看一级一片 | 精品福利视频网站 | 在线色播|