91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

場景視頻景深學習領域,谷歌AI公布三項最新研究突破

ml8z_IV_Technol ? 來源:YXQ ? 2019-04-29 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

視頻中估計3D結構和相機運動是計算機視覺中的一個關鍵問題,這個技術在自動駕駛領域有著廣闊的工業應用前景。目前自動駕駛的核心技術是LiDAR(激光雷達),一種運用雷達原理,采用光和激光作為主要傳感器的汽車視覺系統。LiDAR傳感器賦予了自動駕駛汽車能夠看到周邊環境的“雙眼”,激光雷達技術越先進,視覺感知的精準程度越高,這是自動駕駛得以實現的底層技術基礎。但是最近幾年,放在攝像頭上的深度學習研究,發展很蓬勃。相比之下, 雖然激光雷達 (LiDAR)的數據有諸多優點,但相關學術進展并不太多。相機+數據+神經網絡的組合,正在迅速縮小與LiDAR的能力差距。

無需相機參數、單目、以無監督學習的方式從未標記場景視頻中搞定深度圖

什么是深度圖?

深度圖像(depth image)也被稱為距離影像(range image),由相機拍攝,是指將從圖像采集器到場景中各點的距離(深度)作為像素值的圖像,它直接反映了景物可見表面的幾何形狀。單位為mm,效果參考下圖:

在場景視頻景深學習領域,谷歌AI機器人實驗室聯合公布了三項最新研究突破:

第一,證明了可以以一種無監督的方式訓練深度網絡,這個深度網絡可以從視頻本身預測相機的內在參數,包括鏡頭失真(見圖1)。

第二,在這種情況下,他們是第一個以幾何方式從預測深度直接解決遮擋的問題

第三,大大減少了處理場景中移動元素所需的語義理解量只需要一個覆蓋可能屬于移動對象的像素的單個掩碼,而不是分割移動對象的每個實例并跨幀跟蹤它。

圖1:從未知來源的視頻中學習深度的方法的定性結果,通過同時學習相機的外在和內在參數來實現。 由于該方法不需要知道相機參數,因此它可以應用于任何視頻集。 所有深度圖(在右側可視化,作為差異)都是從原始視頻中學習而不使用任何相機內在函數。 從上到下:來自YouTube8M的幀,來自EuRoC MAV數據集,來自Cityscapes和來自KITTI的幀。

推特網友對此不吝贊美:“這是我見過的最令人印象深刻的無監督結果之一。來自未標記視頻的深度圖對于自動駕駛非常有用:)“

以下是論文具體內容:

從視頻中估計3D結構和相機運動是計算機視覺中的一個關鍵問題,這個技術在自動駕駛領域有著廣闊的工業應用前景。

解決該問題的傳統方法依賴于在多個連續幀中識別場景中的相同點,并求解在這些幀上最大程度一致的3D結構和相機運動。

但是,幀之間的這種對應關系只能針對所有像素的子集建立,這導致了深度估計不確定的問題。與通常處理逆問題一樣,這些缺口是由連續性和平面性等假設填充的。

深度學習能夠從數據中獲得這些假設,而不是手工指定這些假設。在信息不足以解決模糊性的地方,深度網絡可以通過對先前示例進行歸納,以生成深度圖和流場。

無監督方法允許單獨從原始視頻中學習,使用與傳統方法類似的一致性損失,但在訓練期間對其進行優化。在推論中,經過訓練的網絡能夠預測來自單個圖像的深度以及來自成對或更長圖像序列的運動。

隨著對這個方向的研究越來越有吸引力,很明顯,物體運動是一個主要障礙,因為它違反了場景是靜態的假設。已經提出了幾個方向來解決該問題,包括通過實例分割利用對場景的語義理解。

遮擋是另一個限制因素,最后,在此方向的所有先前工作中,必須給出相機的內在參數。這項工作解決了這些問題,因此減少了監督,提高了未標記視頻的深度和運動預測質量。

首先,我們證明了可以以一種無監督的方式訓練深度網絡,這個深度網絡從視頻本身預測相機的內在參數,包括鏡頭失真(見圖1)。

其次,在這種情況下,我們是第一個以幾何方式從預測深度直接解決遮擋的問題。

最后,我們大大減少了處理場景中移動元素所需的語義理解量:我們需要一個覆蓋可能屬于移動對象的像素的單個掩碼,而不是分割移動對象的每個實例并跨幀跟蹤它。

這個掩模可能非常粗糙,實際上可以是矩形邊界框的組合。獲得這樣的粗糙掩模是一個簡單得多的問題,而且與實例分割相比,使用現有的模型可以更可靠地解決這個問題。

除了這些定性進展之外,我們還對我們的方法進行了廣泛的定量評估,并發現它在多個廣泛使用的基準數據集上建立了新的技術水平。將數據集匯集在一起,這種能力通過我們的方法得到了極大的提升,證明可以提高質量。

表1:總結了在KITTI上訓練的模型和評估結果,使用給定相機內建和學習相機內建兩種方式來評估我們方法的深度估計,結果顯而易見,我們獲得了當前最佳SOTA。

表2:總結了在Cityscapes上訓練和測試的模型的評估結果,我們的方法優于以前的方法,并從學習的內建中獲益。

表3:深度估計的消融實驗。 在所有實驗中,訓練集是Cityscapes(CS)和KITTI組合,我們分別在Cityscapes(CS)和KITTI(Eigen partition)上測試模型。 每行代表一個實驗,其中與主方法相比進行了一次更改,如“實驗”行中所述。 數字越小越好。

除了這些定性的進步,我們對我們的方法進行了廣泛的定量評估,發現它在多個廣泛使用的基準數據集上建立了一個新的技術狀態。將數據集集中在一起,這種方法大大提高了數據集的質量。

最后,我們首次演示了可以在YouTube視頻上學習深度和相機內在預測,這些視頻是使用多個不同的相機拍攝的,每個相機的內建都是未知的,而且通常是不同的。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108089
  • LIDAR
    +關注

    關注

    10

    文章

    349

    瀏覽量

    30351

原文標題:谷歌AI:根據視頻生成深度圖,效果堪比激光雷達

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華寶新能斬獲三項2025德國iF設計獎

    倉(Jackery Power Bank & Charging Station),以及在研產品 Jackery Solar Gazebo 2000,一舉斬獲三項iF產品設計獎。
    的頭像 發表于 06-25 15:38 ?250次閱讀

    標準引領,賦能健康中國|喜報!回映電子參與起草的三項腦機接口臨床醫療器械團體標準正式發布

    喜報在腦科學與人工智能深度融合、國家“健康中國2030”戰略持續推進的時代浪潮中,我國神經調控領域標準化建設迎來重大突破。由深圳回映電子科技有限公司作為核心起草單位之一參與制定的三項腦機接口相關神經
    的頭像 發表于 05-13 19:49 ?468次閱讀
    標準引領,賦能健康中國|喜報!回映電子參與起草的<b class='flag-5'>三項</b>腦機接口臨床醫療器械團體標準正式發布

    Future AIHER公司提交三項AI混增系統專利申請

    ,其新近成立的子公司 Future AIHER 已正式提交三項專利申請,旨在確立FF在智能電動動力系統創新的領先地位。
    的頭像 發表于 05-12 10:18 ?303次閱讀

    深演智能斬獲三項國家級權威認證

    近日,由中國信息通信研究院(下文簡稱“信通院”)主辦的 "鑄基計劃 2025 年度會議" 在北京盛大召開。作為數字化轉型領域的領軍企業,深演智能憑借領先的技術能力與行業實踐成果榮譽滿載,一舉斬獲三項國家級權威認kaui證,彰顯其
    的頭像 發表于 04-03 14:18 ?463次閱讀

    華為MWC2025斬獲三項GLOMO大獎

    MWC25巴塞羅那展期間,華為服務與軟件攜手中國移動和bKash在智能化運維運營領域斬獲三項GLOMO大獎,包括“最佳網絡軟件突破獎”,“CTO甄選:卓越移動技術獎”和“最佳金融科技創新獎”。
    的頭像 發表于 03-18 17:08 ?520次閱讀

    AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

    再次感謝發燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰》這本書學習如何構建開發一個視頻應用。AI Agent是一種智能應用,能夠根據用戶需求和環境變化做出相應響應
    發表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    ,涵蓋了通信、人工智能、工業自動化、視頻處理等多個領域: ? 通信行業:用于基站、網絡邊緣計算等場景,處理復雜的物理協議和邏輯控制。 ? 人工智能:FPGA的并行處理能力使其在高性能計算應用中表
    發表于 03-03 11:21

    ?超景深3D檢測顯微鏡技術解析

    在現代科技領域,顯微鏡技術的發展始終是推動科學研究和技術進步的重要引擎。上海桐爾作為這一領域的探索者,其超景深3D檢測顯微鏡技術的突破,為科
    發表于 02-25 10:51

    科技為用戶而生!海爾智家大腦HomeGPT連獲三項大獎

    用戶體驗的全面提升。 連獲三項大獎,讓家更懂用戶所需 用戶的好評與行業認可是科技實力的最佳證明。短短兩個月內,海爾智家大腦HomeGPT入選“2024年工信部‘數字品’應用場景典型案例”,榮獲“2024年度山東省信息產業協會科
    的頭像 發表于 01-24 11:36 ?486次閱讀

    松下電氣榮獲SGS三項服務認證

    近日,松下電氣設備(中國)有限公司在國際公認的測試、檢驗和認證機構SGS的嚴格評審下,榮獲了商品售后服務“五星級”、售后服務完善度“鉑金級”以及顧客滿意度“鉑金級”三項認證證書。這一榮譽的獲得
    的頭像 發表于 01-22 13:40 ?475次閱讀

    鴻海榮獲2024 IR Magazine三項大獎

    與服務商鴻海科技集團(TWSE:2317)宣布榮獲全球權威“投資者關系雜志”《IR Magazine》頒發“最佳企業 - 科技業”、“最佳科技應用(包含AI)”以及“最佳投資人關系人員”三項大獎,肯定公司作為科技產業領導者之一,不斷結合各種創新模式與投資人溝通。今年鴻海一
    的頭像 發表于 12-07 18:10 ?644次閱讀

    蘋果iOS 18.2將推三項備忘錄AI功能,提升創作效率

    11月6日,據外媒報道,蘋果公司正籌備推出第二波Apple Intelligence(蘋果智能)功能,并計劃在下個月發布的iOS 18.2更新中,為備忘錄應用帶來三項關鍵的人工智能改進,旨在提升用戶的創作效率和日常記錄體驗。
    的頭像 發表于 11-06 14:58 ?1087次閱讀

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    偏見、倫理道德等問題。此外,如何更好地將AI與科學研究人員的傳統工作模式相融合,也是一個亟待解決的問題。未來,隨著技術的不斷進步和應用場景的拓展,AI for Science有望在更多
    發表于 10-14 09:16

    3D ToF場景距離(景深)測量系統簡介

    電子發燒友網站提供《3D ToF場景距離(景深)測量系統簡介.pdf》資料免費下載
    發表于 09-29 10:55 ?0次下載
    3D ToF<b class='flag-5'>三</b>維<b class='flag-5'>場景</b>距離(<b class='flag-5'>景深</b>)測量系統簡介

    谷歌Chrome瀏覽器新增AI功能,提升用戶體驗

    谷歌近日宣布,在其廣受歡迎的Chrome瀏覽器中引入了三項前沿的AI技術功能,旨在為用戶提供更加智能、便捷的瀏覽體驗。這些新功能由Gemini技術強力驅動,目前已在Chrome桌面版上線,標志著
    的頭像 發表于 08-05 11:26 ?1132次閱讀
    主站蜘蛛池模板: 拍拍拍无挡视频免费全程1000 | 一级毛片一级黄片 | 成 人在线观看视频网站 | 在线看片福利 | 天天射综合网站 | 人人射人人 | 好吊色37pao在线观看 | 国产老师的丝袜在线看 | 天天拍天天干天天操 | 国产综合图区 | 成人综合在线视频 | 日韩毛片高清免费 | 日本三级网站在线观看 | 一级毛片美国一级j毛片不卡 | 99视频精品全国免费 | 中文字幕久久精品波多野结 | 高清xxx | 99久久99久久久精品齐齐鬼色 | 天天爽夜夜爽夜夜爽 | 少妇被按摩 | 日本媚薬痉挛在线观看免费 | 午夜视频在线观看www中文 | 中文字幕在线色 | 永久在线 | 狠狠干综合 | 天堂8在线天堂资源在线 | 99久久免费中文字幕精品 | 日本三级带日本三级带黄首页 | 男人日女人的网站 | 天天操夜夜操狠狠操 | 777色狠狠一区二区三区香蕉 | 在线免费观看h | 激情网婷婷 | 日韩精品一级a毛片 | 午夜视频福利 | 88av在线看 | 美女视频一区二区三区在线 | 看a网站 | 色片免费网站 | 奇米影视99 | 免费人成网ww777kkk手机 |