在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

騰訊在arxiv上發布論文詳細介紹了數據集的構成以及評價標準等內容

DPVg_AI_era ? 來源:lq ? 2019-01-12 09:13 ? 次閱讀

2018 年 9 月騰訊 AI Lab 開源 “Tencent ML-Images” 項目,該項目由多標簽圖像數據集 ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網絡 ResNet-101 構成。 近日騰訊在 arxiv 上發布論文詳細介紹了數據集的構成以及評價標準等內容,對 Tencent ML-Images 數據集的理解很有幫助。

騰訊 AI Lab 公布的圖像數據集 ML-Images,包含了 1800 萬圖像和 1.1 萬多種常見物體類別,在業內已公開的多標簽圖像數據集中規模最大,足以滿足一般科研機構及中小企業的使用場景。

此外,騰訊 AI Lab 還提供基于 ML-Images 訓練得到的深度殘差網絡 ResNet-101。該模型具有優異的視覺表示能力和泛化性能,在當前業內同類模型中精度最高,將為包括圖像、視頻等在內的視覺任務提供強大支撐,并助力圖像分類、物體檢測、物體跟蹤、語義分割等技術水平的提升。

題目:Tencent ML-Images: A Large-Scale Multi-Label Image Database for Visual Representation Learning

作者:Baoyuan Wu, Weidong Chen, Yanbo Fan, Yong Zhang, Jinlong Hou, Junzhou Huang, Wei Liu, Tong Zhang

【摘要】

在現有的視覺表示學習任務中,深度卷積神經網絡(CNN)通常是針對帶有單個標簽的圖像進行訓練的,例如 ImageNet。然而,單個標簽無法描述一幅圖像的所有重要內容,一些有用的視覺信息在訓練過程中可能會被浪費。在這項工作中,我們建議對帶有多個標簽的圖像進行訓練,以提高訓練后的 CNN 模型的視覺表示質量。

為此,我們構建了一個大規模的多標簽圖像數據庫,其中包含 18000000 個圖像和 11000 個類別,我們稱之為 Tencent ML-Images。我們基于大規模分布式深度學習框架,即 TFplus,在 Tencent ML-Images 上高效訓練 ResNet-101 多標簽輸出模型,共 60 個 epoch,耗時 90 小時。 通過 ImageNet 和 Caltech-256 上的單標簽圖像分類、PASCAL VOC 2007 上的對象檢測、PASCAL VOC 2012 上的語義分割三個遷移學習任務,驗證了 Tencent ML-Images checkpoint 的視覺表示質量良好。

騰訊 ML-Images 數據庫,ResNet-101 的 checkpoint 以及所有訓練代碼已在https://github.com/Tencent/tencent-ml-images上發布。它有望推動研究領域和工業界的其他視覺任務的發展。

論文地址:

https://arxiv.org/abs/1901.01703

作者簡介

第一作者是吳保元,現在是騰訊 AI Lab 的高級研究員,2014 年 8 月至 2016 年 11 月在 KAUST 進行博士后學習,與 Bernard Ghanem 教授一起工作。2014 年 6 月獲得中國科學院自動化研究所模式識別國家重點實驗室博士學位,導師為胡包鋼教授。作者研究興趣包括機器學習計算機視覺和優化,包括圖像標注、弱 / 無監督學習、結構化預測、概率圖模型、視頻處理和整數規劃。

https://sites.google.com/site/baoyuanwu2015/home

其他作者包括樊艷波、張勇也都是博士畢業于中科院自動化研究所,師從胡包鋼教授。

文章簡介

這項工作在新建的多標簽圖像數據庫(稱為 Tencent ML-Images)上展示了大規模的視覺表示學習。文章從討論以下兩個問題開始。

為什么我們需要大規模的圖像數據庫?深度學習一直處于長期低谷,直到 2012 年,AlexNet 在 ILSVRC2012 挑戰的單標簽圖像分類任務中取得了令人驚訝的成績。深度神經網絡的潛力是通過大規模的圖像數據庫釋放出來的,即 ImageNet-ILSVRC2012 。此外,對于許多視覺任務,如目標檢測和語義分割,獲取訓練數據的成本是非常高的。由于訓練數據不足,需要在其他大型數據庫上預先訓練好的視覺呈現良好的 checkpoint 作為初始化,用于其他視覺任務 (如針對單標簽圖像分類的 ImageNet-ILSVRC2012)。

為什么我們需要多標簽圖像數據庫?由于在大多數自然圖像中存在多個對象,單個標注可能會遺漏一些有用的信息,從而誤導 CNN 的訓練。例如,同時包含牛和草的兩個視覺上相似的圖像可能分別被標注為牛和草。合理的方法是 “告訴”CNN 模型這兩幅圖像同時包含牛和草。

這項工作的主要貢獻有四個方面:

建立了一個包含一千八百萬張圖像和一萬一千個類別的多標簽圖像數據庫,被稱為 Tencent ML-Images,這是迄今為止最大的公開可用的多標簽圖像數據庫。

利用大規模分布式深度學習框架,在 Tencent ML-Images 上有效地訓練 ResNet-101 模型。此外,還設計了一種新的損失函數來緩解大規模多標簽數據庫中嚴重的類失衡問題。

我們通過遷移學習三種不同的視覺任務,證實了 Tencent ML-Images 和其預訓練的檢查點有著比較好的質量。

在 GitHub(https://github.com/Tencent/tencent-ml-images)上發布了 Tencent ML-Images 數據庫,包含訓練的 ResNet-101 檢查點,以及從數據預處理,預訓練,微調到圖像分類和特征提取的完整代碼。預計這將推動研究領域和工業界的其他視覺任務的發展。

附文章中部分結果

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    93

    瀏覽量

    11967
  • 數據集
    +關注

    關注

    4

    文章

    1210

    瀏覽量

    24861

原文標題:論文終于公布!騰訊開源最大規模多標簽圖像數據集,刷新行業數據集基準

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    有方科技參編的信息技術團體標準發布

    能力評價》團體標準由中國計算機行業協會正式發布實施,明確信息技術產品供應鏈成熟度共性指標中企業背景、技術掌控、供給能力評價一級指標框架
    的頭像 發表于 12-23 10:44 ?267次閱讀

    【「大話芯片制造」閱讀體驗】+內容概述,適讀人群

    和設備、檢驗中如何發現問題以及如何出貨。回答芯片制造為何要高標準的問題。涉及到芯片制造成本,化學藥品,項目管理部分內容。 總的來說,《大
    發表于 12-21 16:32

    騰訊發布TCHouse-X數據智能平臺

    騰訊云近日正式宣布推出其全新一代數據智能平臺——TCHouse-X。該平臺一體化、智能化、高性能及云原生前沿理念于一身,旨在為企業用戶提供更加便捷、高效的
    的頭像 發表于 12-16 10:17 ?234次閱讀

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+內容簡介

    設計的關系,芯片設計人員掌握算法知識的必要性,以及位寬確定、有符號數處理、浮點數運算、溢出保護和四舍五入算法的實現。第3~11章重點介紹各種典型基本算法的電路設計,其中包括任何數字芯片都必不可少
    發表于 11-21 17:14

    騰訊申請注冊多枚“騰訊AI助手”商標

    近日,根據愛企查App的最新數據顯示,騰訊科技(深圳)有限公司商標領域有新動作,該公司已經正式申請注冊多枚“
    的頭像 發表于 11-19 11:01 ?496次閱讀

    中國首推汽車智能安全評價體系,助力自動駕駛汽車安全性評估

    10月10日傳來消息,我國智能汽車安全領域取得了顯著進展,重慶正式推出了首個汽車智能安全評價體系。該體系針對智能汽車的環境感知、決策控制及應急響應核心方面,設立了全面的
    的頭像 發表于 10-10 16:29 ?1178次閱讀

    聯想M大師臺式機將低碳理念帶進PC端,推進綠色計算機評價標準落地

    “2024綠色計算機標準及新品發布會”。在這次活動中,聯想多家OEM的綠色電腦機型獲得了首批認證。特別值得一提的是,聯想M大師臺式機還榮獲“綠色可持續發展計算機
    的頭像 發表于 09-23 11:43 ?388次閱讀
    聯想M大師臺式機將低碳理念帶進PC端,推進綠色計算機<b class='flag-5'>評價標準</b>落地

    微處理器的指令架構介紹

    和執行。指令架構不僅影響微處理器的性能,還決定其兼容性、可編程性和應用場景。以下是對微處理器指令架構的詳細探討,內容將圍繞其定義、主要
    的頭像 發表于 08-22 10:53 ?1652次閱讀

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲一年前就掛在arXiv的一項研究。開源的那種。
    的頭像 發表于 07-16 18:29 ?667次閱讀
    谷歌DeepMind被曝抄襲開源成果,<b class='flag-5'>論文</b>還中了頂流會議

    pycharm怎么訓練數據

    本文中,我們將介紹如何在PyCharm中訓練數據。PyCharm是一款流行的Python集成開發環境,提供許多用于
    的頭像 發表于 07-11 10:10 ?760次閱讀

    PyTorch如何訓練自己的數據

    PyTorch是一個廣泛使用的深度學習框架,它以其靈活性、易用性和強大的動態圖特性而聞名。訓練深度學習模型時,數據是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數據
    的頭像 發表于 07-02 14:09 ?2137次閱讀

    綠色小水電站生態環境監測系統解決方案

    水利部發布的《綠色小水電評價規程》(SL/T 752—2024)是《綠色小水電評價標準》(SL/T 752—2020)的基礎修訂而成,為
    的頭像 發表于 05-11 16:09 ?465次閱讀

    振弦采集儀巖土工程監測中的性能評價標準選擇

    弦采集儀的性能評價標準選擇進行詳細介紹。 振弦采集儀巖土工程監測中的性能評價
    的頭像 發表于 05-10 13:30 ?307次閱讀
    振弦采集儀<b class='flag-5'>在</b>巖土工程監測中的性能<b class='flag-5'>評價</b>及<b class='flag-5'>標準</b>選擇

    實錘!騰訊終于擁抱鴻蒙生態,微信鴻蒙原生版本即將上線

    定的使用體驗 。此舉也將為鴻蒙生態吸引更多開發者,促進鴻蒙生態的快速發展。相信今年6月分純血鴻蒙操作系統Bate版本搭載手機上的時候不僅有大量的鴻蒙軟件生態支持,騰訊系的微信QQ以及旗下的游戲皆會重磅
    發表于 04-30 21:14

    騰訊突然宣布,微信鴻蒙版要來了!

    「微信」的身影,不少網友更是喊話騰訊,希望QQ、微信盡快適配。 現在, 好消息來了! 最近在網上看到一條重磅消息—— 原生鴻蒙版「微信」已在路上了 。 近日,騰訊程序員交流平臺發布
    發表于 04-30 19:34
    主站蜘蛛池模板: 国产精品推荐天天看天天爽 | 久草在线免费资源站 | 在线另类 | 亚洲精品美女在线观看 | 亚洲一本之道在线观看不卡 | 天堂bt资源www在线 | 欧美精彩狠狠色丁香婷婷 | 欧美日韩精品一区二区在线线 | 人人爱人人射 | 色多多免费观看在线 | 黄色插插插 | 日本免费三级网站 | 国产一级特黄一级毛片 | 天天爱天天爽 | 深爱激情五月网 | 我想看一级播放片一级的 | 99伊人| 日本不卡视频在线播放 | 永久免费品色堂 | 年轻护士3的滋味 | 在线观看www日本免费网站 | 男人的天堂色偷偷之色偷偷 | 国产拍拍视频 | 色婷婷视频| 天天爱天天做天天爽夜夜揉 | 天天干天天摸 | 我要看黄色一级毛片 | 日本簧片在线观看 | 又黄又爽的成人免费网站 | 老师你好大好白好紧好硬 | 乱人伦一区二区三区 | 免费人成网站在线高清 | 午夜久久久 | 天天干小说 | 日本欧美一区二区三区不卡视频 | 日韩毛片大全 | 黄色大秀 | 成人综合网址 | 日本黄色小视频网站 | 免费被黄网站在观看 | 天堂中文www在线 |