91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過遷移學習解決計算機視覺問題

新機器視覺 ? 來源:AI公園 ? 作者:Orhan G. Yal??n ? 2020-10-31 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:公眾號AI公園

作者:OrhanG. Yal??n

編譯:ronghuaiyang

導讀

使用SOTA的預訓練模型來通過遷移學習解決現實的計算機視覺問題。

如果你試過構建高精度機器學習模型,但還沒有試過遷移學習,這篇文章將改變你的生活。至少,對我來說是的。

我們大多數人已經嘗試過,通過幾個機器學習教程來掌握神經網絡的基礎知識。這些教程非常有助于了解人工神經網絡的基本知識,如循環神經網絡,卷積神經網絡,GANs和自編碼器。但是這些教程的主要功能是為你在現實場景中實現做準備。

現在,如果你計劃建立一個利用深度學習人工智能系統,你要么(i)有一個非常大的預算用于培訓優秀的人工智能研究人員,或者(ii)可以從遷移學習中受益。

什么是遷移學習?

遷移學習是機器學習和人工智能的一個分支,其目的是將從一個任務(源任務)中獲得的知識應用到一個不同但相似的任務(目標任務)中。

例如,在學習對維基百科文本進行分類時獲得的知識可以用于解決法律文本分類問題。另一個例子是利用在學習對汽車進行分類時獲得的知識來識別天空中的鳥類。這些樣本之間存在關聯。我們沒有在鳥類檢測上使用文本分類模型。

遷移學習是指從相關的已經學習過的任務中遷移知識,從而對新的任務中的學習進行改進

總而言之,遷移學習是一個讓你不必重復發明輪子的領域,并幫助你在很短的時間內構建AI應用。

遷移學習的歷史

為了展示遷移學習的力量,我們可以引用Andrew Ng的話:

遷移學習將是繼監督學習之后機器學習商業成功的下一個驅動因素

遷移學習的歷史可以追溯到1993年。Lorien Pratt的論文“Discriminability-Based Transfer between Neural Networks”打開了潘多拉的盒子,向世界介紹了遷移學習的潛力。1997年7月,“Machine Learning”雜志發表了一篇遷移學習論文專刊。隨著該領域的深入,諸如多任務學習等相鄰主題也被納入遷移學習領域。“Learning to Learn”是這一領域的先驅書籍之一。如今,遷移學習是科技企業家構建新的人工智能解決方案、研究人員推動機器學習前沿的強大源泉。

遷移學習是如何工作的?

實現遷移學習有三個要求:

由第三方開發開源預訓練模型

重用模型

對問題進行微調

開發開源預訓練模型

預訓練的模型是由其他人創建和訓練來解決與我們類似的問題的模型。在實踐中,幾乎總是有人是科技巨頭或一群明星研究人員。他們通常選擇一個非常大的數據集作為他們的基礎數據集,比如ImageNet或Wikipedia Corpus。然后,他們創建一個大型神經網絡(例如,VGG19有143,667,240個參數)來解決一個特定的問題(例如,這個問題用VGG19做圖像分類。)當然,這個預先訓練過的模型必須公開,這樣我們就可以利用這些模型并重新使用它們。

重用模型

在我們掌握了這些預先訓練好的模型之后,我們重新定位學習到的知識,包括層、特征、權重和偏差。有幾種方法可以將預先訓練好的模型加載到我們的環境中。最后,它只是一個包含相關信息的文件/文件夾。然而,深度學習庫已經托管了許多這些預先訓練過的模型,這使得它們更容易訪問:

TensorFlow Hub

Keras Applications

PyTorch Hub

你可以使用上面的一個源來加載經過訓練的模型。它通常會有所有的層和權重,你可以根據你的意愿調整網絡。

對問題進行微調

現在的模型也許能解決我們的問題。對預先訓練好的模型進行微調通常更好,原因有兩個:

這樣我們可以達到更高的精度。

我們的微調模型可以產生正確的格式的輸出。

一般來說,在神經網絡中,底層和中層通常代表一般的特征,而頂層則代表特定問題的特征。由于我們的新問題與原來的問題不同,我們傾向于刪除頂層。通過為我們的問題添加特定的層,我們可以達到更高的精度。

在刪除頂層之后,我們需要放置自己的層,這樣我們就可以得到我們想要的輸出。例如,使用ImageNet訓練的模型可以分類多達1000個對象。如果我們試圖對手寫數字進行分類(例如,MNIST classification),那么最后得到一個只有10個神經元的層可能會更好。

在我們將自定義層添加到預先訓練好的模型之后,我們可以用特殊的損失函數和優化器來配置它,并通過額外的訓練進行微調。

計算機視覺中的4個預訓練模型

這里有四個預先訓練好的網絡,可以用于計算機視覺任務,如圖像生成、神經風格轉換、圖像分類、圖像描述、異常檢測等:

VGG19

Inceptionv3 (GoogLeNet)

ResNet50

EfficientNet

讓我們一個一個地深入研究。

VGG-19

VGG是一種卷積神經網絡,深度為19層。它是由牛津大學的Karen Simonyan和Andrew Zisserman在2014年構建和訓練的,論文為:Very Deep Convolutional Networks for large Image Recognition。VGG-19網絡還使用ImageNet數據庫中的100多萬張圖像進行訓練。當然,你可以使用ImageNet訓練過的權重導入模型。這個預先訓練過的網絡可以分類多達1000個物體。對224x224像素的彩色圖像進行網絡訓練。以下是關于其大小和性能的簡要信息:

大小:549 MB

Top-1 準確率:71.3%

Top-5 準確率:90.0%

參數個數:143,667,240

深度:26

Inceptionv3 (GoogLeNet)

Inceptionv3是一個深度為50層的卷積神經網絡。它是由谷歌構建和訓練的,你可以查看這篇論文:“Going deep with convolutions”。預訓練好的帶有ImageNet權重的Inceptionv3可以分類多達1000個對象。該網絡的圖像輸入大小為299x299像素,大于VGG19網絡。VGG19是2014年ImageNet競賽的亞軍,而Inception是冠軍。以下是對Inceptionv3特性的簡要總結:

尺寸:92 MB

Top-1 準確率:77.9%

Top-5 準確率:93.7%

參數數量:23,851,784

深度:159

ResNet50 (Residual Network)

ResNet50是一個卷積神經網絡,深度為50層。它是由微軟于2015年建立和訓練的,論文:[Deep Residual Learning for Image Recognition](http://deep Residual Learning for Image Recognition /)。該模型對ImageNet數據庫中的100多萬張圖像進行了訓練。與VGG-19一樣,它可以分類多達1000個對象,網絡訓練的是224x224像素的彩色圖像。以下是關于其大小和性能的簡要信息:

尺寸:98 MB

Top-1 準確率:74.9%

Top-5 準確率:92.1%

參數數量:25,636,712

如果你比較ResNet50和VGG19,你會發現ResNet50實際上比VGG19性能更好,盡管它的復雜性更低。你也可以使用更新的版本,如ResNet101,ResNet152,ResNet50V2,ResNet101V2,ResNet152V2。

EfficientNet

EfficientNet是一種最先進的卷積神經網絡,由谷歌在2019年的論文“efficient entnet: Rethinking Model Scaling for convolutional neural Networks”中訓練并發布。EfficientNet有8種可選實現(B0到B7),甚至最簡單的EfficientNet B0也是非常出色的。通過530萬個參數,實現了77.1%的最高精度性能。

EfficientNetB0的特性簡要介紹如下:

尺寸:29 MB

Top-1 準確率:77.1%

Top-5 準確率:93.3%

參數數量:~5,300,000

深度:159

其他的計算機視覺問題的預訓練模型

我們列出了四種最先進的獲獎卷積神經網絡模型。然而,還有幾十種其他模型可供遷移學習使用。下面是對這些模型的基準分析,這些模型都可以在Keras Applications中獲得。

總結

在一個我們可以很容易地獲得最先進的神經網絡模型的世界里,試圖用有限的資源建立你自己的模型就像是在重復發明輪子,是毫無意義的。

相反,嘗試使用這些訓練模型,在上面添加一些新的層,考慮你的特殊計算機視覺任務,然后訓練。其結果將比你從頭構建的模型更成功。

原文標題:4個計算機視覺領域常用遷移學習模型

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103550
  • 機器視覺
    +關注

    關注

    163

    文章

    4594

    瀏覽量

    122867
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134572

原文標題:4個計算機視覺領域常用遷移學習模型

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數據的支持范圍。在增加這項支持后,該平臺將能夠用于開發低功耗、低內存的邊緣AI視覺模型。這將給諸多應用領域的機器學習開發人員
    的頭像 發表于 03-11 15:11 ?380次閱讀
    英飛凌邊緣AI平臺<b class='flag-5'>通過</b>Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優化

    生成式及多模態人工智能 (AI) 工作負載的廣泛增長,推動了對計算機視覺 (CV) 技術日益高漲的需求。此類技術能夠解釋并分析源自現實世界的視覺信息,并可應用于人臉識別、照片分類、濾鏡處理及增強現實
    的頭像 發表于 02-24 10:15 ?563次閱讀

    AR和VR中的計算機視覺

    ):計算機視覺引領混合現實體驗增強現實(AR)和虛擬現實(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發表于 02-08 14:29 ?1552次閱讀
    AR和VR中的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向用戶提供按需的
    的頭像 發表于 12-17 10:19 ?547次閱讀

    工業中使用哪種計算機

    使其成為工廠、倉庫和其他要求苛刻的工業環境的理想選擇。通過提供高性能和可靠性,工業計算機可確保高效、連續的運行。工業計算機的類型在工業環境中,人們使用各種專用計算機來滿
    的頭像 發表于 11-29 14:07 ?705次閱讀
    工業中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區別

    ? 本文介紹了量子計算機與普通計算機工作原理的區別。 量子計算是一個新興的研究領域,科學家們利用量子力學,制造出具有革命性能力的計算機。雖然現在的量子
    的頭像 發表于 11-24 11:00 ?1467次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區別

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是教機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理解它。比如說,它能認出這是個蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉換
    的頭像 發表于 10-31 17:00 ?1231次閱讀
    【小白入門必看】一文讀懂深度<b class='flag-5'>學習</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及<b class='flag-5'>學習</b>路線

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設備之間以及計算機各部件之間傳輸數據、控制信息和狀態信息的硬件設備和軟件程序。它在計算機系統中
    的頭像 發表于 10-14 14:02 ?1299次閱讀

    簡述計算機總線的分類

    計算機總線作為計算機系統中連接各個功能部件的公共通信干線,其結構和分類對于理解計算機硬件系統的工作原理至關重要。以下是對計算機總線結構和分類的詳細闡述,內容將涵蓋總線的基本概念、內部結
    的頭像 發表于 08-26 16:23 ?5160次閱讀

    晶體管計算機和電子管計算機有什么區別

    晶體管計算機和電子管計算機作為計算機發展史上的兩個重要階段,它們在多個方面存在顯著的區別。以下是對這兩類計算機在硬件、性能、應用以及技術發展等方面區別的詳細闡述。
    的頭像 發表于 08-23 15:28 ?3599次閱讀

    計算機視覺有哪些優缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發展不僅推動了多個行業的變革,也帶來了諸多優勢,但同時也伴隨著一些挑戰和局限性。以下是對
    的頭像 發表于 08-14 09:49 ?2035次閱讀

    計算機視覺中的圖像融合

    在許多計算機視覺應用中(例如機器人運動和醫學成像),需要將多個圖像的相關信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準確性和數據質量。多視圖融合可以提高圖像分辨率,并恢復場景的三維表示
    的頭像 發表于 08-01 08:28 ?1139次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國際計算機視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計算機視覺頂會ECCV 2024,自動駕駛算法技術再有新突破。
    的頭像 發表于 07-27 11:10 ?1459次閱讀
    地平線科研論文入選國際<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現這一目標,計算機視覺技術依賴于
    的頭像 發表于 07-24 12:46 ?1798次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發表于 07-16 10:23 ?1159次閱讀
    主站蜘蛛池模板: 成人午夜大片免费看爽爽爽 | 免费国产小视频 | 爆操极品美女 | 色视频网站色视频播放 | 日本三级理论 | 日本在线网址 | 又黄又湿又爽吸乳视频 | 9久热久re爱免费精品视频 | 亚洲成在线 | 久久mimi色| jiucao在线观看精品 | 国产亚洲人成网站观看 | 狠狠做深爱婷婷综合一区 | 四虎网址| 天天爽天天操 | 中文天堂在线最新2022更新 | 欧美成人午夜影院 | 国内精品久久久久影院男同志 | 亚洲综合久久综合激情久久 | 在线观看免费视频 | 天堂中文在线资源库用 | 在线免费观看视频你懂的 | 国产亚洲欧美一区 | 免费黄色小视频 | 新天堂在线| 亚洲黄视频 | 欧美天堂在线观看 | 午夜久久影院 | 三级黄色免费网站 | 午夜免费福利片观看 | 九七婷婷狠狠成人免费视频 | 伊人亚洲综合网成人 | 国产高清一区二区 | 久久精品免费观看视频 | 四虎最新免费网址 | 国产午夜一区二区在线观看 | 五月婷婷亚洲综合 | 四虎影院在线看 | 色爽爽爽| 亚洲 欧美 综合 | 美女拍拍拍黄色 |