在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

吳恩達:將引領下一波機器學習技術”的遷移學習到底好在哪?

電子工程師 ? 來源:未知 ? 作者:工程師李察 ? 2018-10-27 10:27 ? 次閱讀

兩年前,吳恩達在 NIPS 2016 的 Tutorial 上曾說“在監督學習之后,遷移學習將引領下一波機器學習技術商業化浪潮。”現實中不斷有新場景的出現,遷移學習可以幫助我們更好地處理遇到的新場景。遷移學習到底有哪些優點,能夠成為現在機器學習算法的新焦點?本文將通過與深度學習進行對比,讓大家在應用層面了解遷移學習的原理及其優勢。

前言

深度學習在許多很難用其它方法解決的問題上取得了長足的進步。深度學習的成功歸功于它與傳統的機器學習的幾個關鍵不同點,這使得它在處理非結構化數據的時候能夠大放異彩。如今,深度學習模型可以玩游戲,檢測癌癥,與人類交談,以及駕駛汽車。

但是,使深度學習強大的這幾個不同點同時也使得其成本巨大。你可能聽說過深度學習的成功需要龐大的數據量,昂貴的硬件設施,甚至更加昂貴的精英工程人才。現在,一些公司開始對那些可以減少成本的創新想法和技術特別興奮。比如多任務學習(Multi-task learning),這是一種可以讓機器學習模型一次性從多個任務中進行學習的方法。這種方法的其中一種好處就是,可以減少對訓練數據量的需求。

在這篇文章中,我們將會介紹遷移學習(transfer learning),一種可以讓知識從一個任務遷移到另一個任務中的機器學習方法。遷移學習不需要為你的問題重新開發一個完全定制的解決方案,而是允許你從相關問題中遷移知識,以幫助你更輕松地解決您的自定義問題。通過遷移知識,你可以利用用于獲取這些知識所需的昂貴資源,包括訓練數據,硬件設備,研究人員,而這些成本并不需要你來承擔。下面讓我們看看遷移學習何時以及是怎樣起作用的。

深度學習與傳統機器學習的不同點

遷移學習并不是一項新技術,它也不是專門為深度學習服務的,但是鑒于最近在深度學習方面取得的進展,它很令人興奮。所以首先,我們需要闡明深度學習究竟和傳統的機器學習在哪些方面有所不同。

深度學習進行底層抽象

機器學習是機器自動學習把預測值或者標簽分配給數值型輸入(即數據)的一種方式。這里的難點是,如何確切地確定這個函數,使得其對于給定輸入可以生成輸出。不對函數添加任何限制條件的話,其可能性(復雜性)是無窮無盡的。為了簡化這個任務,根據我們正在解決的問題的類型,相關領域的專業知識,或者簡單的試錯方法,我們通常會在函數上強加某種類型的結構。一種結構定義了某一類型的機器學習模型。

理論上,有無限種可能的結構可供選擇,但在實踐中,大多數機器學習用例可以通過應用少數幾種結構中的其中一種來解決:線性模型,樹的組合分類器,和支持向量機是其中的核心。數據科學家的工作就是從這一小組可能的結構中選擇正確的結構。這些模型作為黑盒對象,可以從許多成熟的機器學習庫中獲得,并且只需幾行代碼即可訓練。舉個例子,你可以用 Python 的 scikit-learn 庫像以下這樣訓練一個隨機森林模型:

或者用 R 來訓練一個線性回歸模型:

與此不同的是,深度學習在更加底層運行。深度學習不是從一小組的模型結構中進行選擇,而是允許開發人員組成任意結構。構建塊是一些模塊或者層,可以將其想象成基本的基礎數據轉換。這意味著當我們應用深度學習時,我們需要打開黑盒子了解數據轉換,而不是把它當做被算法固定的一堆參數。

這種做法使得我們可以構建更加強大的模型,但是同時它也給整個模型構建過程添加了一種全新的挑戰。盡管深度學習社區已經發表了大量研究,到處都有實用的深度學習指南,或者一些經驗之談,如何有效地組合這些數據轉換依然是一個很困難的過程。

下面我們考慮一個極其簡單的卷積神經網絡圖像分類器,這里是用一個流行的深度學習庫 PyTorch 來進行定義的。

因為我們使用的是底層的構建塊,我們可以輕松改變模型的某個單一部件(例如,將F.relu變為F.sigmoid)。這樣做可以得到一個全新的模型架構,它可能會產生截然不同的結果,而且它的可能性,毫不夸張地說,是無止境的。

深度學習還沒有被充分地理解

即使給定了一個固定的神經網絡架構,訓練它也是眾所周知的極其困難。首先,深度學習的損失函數通常不是凸函數,這意味著訓練并不一定產生最優的可能解。第二,深度學習現在還是非常新的技術,它的許多組成部分仍未被充分理解。舉個例子,批標準化(Batch Normalization)最近備受關注,因為似乎將其包含在某些模型中是取得良好結果的關鍵,但是專家無法就其原因達成一致。研究人員 Ali Rahimi 最近在一場機器學習會議上甚至把深度學習與煉金術相提并論,引發了一場論戰。

自動特征工程

深度學習的復雜性促進了一門叫表示學習(representation learning)的技術的發展,這也是為什么經常有人說神經網絡做的是“自動特征工程”。簡單來說就是,我們不是讓人類來手動從數據集中提取有效特征,而是構建一個模型,讓模型可以自己學習對于當前任務來說哪些是需要的和有用的特征。把特征工程的任務交給模型來處理非常有效,但是代價是模型需要龐大的數據量,也因此需要龐大的計算能力。

你可以做什么?

和其他機器學習方法相比,深度學習太過于復雜,看上去似乎無法將其整合到你的業務中。對于那些資源有限的組織機構來說,這種感覺更加強烈。

對于那些需要走在前沿的組織機構來說,可能的確需要聘請專家和購買專業的硬件設施。但是很多情況下這不是必需的。有方法可以讓你不需要進行大量的投資就可以有效地應用深度學習技術。這里就是遷移學習可以大展拳腳的地方了。

遷移學習可以讓知識從一個機器學習模型遷移到另一個模型上。這些模型可能是對模型結構進行了長年研究、用相當多數據集對模型進行訓練、用數以年計的計算時間對模型進行優化而得到的結果。利用遷移學習,你不需要承擔上面說的任何成本就能獲得這項工作的大部分好處!

什么是遷移學習

大多數機器學習任務始于零知識,意思是它的結構和模型的參數是從隨機猜測開始的。當我們說模型是從頭開始學習的時候,意思也是如此。

隨機猜測開始訓練的一個貓檢測模型。通過它見過的許多不同的貓,該模型從中整合出相同的模式,逐漸學習到貓是什么。

在這種情況下,該模型學習到的所有內容都來自于你展示給它的數據。但是,這是解決問題的唯一方法嗎?在某些情況下,看上去的確如此。

貓檢測模型在不相關的應用中,例如欺詐檢測,很有可能沒有什么用處。它只知道如何應付貓的圖片,而不是信用卡交易。

但是在某些情況下,我們似乎可以在不同任務之間共享信息。

貓檢測模型在相關任務中作用很大,例如貓的臉部定位。該檢測器已經知道怎么檢測貓胡子,鼻子,以及眼睛,所有這些對于定位貓的臉部都很有用處。

這就是遷移學習的本質:采用一種模型,學習如何很好地完成某項任務,將其部分或者所有知識遷移到一個相關的任務。

想想我們自己的學習經驗,就會發現這其實很有道理:我們經常遷移以往習得的技能,這樣可以更快地學習新的技能。舉個例子,學過投擲棒球的人不需要重新學習拋東西的機制就能很好地學習到怎么扔一個足球。這些任務本質上是相通的,能夠處理其中一件任務的話自然而然可以把學習到的能力遷移到另一項任務。

在機器學習領域,可能過去 5 年最好的例子就是計算機視覺領域。現在幾乎沒人會從頭開始訓練一個圖像模型。相反,我們會從一個預訓練好的模型開始,這個模型已經知道怎么區分一些簡單的對象,例如貓,狗,還有雨傘。學習區分圖像的模型首先學習如何檢測一些通用圖像特征,例如邊緣,形狀,文本,以及臉部。預訓練模型具有以上這些的基本技能(還有更加具體的技能,例如區分狗和貓的能力)。

此時,預訓練的分類模型可以通過添加層或者在一個新的數據集上重新訓練,來繼承那些花費巨大而獲得的基本技能,然后將其延伸到新的任務。這就是遷移學習。

這種方法的好處很明顯。

遷移學習訓練數據量需求量更小

當你在一個與貓相關的新任務中重復使用你最喜愛的貓檢測模型時,你的模型已經擁有了“一百萬只貓的智慧”,這意味著你不需要再使用那么多的貓圖片來訓練新任務了。減少訓練數據量可以讓你在只有很少數據,或者要獲得更多數據的成本過高或者不可能獲得更多數據的情況下也能訓練,同時可以讓你在比較廉價的硬件設施上更快地訓練模型。

遷移學習訓練模型泛化能力更強

遷移學習可以改進模型的泛化能力,或者說增強其在非訓練數據上分類良好的能力。這是因為在訓練預訓練模型時,是有目的性地讓模型可以學習到對相關任務都很有用的通用特征。當模型遷移到一個新任務時,它將很難過擬合新的訓練數據,因為它將僅從一個很一般的知識庫中繼續學習而已。構建一個泛化能力強的模型是機器學習中最難以及最重要的部分之一。

遷移學習訓練過程更加魯棒

從一個預訓練的模型開始,也可以避免訓練一個帶有數百萬參數的復雜模型,這個過程非常令人沮喪,非常不穩定,而且令人困惑。遷移學習可以將可訓練參數的數量減少多達 100%,使得訓練更穩定,而且更容易調試。

遷移學習降低深度學習的入門門檻

最后,遷移學習降低深度學習的門檻,因為你不需要成為專家就能獲得專家級的結果。舉例來說,流行的圖像分類模型 Resnet-50,這個特定的結構是怎么選擇的呢?這是許多深度學習專家的多年研究和實驗的結果。這個復雜的結構中包含有 2500 萬個權重,如果沒有對這個模型中各個部件的深入了解,從頭優化這些權重可以說是幾乎不可能的任務。幸運的是,有了遷移學習,你可以重用這個復雜的結構,以及這些優化過的權重,因此顯著降低了深度學習的入門門檻。

多任務學習又是什么?

遷移學習是用于訓練機器學習模型的知識共享技術的其中一種,已被證明是非常有效的。目前,知識共享技術中最有趣的兩種就是遷移學習和多任務學習。在遷移學習中,模型首先在單個任務中進行訓練,然后可以用于相關任務的起始點。在學習相關任務時,原始的被遷移模型會學習如何專門處理新的任務,而不需要擔心會不會影響其在原來任務上的效果。而在多任務學習中,單個模型一次性學習處理多個任務,對模型的性能評估則取決于它學習之后能夠多好地完成這些任務。后續我們也會分析討論更過有關多任務學習的好處以及其何時能起作用。

結論

遷移學習是一項知識共享技術,其可以減少構建深度學習模型時對訓練數據量,計算能力,以及工程人才的依賴。由于深度學習可以提供與傳統機器學習相比的顯著改進,遷移學習成為一項必不可少的工具。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3488

    瀏覽量

    50020
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134122
  • 深度學習
    +關注

    關注

    73

    文章

    5555

    瀏覽量

    122498

原文標題:吳恩達說“將引領下一波機器學習技術”的遷移學習到底好在哪?

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    SLAMTEC Aurora:把深度學習“卷”進機器人日常

    在人工智能和機器技術飛速發展的今天,深度學習與SLAM(同步定位與地圖構建)技術的結合,正引領著智能
    的頭像 發表于 02-19 15:49 ?371次閱讀

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編探討機器學習模型市場
    的頭像 發表于 02-13 09:39 ?295次閱讀

    嵌入式機器學習的應用特性與軟件開發環境

    作者:DigiKey Editor 在許多嵌入式系統中,必須采用嵌入式機器學習(Embedded Machine Learning)技術,這是指
    的頭像 發表于 01-25 17:05 ?551次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與軟件開發環境

    傳統機器學習方法和應用指導

    在上篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統
    的頭像 發表于 12-30 09:16 ?1051次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智能數據分析技術的創新源之
    的頭像 發表于 11-16 01:07 ?859次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為種專門為深度學習
    的頭像 發表于 11-15 09:19 ?1102次閱讀

    智浦eIQ AI和機器學習開發軟件增加兩款新工具

    智浦在eIQ AI和機器學習開發軟件中增加了帶有檢索增強生成(RAG)與微調的生成式人工智能(GenAI)流程和eIQ Time Series Studio,以便在小型微控制器(MCU)、功能更強大的大型應用處理器(MPU)等
    的頭像 發表于 11-01 11:39 ?939次閱讀

    人工智能、機器學習和深度學習存在什么區別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中個很大的子集是機器學習——讓算法從數據中學習
    發表于 10-24 17:22 ?2786次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區別

    下一機器技術:工業自動化的五大趨勢

    隨著人工智能(AI)技術的迅猛發展和全球制造業的轉型升級,下一機器技術正在引領工業自動化領域的新
    的頭像 發表于 10-23 15:52 ?1103次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    之前對《時間序列與機器學習書進行了整體瀏覽,并且非常輕松愉快的完成了第章的學習,今天開始學習
    發表于 08-14 18:00

    預訓練和遷移學習的區別和聯系

    預訓練和遷移學習是深度學習機器學習領域中的兩個重要概念,它們在提高模型性能、減少訓練時間和降低對數據量的需求方面發揮著關鍵作用。本文將從定
    的頭像 發表于 07-11 10:12 ?1913次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文介紹深度學習與NLP的區別。 深度學習簡介 深度
    的頭像 發表于 07-05 09:47 ?1518次閱讀

    遷移學習的基本概念和實現方法

    遷移學習(Transfer Learning)是機器學習領域中的個重要概念,其核心思想是利用在
    的頭像 發表于 07-04 17:30 ?3239次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文深入解讀幾種常見的
    的頭像 發表于 07-02 11:25 ?2184次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發表于 07-01 11:40 ?2237次閱讀
    主站蜘蛛池模板: 亚洲色啦啦狠狠网站 | bt天堂网在线资源www | 天堂最新版中文网 | 日本口工禁漫画无遮挡全彩 | 韩国三级视频在线观看 | 国产欧美日韩电影 | 亚洲综合色在线 | 亚洲欧美色图 | 小优视频在线 | 西西人体大胆午夜gog0 | 四虎永久在线精品 | 免费h视频网站 | 日本午夜片成年www 日本午夜三级 | 真实子伦视频不卡 | 天堂在线最新版www中文 | 在线精品国产成人综合第一页 | 亚洲色图25p | 三级在线网址 | 色香焦 | 国产精品视频久久久久久 | 美女被免费网站在线视频九色 | 国产在线精品一区二区夜色 | 色婷婷综合久久久中文字幕 | 亚洲欧美日韩国产一区二区三区精品 | 一级毛片黄色片 | 午夜亚洲| 日韩亚洲欧洲在线rrrr片 | 久久国产高清字幕中文 | 免费国产成人α片 | 717影院理论午夜伦不卡久久 | 国产在线一区二区三区四区 | 一区二区三区高清不卡 | 男女爱爱免费视频 | 91在线免费观看网站 | 久久久噜久噜久久gif动图 | 久久天天干 | 丁香视频在线观看播放 | 涩狠狠狠狠色 | 人人干免费| 亚州免费一级毛片 | 天天艹天天操 |