91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

半監督學習最基礎的3個概念

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

今天給大家介紹半監督學習中的3個最基礎的概念:一致性正則化,熵最小化和偽標簽,并介紹了兩個經典的半監督學習方法。

沒看一的點這里哈:半監督學習入門基礎(一)

半監督學習 (SSL) 是一種非常有趣的方法,用來解決機器學習中缺少標簽數據的問題。SSL利用未標記的數據和標記的數據集來學習任務。SSL的目標是得到比單獨使用標記數據訓練的監督學習模型更好的結果。這是關于半監督學習的系列文章的第2部分,詳細介紹了一些基本的SSL技術。

一致性正則化,熵最小化,偽標簽

SSL的流行方法是在訓練期間往典型的監督學習中添加一個新的損失項。通常使用三個概念來實現半監督學習,即一致性正則化、熵最小化和偽標簽。在進一步討論之前,讓我們先理解這些概念。

一致性正則化強制數據點的實際擾動不應顯著改變預測器的輸出。簡單地說,模型應該為輸入及其實際擾動變量給出一致的輸出。我們人類對于小的干擾是相當魯棒的。例如,給圖像添加小的噪聲(例如改變一些像素值)對我們來說是察覺不到的。機器學習模型也應該對這種擾動具有魯棒性。這通常通過最小化對原始輸入的預測與對該輸入的擾動版本的預測之間的差異來實現。

模型對輸入x及其擾動x^的一致性度量

d(.,.) 可以是均方誤差或KL散度或任何其他距離度量。

一致性正則化是利用未標記數據找到數據集所在的平滑流形的一種方法。這種方法的例子包括π模型、Temporal Ensembling,Mean Teacher,Virtual Adversarial Training等。

熵最小化鼓勵對未標記數據進行更有信心的預測,即預測應該具有低熵,而與ground truth無關(因為ground truth對于未標記數據是未知的)。讓我們從數學上理解下這個。

熵的計算

這里,K是類別的數量,是模型對x預測是否屬于類別k的置信度。

此外,輸入示例中所有類的置信度之和應該為1。這意味著,當某個類的預測值接近1,而其他所有類的預測值接近0時,熵將最小化。因此,這個目標鼓勵模型給出高可信度的預測。

理想情況下,熵的最小化將阻止決策邊界通過附近的數據點,否則它將被迫產生一個低可信的預測。請參閱下圖以更好地理解此概念。

由不同的半監督學習方法生成的決策邊界

偽標簽是實現半監督學習最簡單的方法。一個模型一開始在有標記的數據集上進行訓練,然后用來對沒有標記的數據進行預測。它從未標記的數據集中選擇那些具有高置信度(高于預定義的閾值)的樣本,并將其預測視為偽標簽。然后將這個偽標簽數據集添加到標記數據集,然后在擴展的標記數據集上再次訓練模型。這些步驟可以執行多次。這和自訓練很相關。

在現實中視覺和語言上擾動的例子

視覺:

翻轉,旋轉,裁剪,鏡像等是圖像常用的擾動。

語言

反向翻譯是語言中最常見的擾動方式。在這里,輸入被翻譯成不同的語言,然后再翻譯成相同的語言。這樣就獲得了具有相同語義屬性的新輸入。

NLP中的反向翻譯

半監督學習方法

π model:

這里的目標是一致性正則化。

π模型鼓勵模型對兩個相同的輸入(即同一個輸入的兩個擾動變量)輸出之間的一致性。

π模型有幾個缺點,首先,訓練計算量大,因為每個epoch中單個輸入需要送到網絡中兩次。第二,訓練目標zi?是有噪聲的。

Temporal Ensembling:

這個方法的目標也是一致性正則化,但是實現方法有點不一樣。

眾所周知,與單一模型相比,模型集成通常能提供更好的預測。通過在訓練期間使用單個模型在不同訓練時期的輸出來形成集成預測,這一思想得到了擴展。

簡單來說,不是比較模型的相同輸入的兩個擾動的預測(如π模型),模型的預測與之前的epoch中模型對該輸入的預測的加權平均進行比較。

這種方法克服了π模型的兩個缺點。它在每個epoch中,單個輸入只進入一次,而且訓練目標zi? 的噪聲更小,因為會進行滑動平均。

這種方法的缺點是需要存儲數據集中所有的zi? 。

英文原文:https://medium.com/analytics-vidhya/a-primer-on-semi-supervised-learning-part-2-803f45edac2

責任編輯:xj

原文標題:半監督學習入門基礎(二):最基礎的3個概念

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SSL
    SSL
    +關注

    關注

    0

    文章

    130

    瀏覽量

    26254
  • 半監督
    +關注

    關注

    0

    文章

    5

    瀏覽量

    6402
  • 機器學習
    +關注

    關注

    66

    文章

    8510

    瀏覽量

    134843
  • 深度學習
    +關注

    關注

    73

    文章

    5564

    瀏覽量

    122923

原文標題:半監督學習入門基礎(二):最基礎的3個概念

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?

    的基本理論。了解監督學習、無監督學習和強化學習的基本原理。例如,在監督學習中,理解如何通過標注數據來訓練模型進行分類或回歸任務,像通過大量的貓和狗的圖片標注數據來訓練一
    發表于 07-08 17:44

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?742次閱讀
    使用MATLAB進行無<b class='flag-5'>監督學習</b>

    新品 | 橋1200V CoolSiC? MOSFET EconoDUAL? 3模塊

    新品橋1200VCoolSiCMOSFETEconoDUAL3模塊采用EconoDUAL3封裝的1200V/1.4mΩ橋模塊。芯片為SiCMOSFETM1H增強型1代、集成NTC溫
    的頭像 發表于 04-17 17:05 ?447次閱讀
    新品 | <b class='flag-5'>半</b>橋1200V CoolSiC? MOSFET EconoDUAL? <b class='flag-5'>3</b>模塊

    NX-HB-GAN3R2-BSC橋評估板

    電子發燒友網站提供《NX-HB-GAN3R2-BSC橋評估板.pdf》資料免費下載
    發表于 02-18 17:29 ?2次下載
    NX-HB-GAN<b class='flag-5'>3</b>R2-BSC<b class='flag-5'>半</b>橋評估板

    橋LLC諧振電路的工作原理與模態分析

    自己寫一篇比較詳細的介紹做參考。作為一初學AC-DC電源的工程師,在整理和學習的過程中難免有一些疏忽和錯誤,如發現問題,歡迎大家在評論區指出和討論。 1、橋LLC拓撲 如圖是橋L
    的頭像 發表于 02-12 11:03 ?3806次閱讀
    <b class='flag-5'>半</b>橋LLC諧振電路的工作原理與模態分析

    人工智能和機器學習以及Edge AI的概念與應用

    與人工智能相關各種技術的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發展與相關應用。 人工智能和機器學習是現代科技的核心技術 人工智能(AI)和機器學習(ML)是現代科技的核心技術之一,且已經在許多領域中得到廣泛應用
    的頭像 發表于 01-25 17:37 ?991次閱讀
    人工智能和機器<b class='flag-5'>學習</b>以及Edge AI的<b class='flag-5'>概念</b>與應用

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一核心領域,它使計算機能夠從數據中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為機器學習提供了一種強大的工具,用于從大
    的頭像 發表于 12-05 15:21 ?2048次閱讀

    使用卷積神經網絡進行圖像分類的步驟

    (例如,高分辨率、不同光照條件等)。 2. 數據收集 獲取數據集 :收集或購買一包含你想要分類的圖像的數據集。 數據標注 :確保所有圖像都被正確標注,這對于監督學習是必要的。 3. 數據預處理 圖像尺寸標準化 :將所有圖像調整
    的頭像 發表于 11-15 15:01 ?888次閱讀

    時空引導下的時間序列自監督學習框架

    【導讀】最近,香港科技大學、上海AI Lab等多個組織聯合發布了一篇時間序列無監督預訓練的文章,相比原來的TS2Vec等時間序列表示學習工作,核心在于提出了將空間信息融入到預訓練階段,即在預訓練階段
    的頭像 發表于 11-15 11:41 ?795次閱讀
    時空引導下的時間序列自<b class='flag-5'>監督學習</b>框架

    如何使用 PyTorch 進行強化學習

    的計算圖和自動微分功能,非常適合實現復雜的強化學習算法。 1. 環境(Environment) 在強化學習中,環境是一抽象的概念,它定義了智能體(agent)可以執行的動作(acti
    的頭像 發表于 11-05 17:34 ?1087次閱讀

    特斯拉:HW3若無法滿足無人監督FSD,將免費升級至HW4

    (HW4/AI4)計算機的機會。但馬斯克同時指出,這一升級只有在HW3芯片無法滿足無人監督的FSD功能要求時才會實施,而目前尚無法確定這一條件是否會達成。
    的頭像 發表于 10-24 14:00 ?2074次閱讀

    使用TPA3118時,輸出到3V時,負軸就開始削波了,為什么?

    客戶在使用TPA3118時,15V~16V供電,輸出幅度目標是10V,但實際當輸出到3V時,負軸就開始削波了,檢測IC輸入端信號,是沒有失真的。線路圖核對,參數也是依照EVM的參數,只是,省略
    發表于 10-23 07:50

    加器和全加器的功能特點

    加器和全加器是數字電路中的基本組件,用于執行二進制數的加法運算。它們在計算機、微處理器和其他數字系統中扮演著重要角色。 加器的功能特點 加器是一種簡單的數字電路,它能夠實現兩
    的頭像 發表于 10-18 11:10 ?3742次閱讀

    單相控橋實現有源逆變的可行性分析

    的導通和關斷來實現對交流電的整流。其基本工作原理如下: 電路結構 :單相控橋整流電路由兩晶閘管(如T1、T2)和兩二極管(如D3、D4)組成,它們以橋式結構連接在交流電源和負載之
    的頭像 發表于 08-02 18:14 ?2542次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    收集海量的文本數據作為訓練材料。這些數據集不僅包括語法結構的學習,還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監督學習:模型采用自監督學習策略,在大量無標簽文本數據上學習
    發表于 08-02 11:03
    主站蜘蛛池模板: 在线观看一区二区三区视频 | 久久网站免费观看 | 伊人久久大香线蕉观看 | 久青草免费视频 | 热99热| 综合网激情五月 | 午夜欧美福利 | 男人你懂的在线观看视频 | 欧美性猛交ⅹxxx乱大交免费 | 一区二区三区午夜 | 欧美性free免费 | 一区二区三区高清视频在线观看 | 4399一级成人毛片 | 色www国产阿娇 | 日本欧美强乱视频在线 | 女人扒开腿让男人桶到爽 | 人人看人人做人人爱精品 | 日本xxxⅹ69xxxx护士 | 欧美黑人性色黄在线视频 | 国产精品麻豆va在线播放 | 天天弄天天干 | 国产黄色在线视频 | 免费一级特黄特色黄大任片 | 久久久久国产一级毛片高清版 | 日日操狠狠操 | 777色淫网站女女 | 欧美日本一道免费一区三区 | 五月亭亭免费高清在线 | 久久久久久久久久久观看 | 大伊人网| 在线天堂中文www官网 | 日本拍拍 | 两性色午夜视频免费老司机 | 1024手机在线看片 | 亚洲视频www | 网色视频 | 伊人久久大香线焦在观看 | 主人扒开腿揉捏花蒂调教cfh | 久久精品亚洲精品国产欧美 | 欧美色惰aⅴ| 人人草在线 |