在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:08 ? 次閱讀

導(dǎo)讀

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。

半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是要比單獨(dú)使用有標(biāo)記數(shù)據(jù)訓(xùn)練的監(jiān)督學(xué)習(xí)技術(shù)得到更好的結(jié)果。這是半監(jiān)督學(xué)習(xí)系列文章的第1部分,對(duì)這個(gè)機(jī)器學(xué)習(xí)的重要子領(lǐng)域進(jìn)行了簡(jiǎn)要的介紹。

區(qū)分半監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)

整個(gè)數(shù)據(jù)集中可用于訓(xùn)練的有標(biāo)記數(shù)據(jù)的范圍區(qū)分了機(jī)器學(xué)習(xí)的這三個(gè)相關(guān)領(lǐng)域。

監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最流行的模式,在這種模式中,可以通過標(biāo)簽的形式獲得完整的監(jiān)督。整個(gè)數(shù)據(jù)集都有標(biāo)記,即一個(gè)標(biāo)簽與訓(xùn)練數(shù)據(jù)集中的每個(gè)樣本相關(guān)聯(lián)。機(jī)器學(xué)習(xí)模型使用這個(gè)標(biāo)簽數(shù)據(jù)集訓(xùn)練,并期望對(duì)新的樣本預(yù)測(cè)一個(gè)標(biāo)簽。監(jiān)督學(xué)習(xí)主要包括兩類任務(wù):分類和回歸。分類問題要求算法預(yù)測(cè)一個(gè)離散值,而回歸任務(wù)是需要從輸入變量(X)逼近一個(gè)映射函數(shù)(f)到連續(xù)輸出變量(y)。

手寫數(shù)字識(shí)別使用(MNIST)數(shù)據(jù)集。每個(gè)樣本都有一個(gè)圖像和對(duì)應(yīng)的數(shù)字作為標(biāo)簽。任務(wù)是學(xué)習(xí)從圖像中預(yù)測(cè)標(biāo)簽(即數(shù)字)。

另一個(gè)例子是情感分類,使用IMDB數(shù)據(jù)集。每條記錄都包含一個(gè)評(píng)論和一個(gè)相應(yīng)的標(biāo)簽(正面的或負(fù)面的)。這里的任務(wù)是預(yù)測(cè)給定評(píng)論的情緒。

房?jī)r(jià)預(yù)測(cè)是一個(gè)回歸任務(wù),其中標(biāo)簽(房?jī)r(jià))是一個(gè)連續(xù)變量。

在無監(jiān)督學(xué)習(xí)中,沒有標(biāo)記數(shù)據(jù)可用。訓(xùn)練數(shù)據(jù)集包含樣本,但沒有特定的期望結(jié)果或標(biāo)簽。機(jī)器學(xué)習(xí)模型試圖通過提取有用的特征并對(duì)其進(jìn)行分析來自動(dòng)地在數(shù)據(jù)中找到結(jié)構(gòu)。像聚類、異常檢測(cè)、關(guān)聯(lián)等任務(wù)屬于無監(jiān)督學(xué)習(xí)。

聚類是將數(shù)據(jù)集劃分為多個(gè)簇,使同一簇中的數(shù)據(jù)點(diǎn)與同一簇中的其他數(shù)據(jù)點(diǎn)更相似,與其他簇中的數(shù)據(jù)點(diǎn)不相似。例如,下圖(左)中的數(shù)據(jù)點(diǎn)可以分成3個(gè)簇,如圖(右)所示。注意,簇可以是任何形狀。

半監(jiān)督式學(xué)習(xí)(SSL),正如其名稱所示,介于兩個(gè)極端之間(監(jiān)督式是指整個(gè)數(shù)據(jù)集被標(biāo)記,而非監(jiān)督式是指沒有標(biāo)記)。半監(jiān)督學(xué)習(xí)任務(wù)具有一個(gè)標(biāo)記和一個(gè)未標(biāo)記的數(shù)據(jù)集。它使用未標(biāo)記的數(shù)據(jù)來獲得對(duì)數(shù)據(jù)結(jié)構(gòu)的更多理解。通常,SSL使用小的帶標(biāo)簽數(shù)據(jù)集和較大的未帶標(biāo)簽數(shù)據(jù)集來進(jìn)行學(xué)習(xí)。

我們的目標(biāo)是學(xué)習(xí)一個(gè)預(yù)測(cè)器來預(yù)測(cè)未來的測(cè)試數(shù)據(jù),這個(gè)預(yù)測(cè)器比單獨(dú)從有標(biāo)記的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的預(yù)測(cè)器更好。

監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)在標(biāo)記數(shù)據(jù)上的差別可視化

為什么要關(guān)注半監(jiān)督學(xué)習(xí)

在許多實(shí)際應(yīng)用中,收集大的有標(biāo)簽數(shù)據(jù)集太昂貴或者不可行,但是有大量的無標(biāo)簽數(shù)據(jù)可用。對(duì)于這種情況,半監(jiān)督學(xué)習(xí)是一個(gè)完美的方案。SSL技術(shù)可以利用帶標(biāo)簽的數(shù)據(jù),也可以從未帶標(biāo)簽的數(shù)據(jù)派生結(jié)構(gòu),從而更好地解決總體任務(wù)。

典型的監(jiān)督學(xué)習(xí)算法在標(biāo)記數(shù)據(jù)集較小的情況下,容易出現(xiàn)過擬合問題。SSL通過在訓(xùn)練過程中理解未標(biāo)記數(shù)據(jù)的結(jié)構(gòu)來緩解這個(gè)問題。

此外,這種學(xué)習(xí)技術(shù)減輕了構(gòu)建大量標(biāo)記數(shù)據(jù)集來學(xué)習(xí)任務(wù)的負(fù)擔(dān)。SSL方法更接近我們?nèi)祟惖膶W(xué)習(xí)方式。

讓我們舉個(gè)例子來直觀地看看半監(jiān)督學(xué)習(xí)的效果。在下面的圖中,當(dāng)只對(duì)標(biāo)記數(shù)據(jù)(大的黑點(diǎn)和白點(diǎn))進(jìn)行訓(xùn)練(即對(duì)標(biāo)記數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí))時(shí),決策邊界(虛線)并不遵循數(shù)據(jù)“流形”的輪廓,這可以由額外的未標(biāo)記數(shù)據(jù)(小灰點(diǎn))來表示。

因此,SSL的目標(biāo)是利用未標(biāo)記數(shù)據(jù)來生成決策邊界,從而更好地反映數(shù)據(jù)的底層結(jié)構(gòu)。

由不同的半監(jiān)督學(xué)習(xí)方法生成的決策邊界

半監(jiān)督學(xué)習(xí)的任務(wù)舉例

CIFAR-10— 它是由10個(gè)類的32×32像素的RGB圖像組成的數(shù)據(jù)集,任務(wù)是圖像分類。通常使用Tiny Images數(shù)據(jù)集中的隨機(jī)圖像來形成未標(biāo)記數(shù)據(jù)集。

SVHN— 街景門牌號(hào)數(shù)據(jù)集由真實(shí)門牌號(hào)的32×32像素的RGB圖像組成,任務(wù)是分類最中間的數(shù)字。它附帶一個(gè)“SVHN-extra”數(shù)據(jù)集,該數(shù)據(jù)集由531,131個(gè)額外的數(shù)字圖像組成,可以用作未標(biāo)記數(shù)據(jù)。

Text-Classification Tasks— 亞馬遜評(píng)論數(shù)據(jù)庫(kù),Yelp評(píng)論數(shù)據(jù)集。

總結(jié)

半監(jiān)督學(xué)習(xí)是一種有趣的方法,用于解決機(jī)器學(xué)習(xí)中缺乏標(biāo)記數(shù)據(jù)的問題。SSL算法還利用未標(biāo)記數(shù)據(jù)來提高監(jiān)督學(xué)習(xí)算法的性能。SSL算法通常提供了一種從無標(biāo)簽示例中了解數(shù)據(jù)結(jié)構(gòu)的方法,減輕了對(duì)標(biāo)簽的需求。

本系列的第2部分會(huì)介紹了一些具體的SSL技術(shù),未完待續(xù)。

責(zé)任編輯:xj

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSL
    SSL
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    26103
  • 半監(jiān)督
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6386
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8493

    瀏覽量

    134171
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5555

    瀏覽量

    122538

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?591次閱讀
    使用MATLAB進(jìn)行無<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>

    橋LLC諧振電路的工作原理與模態(tài)分析

    前言:本文參考橋LLC諧振轉(zhuǎn)換器工作原理并結(jié)合自己想法整理而成,本人在查找一些AC-DC開關(guān)電源方面的知識(shí)時(shí),沒有在國(guó)內(nèi)網(wǎng)站找到很詳細(xì)的介紹全橋的拓?fù)湟约肮ぷ髟斫榻B,于是打算自己在學(xué)習(xí)過程中
    的頭像 發(fā)表于 02-12 11:03 ?2703次閱讀
    <b class='flag-5'>半</b>橋LLC諧振電路的工作原理與模態(tài)分析

    時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

    【導(dǎo)讀】最近,香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了一篇時(shí)間序列無監(jiān)督預(yù)訓(xùn)練的文章,相比原來的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作,核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段,即在預(yù)訓(xùn)練階段
    的頭像 發(fā)表于 11-15 11:41 ?677次閱讀
    時(shí)空引導(dǎo)下的時(shí)間序列自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

    曙光公司成都云中心助力提升監(jiān)督質(zhì)效

    數(shù)字化時(shí)代,用好大數(shù)據(jù),推動(dòng)數(shù)字技術(shù)深度融入紀(jì)檢監(jiān)察各項(xiàng)業(yè)務(wù),是大勢(shì)所趨。當(dāng)前,各地正在探索推進(jìn)大數(shù)據(jù)監(jiān)督,借助海量數(shù)據(jù)、算力、算法,不斷延伸監(jiān)督的觸角,拓展發(fā)現(xiàn)問題的渠道。以“算力”補(bǔ)“人力”,“人去看”加“云端算”,大數(shù)據(jù)在類案分析、預(yù)警糾治、溯源治理等方面,正發(fā)揮越
    的頭像 發(fā)表于 11-05 10:05 ?498次閱讀

    加器和全加器的功能特點(diǎn)

    加器和全加器是數(shù)字電路中的基本組件,用于執(zhí)行二進(jìn)制數(shù)的加法運(yùn)算。它們?cè)谟?jì)算機(jī)、微處理器和其他數(shù)字系統(tǒng)中扮演著重要角色。 加器的功能特點(diǎn) 加器是一種簡(jiǎn)單的數(shù)字電路,它能夠?qū)崿F(xiàn)兩個(gè)一位二進(jìn)制數(shù)
    的頭像 發(fā)表于 10-18 11:10 ?3436次閱讀

    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    近日,哈爾濱工業(yè)大學(xué)儀器學(xué)院先進(jìn)光電成像技術(shù)研究室(IPIC)李浩宇教授團(tuán)隊(duì)在生物醫(yī)學(xué)超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展。針對(duì)目前活體細(xì)胞超分辨成像領(lǐng)域中光子效率不足的難題,團(tuán)隊(duì)提出一種基于無監(jiān)督學(xué)習(xí)
    的頭像 發(fā)表于 09-27 06:33 ?504次閱讀
    哈爾濱工業(yè)大學(xué)在超分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    電容補(bǔ)償和全補(bǔ)償?shù)膮^(qū)別

    電容補(bǔ)償和全補(bǔ)償是兩種不同的無功補(bǔ)償方式,主要區(qū)別在于補(bǔ)償?shù)某潭群托ЧR韵率撬鼈兊木唧w區(qū)別: 1、補(bǔ)償程度 : 補(bǔ)償 :電容補(bǔ)償只補(bǔ)償一部分無功功率。通常設(shè)計(jì)為補(bǔ)償?shù)焦β室驍?shù)達(dá)到0.9左右
    的頭像 發(fā)表于 08-14 14:08 ?1602次閱讀
    電容<b class='flag-5'>半</b>補(bǔ)償和全補(bǔ)償?shù)膮^(qū)別

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語法結(jié)構(gòu)的學(xué)習(xí),還包括對(duì)語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監(jiān)督學(xué)習(xí):模型采用自監(jiān)督學(xué)習(xí)策略,在大量無標(biāo)簽文本數(shù)據(jù)上學(xué)習(xí)
    發(fā)表于 08-02 11:03

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    章節(jié)最后總結(jié)了機(jī)器學(xué)習(xí)的分類:有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)、自監(jiān)督學(xué)習(xí)和強(qiáng)化
    發(fā)表于 07-25 14:33

    旗晟機(jī)器人人員行為監(jiān)督AI智慧算法

    ,以實(shí)現(xiàn)對(duì)工業(yè)場(chǎng)景巡檢運(yùn)維的高效化目標(biāo)。那么,下面我們來談?wù)勂礻蓹C(jī)器人AI智慧算法之一——人員行為監(jiān)督AI智慧算法。 旗晟人員行為監(jiān)督AI智慧算法是通過各類采集設(shè)備與AI服務(wù)器,結(jié)合行業(yè)大數(shù)據(jù)庫(kù)積累以及自研AI深度學(xué)習(xí)算法模
    的頭像 發(fā)表于 07-24 17:05 ?484次閱讀
    旗晟機(jī)器人人員行為<b class='flag-5'>監(jiān)督</b>AI智慧算法

    三位和四位萬用表的區(qū)別

    三位和四位萬用表是電子測(cè)量領(lǐng)域中常用的兩種數(shù)字萬用表,它們?cè)跍y(cè)量精度、顯示方式、應(yīng)用范圍等方面存在一定的差異。本文將從多個(gè)方面詳細(xì)分析這兩種萬用表的區(qū)別。 一、基本概念 三位萬用表 三位
    的頭像 發(fā)表于 07-14 14:23 ?9447次閱讀

    神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,其訓(xùn)練方式多樣,其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模式或規(guī)律,從而提取有用的特征表示。這種訓(xùn)練方式對(duì)于大規(guī)模未
    的頭像 發(fā)表于 07-09 18:06 ?1395次閱讀

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實(shí)現(xiàn)。因此,無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法,包括自編碼器、生成對(duì)抗網(wǎng)絡(luò)、聚類算法等,并分析它們的原理、應(yīng)用場(chǎng)景以及優(yōu)
    的頭像 發(fā)表于 07-09 10:50 ?1586次閱讀

    前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和常見激活函數(shù)

    和激活函數(shù)的非線性變換,能夠學(xué)習(xí)和模擬復(fù)雜的函數(shù)映射,從而解決各種監(jiān)督學(xué)習(xí)任務(wù)。本文將詳細(xì)闡述前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),包括其組成層、權(quán)重和偏置、激活函數(shù)等,并介紹幾種常見的激活函數(shù)及其特性。
    的頭像 發(fā)表于 07-09 10:31 ?1726次閱讀

    基于FPGA的類腦計(jì)算平臺(tái) —PYNQ 集群的無監(jiān)督圖像識(shí)別類腦計(jì)算系統(tǒng)

    STDP 無監(jiān)督學(xué)習(xí)算法,可運(yùn)用于圖像的 無監(jiān)督分類。 從平臺(tái)設(shè)計(jì)角度: (1)本設(shè)計(jì)搭建的基于 PYNQ 集群的通用低功耗的大規(guī)模類腦計(jì)算平臺(tái),搭載 PYNN,NEST 等通用 SNN
    發(fā)表于 06-25 18:35
    主站蜘蛛池模板: 亚洲 欧美 日韩 在线 中文字幕 | 黄色国产网站 | 欧美极品第一页 | 免费一级特黄特色大片在线 | 天天干天天爱天天射 | 深爱五月激情 | 欧美成网 | 亚洲国产综合人成综合网站00 | 国产大片免费观看资源 | 欧美人与动性xxxxbbbb | 天堂最新版在线地址 | 国模沟沟一区二区三区 | 欧美成人性色区 | 国产视频黄色 | 国产精品久久精品牛牛影视 | 色涩在线| 日本媚薬痉挛在线观看免费 | 午夜在线观看免费高清在线播放 | 国产成人综合日韩精品婷婷九月 | 黄色免费毛片 | 狼狼鲁狼狼色 | 黄 色 录像成 人播放免费99网 | 交在线观看网站视频 | 精品看片 | 国产网站在线免费观看 | 成人久久网站 | 黄色大片播放 | 国产高清免费在线 | 精品成人在线观看 | 天天夜约| 伊人久久大 | 一级特黄aaa大片在线观看 | 亚洲综合亚洲综合网成人 | 日本wwwwwwwww| 狠狠干综合 | 亚洲区| 免费一级特黄特色大片在线观看 | 黄色天堂 | 综合7799亚洲伊人爱爱网 | www.亚洲一区 | 天天摸天天碰天天碰 |