已完本玄幻小说排行榜,完美世界辰东,小说

眾所周知，對抗訓(xùn)練生成模型（GAN）在圖像生成領(lǐng)域獲得了不凡的效果。盡管基于GAN的無監(jiān)督學(xué)習(xí)方法取得了初步成果，但很快被自監(jiān)督學(xué)習(xí)方法所取代。

DeepMind近日發(fā)布了一篇論文《Large Scale Adversarial Representation Learning》（大規(guī)模對抗性表示學(xué)習(xí)），提出了無監(jiān)督表示學(xué)習(xí)新模型BigBiGAN。

致力于將圖像生成質(zhì)量的提升轉(zhuǎn)化為表征學(xué)習(xí)性能的提高，基于BigGAN模型的基礎(chǔ)上提出了BigBiGAN，通過添加編碼器和修改鑒別器將其擴(kuò)展到圖像學(xué)習(xí)。作者評估了BigBiGAN模型的表征學(xué)習(xí)能力和圖像生成功能，證明在ImageNet上的無監(jiān)督表征學(xué)習(xí)以及無條件圖像生成，該模型達(dá)到了目前的最佳性能。

論文發(fā)布后，諸多AI大牛轉(zhuǎn)發(fā)并給出了評價。

“GAN之父”Ian Goodfellow表示這很酷，在他讀博士期間，就把樣本生成雙產(chǎn)物的表示學(xué)習(xí)感興趣，而不是樣本生成本身。

特斯拉AI負(fù)責(zé)人Andrej Karpathy則表示，自我監(jiān)督的學(xué)習(xí)是一個非常豐富的領(lǐng)域(但需要比ImageNet提供更高的密度和結(jié)構(gòu))，這將避免大規(guī)模數(shù)據(jù)集的當(dāng)前必要性(或在RL中推出)。

1、介紹

近年來，圖像生成模型快速發(fā)展。雖然這些模型以前僅限于具有單?；蚨嗄５慕Y(jié)構(gòu)域，生成的圖像結(jié)構(gòu)簡單，分辨率低，但隨著模型和硬件的發(fā)展，已有生成復(fù)雜、多模態(tài)，高分辨率圖像的能力。

圖1 BigBiGAN框架框圖

聯(lián)合鑒別器，輸入是數(shù)據(jù)潛在對，

，從數(shù)據(jù)分布Px和編碼器輸出中采樣，或

從生成器輸出和潛在分布Pz中采樣。損失包括一元數(shù)據(jù)項和一元潛在項，以及將數(shù)據(jù)和潛在分布聯(lián)系起來的聯(lián)合項。

通過BiGAN或ALI框架學(xué)習(xí)的編碼器，是ImageNet上用于下游任務(wù)的可視化表示學(xué)習(xí)的有效手段。然而，該方法使用了DCGAN樣式生成器，無法在該數(shù)據(jù)集上生成高質(zhì)量圖像，因此編碼器可以建模的語義非常有限。作者基于該方法，使用BigGAN作為生成器，能夠捕獲ImageNet圖像中存在的多模態(tài)和出現(xiàn)的大部分結(jié)構(gòu)?？傮w而言，本文的貢獻(xiàn)如下：

（1）在ImageNet上，BigBiGAN（帶BigGAN的BiGAN生成器）匹配無監(jiān)督表征學(xué)習(xí)的最新技術(shù)水平

（2）為BigBiGAN提出了一個穩(wěn)定版本的聯(lián)合鑒別器

（3）對模型設(shè)計選擇進(jìn)行了全面的實(shí)證分析和消融實(shí)驗(yàn)

（4）表征學(xué)習(xí)目標(biāo)還有助于無條件圖像生成，并展示無條件ImageNet生成的最新結(jié)果

2、BigBiGAN

BiGAN、ALI方法作為GAN框架的擴(kuò)展，能夠?qū)W習(xí)可以用作推理模型或特征表示的編碼器。給定數(shù)據(jù)項x的分布Px（例如，圖像）和潛在項z的分布Pz（通常是像各向同性高斯N（0;I）的簡單連續(xù)分布），生成器模擬條件概率分布

，給定潛在項z后數(shù)據(jù)項x的概率值，如標(biāo)準(zhǔn)GAN生成器。編碼器對逆條件分布

進(jìn)行建模，預(yù)測給定數(shù)據(jù)項x的情況下，潛在項z的概率值。

除了添加之外，BiGAN框架中對GAN的另一種修改是聯(lián)合鑒別器 - 潛在項對（x，z）（而不僅僅是標(biāo)準(zhǔn)GAN中的數(shù)據(jù)項x），并且學(xué)習(xí)區(qū)分?jǐn)?shù)據(jù)分布和編碼器對，生成器和潛在分布。具體地說，它的輸入對是

和

，和的目標(biāo)是“欺騙”鑒別器，使得被采樣的兩個聯(lián)合概率分布和難以區(qū)分。GAN框架的目標(biāo)，定義如下：

在這個目標(biāo)下，在最優(yōu)和最小化聯(lián)合分布和之間的Jensen-Shannon散度，因此在全局最優(yōu)時，兩個聯(lián)合分布

匹配。此外，在和是確定性函數(shù)的情況下（即，學(xué)習(xí)條件分布

和

是Dirac δ函數(shù)），這兩個函數(shù)是全局最優(yōu)的逆：例如

，最佳聯(lián)合鑒別器有效地對x和z施加重建成本。

具體地，鑒別器損失值

其中

優(yōu)化和參數(shù)

3、評估

作者在未標(biāo)記的ImageNet上訓(xùn)練BigBiGAN，固定其表征學(xué)習(xí)結(jié)果，然后在其輸出上訓(xùn)練線性分類器，使用所有訓(xùn)練集標(biāo)簽進(jìn)行全面監(jiān)督學(xué)習(xí)。作者還測量圖像生成性能，其中

IS）和

FID）作為標(biāo)準(zhǔn)指標(biāo)。

3.1 消融

作者先評估了多種模型，見表1。作者使用不同的種子對每個變體進(jìn)行三次運(yùn)行并記錄每個度量的平均值和標(biāo)準(zhǔn)差。

潛在分布隨機(jī)值：

，其中在給定和線性輸出的情況下，預(yù)測

一元損失：

評估刪除損失函數(shù)的一元項影響。只有z一元項和沒有一元項的IS和FID性能要比只有x一元項和兩者都有的性能差，結(jié)果表明x一元項對生成性能有很大的正面影響。

生成器容量：

為了證明生成器在表征學(xué)習(xí)中的重要性，作者改變生成器的容量觀察對結(jié)果的影響。實(shí)驗(yàn)結(jié)果表明，好的圖像生成器模型能提高表征學(xué)習(xí)能力。

帶有不同分辨率的的高分辨率：

使用更高的分辨率，盡管的分辨率相同，但是生成結(jié)果顯著改善（尤其是通過FID）。

結(jié)構(gòu)：

使用不同結(jié)構(gòu)的評估性能，結(jié)果表明網(wǎng)絡(luò)寬度增加，性能會得到提升。

解耦優(yōu)化：

將優(yōu)化器與的優(yōu)化器分離，并發(fā)現(xiàn)簡單地使用10倍的E學(xué)習(xí)速率可以顯著加速訓(xùn)練并改善最終表征學(xué)習(xí)結(jié)果。

3.2與已有方法比較

表征學(xué)習(xí)

表1：BigBiGAN變體的結(jié)果

在生成圖像的IS和FID中，以及ImageNet top-1分類準(zhǔn)確率，根據(jù)從訓(xùn)練集中隨機(jī)抽樣的10K圖像的分割計算，稱為Train分裂。每行中基本設(shè)置的更改用藍(lán)色突出顯示。具有誤差范圍的結(jié)果（寫為“μ±σ”）是具有不同隨機(jī)種子的三次運(yùn)行的平均值和標(biāo)準(zhǔn)偏差。

表2：使用監(jiān)督邏輯回歸分類器對官方ImageNet驗(yàn)證集上的BigBiGAN模型與最近競爭方法的比較

基于10K訓(xùn)練集圖像的trainval子集的最高精度，選擇BigBiGAN結(jié)果并提前停止。ResNet-50結(jié)果對應(yīng)于表1中的行ResNet（“ELR”），RevNet-50×4對應(yīng)于RevNet×4（“ELR”）

表3：無監(jiān)督（無條件）生成的BigBiGAN與已有的無監(jiān)督BigGAN的比較結(jié)果

作者將“偽標(biāo)簽”方法指定為SL（單標(biāo)簽）或聚類。為了進(jìn)行比較，訓(xùn)練BigBiGAN的步數(shù)（500K）與基于BigGAN的方法相同，但也可以在最后一行中對1M步驟進(jìn)行額外訓(xùn)練，并觀察其變化。上述所有結(jié)果均包括中值m以及三次運(yùn)行的平均μ和標(biāo)準(zhǔn)偏差σ，表示為“m（μ±σ）”。BigBiGAN的結(jié)果由最佳FID與Train的停止決定的。

無監(jiān)督圖像生成

圖2：從無監(jiān)督的BigBiGAN模型中選擇的重建

上圖2中第一行表示真實(shí)數(shù)據(jù)x~Px；第二行表示由

3.3 重建

BiGAN E和G通過計算編碼器預(yù)測的潛在表示E(x)，然后將預(yù)測的潛在表示傳回生成器，得到重建的G(E(x))，從而重構(gòu)數(shù)據(jù)實(shí)例x。我們在圖2中展示了BigBiGAN重構(gòu)。這些重構(gòu)遠(yuǎn)非有像素級的完美度，部分原因可能是目標(biāo)并沒有明確強(qiáng)制執(zhí)行重構(gòu)成本，甚至在訓(xùn)練時也沒有計算重構(gòu)。然而，它們可能為編碼器學(xué)習(xí)建模的特性提供一些直觀的認(rèn)識。例如，當(dāng)輸入圖像包含一條狗、一個人或一種食物時，重建通常是相同“類別”的不同實(shí)例，具有相似的姿勢、位置和紋理。這些重構(gòu)傾向于保留輸入的高級語義，而不是低級細(xì)節(jié)，這表明BigBiGAN訓(xùn)練鼓勵編碼器對前者建模，而不是后者。

4、相關(guān)研究

基于自我監(jiān)督圖像中的無監(jiān)督表示學(xué)習(xí)的許多方法被證明是非常成功的。自我監(jiān)督通常涉及從以某種方式設(shè)計成類似于監(jiān)督學(xué)習(xí)的任務(wù)中學(xué)習(xí)，但是其中“標(biāo)簽”可以自動地從數(shù)據(jù)本身創(chuàng)建而無需人工操作。早期的例子是相對位置預(yù)測，其中模型在輸入的圖像塊對上進(jìn)行訓(xùn)練并預(yù)測它們的相對位置。

對比預(yù)測編碼（CPC）是最近的相關(guān)方法，其中，給定圖像補(bǔ)丁，模型預(yù)測哪些補(bǔ)丁出現(xiàn)在其他圖像位置中。其他方法包括著色、運(yùn)動分割、旋轉(zhuǎn)預(yù)測和樣本匹配。

對這些方法進(jìn)行了嚴(yán)格的實(shí)證比較。相對于大多數(shù)自我監(jiān)督的方法，BigBiGAN和基于生成模型的其他方法的關(guān)鍵優(yōu)勢是它們的輸入可能是全分辨率圖像或其他信號，不需要裁剪或修改所需的數(shù)據(jù)。這意味著結(jié)果表示通?？梢灾苯討?yīng)用于下游任務(wù)中的完整數(shù)據(jù)，而不會發(fā)生域移位（domain shift）。

還提出了許多相關(guān)的自動編碼器和GAN變體。關(guān)聯(lián)壓縮網(wǎng)絡(luò)（ACN）學(xué)會通過調(diào)節(jié)其他先前在代碼空間中相似的傳輸數(shù)據(jù)的數(shù)據(jù)來壓縮數(shù)據(jù)集級別，從而產(chǎn)生可以“模糊”語義相似樣本的模型，類似于BigBiGAN重建。VQ-VAE 將離散（矢量量化）編碼器與自回歸解碼器配對，以產(chǎn)生具有高壓縮因子的忠實(shí)重建，并在強(qiáng)化學(xué)習(xí)設(shè)置中展示表示學(xué)習(xí)結(jié)果。在對抗性空間中，對抗性自動編碼器提出了一種自動編碼器式編碼器 - 解碼器對，用像素級重建成本訓(xùn)練，用鑒別器代替VAE中使用的先驗(yàn)的KL-發(fā)散正則化。

在另一個提出的VAE-GAN混合中，在大多數(shù)VAE中使用的像素空間重建誤差被替換為距GAN鑒別器的中間層的特征空間距離。AGE和α-GAN等其他混合方法增加了編碼器來穩(wěn)定GAN訓(xùn)練。這些方法與BiGAN框架間的一個區(qū)別是，BiGAN不會以明確的重建成本訓(xùn)練編碼器，雖然可以證明BiGAN隱含地使重建成本最小化，但定性重建結(jié)果表明這種重建成本具有不同的風(fēng)格，強(qiáng)調(diào)了像素級細(xì)節(jié)上的高級語義。

5.探討

我們已經(jīng)證明，BigBiGAN是一種純粹基于生成模型的無監(jiān)督學(xué)習(xí)方法，它在ImageNet上實(shí)現(xiàn)了圖像表示學(xué)習(xí)的最好的結(jié)果。我們的消融實(shí)驗(yàn)進(jìn)一步證實(shí)強(qiáng)大的生成模型可以有利于表征學(xué)習(xí)，反過來，學(xué)習(xí)推理模型可以改善大規(guī)模的生成模型。在未來，我們希望表示學(xué)習(xí)可以繼續(xù)受益于生成模型和推理模型的進(jìn)一步發(fā)展，同時擴(kuò)展到更大的圖像數(shù)據(jù)庫。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

GaN

GaN

+關(guān)注

關(guān)注
19

文章
1967

瀏覽量
74369
無監(jiān)督學(xué)習(xí)

無監(jiān)督學(xué)習(xí)

+關(guān)注

關(guān)注
1

文章
16

瀏覽量
2775

原文標(biāo)題：BigBiGAN問世，“GAN父”都說酷的無監(jiān)督表示學(xué)習(xí)模型有多優(yōu)秀？

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

時空引導(dǎo)下的時間序列自監(jiān)督學(xué)習(xí)框架

【導(dǎo)讀】最近，香港科技大學(xué)、上海AI Lab等多個組織聯(lián)合發(fā)布了一篇時間序列無監(jiān)督預(yù)訓(xùn)練的文章，相比原來的TS2Vec等時間序列表示學(xué)習(xí)工作，核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段，

發(fā)表于 11-15 11:41 ?343次閱讀

時空引導(dǎo)下的時間序列自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>框架

AI大模型與深度學(xué)習(xí)的關(guān)系

AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系，它們互為促進(jìn)，相輔相成。以下是對兩者關(guān)系的介紹：一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐：深度學(xué)習(xí)

發(fā)表于 10-23 15:25 ?1389次閱讀

java子類可以繼承父類的什么

Java是一種面向?qū)ο蟮木幊陶Z言，它支持繼承的概念。繼承是面向?qū)ο缶幊痰娜筇匦灾?，它允許一個類（稱為子類或派生類）繼承另一個類（稱為父類或基類）的屬性和方法。在Java中，子類可以繼承父類

發(fā)表于 08-20 11:02 ?1434次閱讀

【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識學(xué)習(xí)

收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語法結(jié)構(gòu)的學(xué)習(xí)，還包括對語言的深層次理解，如文化背景、語境含義和情感色彩等。自監(jiān)督學(xué)習(xí)：模型采用自監(jiān)督學(xué)習(xí)策略，在大量

發(fā)表于 08-02 11:03

【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

章節(jié)最后總結(jié)了機(jī)器學(xué)習(xí)的分類：有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、自

發(fā)表于 07-25 14:33

神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分，其訓(xùn)練方式多樣，其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模

發(fā)表于 07-09 18:06 ?919次閱讀

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的一個重要分支，近年來在多個領(lǐng)域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領(lǐng)域。然而，深度學(xué)習(xí)模型的強(qiáng)大性能往往依賴于大量

發(fā)表于 07-09 10:50 ?984次閱讀

基于FPGA的類腦計算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計算系統(tǒng)

STDP 無監(jiān)督學(xué)習(xí)算法，可運(yùn)用于圖像的無監(jiān)督分類。從平臺設(shè)計角度： (1)本設(shè)計搭建的基于 PYNQ 集群的通用低功耗的大規(guī)模類腦計算平臺，搭載 PYNN，NEST 等

發(fā)表于 06-25 18:35

大語言模型：原理與工程時間+小白初識大語言模型

開拓深度學(xué)習(xí)的思路。對于新涌現(xiàn)的大語言模型的能力，主要是表現(xiàn)在學(xué)習(xí)能力的提升、語言理解和生成能力、創(chuàng)新和探索的能力。基礎(chǔ)技術(shù) 詞表示技術(shù) 詞表示

發(fā)表于 05-12 23:57

這個是不是表示沒有仿真模型啊

先上圖這個是不是表示沒有仿真模型啊？哪個版本有ds12c887的仿真模型?。恐x謝！

發(fā)表于 05-12 22:17

【大語言模型：原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

概率推斷，利用共現(xiàn)矩陣學(xué)習(xí)每個詞的主題分布，進(jìn)而將其作為詞的表示向量。在大規(guī)模語料庫中進(jìn)行模型訓(xùn)練，使語義相似的詞具有相似的主題分布。然而，這類方法存在一個問題，即模型一旦訓(xùn)練完成，詞

發(fā)表于 05-05 12:17

【大語言模型：原理與工程實(shí)踐】揭開大語言模型的面紗

Transformer架構(gòu)，利用自注意力機(jī)制對文本進(jìn)行編碼，通過預(yù)訓(xùn)練、有監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)等階段，不斷提升性能，展現(xiàn)出強(qiáng)大的語言理解和生成能力。大語言模型的涌現(xiàn)能力，是指隨著

發(fā)表于 05-04 23:55

跟優(yōu)秀的人，學(xué)習(xí)記筆記！文末有看海的點(diǎn)評

放秘籍》-儀表放大器專項的優(yōu)秀學(xué)習(xí)筆記，說實(shí)話，我看了后感覺非常驚艷，簡約美觀，一目了然，部分筆記截圖如下，作者：冰朔咱們看上面的學(xué)習(xí)筆記，他有幾個非常贊的優(yōu)點(diǎn)：對于一些概念，沒

發(fā)表于 03-22 18:19 ?1247次閱讀

名單公布！【書籍評測活動NO.30】大規(guī)模語言模型：從理論到實(shí)踐

個文本質(zhì)量對比模型，用于對有監(jiān)督微調(diào)模型對于同一個提示詞給出的多個不同輸出結(jié)果進(jìn)行質(zhì)量排序。這一階段的難點(diǎn)在于如何限定獎勵模型的應(yīng)用范圍及如

發(fā)表于 03-11 15:16

Meta發(fā)布新型無監(jiān)督視頻預(yù)測模型“V-JEPA”

Meta，這家社交媒體和科技巨頭，近日宣布推出一種新型的無監(jiān)督視頻預(yù)測模型，名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注，因?yàn)樗ㄟ^抽象性預(yù)測生成視頻中缺失或模糊的部分來

發(fā)表于 02-19 11:19 ?1093次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

BigBiGAN問世,“GAN父”都說酷的無監(jiān)督表示學(xué)習(xí)模型有多優(yōu)秀?

評論

時空引導(dǎo)下的時間序列自監(jiān)督學(xué)習(xí)框架

AI大模型與深度學(xué)習(xí)的關(guān)系

java子類可以繼承父類的什么

【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識學(xué)習(xí)

【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

基于FPGA的類腦計算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計算系統(tǒng)

大語言模型：原理與工程時間+小白初識大語言模型

這個是不是表示沒有仿真模型啊

【大語言模型：原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

【大語言模型：原理與工程實(shí)踐】揭開大語言模型的面紗

跟優(yōu)秀的人，學(xué)習(xí)記筆記！文末有看海的點(diǎn)評

名單公布！【書籍評測活動NO.30】大規(guī)模語言模型：從理論到實(shí)踐

Meta發(fā)布新型無監(jiān)督視頻預(yù)測模型“V-JEPA”