在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦打造“以一當十”的GAN:僅用10%標記數據,生成圖像卻更逼真

DPVg_AI_era ? 來源:YXQ ? 2019-03-22 08:53 ? 次閱讀

近日,谷歌大腦研究人員提出了一種基于自監督和半監督學習的“條件GAN”,使用的標記數據量大降90%,生成圖像的質量比現有全監督最優模型BigGAN高出20%(以FID得分計),有望緩解圖像生成和識別領域標記數據量嚴重不足的問題。

生成對抗網絡(GAN)是一類強大的深度生成模型。GAN背后的主要思想是訓練兩個神經網絡:生成器負責學習如何合成數據,而判別器負責學習如何區分真實數據與生成器合成的虛假數據。目前,GAN已成功用于高保真自然圖像合成,改善學習圖像壓縮質量,以及數據增強等任務。

對于自然圖像合成任務來說,現有的最優結果是通過條件GAN實現的。與無條件GAN不同,條件GAN在訓練期間要使用標簽(比如汽車,狗等)。雖然數據標記讓圖像合成任務變得更容易實現,在性能上獲得了顯著提升,但是這種方法需要大量標記數據,而在實際任務中很少有大量標記數據可用。

隨著ImageNet上訓練過程的持續,生成的圖像逼真度進步明顯

谷歌大腦的研究人員在最近的《用更少的數據標簽生成高保真圖像》中,提出了一種新方法來減少訓練最先進條件GAN所需的標記數據量。文章提出結合大規模GAN的最新進展,將高保真自然圖像合成技術與最先進技術相結合,使數據標記數量減少到原來的10%。

在此基礎上,研究人員還發布了Compare GAN庫的重大更新,其中包含了訓練和評估現代GAN所需的所有組件。

利用半監督和自監督方式提升預測性能

條件GAN與基線BigGAN的FID分數對比,圖中黑色豎線為BigGAN基線模型(使用全部標記數據)得分。S3GAN在僅使用10%標記數據的情況下,得分比基線模型最優得分高20%

在條件GAN中,生成器和判別器通常都以分類標簽為應用條件。現在,研究人員建議使用推斷得出的數據標簽,來替換手工標記的真實標簽。

上行:BigGAN全監督式學習生成的128×128像素最優圖像樣本。下行為S3GAN生成的圖像樣本,標記數據量降低了90%,FID得分與BigGAN表現相當

為了推斷大型數據集中多數未標記數據的高質量標簽,可以采取兩步方法:首先,僅使用數據集的未標記部分來學習特征表示。

為了學習特征表示,需要利用新方法,以不同的方法利用自我監督機制:將未標記的圖像進行隨機旋轉,由深度卷積神經網絡負責預測旋轉角度。這背后的思路是,模型需要能夠識別主要對象及其形狀,才能在此類任務中獲得成功。

對一幅未標記的圖像進行隨機旋轉,網絡的任務是預測旋轉角度。成功的模型需要捕捉有意義的語義圖像特征,這些特征可用于完成其他視覺任務

研究人員將訓練網絡的一個中間層的激活模式視為輸入的新特征表示,并訓練分類器,以使用原始數據集的標記部分識別該輸入的標簽。由于網絡經過預訓練,可以從數據中提取具有語義意義的特征,因此,訓練此分類器比從頭開始訓練整個網絡更具樣本效率。最后使用分類器對未標記的數據進行標記。

為了進一步提高模型質量和訓練的穩定性,最好讓判別器網絡學習有意義的特征表示。通過這些改進手段,在加上大規模的訓練,使得新的條件GAN在ImageNet圖像合成任務上達到了最優性能。

給定潛在向量,由生成器網絡生成圖像。在每行中,最左側和最右側圖像的潛在代碼之間的線性插值導致圖像空間中的語義插值

CompareGAN:用于訓練和評估GAN的庫

對GAN的前沿研究在很大程度上依賴于經過精心設計和測試的代碼庫,即使只是復制或再現先前的結果和技術,也需要付出巨大努力。

為了促進開放科學并讓研究界從最近的進步中獲益,研究人員發布了Compare GAN庫的重大更新。該庫包括現代GAN中常用的損失函數,正則化和歸一化方案,神經架構和量化指標,現已支持:

GPU和TPU訓練

通過Gin進行輕量級配置(含實例)

通過TensorFlow數據集庫提供大量數據集

未來方向:自監督學習會讓GAN更強大

由于標記數據源和未標記數據源之間的差距越來越大,讓模型具備從部分標記的數據中學習的能力變得越來越重要。

目前來看,自監督學習和半監督學習的簡單而有力的結合,有助于縮小GAN的這一現實差距。自監督是一個值得研究的領域,值得在該領域開展面向其他生成建模任務的研究。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6221

    瀏覽量

    107375
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2165

    瀏覽量

    76026

原文標題:谷歌大腦打造“以一當十”的GAN:僅用10%標記數據,生成圖像卻更逼真

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    技術分享 | 高逼真合成數據助力智駕“看得更準、學得更快”

    自動駕駛研發如何高效獲取海量訓練數據?高逼真合成數據技術正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數據。文章詳解如何構建符
    的頭像 發表于 04-29 10:47 ?948次閱讀
    技術分享 | 高<b class='flag-5'>逼真</b>合成<b class='flag-5'>數據</b>助力智駕“看得更準、學得更快”

    如何使用離線工具od SPSDK生成完整圖像

    SDSDK)會生成個缺少前 4KB 的文件。 這些將由 flashloader 直接在目標上填充,使用將要傳達給它的參數,對吧? 我需要離線工作。我需要生成個 “完整
    發表于 03-28 06:51

    使用DLPC350投射格雷碼時,切換pattern頻率&gt;10frame/s,出現了圖像重疊的問題怎么解決?

    你好,我在使用DLPC350 投射格雷碼(8bit深度)時, 切換pattern頻率 &gt; 10frame/s,出現了圖像錯誤或者說 圖像重疊的問題: 從
    發表于 02-21 16:03

    管廊、排澇、路燈接入數據中臺助力打造“智慧城市大腦

    問題,往往不能快速高效形成對城市宏觀層面的科學決策,嚴重制約城市智慧化發展步伐。 通過將管廊、排澇、路燈等系統接入數據中臺,無疑是打造“智慧城市大腦”的重要環。這
    的頭像 發表于 01-20 17:25 ?292次閱讀
    管廊、排澇、路燈接入<b class='flag-5'>數據</b>中臺助力<b class='flag-5'>打造</b>“智慧城市<b class='flag-5'>大腦</b>”

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3 模型根據這些提示生成高質量的圖像
    的頭像 發表于 01-03 10:38 ?777次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型<b class='flag-5'>生成</b>高質量<b class='flag-5'>圖像</b>

    谷歌:超四分之新代碼由人工智能生成

    10月30日最新消息顯示,谷歌正積極投身于系列人工智能產品的開發中,并且在其構建過程中,人工智能也扮演著舉足輕重的角色。谷歌首席執行官桑達爾?皮查伊在公司2024年第三季度財報電話會
    的頭像 發表于 10-30 15:13 ?651次閱讀

    霍尼韋爾攜手谷歌云,在工業領域引入生成式AI Gemini

    10月21日新聞,霍尼韋爾(Honeywell)攜手谷歌云(Google Cloud)達成合作,旨在將生成式人工智能Gemini引入工業領域,共同推動工業智能化進程。
    的頭像 發表于 10-23 14:20 ?581次閱讀

    高通與谷歌達成多年技術合作,共推汽車行業數字化轉型

    北京時間10月23日,高通技術公司宣布與谷歌達成項為期多年的技術合作,旨在加速c行業的數字化轉型。   基于雙方長期的合作關系,高通和谷歌將共同利用驍龍數字底盤、Android
    的頭像 發表于 10-23 11:53 ?1340次閱讀

    沃達豐與谷歌深化年戰略合作

    沃達豐近日宣布,其與全球科技巨頭谷歌的戰略合作伙伴關系得到了進步深化。這為期年的協議,總價值超過10億美元,旨在將
    的頭像 發表于 10-09 16:22 ?448次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的發布標志著AI圖像創作領域邁入了
    的頭像 發表于 08-30 16:23 ?1455次閱讀

    深入理解渲染引擎:打造逼真圖像的關鍵

    在數字世界中,圖像渲染是創造逼真視覺效果的核心技術。渲染引擎,作為這過程中的關鍵組件,負責將二維或三維的模型、紋理、光照等數據轉化為人們肉眼可見的二維
    的頭像 發表于 06-29 08:28 ?552次閱讀
    深入理解渲染引擎:<b class='flag-5'>打造</b><b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關鍵

    谷歌和Meta希望與好萊塢合作獲得授權內容

    據知情人士透露,谷歌母公司Alphabet和Meta正與好萊塢主要電影公司洽談,旨在獲得電影IP的授權,用于其人工智能視頻生成軟件。這兩家科技巨頭正積極開發新技術,能夠根據文本提示創建逼真的場景。
    的頭像 發表于 05-27 09:52 ?523次閱讀

    慧視SpeedDP大模型打造圖像標注新時代

    在人工智能時代,圖像標注不僅能夠反哺AI的發展,還能進步降低項目成本。傳統的圖像標注需要人工采用文本或者相應工具機械式的進行圖像標簽分配,例如谷歌
    的頭像 發表于 05-24 08:29 ?875次閱讀
    慧視SpeedDP大模型<b class='flag-5'>打造</b><b class='flag-5'>圖像</b>標注新時代

    谷歌追加10億歐元推動歐洲AI業務增長

    谷歌近日宣布,將向其芬蘭數據中心園區追加投資10億歐元,旨在擴大園區規模,進步推動歐洲AI業務增長。此舉反映了谷歌對北歐地區,特別是芬蘭作
    的頭像 發表于 05-23 14:09 ?536次閱讀

    榮耀新品將搭載谷歌AI功能,提升生成式AI體驗

    榮耀于5月22日宣布,將在新款智能手機上集成谷歌的AI功能,實現生成式AI體驗。此外,新機還將得到谷歌云服務的支持。
    的頭像 發表于 05-23 08:51 ?696次閱讀
    主站蜘蛛池模板: aaa在线| 亚洲 另类色区 欧美日韩 | 老司机深夜影院入口aaaa | 欧美色图28p | 正在播放91大神调教偷偷 | 99精品久久久久久久婷婷 | 婷婷六月久久综合丁香一二 | 国产三级在线免费 | 国产精品第九页 | 好紧好爽太大了h视频 | 色网站免费视频 | 中文字幕在线观看一区二区三区 | 免费在线观看黄 | 久久久综合色 | 欲香欲色天天综合和网 | 图片区网友自拍另类图区 | 美女黄色一级毛片 | ssswww日本免费网站片 | 丁香六月五月婷婷 | 免费簧片视频 | 国产女人又爽又大 | 亚洲综合久久综合激情久久 | 免费播放特黄特色毛片 | jk黑色丝袜美腿老师啪啪 | 欧美日韩视频综合一区无弹窗 | 黄视频网站免费观看 | 全部免费特黄特色大片视频 | 日本黄色大片网站 | 啪啪激情综合 | 激情综合婷婷 | 精品国内一区二区三区免费视频 | 羞羞答答xxdd影院欧美 | 夜夜艹天天干 | 亚洲免费视频在线观看 | 美女视频一区二区 | 亚洲综合精品成人啪啪 | 国产在线精品一区免费香蕉 | 东北老女人啪啪对白 | 日韩欧美亚洲综合久久影院d3 | 免费一级e一片在线播放 | 97久草 |