在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達再出黑魔法GauGAN:憑借幾根線條,草圖秒變風景照

DPVg_AI_era ? 來源:lp ? 2019-05-01 09:10 ? 次閱讀

英偉達最近發布的圖像合成 “黑魔法”GauGAN 效果令人驚嘆,現在,相關代碼和預訓練模型終于公開了。

還記得英偉達在GTC2019披露的令人驚嘆的圖像生成器GauGAN嗎?僅憑幾根線條,草圖秒變風景照,自動生成照片級逼真圖像的技術堪比神筆馬良。

圖中,左邊是人類操作員畫的,右邊是AI直接“簡單加上幾筆細節”后生成的。在普通人看來,右邊的圖像幾乎毫無破綻,看不出這并非一張風光照片,而是AI生成的虛擬海灘。

從圖中我們可以看出,GauGAN并不是像Photoshop里貼一個圖層那樣,簡單的把圖形貼上去,而是根據相鄰兩個圖層之間的對應關系對邊緣進行調整。比如石頭在水里的倒影應該是什么樣的、被瀑布沖刷的山石應該是怎樣的狀態、近處的山和遠處的山之間的層次應該如何表現…

相關閱讀:英偉達再出黑魔法GauGAN:憑借幾根線條,草圖秒變風景照

GauGAN背后的技術來自來自英偉達和MIT的研究團隊。這個團隊,包括來自英偉達的Ting-ChunWang、劉明宇(Ming-YuLiu),TaesungPark(當時在英偉達實習),以及來自MIT的朱俊彥(Jun-YanZhu)。

論文地址:https://arxiv.org/pdf/1903.07291.pdf

他們提出一種名為“空間自適應歸一化”(SPADE)的語義圖像合成技術,論文已經被CVPR2019接收,并入選oralpaper。

近日,SPADE的代碼終于發布,包括預訓練模型等,有興趣的同學趕緊來試試復現吧。

SPADE:空間自適應歸一化

GauGAN是基于名為“空間自適應歸一化”(spatially-adaptivenormalization,SPADE)技術實現的。該方法通過一個簡單但有效的層,在給定輸入語義布局的情況下合成照片級真實的圖像。

以前的方法直接將語義布局作為輸入提供給網絡,然后通過卷積、歸一化和非線性層進行處理。我們證明了以前的方法不是最優的,因為歸一化層往往會消除語義信息

為了解決這個問題,我們建議使用輸入布局,通過空間自適應的、學習的變換來調整歸一化層中的激活。

在幾個具有挑戰性的數據集上的實驗表明,與現有方法相比,SPADE在視覺保真度和與輸入布局的對齊方面具有優勢。最后,我們的模型允許用戶輕松地控制合成結果的樣式和內容,以及創建多模態的結果。

方法簡述

在許多常見的歸一化技術中,如BatchNormalization(Ioffeetal.,2015),在實際歸一化步驟之后會應用到學習的affinelayers(如在PyTorch和TensorFlow)中。

在SPADE中,affinelayers是從語義分割映射中學習的。這類似于條件歸一化(DeVriesetal.,2017和Dumoulinetal.,2016),除了學習的affineparameters,還需要空間自適應,這意味著我們將對每個語義標簽使用不同的縮放和偏差。

使用這種簡單的方法,語義信號可以作用于所有層的輸出,而不受可能丟失這些信息的歸一化過程的影響。此外,由于語義信息是通過SPADE層提供的,所以可以使用隨機的潛在向量作為網絡的輸入,從而實現操縱所生成的圖像的樣式。

與現有方法的比較

SPADE在COCO-Stuff數據集上的性能優于現有方法。因為具有更多的場景和標簽,COCO-Stuff數據集比Cityscapes數據集更具挑戰性。上面的圖片比較了GRN、pix2pixhd以及SPADE的效果。

應用到 Flickr 圖片

由于SPADE適用于不同的標簽,因此可以使用現有的語義分割網絡對其進行訓練,學習從語義映射到照片的反向映射。上面這些圖片是由SPADE對從Flickr上抓取的40k張圖片進行訓練生成的。

代碼開源

安裝

克隆這個 repo

git clonehttps://github.com/NVlabs/SPADE.gitcd SPADE/

這段代碼需要PyTorch1.0和python3+。請通過以下方式安裝依賴項

pip install -r requirements.txt

代碼還需要同步的 Synchronized-BatchNorm-PyTorch rep.

cd models/networks/ git clonehttps://github.com/vacancy/Synchronized-BatchNorm-PyTorchcpSynchronized-BatchNorm-PyTorch/sync_batchnorm.-rfcd ../../

為了重現論文中報告的結果,你需要一臺有8個V100GPU的NVIDIADGX1機器。

數據集準備

對于COCO-Stuff、Cityscapes或ADE20K,必須預先下載數據集。請在相關網頁下載。

準備COCO-Stuff數據集。圖像、標簽和實例映射應該與數據集/coco_stuff/中的目錄結構相同。特別地,我們使用了一個實例映射,它結合了“thingsinstancemap”和“stufflabelmap”的邊界。我們使用了一個簡單的腳本數據集/coco_generate_instance_map.py。請使用pipinstallpycocotools安裝pycocotools,并參考腳本生成實例映射。

準備ADE20K數據集。解壓數據集后,將jpg圖像文件ADEChallengeData2016/images/和png標簽文件ADEChallengeData2016/annotatoins/放在同一個目錄中。

使用預訓練模型生成圖像

數據集準備好后,就可以使用預訓練模型生成圖像。

1、從 Google Drive Folder 下載預訓練模型的 tar,保存在 'checkpoint /‘中,然后運行

cd checkpoints tar xvf checkpoints.tar.gz cd ../

2、使用預訓練模型生成圖像

python test.py --name [type]_pretrained --dataset_mode [dataset] --dataroot [path_to_dataset]

3、輸出圖像默認存儲在./results/[type]_pretrained/。

訓練新模型

可以使用以下命令訓練新模型。

1、準備數據集

要在論文中的數據集上訓練,可以下載數據集并使用--dataset_mode選項,該選項將選擇加載BaseDataset上的哪個子類。對于自定義數據集,最簡單的方法是使用./data/custom_dataset。通過指定選項--dataset_modecustom,以及--label_dir[path_to_labels]--image_dir[path_to_images]。你還需要指定更多選項,例如--label_nc(數據集中標簽類的數目),--contain_dontcare_label(指定是否有一個未知的標簽),或者--no_instance(表示地圖數據集沒有實例)。

2、訓練

# To train on the Facades or COCO dataset, for example.python train.py --name [experiment_name] --dataset_mode facades --dataroot [path_to_facades_dataset]python train.py --name [experiment_name] --dataset_mode coco --dataroot [path_to_coco_dataset]# To train on your own custom datasetpython train.py --name [experiment_name] --dataset_mode custom --label_dir [path_to_labels] -- image_dir [path_to_images] --label_nc [num_labels]

你還可以指定許多選項,請使用 python train.py --help.

測試

測試與測試預訓練模型相似

python test.py --name [name_of_experiment] --dataset_mode [dataset_mode] --dataroot [path_to_dataset]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 代碼
    +關注

    關注

    30

    文章

    4845

    瀏覽量

    69256
  • 數據集
    +關注

    關注

    4

    文章

    1212

    瀏覽量

    24896
  • 英偉達
    +關注

    關注

    22

    文章

    3862

    瀏覽量

    92212

原文標題:草圖秒變風景照,英偉達神筆馬良GaoGAN終于開源了

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    下一代SDR收發器中的黑魔法:發射本振泄漏!“零中頻”的挑戰如何破?

    零中頻,優勢&挑戰。“下一代SDR收發器中的黑魔法”,“零中頻”現在也面臨一個亟待克服的挑戰——發射本振泄漏,簡稱“發射LOL”。
    的頭像 發表于 09-11 15:46 ?1.1w次閱讀
    下一代SDR收發器中的<b class='flag-5'>黑魔法</b>:發射本振泄漏!“零中頻”的挑戰如何破?

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    高端VR設備起量,英偉稱今年1500萬,明年翻倍

      導讀:關于VR,有人唱衰,有人認為前景無限。在本周的VRX大會上,英偉總經理格林斯特恩則認為VR在明年將實現爆發。   據外媒報道,要說VR市場今年的大贏家,絕對非索尼莫屬。憑借399
    發表于 12-13 14:32

    英偉TX2手冊

    英偉TX2數據手冊,喜歡請關注
    發表于 01-07 22:08

    英偉DPU的過“芯”之處

    ,AI硬件正成為越來越多數據中心擴容建設的關鍵所在。當超強AI算力成為數據中心的剛需,英偉GPU憑借強大的并行計算和浮點能力,突破了深度學習的算力瓶頸,成為AI硬件的首選。這一契機才使得英偉
    發表于 03-29 14:42

    PCB設計黑魔法

    PCB設計黑魔法
    發表于 08-03 10:24 ?63次下載
    PCB設計<b class='flag-5'>黑魔法</b>書

    英偉黑魔法GauGAN

    這張圖真實的體現了在通常情況下,學生面對老師傳授知識、或者技能時候的一種狀態。很多人對此深有同感:在大牛口中“簡單加幾筆細節”的操作,在凡人看來無異于直接從新手跳到王者。但這種情況正在改變,手殘黨也可以畫出逼真的風光大片了!這完全要感謝英偉最新推出的一款黑科技。
    的頭像 發表于 03-21 09:16 ?1.4w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>的<b class='flag-5'>黑魔法</b>:<b class='flag-5'>GauGAN</b>

    英偉新開源的工具它利用生成對抗網絡,隨便幾個線條就能生成栩栩如生的圖像

    GauGAN 背后的技術來自來自英偉和 MIT 的研究團隊。這個團隊,包括來自英偉的 Ting-Chun Wang、劉明宇(Ming-Y
    的頭像 發表于 04-29 15:30 ?3047次閱讀

    英偉GauGAN開放測試,人人當畫家!

    從GaoGAN的測試界面來看,與之前英偉放出的Demo和視頻介紹中幾乎完全一樣。只需要首先點擊屏幕下方的服務條款前面的勾,就可以盡情作畫啦。
    的頭像 發表于 06-23 08:35 ?8094次閱讀

    英偉研究團隊的公布的“AI神筆”嗎?

    今年3月英偉的新科技GauGAN在GTC 2019上一經推出,獲得無數手殘黨點贊。GauGAN的拼寫與印象派大師高更(Gauguin)僅兩字之差,而前者生成的圖象與大師之作相比也絲毫
    的頭像 發表于 08-02 15:29 ?2905次閱讀

    作為電子領域的“黑魔法”,這三者之間的聯系很有趣

    RF工程常被視為電子領域的黑魔法
    的頭像 發表于 08-07 17:52 ?4719次閱讀
    作為電子領域的“<b class='flag-5'>黑魔法</b>”,這三者之間的聯系很有趣

    干貨 | 下一代SDR收發器中的黑魔法

    RF工程常被視為電子領域的黑魔法
    的頭像 發表于 08-14 17:54 ?3701次閱讀
    干貨 | 下一代SDR收發器中的<b class='flag-5'>黑魔法</b>

    電子領域的黑魔法:復數RF混頻器的揭秘

    RF工程常被視為電子領域的黑魔法。它可能是數學和力學的某種奇特組合,有時甚至儀僅是試錯。它讓許多優秀的工程師不得其解,有些工程師僅了解結果而對細節毫無所知。現有的許多文獻往往不建立基本概念,而是直接跳躍到理論和數學解釋。
    發表于 07-24 10:26 ?0次下載
    電子領域的<b class='flag-5'>黑魔法</b>:復數RF混頻器的揭秘

    英偉股價能否憑借AI進一步上漲到500美元?

    達到了394.82美元。 所以,在本文中猛獸財經將再次分析英偉的股價能否憑借AI進一步上漲到500美元?(截止撰寫本文時英偉的股價為:4
    的頭像 發表于 06-26 09:39 ?693次閱讀
    主站蜘蛛池模板: 4338×亚洲全国最大色成网站 | 国产大片黄在线看免费 | 国模欢欢大尺度 | 性色爽爱性色爽爱网站 | 国产成人永久在线播放 | 永久精品免费影院在线观看网站 | 精品乱码一区二区三区四区 | 可以直接看的黄址 | 中国一级毛片aaa片 中国一级特黄aa毛片大片 | 速度与激情在线 | 久久免费看视频 | 中文字幕不卡在线播放 | 一区二区三区四区在线观看视频 | 日本a级精品一区二区三区 日本a级特黄三级三级三级 | 天天干天日 | 91在线免费观看网站 | 色综合天天综一个色天天综合网 | 久久精品国产99久久72 | 在线免费成人 | 2021久久精品免费观看 | 日本高清高色 | 年下攻高h好涨 | 欧美性野久久久久久久久 | 丁香网五月| 黑人影院 | 你懂的欧美 | 性色aⅴ闺蜜一区二区三区 性色成人网 | 欧美又黄又嫩大片a级 | 九色视频在线播放 | 在线天堂中文新版www | 最新免费jlzzjlzz在线播放 | 国产精品亚洲一区二区三区在线播放 | 日本wwwxx| 亚洲三级黄色 | 激情六月丁香婷婷 | 夜夜夜夜曰天天天天拍国产 | 亚洲午夜久久久精品影院视色 | 月夜免费观看完整视频 | 大胆国模一区二区三区伊人 | 四月婷婷七月婷婷综合 | 人人射人人射 |