在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓GAN再次偉大!拽一拽關(guān)鍵點就能讓獅子張嘴&大象轉(zhuǎn)身

OpenCV學(xué)堂 ? 來源:量子位 ? 2023-05-24 15:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這兩天,一段AI修圖視頻在國內(nèi)外社交媒體上傳瘋了。

不僅直接躥升B站關(guān)鍵詞聯(lián)想搜索第一,視頻播放上百萬,微博推特也是火得一塌糊涂,轉(zhuǎn)發(fā)者紛紛直呼“PS已死”。

e9ff026e-f8f4-11ed-90ce-dac502259ad0.png

怎么回事?

原來,現(xiàn)在P圖真的只需要“輕輕點兩下”,AI就能徹底理解你的想法!

小到豎起狗子的耳朵:

ea4c2062-f8f4-11ed-90ce-dac502259ad0.gif

大到讓整只狗子蹲下來,甚至讓馬岔開腿“跑跑步”,都只需要設(shè)置一個起始點和結(jié)束點,外加拽一拽就能搞定:

ea59d586-f8f4-11ed-90ce-dac502259ad0.gif

不止是動物的調(diào)整,連像汽車這樣的“非生物”,也能一鍵拉升底座,甚至升級成“加長豪華車”:

eb9002cc-f8f4-11ed-90ce-dac502259ad0.gif

這還只是AI修圖的“基操”。

要是想對圖像實現(xiàn)更精準(zhǔn)的控制,只需畫個圈給指定區(qū)域“涂白”,就能讓狗子轉(zhuǎn)個頭看向你:

ed972ac8-f8f4-11ed-90ce-dac502259ad0.gif

或是讓照片中的小姐姐“眨眨眼”:

f8c026de-f8f4-11ed-90ce-dac502259ad0.gif

甚至是讓獅子張大嘴,連牙齒都不需要作為素材放入,AI自動就能給它“安上”:

f8fd2ab6-f8f4-11ed-90ce-dac502259ad0.gif

f91171f6-f8f4-11ed-90ce-dac502259ad0.png

如此“有手就能做”的修圖神器,來自一個MIT、谷歌、馬普所等機構(gòu)聯(lián)手打造的DragGAN新模型,論文已入選SIGGRAPH 2023。

f93be5d0-f8f4-11ed-90ce-dac502259ad0.png

沒錯,在擴散模型獨領(lǐng)風(fēng)騷的時代,竟然還能有人把GAN玩出新花樣!

f99a34f0-f8f4-11ed-90ce-dac502259ad0.png

f9b98d00-f8f4-11ed-90ce-dac502259ad0.gif

目前這個項目在GitHub上已經(jīng)有5k+ Star,熱度還在不斷上漲中(盡管一行代碼還沒發(fā))。

f9d4ca8e-f8f4-11ed-90ce-dac502259ad0.png

所以,DragGAN模型究竟長啥樣?它又如何實現(xiàn)上述“神一般的操作”?

f9ee9b26-f8f4-11ed-90ce-dac502259ad0.gif

拽一拽關(guān)鍵點,就能修改圖像細節(jié)

這個名叫DragGAN的模型,本質(zhì)上是為各種GAN開發(fā)的一種交互式圖像操作方法。

論文以StyleGAN2架構(gòu)為基礎(chǔ),實現(xiàn)了點點鼠標(biāo)、拽一拽關(guān)鍵點就能P圖的效果。

具體而言,給定StyleGAN2生成的一張圖像,用戶只需要設(shè)置幾個控制點(紅點)和目標(biāo)點(藍點),以及圈出將要移動的區(qū)域(比如狗轉(zhuǎn)頭,就圈狗頭)。

fabe604a-f8f4-11ed-90ce-dac502259ad0.png

然后模型就將迭代執(zhí)行運動監(jiān)督和點跟蹤這兩個步驟,其中運動監(jiān)督會驅(qū)動紅色的控制點向藍色的目標(biāo)點移動,點跟蹤則用于更新控制點來跟蹤圖像中的被修改對象。

這個過程一直持續(xù)到控制點到達它們對應(yīng)的目標(biāo)點。

faf726b4-f8f4-11ed-90ce-dac502259ad0.png

不錯,運動監(jiān)督和點跟蹤就是我們今天要講的重點,它是DragGAN模型中最主要的兩個組件。

先說運動監(jiān)督。在此之前,業(yè)界還沒有太多關(guān)于如何監(jiān)督GAN生成圖像的點運動的研究。

在這項研究中,作者提出了一種不依賴于任何額外神經(jīng)網(wǎng)絡(luò)的運動監(jiān)督損失(loss)。

其關(guān)鍵思想是,生成器的中間特征具有很強的鑒別能力,因此一個簡單的損失就足以監(jiān)督運動。

所以,DragGAN的運動監(jiān)督是通過生成器特征圖上的偏移補丁損失(shifted patch loss)來實現(xiàn)的。

如下圖所示,要移動控制點p到目標(biāo)點t,就要監(jiān)督p點周圍的一小塊patch(紅圈)向前移動的一小步(藍圈)。

faff489e-f8f4-11ed-90ce-dac502259ad0.png

再看點跟蹤。

先前的運動監(jiān)督會產(chǎn)生一個新的latent code、一個新特征圖和新圖像。

由于運動監(jiān)督步驟不容易提供控制點的精確新位置,因此我們的目標(biāo)是更新每個手柄點p使其跟蹤上對象上的對應(yīng)點。

此前,點跟蹤通常通過光流估計模型或粒子視頻方法實現(xiàn)。

但同樣,這些額外的模型可能會嚴(yán)重影響效率,并且在GAN模型中存在偽影的情況下可能使模型遭受累積誤差。

因此,作者提供了一種新方法,該方法通過最近鄰檢索在相同的特征空間上進行點跟蹤。

而這主要是因為GAN模型的判別特征可以很好地捕捉到密集對應(yīng)關(guān)系。

基于這以上兩大組件,DragGAN就能通過精確控制像素的位置,來操縱不同類別的對象完成姿勢、形狀、布局等方面的變形。

作者表示,由于這些變形都是在GAN學(xué)習(xí)的圖像流形上進行的,它遵從底層的目標(biāo)結(jié)構(gòu),因此面對一些復(fù)雜的任務(wù)(比如有遮擋),DragGAN也能產(chǎn)生逼真的輸出。

單張3090幾秒鐘出圖

所以,要實現(xiàn)幾秒鐘“精準(zhǔn)控圖”的效果,是否需要巨大的算力?

nonono。大部分情況下,每一步拖拽修圖,單張RTX 3090 GPU在數(shù)秒鐘內(nèi)就能搞定。

fb5c5674-f8f4-11ed-90ce-dac502259ad0.png

具體到生成圖像的效果上,實際評估(均方誤差MSE、感知損失LPIPS)也超越了一系列類似的“AI修圖”模型,包括RAFT和PIPs等等:

fb77141e-f8f4-11ed-90ce-dac502259ad0.png

如果說文字的還不太直觀,具體到視覺效果上就能感受到差異了:

fba846e2-f8f4-11ed-90ce-dac502259ad0.png

值得一提的是,DragGAN的“潛力”還不止于此。

一方面,如果增加關(guān)鍵點的數(shù)量,還能實現(xiàn)更加精細的AI修圖效果,用在人臉這類對修圖要求比較嚴(yán)格的照片上,也是完全沒問題:

fbb3bcf2-f8f4-11ed-90ce-dac502259ad0.png

另一方面,不止開頭展示的人物和動物,放在汽車、細胞、風(fēng)景和天氣等不同類型的圖像上,DragGAN也都能精修搞定。

fc41f0bc-f8f4-11ed-90ce-dac502259ad0.png

除了不同的照片類型,從站到坐、從直立到跑步、從跨站到并腿站立這種姿勢變動較大的圖像,也能通過DragGAN實現(xiàn):

fc88679a-f8f4-11ed-90ce-dac502259ad0.png

也難怪網(wǎng)友會調(diào)侃“遠古的PS段子成真”,把大象轉(zhuǎn)個身這種甲方需求也能實現(xiàn)了。

fda8e65e-f8f4-11ed-90ce-dac502259ad0.png

不過,也有網(wǎng)友指出了DragGAN目前面臨的一些問題。

例如,由于它是基于StyleGAN2生成的圖像進行P圖的,而后者訓(xùn)練成本很高,因此距離真正商業(yè)落地可能還有一段距離。

fdb19b28-f8f4-11ed-90ce-dac502259ad0.png

除此之外,在論文中提到的“單卡幾秒鐘修圖”的效果,主要還是基于256×256分辨率圖像:

fdcd008e-f8f4-11ed-90ce-dac502259ad0.png

至于模型是否能擴展到256×256以外圖像,生成的效果又是如何,都還是未知數(shù)。

有網(wǎng)友表示“至少高分辨率圖像從生成時間來看,肯定還要更長”。

fdef08e6-f8f4-11ed-90ce-dac502259ad0.png

實際上手的效果究竟如何,我們可以等6月論文代碼開源后,一測見真章。

團隊介紹

DragGAN的作者一共6位,分別來自馬克斯?普朗克計算機科學(xué)研究,薩爾布呂肯視覺計算、交互與AI研究中心,MIT,賓夕法尼亞大學(xué)和谷歌AR/VR部門。

fe09d5d6-f8f4-11ed-90ce-dac502259ad0.png

其中包括兩位華人:

一作潘新鋼,他本科畢業(yè)于清華大學(xué)(2016年),博士畢業(yè)于香港中文大學(xué)(2021年),師從湯曉鷗教授。

現(xiàn)在是馬普計算機科學(xué)研究所的博士后,今年6月,他將進入南洋理工大學(xué)擔(dān)任助理教授(正在招收博士學(xué)生)。

fe1298a6-f8f4-11ed-90ce-dac502259ad0.png

另一位是Liu Lingjie,香港大學(xué)博士畢業(yè)(2019年),后在馬普信息學(xué)研究所做博士后研究,現(xiàn)在是賓夕法尼亞大學(xué)助理教授(也在招學(xué)生),領(lǐng)導(dǎo)該校計算機圖形實驗室,也是通用機器人、自動化、傳感與感知 (GRASP)實驗室成員。

fe86264a-f8f4-11ed-90ce-dac502259ad0.png

值得一提的是,為了展示DragGAN的可控性,一作還親自上陣,演示了生發(fā)、瘦臉和露齒笑的三連P圖效果:

fed26ee2-f8f4-11ed-90ce-dac502259ad0.png

是時候給自己的主頁照片“修修圖”了(手動狗頭)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35041

    瀏覽量

    279119
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2204

    瀏覽量

    76721
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    483

    瀏覽量

    17654

原文標(biāo)題:讓GAN再次偉大!拽一拽關(guān)鍵點就能讓獅子張嘴&大象轉(zhuǎn)身,DragGAN爆火

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    新知|Verizon與AT&T也可以手機直接連接衛(wèi)星了

    近日,Verizon與AT&T宣布,手機直連衛(wèi)星方面取得重要進展,使用普通手機實現(xiàn)了通過衛(wèi)星的視頻通話。很顯然,Verizon與AT&T的這舉措是針對此前T-Mobile
    的頭像 發(fā)表于 06-19 07:07 ?437次閱讀
    新知|Verizon與AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T也可以手機直接連接衛(wèi)星了

    雙模載波芯片CN8513&amp;amp;amp;CN8514在智能家居中的創(chuàng)新應(yīng)用

    雙模載波芯片CN8513&amp;CN8514在智能家居中的創(chuàng)新應(yīng)用
    的頭像 發(fā)表于 02-10 09:43 ?460次閱讀
    雙模載波芯片CN8513&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;CN8514在智能家居中的創(chuàng)新應(yīng)用

    如何判斷產(chǎn)品需不需要做AT&amp;amp;amp;T認(rèn)證?AT&amp;amp;amp;T測試內(nèi)容和要求分享

    隨著經(jīng)濟全球化的發(fā)展,國內(nèi)越來越多產(chǎn)品廠商選擇將自家產(chǎn)品出口到北美市場,而這時候各位廠商都會面臨產(chǎn)品需不需要做AT&amp;T的問題。今天英利檢測針對這問題整理了些關(guān)于AT&amp
    的頭像 發(fā)表于 12-23 17:46 ?612次閱讀
    如何判斷產(chǎn)品需不需要做AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T認(rèn)證?AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T測試內(nèi)容和要求分享

    北美運營商AT&amp;amp;amp;T認(rèn)證中的VoLTE測試項

    北美運營商AT&amp;T的認(rèn)證測試內(nèi)容涵蓋了多個方面,以確保設(shè)備和服務(wù)的質(zhì)量、兼容性以及用戶體驗。在AT&amp;T的認(rèn)證測試中,VoLTE(VoiceoverLTE)測試項是個重要的組成部分
    的頭像 發(fā)表于 12-06 16:52 ?594次閱讀
    北美運營商AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T認(rèn)證中的VoLTE測試項

    「賦能每氪 2024吉利集團&amp;amp;amp;TOSUN同星用戶日」活動圓滿落幕

    圓滿落幕11月20日,「賦能每氪2024吉利集團&amp;TOSUN同星用戶日」活動在寧波·吉利研究院順利舉行!同星智能再次走進吉利集團,為吉利集團客戶朋友帶來了場技術(shù)盛宴,為雙方
    的頭像 發(fā)表于 11-23 01:05 ?406次閱讀
    「賦能每<b class='flag-5'>一</b>氪 2024吉利集團&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;TOSUN同星用戶日」活動圓滿落幕

    能力再次提升! 迅為RK3588/RK3568開發(fā)板&amp;amp;amp;核心板新增定制分區(qū)鏡像

    能力再次提升! 迅為RK3588/RK3568開發(fā)板&amp;核心板新增定制分區(qū)鏡像
    的頭像 發(fā)表于 11-06 15:11 ?1411次閱讀
    能力<b class='flag-5'>再次</b>提升! 迅為RK3588/RK3568開發(fā)板&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;核心板新增定制分區(qū)鏡像

    迅為itop-3568開發(fā)板AMP雙系統(tǒng)使用手冊之燒寫AMP鏡像

    迅為itop-3568開發(fā)板AMP雙系統(tǒng)使用手冊之燒寫AMP鏡像
    的頭像 發(fā)表于 11-04 15:00 ?1242次閱讀
    迅為itop-3568開發(fā)板<b class='flag-5'>AMP</b>雙系統(tǒng)使用手冊之燒寫<b class='flag-5'>AMP</b>鏡像

    北美運營商AT&amp;amp;amp;T認(rèn)證的費用受哪些因素影響

    申請北美運營商AT&amp;T認(rèn)證的價格因多種因素而異,包括產(chǎn)品類型、認(rèn)證范圍、測試難度等。般來說,申請AT&amp;T認(rèn)證的費用可能相對較高,因為AT&amp;T作為北美地區(qū)的主要
    的頭像 發(fā)表于 10-16 17:10 ?629次閱讀
    北美運營商AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T認(rèn)證的費用受哪些因素影響

    onsemi LV/MV MOSFET 產(chǎn)品介紹 &amp;amp;amp; 行業(yè)應(yīng)用

    系列MOSFET介紹。4.onsemiLV/MVMOSFET市場&amp;應(yīng)用。技術(shù)亮點onsemi最新代T10系列MOSFET優(yōu)勢&amp;市場前景。學(xué)習(xí)收獲期望了解onsemiSi
    的頭像 發(fā)表于 10-13 08:06 ?900次閱讀
    onsemi LV/MV MOSFET 產(chǎn)品介紹 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行業(yè)應(yīng)用

    思瑞浦車規(guī)級產(chǎn)品矩陣,全面覆蓋汽車級CAN&amp;amp;amp;LIN、LDO需求

    也與大家互動分享了思瑞浦汽車級LDO新產(chǎn)品、汽車級CAN&amp;LIN新產(chǎn)品。讓我們起回顧這場直播!精選問題解答Q&amp;A思瑞浦汽車芯片哪些類型?信號鏈:運放、比較器、ADC/D
    的頭像 發(fā)表于 09-21 08:10 ?1119次閱讀
    思瑞浦車規(guī)級產(chǎn)品矩陣,全面覆蓋汽車級CAN&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;LIN、LDO需求

    【直播預(yù)告】ADI &amp;amp;amp; WT·世健MCU痛問題探索季:MCU應(yīng)用難題全力擊破!

    ;ADI&amp;WT?世健MCU痛探索季"活動,吸引了眾多工程師熱議。針對工程師關(guān)心的問題,WT文曄科技將邀請ADI講師在9月19日開啟直播分享,幫助工程師們?nèi)羝芃CU應(yīng)用難題~直播時
    的頭像 發(fā)表于 09-19 08:05 ?653次閱讀
    【直播預(yù)告】ADI &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; WT·世健MCU痛<b class='flag-5'>點</b>問題探索季:MCU應(yīng)用難題全力擊破!

    從邊緣到云端,合宙DTU&amp;amp;amp;RTU打造無縫物聯(lián)網(wǎng)解決方案

    DTU(數(shù)據(jù)傳輸單元)與RTU(遠程終端單元)是連接邊緣與云端的橋梁,是實現(xiàn)數(shù)據(jù)無縫流動的關(guān)鍵。 合宙推出的 DTU&amp;RTU成功推動了眾多企業(yè)實現(xiàn)了生產(chǎn)設(shè)備的遠程監(jiān)控和智能控制。
    的頭像 發(fā)表于 09-12 15:27 ?1894次閱讀
    從邊緣到云端,合宙DTU&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;RTU打造無縫物聯(lián)網(wǎng)解決方案

    Allegro X 23.11 版本更新 I PCB 設(shè)計:鍵移除評審內(nèi)容 &amp;amp;amp; 導(dǎo)入ODB++

    ,助力您提升設(shè)計質(zhì)量和設(shè)計效率。legroXPCBDesigner系統(tǒng)級PCB設(shè)計鍵移除評審內(nèi)容&amp;導(dǎo)入ODB++在23.
    的頭像 發(fā)表于 08-30 12:21 ?959次閱讀
    Allegro X 23.11 版本更新 I PCB 設(shè)計:<b class='flag-5'>一</b>鍵移除評審內(nèi)容 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 導(dǎo)入ODB++

    OC7201C資料(PCB &amp;amp; 原理圖)

    電子發(fā)燒友網(wǎng)站提供《OC7201C資料(PCB &amp; 原理圖).zip》資料免費下載
    發(fā)表于 07-18 16:19 ?2次下載

    FS201資料(pcb &amp;amp; DEMO &amp;amp; 原理圖)

    電子發(fā)燒友網(wǎng)站提供《FS201資料(pcb &amp; DEMO &amp; 原理圖).zip》資料免費下載
    發(fā)表于 07-16 11:24 ?2次下載
    主站蜘蛛池模板: 一区二区视屏 | 天天干夜夜玩 | 午夜网站在线 | 久久草在线视频播放 | freesex性欧美重口 | 又长又大又粗又硬3p免费视频 | 天天天天添天天拍天天谢 | 狠狠色噜噜狠狠狠狠狠色综合久久 | 久操操操 | 四虎三级 | 久久国产精品久久久久久 | 日韩a级毛片免费观看 | 女人十六毛片 | 日本一区二区三区不卡在线看 | 免费观看一级特黄欧美大片 | 在线黄色网 | 天天视频黄 | 免费高清在线爱做视频 | 亚洲欧美日本视频 | 天堂资源在线官网 | 一级毛片一级毛片一级毛片 | 国产美女视频一区二区三区 | 男女爱爱视频免费看 | 日本免费不卡视频一区二区三区 | 搞逼综合网 | 天天综合天天添夜夜添狠狠添 | 国产成人亚洲精品77 | 国产免费一级高清淫曰本片 | 中国业余老太性视频 | 夜色伊人 | 一区二区三区高清在线观看 | 奇米一区二区 | 奇米影视999 | 久久看免费视频 | 不卡无毒免费毛片视频观看 | 久久亚洲精品国产亚洲老地址 | 2021天天操| 美剧免费在线观看 | 狠久久| 色噜噜狠狠网站 | 三级在线观看 |