最近來自馬克斯?普朗克計算機科學研究所、MIT CSAIL和谷歌的研究者們研究了一種控制GAN的新方法DragGAN,這項技術的特點是,用戶只要點擊拖拽,就可以“改變汽車的尺寸或者將人物的笑容變成皺眉”。
其中演示的案例包括增加山峰的高度、改變模特的姿勢和衣服的長度以及形狀、張開或閉合獅子的嘴巴、將一個人的表情從平淡變成微笑等。
DragGAN是一個直觀的圖像編輯工具PM系統,用戶只需要控制圖像中的像素點和方向,就可以快速調整照片主體的位置、姿態、表情、大小和角度等。
而根據他們的說法,他們的方法是基于GAN的操作中優于SOTA,并為圖像編輯開辟了新方向。
這種工具的潛力主要表現在,從文本生成圖像的人工智能并不總是能輸出你想要的結果,同時用戶還可以在生成圖像之后再進行重新編輯,而且不用重新生成新的圖像。
以上源自互聯網,版權歸原作所有
審核編輯黃宇
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
88文章
35136瀏覽量
279791
發布評論請先 登錄
相關推薦
熱點推薦
任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?
實踐。
為開源項目貢獻代碼或者文檔。比如,幫助完善一個機器學習數據集的加載模塊的代碼,或者撰寫某個AI算法的使用說明文檔。這不僅可以提升自己的技術能力,還能在AI社區中建立自己的聲譽。
發表于 07-08 17:44
迅為RK3568開發板Dev-Eco studio 的界面布局-導航欄-代碼編輯區
前顯示行號 +- 按鈕可以按照模塊折疊代碼。
ctrl+鼠標滾輪放大或者縮小代碼字體。
按住鼠標左鍵,拖動文件,可以分屏展示。
發表于 06-20 11:12
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的支持,即可完成目標或其他自研大模型輕松部署。讓AI
發表于 04-13 19:52
開源的AI MPU
1. 基于RISC-V的開源AI MPU/加速器 ? ?**(1) SiFive Intelligence系列**? ? 特點 ?:SiFive提供開源的RISC-V IP核,支持AI
聲云AI語音鼠標開啟智能辦公新時代
在數字化飛速發展的當下,人們對輸入設備的效率和便捷性有了更高的追求。傳統鼠標只能實現基本的指針控制,在文字輸入場景下,鍵盤輸入速度受限且在特殊環境中使用不便。而聲云 AI 語音鼠標方案的問世,正是為了滿足用戶對高效、便捷輸入的迫
Banana Pi 與瑞薩電子攜手共同推動開源創新:BPI-AI2N
對技術創新的共同追求,也為開源硬件行業的發展帶來了更多可能性。BPI-AI2N & BPI-AI2N Carrier 將在 2025年3月11日-13日德國紐倫堡嵌入式世界展會
發表于 03-12 09:43
AI潮流下的辦公“神器”選擇,沸蛇AI語音鼠標真正實現效率翻倍
年終臨近,各種考核、匯報、總結也隨之而來,忙上天的白領們不得閑暇。事實上,許多流程化、模板化的工作并非困難模式,只是處理起來比較費時,這個時候AI就可以幫上忙。沸蛇AI語音鼠標就是一款能夠幫助辦公

字節發布SeedEdit圖像編輯模型
,SeedEdit模型憑借其強大的技術實力,支持用戶通過一句簡單的自然語言描述,即可輕松實現對圖像的多種編輯操作。無論是修圖、換裝、美化,還是轉化風格、在指定區域添加或刪除元素等復雜任
Llama 3 與開源AI模型的關系
在人工智能(AI)的快速發展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術的創新,還促進了全球開發者社區的合作。Llama 3,作為一個新興的
Freepik攜手Magnific AI推出AI圖像生成器
近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著AI
評論