在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

放下你的PhotoShop!無限圖像編輯已開源!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-10 10:09 ? 次閱讀

0. 筆者個人體會

最近文本到圖像的工作很火,生成的圖像也非常真實。但還有個問題,現有工作效率比較低,往往只能接受一次text指令,再修改就要重新輸入text重新生成,可能會影響原本的語義信息,這樣導出的圖像和最初圖像可能差距甚遠。

今天筆者將為大家分享一項最新開源的工作LEDITS++,可以一次輸入無限多的編輯指令,一次性生成真實圖像!而且LEDITS++是無參數方案,不需要微調和優化。不得不感慨AI發展之迅速,距離人們真實生活也越來越近了。

下面一起來閱讀一下這項工作,文末附論文和代碼鏈接~

1. 效果展示

先看一下具體效果,輸入具體指令就可以直接產生對應效果。PS要想在幾十秒內達到同等效果應該是有點困難。

27892dc0-96ad-11ee-8b88-92fbcf53809c.png

LEDITS++很強調編輯前后的圖像一致性,也就是僅修改圖像的相關區域,保持原始圖像的語義信息。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

27a9e4fc-96ad-11ee-8b88-92fbcf53809c.png

代碼已經開源了,官方主頁也開放了交互式demo,感興趣的讀者可以上傳自己的圖像和文本指令嘗鮮一下效果。

2. 具體原理是什么?

LEDITS++可以分為三個部分:(1)有效的圖像反轉;(3)多功能文本編輯;(3)圖像變化的語義基礎。

我們知道擴散模型生成圖像是通過反轉采樣來進行的,重點是識別噪聲。LEDITS++從DDPM反演中提取特征,并提出一種有效的反演方法,大大減少所需的步驟,同時降低重建誤差。當將反向擴散過程公式化為SDE時,DDPM可以被視為一階SDE解算器。使用高階微分方程解算器可以更有效地解算,因此作者推導出一種新的更快技術------DPM-solver++反演。

27cde406-96ad-11ee-8b88-92fbcf53809c.png

在創建重建序列之后,可以通過一組編輯指令操縱噪聲來編輯圖像。根據有條件和無條件估計,作者分別設計了一個專門的引導項,既反映了編輯的方向,又最大化了對所需編輯效果的細粒度控制。

27ef003c-96ad-11ee-8b88-92fbcf53809c.png

最后,LEDITS++還包括一個Mask項,由交叉注意層生成的Mask和噪聲估計導出的Mask取交集計算得到。Mask可以捕捉與編輯概念相關的圖像區域,對于多次編輯特別有效。這里也推薦工坊推出的新課程《徹底搞懂視覺-慣性SLAM:VINS-Fusion原理精講與源碼剖析》。

2815c21c-96ad-11ee-8b88-92fbcf53809c.png

3. 和其他SOTA方法對比如何?

不同編輯方法的指令對齊和圖像相似度權衡的比較,側重CLIP得分(越高越好)與LPIPS相似度(越低越好),也就是圖中越靠近左上角效果越好。

282ecd02-96ad-11ee-8b88-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41064
  • AI
    AI
    +關注

    關注

    88

    文章

    34457

    瀏覽量

    275847
  • 開源
    +關注

    關注

    3

    文章

    3628

    瀏覽量

    43548

原文標題:放下你的PhotoShop!無限圖像編輯已開源!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    擁抱開源!一起來做FPGA開發板啦!

    。 今天,我們懷揣著對開源的熱愛與信仰,發起“擁抱開源——一起來做FPGA開發板” 項目!無論是FPGA領域的資深開發者,渴望探索國產芯片的無限可能;還是初入茅廬的技術小白,想要在實
    發表于 06-06 14:05

    開源鴻蒙開發者大會2025·AI分論壇圓滿閉幕,探索開源鴻蒙AI無限可能

    5月24日,開源鴻蒙開發者大會2025·AI分論壇在深圳蛇口希爾頓南海酒店成功舉辦?;顒犹匮麑W術領袖、開源專家、行業先鋒和社區開發者,從終端操作系統、國產大模型、智能體、算力芯片、應用場景、機器人等
    的頭像 發表于 05-26 18:06 ?386次閱讀
    <b class='flag-5'>開源</b>鴻蒙開發者大會2025·AI分論壇圓滿閉幕,探索<b class='flag-5'>開源</b>鴻蒙AI<b class='flag-5'>無限</b>可能

    從初學到進階:樹莓派上最適合的代碼編輯器推薦!

    之前,需要安裝一些必備工具,代碼編輯器便是其中之一。樹莓派系統自帶了一些代碼編輯器,它們功能良好,足以滿足基本需求。不過,如果需要更高級的功能,就必須探索其他
    的頭像 發表于 05-15 16:20 ?153次閱讀
    從初學到進階:樹莓派上最適合<b class='flag-5'>你</b>的代碼<b class='flag-5'>編輯</b>器推薦!

    Vim編輯器的基本操作

    26個字母鍵為核心,用極簡的操作重構了代碼編輯的宇宙。今天,就讓我們一同走進Vim的世界,探索它如何以獨特的方式提升的編程效率。
    的頭像 發表于 05-06 13:41 ?307次閱讀
    Vim<b class='flag-5'>編輯</b>器的基本操作

    TIDA-00570板子的FPGA程序能開放下載嗎?

    TIDA-00570 板子的FPGA程序能開放下載嗎?
    發表于 02-20 07:07

    SparseViT:以非語義為中心、參數高效的稀疏化視覺Transformer

    ? 背景簡介 隨著圖像編輯工具和圖像生成技術的快速發展,圖像處理變得非常方便。然而圖像在經過處理后不可避免的會留下偽影(操作痕跡),這些偽影可分為語義和非語義特征。因此目前幾乎所有的
    的頭像 發表于 01-15 09:30 ?395次閱讀
    SparseViT:以非語義為中心、參數高效的稀疏化視覺Transformer

    開源鴻蒙技術分論壇在武漢成功舉辦

    舉行。本次論壇通過南北向開發賦能,融合前沿的行業案例經驗,生動展現了開源鴻蒙在驅動技術創新與產業升級中的優勢與無限潛能。 開源技術引領變革,構建枝繁葉茂生態體系 在萬物智聯的時代浪潮中,開源
    的頭像 發表于 12-24 13:38 ?723次閱讀

    與鴻同行,探索無限!開源鴻蒙技術分論壇在武漢成功舉辦

    。本次論壇通過南北向開發賦能,融合前沿的行業案例經驗,生動展現了開源鴻蒙在驅動技術創新與產業升級中的優勢與無限潛能。開源技術引領變革,構建枝繁葉茂生態體系在萬物智聯的
    的頭像 發表于 12-23 21:29 ?971次閱讀
    與鴻同行,探索<b class='flag-5'>無限</b>!<b class='flag-5'>開源</b>鴻蒙技術分論壇在武漢成功舉辦

    高倍金相自動測量顯微鏡無限遠光學系統

    高倍金相自動測量顯微鏡無限遠光學系統在無限遠處形成圖像,是通過在物鏡與目鏡之間的主鏡筒中設置鏡筒透鏡,構建了一個能夠形成中間圖像的光學系統。并可以靈活添加各種輔助組件,豐富了顯微鏡的功
    的頭像 發表于 12-14 20:31 ?847次閱讀
    高倍金相自動測量顯微鏡<b class='flag-5'>無限</b>遠光學系統

    字節發布SeedEdit圖像編輯模型

    近日,字節跳動公司在其豆包大模型團隊的官方網站上,正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創新性的圖像編輯模型,為用戶提供了前所未有的便捷圖像編輯體驗。 據官方介紹
    的頭像 發表于 11-12 10:43 ?690次閱讀

    圖像采集卡的接口類型有哪些?

    圖像采集卡又稱圖像捕獲卡,是一種能獲取數字視頻圖像信息并進行存儲和播放的硬件設備。它的作用是將圖像信號采集到計算機中,以數據文件的形式保存在硬盤上,是
    的頭像 發表于 10-24 17:07 ?628次閱讀
    <b class='flag-5'>圖像</b>采集卡的接口類型有哪些?

    vim編輯器如何使用

    Vim編輯器是一個功能強大的文本編輯器,它基于Vi進行改進,并增加了許多新特性。Vim編輯器的使用主要涉及其不同的工作模式及相應操作。以下是Vim編輯器的基本使用方法: 一、Vim
    的頭像 發表于 08-30 14:58 ?827次閱讀

    Matepad pro12.2 上市半個月,但是還沒有在開源網站看到該項目的開源信息,違背開源精神

    Matepad pro12.2 上市半個月,本人自己也購買了同款12+256的pad,想要同步學習下這款pad的一些體驗還不錯的功能點,但是目前為止還沒有在開源網站看到該項目的開源信息,也查詢不到
    發表于 08-27 17:25

    Adobe在Illustrator和Photoshop設計軟件中引入新工具和生成性AI功能

    Adobe正在其Illustrator和Photoshop設計軟件中引入一些新工具和生成性AI功能,旨在幫助加快創意工作流程。Illustrator最引人注目的更新來自Adobe最新的Firefly
    的頭像 發表于 07-29 17:10 ?1276次閱讀

    esp32無限重啟的原因?

    esp32無限重啟,重啟記錄顯示 Software reset due to exception/panic, 有誰知道這是什么原因重啟嗎?
    發表于 06-25 08:13
    主站蜘蛛池模板: 男子扒开美女尿口做羞羞的事 | 日日做夜夜做 | 乱说欲小说又粗又长 | 日本不卡在线一区二区三区视频 | 72种姿势欧美久久久久大黄蕉 | lsj老司机精品视频在线观看 | 久久中文字幕一区二区三区 | 亚洲免费网站在线观看 | 免费在线亚洲 | 香蕉视频色版在线观看 | 国产高清一区二区三区四区 | 伦理片第一页 | 夜夜操操 | 天天摸天天做 | www.xxx.日本| xxxx69日本| 日韩卡1卡2卡三卡四卡二卡免 | 四虎永久免费在线观看 | 国内视频一区二区 | 欧洲无线区一二区 | 天天躁夜夜躁狠狠躁2018a | 91华人在线视频 | 欲色啪| 四虎国产精品永久地址49 | 国产热视频| 经典三级一区二区三区视频 | 龙口护士门91午夜国产在线 | 男人的天堂天堂网 | 国产香蕉一区二区精品视频 | 色多多视频在线观看 | 日本三黄色大 | 夜夜精品视频 | 国模一区二区三区私啪啪 | 亚洲视频在线观看一区 | 狠狠色狠狠干 | 美女网站色免费 | 天堂资源网 | 久久伊人精品青青草原高清 | 3344在线观看永久免费 | 午夜影院美女 | 好硬好大好爽女房东在线观看 |