91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2025-01-03 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者 /ML 谷歌開發(fā)者專家王玉成

介紹

在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)量的圖像,您可以獲得卓越的視覺效果。這個過程并不止于此;一旦圖像生成,Imagen 2 可以進(jìn)一步優(yōu)化以滿足特定需求,從而創(chuàng)建一個強(qiáng)大的工作流程,用于制作頂級視覺內(nèi)容。

使用 Gemini 進(jìn)行提示生成

Gemini 是谷歌開發(fā)的強(qiáng)大語言模型,擅長生成連貫且上下文準(zhǔn)確的文本。在這個工作流程中,Gemini 用于創(chuàng)建詳細(xì)且富有想象力的提示,這些提示將作為圖像生成的基礎(chǔ)。提示的質(zhì)量至關(guān)重要,因?yàn)樗苯佑绊?Imagen 2 模型的輸出。通過仔細(xì)制作或完善 Gemini 的 Prompt,您可以確保生成的圖像與您的創(chuàng)意愿景相一致。

使用 Imagen 3 生成圖像

一旦從 Gemini 獲得了精心制作的 Prompt,下一步就是使用谷歌的 Imagen 3 模型生成圖像。Imagen 3 是一個尖端的生成式 AI 模型,專門根據(jù)文本描述生成高分辨率、細(xì)節(jié)豐富的圖像。該模型以其能夠以驚人的準(zhǔn)確性渲染復(fù)雜場景、紋理和光照而脫穎而出。通過將 Gemini 生成的提示輸入到 Imagen 3 中,你可以創(chuàng)建不僅視覺上令人驚嘆,而且精確符合初始概念的圖像。

使用 Imagen 2 精調(diào)生成的圖像

該工作流程的最后一步是優(yōu)化由 Imagen 2 生成的圖像。根據(jù)需求,這可能涉及調(diào)整顏色、增強(qiáng)細(xì)節(jié),甚至合并多張圖像。目標(biāo)是對來自 Imagen 3 的高質(zhì)量輸出進(jìn)行微調(diào),以確保最終圖像完全符合所需的美學(xué)和功能標(biāo)準(zhǔn)。

關(guān)于 Imagen 模型的有用資源

在 Vertex AI 上查找主題 Imagen | AI 圖像生成器以獲取更多信息。此頁面指導(dǎo)如何請求訪問 Vertex AI 上的 Imagen。

工作流程

準(zhǔn)備 Prompt

Vertex AI 提供多個模塊供使用。首先打開 Gemini 以生成滿足我們需求的理想 Prompt。要全面了解 Prompt 創(chuàng)建的關(guān)鍵方面,您可以閱讀 Prompt 和圖像屬性指南 (需要有限訪問權(quán)限)。

我們選擇 gemini-1.5-flash 作為當(dāng)前的語言模塊,它為高容量、高質(zhì)量、具有成本效益的應(yīng)用提供了速度和效率。有關(guān)更多信息,請閱讀 Gemini 模塊。

43c6e928-c8ed-11ef-9310-92fbcf53809c.png

點(diǎn)擊 Edit 輸入系統(tǒng)指令,然后點(diǎn)擊保存。

System instructions:

You are an experienced article illustrator, skilled in creating illustrations for articles with a deep cultural background, capable of understanding the deeper meaning behind the text.

43e4a12a-c8ed-11ef-9310-92fbcf53809c.png

Prompt:

I'm currently reading the novel `One Hundred Years of Solitude` and plan to write an article expressing my sympathy for the tragic fate of the family. To enrich the content, I intend to include some illustrations in the article. After the title, I need an image that visually represents the time period and setting of the novel. We will generate and modify this image to achieve the desired effect.

I want to generate a prompt to help me generate an image, and the prompt contains the basic rules:

1. Short keyword-based prompts separated by commas.

2. Prompt includes: "A painting of...", "A sketch of..."for example

3. General Modifiers:high-quality, beautiful, stylized for example

4. Photos: like 4K, HDR, Studio Photo for example

5. Art, Illustration:by a professional, detailed for example

輸入 Prompt 并點(diǎn)擊紅色標(biāo)記的部分以生成結(jié)果。

43fa711c-c8ed-11ef-9310-92fbcf53809c.png 結(jié)果:

4416740c-c8ed-11ef-9310-92fbcf53809c.png

原始結(jié)果:

A painting of, a bustling town square in a South American village, early 20th century, with a sense of magic realism, high-quality, by a professional artist.

Here are some variations for your prompt based on specific aspects of "One Hundred Years of Solitude":

Focus on the Buendía family: "A sketch of, the Buendía family gathered at a table, in a traditional Colombian home, with a feeling of isolation, high-quality, detailed"

Highlight the cyclical nature of history: "A photorealistic image of, a crumbling, overgrown mansion in a jungle setting, with the remnants of a forgotten era, HDR, stylized"

Emphasize the magical elements: "A painting of, a vibrant, surreal landscape, with fantastical creatures and strange weather patterns, in a dreamlike style, high-quality, beautiful"

By combining different elements of these prompts, you can create a visually striking image that perfectly captures the essence of "One Hundred Years of Solitude." Remember to experiment with different keywords and art styles to find the ideal representation for your article.

修改結(jié)果:

A painting of, a bustling town square in a South American village, early 20th century, with a sense of magic realism, by a professional artist, Focus on the Buendía family, the Buendía family gathered at a table, in a traditional Colombian home, with a feeling of isolation, high-quality, detailed.

打開 Imagen 3,檢查高級選項(xiàng),如下所示:

443a0e94-c8ed-11ef-9310-92fbcf53809c.png

確保選項(xiàng) Person/face generation is Allow (Adults Only)

4454c8e2-c8ed-11ef-9310-92fbcf53809c.png

此選擇用于避免產(chǎn)生如下問題 "圖像生成失敗,出現(xiàn)以下錯誤:項(xiàng)目或用戶未被允許關(guān)閉兒童檢測過濾器":

4469a9a6-c8ed-11ef-9310-92fbcf53809c.png

輸入 Prompt:

A painting of, a bustling town square in a South American village, early 20th century, with a sense of magic realism, by a professional artist, Focus on the Buendía family, the Buendía family gathered at a table, in a traditional Colombian home, with a feeling of isolation, high-quality, detailed.

43c6e928-c8ed-11ef-9310-92fbcf53809c.png

點(diǎn)擊 GENERATE,結(jié)果應(yīng)該是這樣的:

我喜歡第二個。我們可以點(diǎn)擊第二張圖片:

對話框顯示如下:

我們使用 UPSCALE/EXPORT 按鈕下載此圖像,選擇 Upscle images (如果需要):

44f80f84-c8ed-11ef-9310-92fbcf53809c.png

點(diǎn)擊 EXPORT 按鈕以下載 PNG 格式的圖像。

我們想編輯這張圖片,所以我們再次檢查了第二張圖片。

點(diǎn)擊 EDIT IMAGE 按鈕。

頂部有很多工具可以幫助我們編輯圖像。Imagen 3 現(xiàn)在不支持 Edit image,確保模型已更改為 imagen 2 (預(yù)計 Imagen 3 將在未來支持 Edit image)。

我想把所有遠(yuǎn)離桌子的人都移走,只留下在桌子旁邊的人。所以我添加了一個 Musk box (遮罩盒) 并生成了一張圖像。我們不需要任何提示來進(jìn)行此操作。

點(diǎn)擊 GENERATE 按鈕后的結(jié)果:

為什么?二樓的閣樓消失了,與一樓合并,并創(chuàng)建了 4 幅圖片。

原來,我在原始圖片上添加了三個 Musk box,兩個 Musk box 給人打了 Musk,一個 Musk box 給二樓打了 Musk。Imagan 3 的編輯操作有多智能?我們可以持續(xù)編輯圖像。

結(jié)果是:

這是我想要的最終圖片。如果您有權(quán)限,請閱讀有關(guān)圖像編輯的更多信息。

結(jié)論

通過將谷歌的 Gemini 模型的創(chuàng)造力與 Imagen 3 的先進(jìn)圖像生成能力以及 Imagen 2 的編輯能力相結(jié)合,您可以開發(fā)出一個強(qiáng)大的工作流程,以生成高質(zhì)量、精致的圖像。這個過程允許從文本到視覺內(nèi)容的無縫過渡,提供對最終輸出的靈活性和控制。無論是用于廣告、內(nèi)容創(chuàng)作還是藝術(shù)創(chuàng)作,這種方法都提供了一個強(qiáng)大的工具集,以實(shí)現(xiàn)卓越的視覺效果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108169
  • Gemini
    +關(guān)注

    關(guān)注

    0

    文章

    68

    瀏覽量

    7924
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35165

    瀏覽量

    280077

原文標(biāo)題:【GDE 分享】利用谷歌的 Gemini 和 Imagen 模型進(jìn)行高質(zhì)量圖像生成和優(yōu)化

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    protel輸出高質(zhì)量gerber

    圖文并茂一步一步手把手教你輸出高質(zhì)量的gerber傻瓜式教學(xué)。。。。[hide] [/hide]
    發(fā)表于 12-12 15:43

    高質(zhì)量C語言編程

    高質(zhì)量c語言,精,精,精,精華
    發(fā)表于 07-22 13:48

    編寫高質(zhì)量C語言代碼

    編寫高質(zhì)量C語言代碼 編寫高質(zhì)量C語言代碼 編寫高質(zhì)量C語言代碼
    發(fā)表于 07-31 17:47

    高質(zhì)量編程

    干貨,《495個C語言問題》、《華為內(nèi)部程序設(shè)計編碼規(guī)范》、《C語言:陷阱和缺陷》、《高質(zhì)量C編程[林銳]》
    發(fā)表于 02-27 19:39

    基于FPGA的高速高質(zhì)量圖像旋轉(zhuǎn)

    基于FPGA的高速高質(zhì)量圖像旋轉(zhuǎn),下來看看
    發(fā)表于 08-30 15:10 ?9次下載

    獸醫(yī)超聲:高質(zhì)量和高強(qiáng)度圖像系統(tǒng)

      超聲波機(jī)器的主要用途之一是檢測動物的懷孕情況。準(zhǔn)確診斷農(nóng)場動物的懷孕需要高質(zhì)量圖像。這些機(jī)器還需要高強(qiáng)度(更高的電壓和更高的電流脈沖),以便更強(qiáng)的脈沖可以穿透大型動物。對于帶入獸醫(yī)診所的小動物,需要具有高分辨率黑白或彩色圖像
    的頭像 發(fā)表于 04-24 09:37 ?2341次閱讀

    清華朱軍團(tuán)隊(duì)提出ProlificDreamer:直接文本生成高質(zhì)量3D內(nèi)容

    Imagen 生成的照片(下圖靜態(tài)圖)和 ProlificDreamer(基于 Stable-Diffusion)生成的 3D(下圖動態(tài)圖)進(jìn)行對比。有網(wǎng)友感慨:短短一年時間,高質(zhì)量
    的頭像 發(fā)表于 05-29 10:02 ?1260次閱讀
    清華朱軍團(tuán)隊(duì)提出ProlificDreamer:直接文本<b class='flag-5'>生成</b><b class='flag-5'>高質(zhì)量</b>3D內(nèi)容

    生成高質(zhì)量 3D 網(wǎng)格,從重建到生成式 AI

    有很多優(yōu)點(diǎn),包括支持現(xiàn)有的軟件包、高級硬件加速,以及支持物理模擬。然而,并非所有網(wǎng)格都是相同的,只有高質(zhì)量的網(wǎng)格才能實(shí)現(xiàn)這些優(yōu)點(diǎn)。 NVIDIA Research 提出了一種名為“FlexiCubes”的新方法,它可以在 3D 工作流中生成
    的頭像 發(fā)表于 08-17 19:15 ?1023次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>高質(zhì)量</b> 3D 網(wǎng)格,從重建到<b class='flag-5'>生成</b>式 AI

    谷歌Gemini AI模型因人物圖像生成問題暫停運(yùn)行

    據(jù)報道,部分用戶發(fā)現(xiàn)Gemini生成的圖片存在明顯錯誤,如特斯拉創(chuàng)始人和其他名人變成了黑人模樣。谷歌已決定暫停該模型的人物圖像
    的頭像 發(fā)表于 02-25 09:59 ?877次閱讀

    谷歌計劃重新推出改進(jìn)后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席執(zhí)行官德米斯·哈薩比斯在2月26日透露,公司計劃在接下來的幾周內(nèi)重新發(fā)布其備受關(guān)注的Gemini AI模型人像生成功能。此前,由于在某些歷史
    的頭像 發(fā)表于 02-28 10:17 ?885次閱讀

    KOALA人工智能圖像生成模型問世

    近日,韓國科學(xué)團(tuán)隊(duì)宣布研發(fā)出名為 KOALA 的新型人工智能圖像生成模型,該模型在速度和質(zhì)量上均實(shí)現(xiàn)了顯著突破。KOALA 能夠在短短 2
    的頭像 發(fā)表于 03-05 10:46 ?1073次閱讀

    谷歌發(fā)布Imagen 3,提升圖像文本生成技術(shù)

    已為谷歌人工智能研究所DeepMind掌門人的德米斯·哈薩比斯指出,相比于前款Imagen 2,Image 3能夠更加精準(zhǔn)地解碼文字提示信息,并據(jù)此創(chuàng)建出更有創(chuàng)造力、細(xì)節(jié)豐富且出錯率較低的圖像
    的頭像 發(fā)表于 05-15 11:24 ?1047次閱讀

    谷歌發(fā)布AI文生圖大模型Imagen

    近日,谷歌在人工智能領(lǐng)域取得新突破,正式推出了Imagen文生圖模型。這款模型以其卓越的細(xì)節(jié)調(diào)整功能、逼真的光線效果以及從草圖快速生成高分辨
    的頭像 發(fā)表于 05-16 09:30 ?824次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該
    的頭像 發(fā)表于 05-14 16:53 ?445次閱讀

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    Pro、擴(kuò)散語言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應(yīng)用、圖像生成
    的頭像 發(fā)表于 05-22 09:01 ?5263次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來!多線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時代
    主站蜘蛛池模板: 国产成人a毛片 | 1515hh四虎免费观38com | 欧美三级在线观看视频 | 国精视频一区二区视频 | 男女无遮挡一进一出性视频 | 美女免费视频黄 | 在线视频这里只有精品 | 久久精品免费观看视频 | 乱好看的的激情伦小说 | 国产网站免费 | 日本五十交尾在线观看 | 国产中文字幕一区 | 黄色有码视频 | 免费看黄色毛片 | 在线二区| 美女张开腿让男人桶爽 | 精品久久久久久午夜 | 欧美网站在线播放 | 六月婷婷导航福利在线 | 一级特级aaa毛片 | 国产精品乳摇在线播放 | 特级毛片免费视频观看 | 午夜影院官网 | 欧洲三级网站 | 啊用力太猛了啊好深视频免费 | 喷潮白浆| 亚洲成综合人影院在院播放 | 亚洲狠狠婷婷综合久久久图片 | 美女被免费网站在线视频九色 | 免费观看一级特黄三大片视频 | 天天操天天操天天操香蕉 | 亚洲一区在线视频 | 天天爽夜爽免费精品视频 | 欧日韩美香蕉在线观看 | 欧美亚洲一区二区三区在线 | 欧美综合国产精品日韩一 | 视频在线观看一区二区三区 | 黄色三级视频网站 | 成人黄色在线网站 | 深夜国产成人福利在线观看女同 | 欧美一级一一特黄 |