作者 / 產品經理 Ivan Solovyev
開發者現在可以通過 Gemini API 訪問 Google 最先進的圖像生成模型 Imagen 3。該模型最初僅對付費用戶開放,不久后也將面向免費用戶推出。
Imagen 3 擅長生成具有視覺吸引力、無偽影且風格多樣的圖像,從超現實主義圖像到印象派風景,從抽象構圖到動漫角色等應有盡有。改進后的提示遵循能力使其能夠輕松地將絕佳創意轉化為高質量圖像。總體而言,Imagen 3 在各種基準測試中展現出了最先進的性能。通過 Gemini API 使用 Imagen 3 的價格為每張圖像 0.03 美元,并且用戶可以控制寬高比、生成選項數量等更多參數。
為了幫助遏制錯誤信息和錯誤歸因,所有由 Imagen 3 生成的圖像都包含一個不可見的數字SynthID水印,用于識別它們為 AI 生成的圖像。
了解 Imagen 3 的實際效果
下方圖庫展示了Imagen 3在多種風格圖像上的卓越表現。
開始使用 Gemini API 中的 Imagen 3
此 Python 代碼段展示了如何使用 Gemini API 和 Imagen 3 生成圖像。
fromgoogleimportgenai fromgoogle.genaiimporttypes fromPILimportImage fromioimportBytesIO client = genai.Client(api_key='GEMINI_API_KEY') response = client.models.generate_images( model='imagen-3.0-generate-002', prompt='a portrait of a sheepadoodle wearing cape', config=types.GenerateImagesConfig( number_of_images=1, ) ) forgenerated_imageinresponse.generated_images: image = Image.open(BytesIO(generated_image.image.image_bytes)) image.show()圖像已生成
您可以在 Gemini API 開發者文檔中探索更多關于提示技巧和圖像風格的內容,有關評分、方法論及性能提升的更多詳情,請參閱我們更新后的技術報告附錄 D。
我們非常高興能夠邁出第一步,將我們的生成式媒體模型擴展至 Gemini API。我們還計劃在不久的將來推出更多模型,以便開發者能夠將生成式媒體與語言模型結合起來使用。
-
Google
+關注
關注
5文章
1789瀏覽量
58908 -
Gemini
+關注
關注
0文章
67瀏覽量
7896 -
圖像生成
+關注
關注
0文章
25瀏覽量
7027
原文標題:Gemini API 集成 Imagen 3,帶來更強大的圖像生成功能
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺
谷歌Gemini 2.5模型系列更新
AlphaEvolve:一款基于Gemini的編程Agent,用于設計高級算法

谷歌Gemini API最新進展
谷歌 Gemini 2.0 Flash 系列 AI 模型上新
谷歌推出Gemini 2.0 Flash體驗版
借助谷歌Gemini和Imagen模型生成高質量圖像

OpenAI暫不推出Sora視頻生成模型API
谷歌正式發布Gemini 2.0 性能提升近兩倍
谷歌發布Gemini 2.0 AI模型
在設備上利用AI Edge Torch生成式API部署自定義大語言模型

評論