作者 / Android Studio 開發者產品經理 Paris Hsu
在開發生命周期的每個階段,Android Studio 中的 Gemini 都已成為您的 AI 助手,助您更輕松地構建高質量的應用。我們很高興地與您分享一項重大升級:Android Studio 中的 Gemini 現已支持多模態輸入,您可在提示中直接添加圖像!這為團隊協作和界面開發工作流程解鎖了更多新的可能性。
您可以下載最新的 Android Studio Canary 版來體驗這項新功能。我們列舉了一些可以嘗試的用例,目前仍在努力將此功能引入未來的穩定版本。在此過程中,我們十分期待了解您的想法與反饋。
圖像附件 - 交互新維度
我們在 2024 Google I/O 大會上首次預覽了 Gemini 的多模態功能。借助這項技術,Android Studio 中的 Gemini 能夠理解簡單的線框圖,并將其轉換為可運行的 Jetpack Compose 代碼。
現在,您可以在 Gemini 聊天窗口中找到圖像附件圖標。只需將 JPEG 或 PNG 文件作為附件添加到提示中,即可靜待 Gemini 理解并響應視覺信息。我們觀察到,具有強烈色彩對比度的圖像效果最佳。
我們建議您嘗試各種提示和圖像。您可從以下這些引人注目的用例入手:
快速界面原型設計和迭代:將應用界面的簡單線框圖或高保真原型轉換為可運行的代碼。
圖表說明和文檔:讓 Gemini 解釋復雜架構或數據流程圖的組成部分和關系,從而獲得更深入的理解。
界面問題排查:捕獲界面錯誤屏幕截圖,并向 Gemini 尋求解決方案。
快速界面原型設計和迭代
Gemini 的多模態支持可讓您將視覺設計轉換為可運行的界面代碼。您只需上傳圖像并使用清晰的提示即可。無論您是提供自己制作的草圖還是設計師的模型圖,這一功能都可以發揮作用。
以下是一個示例提示:"請根據提供的圖像編寫 Android Jetpack Compose 代碼,生成一個盡可能接近該圖像的界面。請確保包括導入語句、使用 Material3 并添加代碼注釋。" 然后,您可以根據需要添加與圖像相關的特定或附加說明。
對于更復雜的界面,請優化您的提示以明確所需的特定功能。例如,在轉換計算器原型時,添加 "使交互和計算按預期工作" 的提示,會生成一個功能完備的計算器:
請注意:此功能提供的是一個初始的設計框架。這是一個很好的 "初稿",需要您進行編輯和調整。常見的優化包括確保導入正確的可繪制資源和圖標。您可以將生成的代碼理解為高效的起點,從而加快您的界面開發工作流程。
圖表說明和文檔
借助 Gemini 的多模態能力,您還可以嘗試上傳圖表圖像,并要求提供解釋或生成文檔。
提示示例:上傳 Now in Android 架構圖,并輸入 "解釋此圖中的組件和數據流" 或 "撰寫有關此圖的文檔"。
界面問題排查
利用 Gemini 的視覺分析能力來快速識別和解決 bug。上傳有問題的界面屏幕截圖,Gemini 將分析圖像并提供潛在的解決方案。您還可以添加相關的代碼片段,以獲得更精確的幫助。
在下面的示例中,我們使用了 Compose 界面檢查,發現按鈕在平板電腦屏幕上拉伸得太寬,因此我們截取了屏幕截圖并要求 Gemini 提供解決方案——它能夠利用窗口大小類別 (Window Size Classes) 來提供正確的解決方案。
-
Android
+關注
關注
12文章
3961瀏覽量
129428 -
AI
+關注
關注
87文章
33972瀏覽量
274854 -
Studio
+關注
關注
2文章
203瀏覽量
29471
原文標題:Android Studio 中的 Gemini 現已支持多模態圖像附件功能
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
谷歌I/O 2025大會前透露:Android 16接入Gemini,智能手機、XR設備升級

MaaS X Cherry Studio:基于DeepSeek API快速構建個人AI智能助手

谷歌Gemini API最新進展
?多模態交互技術解析
字節跳動發布OmniHuman 多模態框架
三星 Galaxy S25 系列與谷歌 Gemini 深度整合

谷歌推出Gemini 2.0 Flash體驗版
商湯日日新多模態大模型權威評測第一
谷歌正式發布Gemini 2.0 性能提升近兩倍
谷歌發布Gemini 2.0 AI模型
Waymo利用谷歌Gemini大模型,研發端到端自動駕駛系統
利用OpenVINO部署Qwen2多模態模型
Build 2024發布多項Azure AI Speech全新多模態功能

評論