作者 / Clement Farabet, VP of Research, Google DeepMind; Tris Warkentin, Director, Google DeepMind
Gemma 開放模型系列是 Google 推動實用 AI 技術普惠大眾的重要基石。上個月,Gemma 迎來了首個生日。回望過去一年,其成果斐然:全球下載量突破 1 億,社區欣欣向榮,衍生模型超過 6 萬個1。Gemma 生態的蓬勃發展,不斷激發我們的創新熱情。
Gemma 生態
我們在全球推出 Gemma 3,一系列基于 Gemini 2.0 模型同源技術打造的輕量級、先進開放模型。它們是 Google 迄今為止在性能、可移植性和社會責任方面表現最出色的開放模型。Gemma 3 專為設備端高效運行而設計,讓手機、筆記本或工作站都能輕松駕馭,助力開發者隨心打造 AI 應用。Gemma 3 提供 1B、4B、12B 和 27B 等多種規格,適合不同的硬件和性能需求。
接下來,我們將深入剖析 Gemma 3 的強大之處,為你介紹全新的 ShieldGemma 2,并引導你融入日益壯大的 Gemma 生態。
Gemma 3 為開發者解鎖更多創新可能
領先的單加速器模型:Gemma 3 以小巧的體積,實現頂尖的性能。它超越了 Llama-405B、DeepSeek-V3 和 o3-mini,在 LMArena 的初步人類偏好評估中名列前茅,可助力你在單 GPU 或 TPU 環境下,打造令人驚艷的用戶體驗。
140 種語言,全球暢行:打造能與你的用戶無礙溝通的應用。Gemma 3 開箱即支持超過 35 種語言,并針對 140 多種語言進行了預訓練。
強大的文本和視覺推理能力:輕松打造能深度解析圖片、文本和短視頻的應用,開啟智能交互的無限潛能。
更大上下文窗口,駕馭復雜任務:Gemma 3 支持 128k token 的上下文窗口,助力你的應用深度理解和處理大量信息。
支持函數調用,構建智能 AI 工作流:Gemma 3 支持函數調用和結構化輸出,助你實現任務自動化,構建智能 "代理"。
量化模型,更快實現卓越性能:Gemma 3 提供官方量化版本,在保證精度的前提下,有效降低模型體積和計算資源消耗。
此圖展示了多款 AI 模型在 Chatbot Arena Elo 評分體系中的排名,分數 (頂部數值) 越高,代表用戶偏好度越高。底部的圓點代表預估的 NVIDIA H1 00 GPU 需求量。Gemma 3 27B 模型表現優異,僅需單個 GPU 即可運行,而其他模型最多需要 32 個。
若想深入了解這些強大功能背后的技術細節,以及對我們所用的負責任開發方法的全面解讀,請參閱 Gemma 3 技術報告。
以嚴格的安全規范,負責任地打造 Gemma 3
我們堅信,開放模型必須經過嚴密的風險評估。我們的策略是在創新與安全之間取得平衡,并依據模型性能調整測試力度。Gemma 3 的研發過程融入了完善的數據治理,通過精細調校和嚴謹的基準測試,確保其與我們的安全準則高度契合。盡管對更強大模型的深入測試,往往能為我們評估較弱模型提供參考,但鑒于 Gemma 3 在 STEM 領域的顯著提升,我們特別針對其在有害內容生成方面的潛在濫用風險,進行了專項評估。結果顯示,該風險處于較低水平。
隨著業界不斷涌現更強大的模型,我們亟需共同探索與風險相匹配的安全策略。我們將持續學習,并不斷優化開放模型的安全實踐。
ShieldGemma 2:圖像應用的內置安全屏障
在 Gemma 3 發布之際,我們還同步推出了 ShieldGemma 2,一款基于 Gemma 3 架構的強大 4B 圖像安全檢測工具。ShieldGemma 2 提供開箱即用的圖像安全解決方案,針對危險內容、色情內容和暴力內容三大類別,輸出安全標簽。開發者可根據自身需求和用戶偏好,對 ShieldGemma 進行深度定制。ShieldGemma 2 秉承開放理念,賦予開發者充分的靈活性和掌控力,并依托 Gemma 3 架構的高效性能,推動負責任的 AI 開發。
與你熟悉的工具無縫集成
Gemma 3 和 ShieldGemma 2 能夠無縫集成到你現有的工作流程中:
使用喜愛的工具進行開發:Gemma 3 和 ShieldGemma 2 全面支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp,讓你隨心選擇最適合項目需求的開發工具。
秒速上手,即刻開始試驗:立即體驗 Gemma 3,開啟開發進程。你可以在 Google AI Studio 中盡情探索其強大功能,或通過 Kaggle 或 Hugging Face 下載模型。
個性定制,滿足獨特需求:Gemma 3 的代碼庫重構升級,提供高效微調和推理的實用方案。你可以在 Google Colab、Vertex AI,甚至游戲顯卡等你偏好的平臺上,對模型進行訓練和適配。
靈活部署,方案隨心選擇:Gemma 3 支持多種部署方式,涵蓋 Vertex AI、Cloud Run、Google GenAI API、本地環境及其他平臺,讓你根據應用和架構需求,自由選擇最佳部署方案。
NVIDIA GPU 優化,盡享卓越性能:NVIDIA 直接對 Gemma 3 模型進行了深度優化,確保你在從 Jetson Nano 到最新 Blackwell 芯片的各類 GPU 上,都能獲得最佳性能。
Gemma 3 現已入駐 NVIDIA API Catalog,只需一次 API 調用,即可快速構建原型。
跨越多種硬件平臺,加速 AI 開發進程:Gemma 3 不僅針對 Google Cloud TPU 做了深度優化,還通過開源 ROCm 堆棧與 AMD GPU 實現了集成。對于 CPU 環境,Gemma.cpp 提供了直接高效的解決方案。
模型與工具構筑的 "Gemma 宇宙"
Gemma 生態是一個由社區共建的龐大體系,匯聚了眾多 Gemma 模型與工具,為創新提供源源不斷的動力。例如,AI Singapore 的 SEA-LION v3 致力于消除語言隔閡,促進東南亞地區的交流;INSAIT 的 BgGPT 是首款以保加利亞語為核心的大語言模型,充分展現了 Gemma 卓越的多語言能力;Nexa AI 的 OmniAudio 則揭示了設備端 AI 的無限潛力,將先進的音頻處理能力帶入人們的日常生活。
為助力學術研究的創新突破,我們正式啟動了 Gemma 3 學術計劃。學術研究人員可申請價值 1 萬美元的 Google Cloud 抵用金,加速基于 Gemma 3 的研究進程。申請通道即日開啟,持續四周。歡迎訪問我們的網站提交申請。
即刻開啟 Gemma 3 探索之旅
秉承我們對普及優質 AI 的不懈追求,Gemma 3 應運而生,開啟全新篇章。準備好探索 Gemma 3 的強大功能了嗎?請參考以下入門指南:
去上手探索
通過 Google AI Studio,無需任何設置,即可在瀏覽器中直接體驗全精度的 Gemma 3。
在 Google AI Studio 中獲取 API 密鑰,然后通過 Google GenAI SDK 輕松調用 Gemma 3。
https://ai.google.dev/gemini-api/docs/sdks
定制和開發
從 Hugging Face、Ollama 或 Kaggle 下載 Gemma 3 模型。
利用 Hugging Face 的 Transformers 庫,或使用你偏好的開發環境,輕松對模型進行微調和適配,使其滿足你的獨特需求。
部署和拓展
利用 Vertex AI,將你的 Gemma 3 定制成果大規模推向商業應用。
使用 Ollama,在 Cloud Run 上進行推理運算。
通過 NVIDIA API Catalog 上手使用 NVIDIA NIM 推理微服務。
-
Google
+關注
關注
5文章
1787瀏覽量
58678 -
AI
+關注
關注
87文章
34256瀏覽量
275411 -
模型
+關注
關注
1文章
3487瀏覽量
49995
原文標題:Gemma 3 發布:巔峰性能,單 GPU/TPU 即可運行
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Gemini API集成Google圖像生成模型Imagen 3
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
在龍芯3a6000上部署DeepSeek 和 Gemma2大模型
定制本地的ChatFile的AI問答系統

Google兩款先進生成式AI模型登陸Vertex AI平臺
Google DeepMind發布Genie 2:打造交互式3D虛擬世界
Google AI Edge Torch的特性詳解

谷歌推出效率與性能躍階的全新開放模型標準

Google Gemma 2模型的部署和Fine-Tune演示

評論