谷歌開源70億參數大語言模型，全方位超越Meta Llama-2？

電子發燒友網報道（文/周凱揚）在Sora把AI生成領域的視線全部吸引過去的這段時間里，谷歌卻依然在竭盡全力推進新的生成模型發展。除了上周發布的下一代Gemini 1.5外，谷歌也在近日推出了一系列基于Gemini打造的開源模型Gemma。

谷歌加入AI模型開源陣營，Gemma橫空出世

根據谷歌的介紹，Gemma是由谷歌DeepMind以及其他團隊開發，由Gemini啟發并采用了相同的研究與技術的輕量級模型。與之一起發布的還有全新的響應式生成AI工具包，為利用Gemma創造更安全的AI應用提供關鍵工具和指導。

從參數大小上來看，Gemma分為20億參數（Gemma 2B）和70億（Gemma 7B）參數兩個版本，且每個版本又有基礎版（預訓練）和指令調整版兩個變體。其中70億參數的版本適合消費級的GPU和TPU開發，而20億參數的版本可以用于CPU和端側應用上。

在預訓練數據上，Gemma 2B和7B分別采用了2T和6T的Token進行訓練，數據來源是以英文為主的網絡文檔、數學計算和代碼。需要注意的是，盡管其背后所采用的技術與Gemini類似，但這些模型并不屬于多模態模型，也并不適合用于追求極致的多語言任務性能。

在訓練硬件上，谷歌采用了自研的TPUv5e，其中Gemma 7B用到了4096塊TPUv5e進行訓練，Gemma 2B用到了512塊TPUv5e進行訓練。

開源LLM混戰，Gemma 7B超越Llama-2 13B？

根據谷歌官方提供的數據，與Meta的Llama-2相比，Gemma 7B在多個項目上展現出了優勢，比如大規模多任務語言理解（MMLU）、GSM8K和Math計算和HumanEval Python代碼生成等應用上，都超過了Llama-2 7B，甚至不少超過了Llama-2 13B。

開源模型文本任務性能對比 / 谷歌

谷歌表示，與同等體量的開源模型對比，比如LLaMA-2和Mistral等，18項文字相關的任務中，Gemma能夠做到在11項任務中性能勝出，且平均性能得分占優。

不過Gemma也并不是完全超越了Llama-2，從Huggingface給出的平均得分來看，Gemma 7B超過了同級別的Llama 2 7B，但還是低于LLama 2 70B Chat，不過考慮到這兩者之間的參數差異，也印證了Gemma 7B的強大。至于Gemma 2B，與同規格的其他優秀開源LLM相比，比如PHI-2(2.7B)，也不存在優勢。

作為一個輕量級的模型，Gemma也對跨設備兼容性做了優化，可以在筆記本、PC、IoT設備、智能手機和云端運行。谷歌也與英偉達達成合作，Gemma針對英偉達的GPU硬件進行了優化，無論是云端的AI GPU還是桌面端的RTX AI PC，都能享受Gemma帶來的性能。

寫在最后

盡管Gemma是谷歌首個大型的開源LLM，但這早已經不是谷歌對開源AI社區做出的首個貢獻了，諸如Transformers, TensorFlow, BERT, T5, JAX, AlphaFold和AlphaCode等，可以說當前AI能夠有如此繁榮的開發生態，谷歌做出了不少貢獻。無疑Gemma的出現，也會給AI開發生態帶來新的選擇。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6231

瀏覽量
107879
AI

AI

+關注

關注
88

文章
34839

瀏覽量
277363
算力

算力

+關注

關注
2

文章
1175

瀏覽量
15564
大模型

大模型

+關注

關注
2

文章
3094

瀏覽量
3984

E4Life
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot ASML 2023年末爆單，中國貢獻營收翻倍
Hot 蘋果瘋狂堆料M1 Max與Pro，圖形性能直超RTX 3080？！

New 只能跑Transformer的AI芯片，卻號稱全球最快？
New 臺積電開始探索面板級封裝，但三星更早？

精選推薦
更多

文章

資料

帖子

如何在樹莓派上安裝并運行 Arduino 集成開發環境！

上海晶珩電子科技有限公司
3小時前

122 閱讀

W55MH32以太網單片機開發教程第三十四章 TRNG——真隨機數

W55MH32
4小時前

172 閱讀

第三十一章 MCO——PA8從主頻分頻輸出

W55MH32
4小時前

154 閱讀

解讀納微電機驅動專用型GaNSense氮化鎵功率芯片

納微芯球
5小時前

210 閱讀

RGB+EVS視覺融合相機：事件相機的革命性突破?

視美泰
6小時前

212 閱讀

使用因果圖設計測試用例

張勇
110

5積分

24下載

芯景科技AT400 LED驅動芯片

南風一號
180

5積分

48下載

Rio MicroPaaS平臺

胡秋陽
15.30 MB

2積分

1下載

RustDesk開源遠程桌面軟件

陳秀英
0.62 MB

免費

0下載

Kakoune代碼編輯器

1652711011.026500
1.24 MB

2積分

1下載

【BPI-CanMV-K230D-Zero開發板體驗】02 按鍵中斷切換彩色LED顏色

jf_83922529
20小時前

81 閱讀

實現低漏電流同時保證 EMI 性能的電源設計

yuu_cool
20小時前

76 閱讀

零知開源——基于STM32F407VET6零知增強板的四路獨立計時器

PCB56242069
20小時前

134 閱讀

【潤開鴻HH-SCDAYU800A開發板試用體驗】Hello World

傘振凱
20小時前

216 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】人臉檢測、手勢識別、車牌識別

jf_07365693
1天前

393 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

谷歌開源70億參數大語言模型，全方位超越Meta Llama-2？

評論

搜索歷史

谷歌開源70億參數大語言模型，全方位超越Meta Llama-2？

評論

谷歌開源70億參數大語言模型，全方位超越Meta Llama-2？