在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開源70億參數大語言模型,全方位超越Meta Llama-2?

E4Life ? 來源:電子發燒友 ? 作者:周凱揚 ? 2024-02-23 00:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)在Sora把AI生成領域的視線全部吸引過去的這段時間里,谷歌卻依然在竭盡全力推進新的生成模型發展。除了上周發布的下一代Gemini 1.5外,谷歌也在近日推出了一系列基于Gemini打造的開源模型Gemma。

谷歌加入AI模型開源陣營,Gemma橫空出世

根據谷歌的介紹,Gemma是由谷歌DeepMind以及其他團隊開發,由Gemini啟發并采用了相同的研究與技術的輕量級模型。與之一起發布的還有全新的響應式生成AI工具包,為利用Gemma創造更安全的AI應用提供關鍵工具和指導。

從參數大小上來看,Gemma分為20億參數(Gemma 2B)和70億(Gemma 7B)參數兩個版本,且每個版本又有基礎版(預訓練)和指令調整版兩個變體。其中70億參數的版本適合消費級的GPU和TPU開發,而20億參數的版本可以用于CPU和端側應用上。

在預訓練數據上,Gemma 2B和7B分別采用了2T和6T的Token進行訓練,數據來源是以英文為主的網絡文檔、數學計算和代碼。需要注意的是,盡管其背后所采用的技術與Gemini類似,但這些模型并不屬于多模態模型,也并不適合用于追求極致的多語言任務性能。

在訓練硬件上,谷歌采用了自研的TPUv5e,其中Gemma 7B用到了4096塊TPUv5e進行訓練,Gemma 2B用到了512塊TPUv5e進行訓練。

開源LLM混戰,Gemma 7B超越Llama-2 13B?

根據谷歌官方提供的數據,與Meta的Llama-2相比,Gemma 7B在多個項目上展現出了優勢,比如大規模多任務語言理解(MMLU)、GSM8K和Math計算和HumanEval Python代碼生成等應用上,都超過了Llama-2 7B,甚至不少超過了Llama-2 13B。

wKgaomXXHwmAORLbAAExLTvutQk859.png
開源模型文本任務性能對比 / 谷歌


谷歌表示,與同等體量的開源模型對比,比如LLaMA-2和Mistral等,18項文字相關的任務中,Gemma能夠做到在11項任務中性能勝出,且平均性能得分占優。

不過Gemma也并不是完全超越了Llama-2,從Huggingface給出的平均得分來看,Gemma 7B超過了同級別的Llama 2 7B,但還是低于LLama 2 70B Chat,不過考慮到這兩者之間的參數差異,也印證了Gemma 7B的強大。至于Gemma 2B,與同規格的其他優秀開源LLM相比,比如PHI-2(2.7B),也不存在優勢。

作為一個輕量級的模型,Gemma也對跨設備兼容性做了優化,可以在筆記本、PC、IoT設備、智能手機和云端運行。谷歌也與英偉達達成合作,Gemma針對英偉達的GPU硬件進行了優化,無論是云端的AI GPU還是桌面端的RTX AI PC,都能享受Gemma帶來的性能。

寫在最后

盡管Gemma是谷歌首個大型的開源LLM,但這早已經不是谷歌對開源AI社區做出的首個貢獻了,諸如Transformers, TensorFlow, BERT, T5, JAX, AlphaFold和AlphaCode等,可以說當前AI能夠有如此繁榮的開發生態,谷歌做出了不少貢獻。無疑Gemma的出現,也會給AI開發生態帶來新的選擇。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    107879
  • AI
    AI
    +關注

    關注

    88

    文章

    34839

    瀏覽量

    277363
  • 算力
    +關注

    關注

    2

    文章

    1175

    瀏覽量

    15564
  • 大模型
    +關注

    關注

    2

    文章

    3094

    瀏覽量

    3984
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進行推理時出現“從 __Int64 轉換為無符號 int 的錯誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發表于 06-25 07:20

    無法在OVMS上運行來自Meta的大型語言模型 (LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama
    發表于 03-05 08:07

    在算力魔方上本地部署Phi-4模型

    ?作者:算力魔方創始人/英特爾邊緣計算創新大使 劉力 前面我們分享了《Meta重磅發布Llama 3.3 70B:開源AI模型的新里程碑》,
    的頭像 發表于 01-15 11:05 ?479次閱讀
    在算力魔方上本地部署Phi-4<b class='flag-5'>模型</b>

    Meta重磅發布Llama 3.3 70B:開源AI模型的新里程碑

    ?在人工智能領域,Meta的最新動作再次引起了全球的關注。今天,我們見證了Meta發布的 Llama 3.3 70B 模型,這是一個
    的頭像 發表于 12-18 16:46 ?567次閱讀
    <b class='flag-5'>Meta</b>重磅發布<b class='flag-5'>Llama</b> 3.3 <b class='flag-5'>70</b>B:<b class='flag-5'>開源</b>AI<b class='flag-5'>模型</b>的新里程碑

    Meta推出Llama 3.3 70B,AI大模型競爭白熱化

    在今年的AI領域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時,馬斯克的xAI也宣布其Grok模型從今
    的頭像 發表于 12-09 14:50 ?791次閱讀

    用Ollama輕松搞定Llama 3.2 Vision模型本地部署

    Ollama 是一個開源的大語言模型服務工具,它的核心目的是簡化大語言模型(LLMs)的本地部署和運行過程,請參考《Gemma
    的頭像 發表于 11-23 17:22 ?3685次閱讀
    用Ollama輕松搞定<b class='flag-5'>Llama</b> 3.2 Vision<b class='flag-5'>模型</b>本地部署

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴展了 Meta Llama 開源模型集的
    的頭像 發表于 11-20 09:59 ?751次閱讀

    Meta發布Llama 3.2量化版模型

    近日,Meta開源Llama 3.2的1B與3B模型后,再次為人工智能領域帶來了新進展。10月24日,Meta正式推出了這兩個
    的頭像 發表于 10-29 11:05 ?816次閱讀

    Llama 3 語言模型應用

    在人工智能領域,語言模型的發展一直是研究的熱點。隨著技術的不斷進步,我們見證了從簡單的關鍵詞匹配到復雜的上下文理解的轉變。 一、Llama 3 語言
    的頭像 發表于 10-27 14:15 ?706次閱讀

    亞馬遜云科技上線Meta Llama 3.2模型

    亞馬遜云科技近日宣布,Meta公司的新一代模型Llama 3.2已在其平臺上正式上線。該模型包括Meta首款多模態
    的頭像 發表于 10-11 18:08 ?732次閱讀

    亞馬遜云科技正式上線Meta Llama 3.2模型

    亞馬遜云科技宣布,Meta的新一代模型Llama 3.2,包括其首款多模態模型,現已在Amazon Bedrock和Amazon SageMaker中正式可用。
    的頭像 發表于 10-11 09:20 ?847次閱讀

    PerfXCloud平臺成功接入Meta Llama3.1

    近日,Meta對外宣布推出迄今為止最強大的開源模型——Llama3.1 405B,同時還發布了全新優化升級的70B和8B版本,技術革新的浪潮
    的頭像 發表于 07-25 10:26 ?881次閱讀

    Meta發布全新開源模型Llama 3.1

    科技巨頭Meta近期震撼發布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標志著Meta在AI領域的又一重大突破。
    的頭像 發表于 07-24 18:25 ?1766次閱讀

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數據策管、合成數據生成、微調、檢索、防護到評估的全方位生成式 AI 模型服務,以便部署自定義 Llama 3.1 NVIDIA NIM 微服務和新的 NVIDIA NeMo
    發表于 07-24 09:39 ?905次閱讀
    NVIDIA AI Foundry 為全球企業打造自定義 <b class='flag-5'>Llama</b> 3.1 生成式 AI <b class='flag-5'>模型</b>

    Meta即將發布超強開源AI模型Llama 3-405B

    在人工智能領域的激烈競爭中,Meta公司再次擲出重磅炸彈,宣布將于7月23日正式發布其最新力作——Llama 3-405B,一個擁有驚人4050參數
    的頭像 發表于 07-18 09:58 ?1308次閱讀
    主站蜘蛛池模板: 国产天天射 | 日韩a毛片免费全部播放完整 | 伊人网视频在线 | 亚洲视频色 | 国产成人精品三级在线 | 一级片免费在线 | 免费人成动漫在线播放r18 | 四虎影视最新 | 女bbbbxxxx另类亚洲 | 欧美aaa| 国模私拍在线观看 | 在线高清视频大全 | 日本免费一级 | 乱子伦xxxx厨房 | 手机天堂网 | 日韩一级在线观看 | 天天看天天爽 | 国产网站在线免费观看 | 圆胖肥女人性视频 | 欧美三级网站 | 日本xxxxbbbb | 亚洲看黄 | 免费被黄网站在观看 | 五月天丁香婷婷网 | 窝窝午夜看片成人精品 | 四虎国产精品永久在线播放 | 黄色在线免费看 | 欧美激情综合亚洲五月蜜桃 | 午夜精品视频在线看 | 1024在线观看你懂的 | 加勒比色综合 | 亚洲精品美女久久久 | 色网站免费看 | 神马电影天堂网 | 在线观看视频在线观看 | 欧美性猛交xxxx乱大交中文 | 亚洲精品自拍区在线观看 | 性欧美处 | 欧美成人午夜影院 | 亚洲成a人片在线看 | 天天骑夜夜操 |