在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里國際基于Gemma開放模型探索多模態應用

谷歌開發者 ? 來源:谷歌開發者 ? 2025-06-11 10:04 ? 次閱讀

作者 / 開發者品牌和聲譽營銷部 Francesca Di Felice

阿里巴巴集團是一家全球化的科技公司,其目標簡單而明確:讓天下沒有難做的生意。自 1999 年以來,該集團創建了一系列工具和基礎設施來支持中小企業。如今,阿里國際運營著全球規模最大的零售商業業務之一。

阿里巴巴為其連接全球買家和供應商的國際電子商務平臺構建了一系列多模態大模型 (MLLM)。這個名為 Ovis 的模型系列能夠感知和理解視覺信息,允許用戶輸入圖像或視頻請求并獲得文本輸出結果。其性能最佳的模型之一Ovis1.6-Gemma2-9B是基于 Gemma 構建的。

挑戰

阿里巴巴的開發者希望為公司的國際電子商務平臺創建一個有效的多模態大模型,但在尋找一個能夠勝任多種任務且易于集成的基礎模型時遇到了困難。在對現有開放模型進行初步實驗時,團隊發現這些模型在多模態推理和文本生成等關鍵領域存在多種性能差距。

經過全面測試,Gemma 2 的指令調優 9B 參數模型 (gemma-2-9b-it) 展現出最佳的綜合性能,具備卓越的指令遵循能力和強大的文本生成能力。它在數學和編程等語言任務方面的優勢使其成為多模態模型的理想基礎。然而,無縫集成視覺和文本嵌入又增加了任務的復雜度。團隊需要創新,以確保模型能夠在基于圖像的產品發布等關鍵業務應用中高效運行。

Gemma 在通用語言任務上表現尤為出色,特別是在數學和編程方面。我們利用 Gemma 的語言能力來提升我們在多模態任務上的表現。

解決方案

使用gemma-2-9b-it作為 Ovis 的基礎語言模型,為構建多模態架構奠定了堅實的基礎,彌補了視覺和文本輸入之間的差距。Ovis 采用獨特的方法:首先,它將連續的視覺特征轉換為概率性的視覺令牌 (Token)。然后,通過加權索引,Ovis 將這些令牌組裝成視覺嵌入。在此基礎上,Gemma 的 Transformer 架構將這些嵌入與文本輸入集成,確保多模態數據無縫流動。

Gemma 2 在數學和邏輯方面的優勢顯著提升了 Ovis 在推理和理解任務上的能力,使阿里巴巴團隊能夠將這一新模型部署到各種業務運營中。例如,阿里國際數字商業平臺用戶現在可以使用 Ovis 根據產品圖像來識別產品類別和屬性或添加標簽。這大大減少了手動輸入的需求,讓用戶能夠更高效地創建商品詳情。

Ovis 的功能還擴展到了其他使用場景,如檢測文本與圖像之間的一致性問題、評估圖像質量以及生成結構化輸出。這些功能彰顯了 Ovis 的多功能性及其適應各種任務的能力。

影響

Ovis 顯著改進了阿里國際數字商業平臺上的產品生產工作流程,并在推理過程中展現出卓越的效率,為多模態 AI 設定了新的標準。自發布以來,Ovis 已在 GitHub、Hugging Face、Model Scope 和 OpenCompass 等平臺上獲得了廣泛的認可和應用,甚至在 Hugging Face 首頁獲得推薦展示。

未來計劃

阿里巴巴計劃優化并擴展 Ovis 系列以適應新的應用場景,同時與其他開發者和社區分享團隊的研究成果和見解,推動創新。

擴展產品系列

阿里巴巴希望引入更多樣化的新型 Ovis 模型,以滿足更多業務需求,例如為資源有限的團隊提供較小規模的模型。開發團隊基于 gemma-2-27b 模型發布了30B 參數版本,并且已經在為未來的迭代做準備。

新用例

基于社區反饋,阿里巴巴將改進 Ovis 系列的光學字符識別、視覺理解和通用多模態理解能力,為用戶提供更多使用模型的方式。團隊還計劃利用模型出色的圖像-文本理解能力,在 Ovis 中加入照片分析、健身指導和美容建議等功能。

知識共享

阿里巴巴致力于與更廣泛的 AI 社區分享研究成果。團隊希望推動多模態技術領域中研究人員和開發者之間的協作與創新,進一步鞏固 Ovis 作為全球商業變革性工具的地位。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34589

    瀏覽量

    276236
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1637

    瀏覽量

    48120
  • 模型
    +關注

    關注

    1

    文章

    3500

    瀏覽量

    50134

原文標題:Gemmaverse 開發者故事 | 阿里國際基于 Gemma 開放模型探索多模態應用

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    愛芯通元NPU適配Qwen2.5-VL-3B視覺模態模型

    熟悉愛芯通元NPU的網友很清楚,從去年開始我們在端側模態模型適配上一直處于主動緊跟的節奏。先后適配了國內最早開源的模態大模MiniCP
    的頭像 發表于 04-21 10:56 ?1285次閱讀
    愛芯通元NPU適配Qwen2.5-VL-3B視覺<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    海康威視發布模態模型AI融合巡檢超腦

    基于海康觀瀾大模型技術體系,海康威視推出新一代模態模型AI融合巡檢超腦,全面升級人、車、行為、事件等算法,為行業帶來全新的
    的頭像 發表于 04-17 17:12 ?668次閱讀

    Google Gemma 3開發者指南

    自首次推出以來,Gemma 模型的下載量已超過 1 億次,社區為各種用例創建了超過 60,000 個變體1。我們很高興推出 Gemma 3,這是 Gemma
    的頭像 發表于 04-08 10:50 ?290次閱讀
    Google <b class='flag-5'>Gemma</b> 3開發者指南

    Google發布最新AI模型Gemma 3

    Gemma 開放模型系列是 Google 推動實用 AI 技術普惠大眾的重要基石。上個月,Gemma 迎來了首個生日。回望過去一年,其成果斐然:全球下載量突破 1 億,社區欣欣向榮,衍
    的頭像 發表于 03-18 09:51 ?775次閱讀

    海康威視發布模態模型文搜存儲系列產品

    模態模型為安防行業帶來重大技術革新,基于觀瀾大模型技術體系,海康威視將大參數量、大樣本量的圖文模態
    的頭像 發表于 02-18 10:33 ?571次閱讀

    在龍芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.運行Gemma 2大模型 如果想體驗 Google Gemma 2 可以到下面的網站選擇不同參數的大模型https://ollama.
    發表于 02-07 19:35

    智譜 GLM-PC 開放體驗,模態 Agent 升級

    1月23日,北京智譜華章科技有限公司宣布旗下智譜GLM-PC開放體驗,標志著自主操作電腦的模態Agent迎來重要升級。 GLM-PC是基于智譜
    的頭像 發表于 01-24 14:10 ?733次閱讀

    阿里云發布開源模態推理模型QVQ-72B-Preview

    近日,阿里云宣布了一項重大技術突破,正式發布了業界首個開源模態推理模型——QVQ-72B-Preview。這一模型的問世,標志著
    的頭像 發表于 12-27 10:28 ?551次閱讀

    商湯日日新模態模型權威評測第一

    剛剛,商湯科技日日新SenseNova模態模型,在權威綜合評測權威平臺OpenCompass的模態評測中取得榜單第一。
    的頭像 發表于 12-20 10:39 ?927次閱讀

    一文理解模態大語言模型——下

    /understanding-multimodal-llms ? 《一文理解模態大語言模型 - 上》介紹了什么是模態大語言
    的頭像 發表于 12-03 15:18 ?547次閱讀
    一文理解<b class='flag-5'>多</b><b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>——下

    利用OpenVINO部署Qwen2模態模型

    模態模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,
    的頭像 發表于 10-18 09:39 ?1127次閱讀

    阿里國際發布翻譯大模型Marco

    近日,阿里國際正式推出了其翻譯大模型——Marco。這款模型已在阿里國際AI官網Aidge上線,
    的頭像 發表于 10-17 16:07 ?645次閱讀

    云知聲推出山海模態模型

    在人工智能技術的浩瀚星海中,模態交互技術正成為引領未來的新航標。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創新之姿,推出了其匠心獨運的山海模態
    的頭像 發表于 08-27 15:20 ?603次閱讀

    Google Gemma 2模型的部署和Fine-Tune演示

    Google 近期發布了最新開放模型 Gemma 2,目前與同等規模的開放模型相比,取得了明顯的優勢,同時在安全可控性上得到了顯著的增強。
    的頭像 發表于 08-09 17:04 ?1216次閱讀
    Google <b class='flag-5'>Gemma</b> 2<b class='flag-5'>模型</b>的部署和Fine-Tune演示

    依圖模態模型伙伴CTO精研班圓滿舉辦

    模型在不同行業領域的應用前景;7月19日, “依圖科技模態模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖
    的頭像 發表于 07-23 15:16 ?663次閱讀
    主站蜘蛛池模板: 午夜资源| 中文字幕自拍 | 天天摸夜夜添狠狠添2018 | 欧日韩美香蕉在线观看 | 激情综合在线观看 | 亚洲欧美强伦一区二区另类 | 中国业余老太性视频 | aa视频在线| 色噜噜狠狠色综合欧洲selulu | 久久99热久久精品动漫 | 伊人久久成人爱综合网 | 国产福利午夜 | 5566成人| 欧美一级www片免费观看 | 久久精品国产精品亚洲婷婷 | 一级做a爱片特黄在线观看 一级做a爱片特黄在线观看免费看 | 人人人人凹人人爽人人澡 | 欧美肉到失禁高h视频在线 欧美三级成人 | 在线中文字幕一区 | 久久精品波多野结衣 | 另类专区欧美 | asian极品呦女爱爱 | 女性一级全黄生活片 | 精品女视频在线观看免费 | 狠狠干成人 | 精品一区亚洲 | 亚洲一区二区欧美 | 悠悠影院欧美日韩国产 | 色偷偷91久久综合噜噜噜噜 | 一级毛片黄色片 | 欧美色综合久久 | 欧美色欧美色 | 五月婷婷激情五月 | 国产精品美女www爽爽爽视频 | 激情五月婷婷丁香 | 欧美极品另类 | 色5月婷婷| 夜夜春夜夜夜夜猛噜噜噜噜噜 | 欧美seav在线 | 中文三 级 黄 色 片 | 免费视频播放 |