在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hugging Face推出最小AI視覺語言模型

麥辣雞腿堡 ? 來源:網(wǎng)絡(luò)整理 ? 2025-01-24 14:15 ? 次閱讀

Hugging Face平臺于1月23日發(fā)布博文,推出了兩款令人矚目的輕量級AI模型——SmolVLM-256M-Instruct和SmolVLM-500M-Instruct。

其中,SmolVLM-256M-Instruct僅有2.56億參數(shù),是有史以來發(fā)布的最小視覺語言模型,可在內(nèi)存低于1GB的PC上運(yùn)行并提供卓越性能。SmolVLM-500M-Instruct有5億參數(shù),主要針對硬件資源限制,幫助開發(fā)者應(yīng)對大規(guī)模數(shù)據(jù)分析挑戰(zhàn)。

這兩款模型具備先進(jìn)的多模態(tài)能力,可執(zhí)行圖像描述、短視頻分析以及回答關(guān)于PDF或科學(xué)圖表的問題等任務(wù)。其開發(fā)依賴于The Cauldron和Docmatix兩個專有數(shù)據(jù)集。The Cauldron包含50個高質(zhì)量圖像和文本數(shù)據(jù)集,側(cè)重于多模態(tài)學(xué)習(xí);Docmatix專為文檔理解定制,將掃描文件與詳細(xì)標(biāo)題配對以增強(qiáng)理解。

此外,模型采用了更小的視覺編碼器SigLIP base patch-16/512,通過優(yōu)化圖像標(biāo)記處理方式,減少了冗余,還將圖像編碼速率提升至每個標(biāo)記4096像素,相比早期版本的每標(biāo)記1820像素有了顯著改進(jìn)。

Hugging Face此次推出的最小AI視覺語言模型,為AI在低資源設(shè)備上的應(yīng)用開辟了新的道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47683

    瀏覽量

    240302
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    10342
  • AI視覺
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    4510
收藏 人收藏

    評論

    相關(guān)推薦

    廣和通推出AI玩具大模型解決方案

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實(shí)現(xiàn)
    的頭像 發(fā)表于 01-21 10:27 ?223次閱讀

    AI語言模型開發(fā)步驟

    開發(fā)一個高效、準(zhǔn)確的大語言模型是一個復(fù)雜且多階段的過程,涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計(jì)、訓(xùn)練與優(yōu)化、評估與調(diào)試等多個環(huán)節(jié)。接下來,AI部落小編為大家詳細(xì)闡述
    的頭像 發(fā)表于 12-19 11:29 ?281次閱讀

    NaVILA:加州大學(xué)與英偉達(dá)聯(lián)合發(fā)布新型視覺語言模型

    日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了一款創(chuàng)新的視覺語言模型——NaVILA。該模型在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了獨(dú)特的應(yīng)用潛力,為智能機(jī)
    的頭像 發(fā)表于 12-13 10:51 ?346次閱讀

    語言模型開發(fā)語言是什么

    在人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小編為您介紹大
    的頭像 發(fā)表于 12-04 11:44 ?231次閱讀

    谷歌全新推出開放式視覺語言模型PaliGemma

    這種熱烈的反響非常鼓舞人心,開發(fā)者們打造了一系列多樣的項(xiàng)目,例如用于印度語言的多語言變體 Navarasa,以及設(shè)備端側(cè)動作模型 Octopus v2。開發(fā)者們展示了 Gemma 在打造極具影響力且易于使用的
    的頭像 發(fā)表于 10-15 17:37 ?452次閱讀

    谷歌推出效率與性能躍階的全新開放模型標(biāo)準(zhǔn)

    AI 有可能解決人類面臨的一些最緊迫的問題,但前提是每個人都擁有構(gòu)建 AI 的工具。這就是我們在今年早些時候推出 Gemma 的原因,Gemma 是一系列輕量級開放模型系列,采用了與創(chuàng)
    的頭像 發(fā)表于 09-09 15:43 ?441次閱讀
    谷歌<b class='flag-5'>推出</b>效率與性能躍階的全新開放<b class='flag-5'>模型</b>標(biāo)準(zhǔn)

    借助Arm Neoverse加速Hugging Face模型

    人工智能 (AI) 有望觸及并改變我們生活的方方面面。如今,包括醫(yī)療保健、金融、制造、教育、媒體和運(yùn)輸?shù)仍趦?nèi)的各行各業(yè)都在利用 AI 進(jìn)行創(chuàng)新。它們通過運(yùn)行復(fù)雜的 AI 工作負(fù)載來提高生產(chǎn)力,改善消費(fèi)者決策,提升教育體驗(yàn)等,而這
    的頭像 發(fā)表于 09-02 10:44 ?359次閱讀
    借助Arm Neoverse加速<b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b><b class='flag-5'>模型</b>

    Hugging Face科技公司推出SmolLM系列語言模型

    7月22日最新資訊,Hugging Face科技公司在語言模型領(lǐng)域再創(chuàng)新高,正式推出了SmolLM系列——一款專為適應(yīng)多樣計(jì)算資源而設(shè)計(jì)的緊
    的頭像 發(fā)表于 07-23 16:35 ?398次閱讀

    亞馬遜云攜手AI新創(chuàng)企業(yè)Hugging Face,提升AI模型在定制芯片計(jì)算性能

    Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開發(fā)者分享Chatbot和相關(guān)軟件的核心平臺,受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。
    的頭像 發(fā)表于 05-23 14:24 ?458次閱讀

    Hugging Face提供1000萬美元免費(fèi)共享GPU

    全球最大的開源AI社區(qū)Hugging Face近日宣布,將提供價值1000萬美元的免費(fèi)共享GPU資源,以支持開發(fā)者創(chuàng)造新的AI技術(shù)。這一舉措旨在幫助小型開發(fā)者、研究人員和初創(chuàng)公司,對抗
    的頭像 發(fā)表于 05-20 09:40 ?714次閱讀

    Hugging Face推出開源機(jī)器人代碼庫LeRobot

    AI領(lǐng)域的佼佼者Hugging Face近日宣布重磅推出并全面開源其機(jī)器人工具包——LeRobot。這一創(chuàng)新工具包基于史上最大規(guī)模的眾包機(jī)器人數(shù)據(jù)集,為開發(fā)者提供了一個前所未有的平臺。
    的頭像 發(fā)表于 05-09 10:32 ?635次閱讀

    Snowflake推出面向企業(yè)AI的大語言模型

    Snowflake公司近日推出了企業(yè)級AI模型——Snowflake Arctic,這是一款大型語言模型(LLM),專為滿足企業(yè)復(fù)雜工作負(fù)載
    的頭像 發(fā)表于 05-07 10:03 ?510次閱讀

    【大語言模型:原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

    下游任務(wù)提供豐富的文本表示,如谷歌公司推出的BERT。(2) Decoder-Only 預(yù)訓(xùn)練語言模型:這類模型一般使用單向的 Decoder 結(jié)構(gòu),通常擅長生成任務(wù),如OpenAI
    發(fā)表于 05-05 12:17

    Stability AI發(fā)布Stable Code Instruct 3B大語言模型,可編譯多種編程語言

    據(jù)報道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型,此款模型的顯著特點(diǎn)是
    的頭像 發(fā)表于 03-27 10:04 ?582次閱讀

    ServiceNow、Hugging Face 和 NVIDIA 發(fā)布全新開放獲取 LLM,助力開發(fā)者運(yùn)用生成式 AI 構(gòu)建企業(yè)應(yīng)用

    2024 年 2 月 28 日 - ServiceNow(NYSE:NOW)、Hugging Face 和 NVIDIA 于今日發(fā)布 StarCoder2,其為一系列用于代碼生成的開放獲取大語言
    發(fā)表于 02-29 11:12 ?270次閱讀
    ServiceNow、<b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 和 NVIDIA 發(fā)布全新開放獲取 LLM,助力開發(fā)者運(yùn)用生成式 <b class='flag-5'>AI</b> 構(gòu)建企業(yè)應(yīng)用
    主站蜘蛛池模板: 婷婷丁香色综合狠狠色 | 美女张开腿让男人桶爽 | 国产又色又爽又黄的网站在线一级 | 国产一区二区三区在线观看影院 | 一级黄视频 | 成人国产三级精品 | 国产精品久久久亚洲第一牛牛 | 成人美女隐私免费 | zsvdy午夜片 爱爱456高清国语在线456 | 亚洲大黑香蕉在线观看75 | 看天堂 | 亚洲成人网在线观看 | 91视频免费观看 | 国产成人精品男人的天堂538 | 色偷偷91久久综合噜噜噜 | 1024手机看片日韩 | 夜夜爽天天狠狠九月婷婷 | 国产激情视频一区二区三区 | 操女网站| 亚洲精品免费视频 | 免费 的黄色 | 免费看曰批女人爽的视频网址 | 精品国模 | 亚洲视频高清 | 成 人 在 线 免费 8888 www | 国模论坛 | 看视频免费 | 午夜国产理论 | 五月综合色啪 | 2021精品国产综合久久 | 四虎影视最新网址 | 韩国床戏合集三小时hd中字 | 欧美在线高清视频 | 日韩黄色成人 | 欧美三级视频 | 国产又爽又黄又粗又大 | 欧美一区二区三区男人的天堂 | 亚洲欧美一区二区三区在线播放 | 狠狠成人| 国产裸露片段精华合集链接 | 在线视频一本 |