在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA在多模態(tài)生成式AI領(lǐng)域的突破性進(jìn)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-05-15 10:49 ? 次閱讀

在今年的國(guó)際學(xué)習(xí)表征大會(huì)(ICLR)上,NVIDIA 發(fā)表了 70 余篇論文,其內(nèi)容涵蓋醫(yī)療、機(jī)器人自動(dòng)駕駛汽車以及大語言模型等領(lǐng)域。

推動(dòng) AI 進(jìn)步需要采用全棧式方法,這依賴于包括加速處理器和網(wǎng)絡(luò)技術(shù)在內(nèi)的強(qiáng)大計(jì)算基礎(chǔ)設(shè)施,并將其與優(yōu)化的編譯器、算法及應(yīng)用程序相連接。

NVIDIA Research 正在該領(lǐng)域進(jìn)行全方位的創(chuàng)新,并在此過程中為幾乎所有行業(yè)提供支持。在近日舉行的國(guó)際學(xué)習(xí)表征大會(huì)(ICLR)上,NVIDIA 提交了 70 余篇論文,展示了 AI 在自動(dòng)駕駛汽車、醫(yī)療、多模態(tài)內(nèi)容創(chuàng)作、機(jī)器人等領(lǐng)域的應(yīng)用進(jìn)展。

NVIDIA 應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示:“ICLR 是全球最具影響力的 AI 會(huì)議之一,研究人員在此發(fā)布推動(dòng)各行各業(yè)進(jìn)步的關(guān)鍵技術(shù)創(chuàng)新。NVIDIA 今年提交的研究成果旨在加速計(jì)算堆棧的各個(gè)層級(jí),從而增強(qiáng) AI 在各行業(yè)的影響力和實(shí)用性。”

解決現(xiàn)實(shí)世界挑戰(zhàn)的研究工作

NVIDIA 在 ICLR 上提交的多篇論文聚焦多模態(tài)生成式 AI 領(lǐng)域的突破性進(jìn)展,以及 AI 訓(xùn)練和合成數(shù)據(jù)生成的新方法,具體包括:

Fugatto:Fugatto 是世界上最靈活的音頻生成式 AI 模型。根據(jù)輸入的文本提示和音頻文件,它能夠生成或修改包含任意的音樂、人聲和聲音組合的作品。在 ICLR 上展示的其他 NVIDIA 模型對(duì)音頻大語言模型(LLM)進(jìn)行了改進(jìn),以使其更好地理解語音。

HAMSTER:這篇論文提出了一種視覺-語言-動(dòng)作模型的分層設(shè)計(jì)方案,它可以更好地從域外微調(diào)數(shù)據(jù)(即無需在真實(shí)機(jī)器人硬件上收集的低成本數(shù)據(jù))中遷移知識(shí),進(jìn)而提升機(jī)器人在測(cè)試場(chǎng)景中的技能水平。

Hymba:這個(gè)小語言模型家族采用混合模型架構(gòu),由此創(chuàng)造的 LLM 融合了 Transformer 模型和狀態(tài)空間模型的優(yōu)勢(shì),實(shí)現(xiàn)了高分辨率記憶檢索、高效的上下文總結(jié)以及常識(shí)推理任務(wù)。借助這種混合模型架構(gòu),Hymba 在保持性能的前提下將吞吐量提升了 3 倍,緩存減少至約1/4。

LongVILA:該訓(xùn)練流程實(shí)現(xiàn)了高效的視覺語言模型訓(xùn)練與推理,以支持長(zhǎng)視頻理解。使用長(zhǎng)視頻訓(xùn)練 AI 模型時(shí),需要大量算力和密集內(nèi)存,而這篇論文提出的系統(tǒng)可以高效地并行處理長(zhǎng)視頻的訓(xùn)練和推理,在 256 塊 GPU 上進(jìn)行訓(xùn)練時(shí)可擴(kuò)展到多達(dá) 200 萬個(gè) token。LongVILA 在 9 個(gè)主流視頻基準(zhǔn)測(cè)試中均達(dá)到當(dāng)前最優(yōu)性能。

LLaMaFlex:這篇論文提出了一種全新的零樣本生成技術(shù),可從單個(gè)大型模型來構(gòu)建一系列壓縮 LLM 家族。研究人員發(fā)現(xiàn),LLaMaFlex 生成的壓縮模型在精度上媲美或優(yōu)于現(xiàn)有剪枝、彈性架構(gòu)及從頭訓(xùn)練的模型。相比剪枝和知識(shí)蒸餾等技術(shù),這種能力能夠顯著降低訓(xùn)練模型家族的成本。

Proteina:該模型可以生成多樣且可設(shè)計(jì)的蛋白質(zhì)骨架,即維持蛋白質(zhì)結(jié)構(gòu)的框架。它采用 Transformer 模型架構(gòu),參數(shù)數(shù)量是此前模型的 5 倍。

SRSA:這個(gè)框架解決了使用現(xiàn)有技能庫教會(huì)機(jī)器人執(zhí)行新任務(wù)的難題。這意味著機(jī)器人無需從頭學(xué)習(xí),而是能夠?qū)F(xiàn)有技能應(yīng)用并適配到新任務(wù)中。研究人員開發(fā)了預(yù)測(cè)最相關(guān)預(yù)置技能的框架,使機(jī)器人在執(zhí)行未知任務(wù)時(shí)的零樣本成功率提高了 19%。

STORM:通過僅需少量快照即可推斷出精確的 3D 表示,該模型能夠重建動(dòng)態(tài)戶外場(chǎng)景,比如行駛的汽車或隨風(fēng)搖曳的樹木。該模型能夠在 200 毫秒內(nèi)重建大規(guī)模戶外場(chǎng)景,在自動(dòng)駕駛開發(fā)中具有應(yīng)用潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    212

    文章

    29367

    瀏覽量

    211159
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5206

    瀏覽量

    105611
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33815

    瀏覽量

    274651

原文標(biāo)題:NVIDIA Research 在 ICLR 大會(huì)引領(lǐng)新一波多模態(tài)生成式 AI 浪潮

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性進(jìn)展

    近日,華為公司常務(wù)董事、華為云計(jì)算CEO張平安在華為云生態(tài)大會(huì)2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性進(jìn)展——推出基于新型高速總線架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?668次閱讀

    NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著
    的頭像 發(fā)表于 04-07 11:33 ?271次閱讀

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    全系智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合
    發(fā)表于 03-21 14:12 ?199次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合
    的頭像 發(fā)表于 03-20 19:03 ?308次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗(yàn)

    NVIDIA Omniverse擴(kuò)展至生成物理AI領(lǐng)域

    NVIDIA近日宣布,其Omniverse?平臺(tái)再次實(shí)現(xiàn)重大突破,成功推出多個(gè)生成AI模型和藍(lán)圖,將Omniverse的應(yīng)用范圍進(jìn)一步擴(kuò)展
    的頭像 發(fā)表于 01-13 10:56 ?642次閱讀

    麻省理工科技評(píng)論:2025年AI領(lǐng)域突破性技術(shù)

    《麻省理工科技評(píng)論》于1月3日公布2025年十大突破性技術(shù),其中AI相關(guān)技術(shù)有:生成AI搜索:整合
    的頭像 發(fā)表于 01-07 23:40 ?781次閱讀
    麻省理工科技評(píng)論:2025年<b class='flag-5'>AI</b><b class='flag-5'>領(lǐng)域</b><b class='flag-5'>突破性</b>技術(shù)

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實(shí)現(xiàn)對(duì)降雪、結(jié)冰和冰雹的預(yù)測(cè)。
    的頭像 發(fā)表于 11-21 10:07 ?558次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用
    的頭像 發(fā)表于 11-19 14:48 ?719次閱讀

    高通與智譜推動(dòng)模態(tài)生成AI體驗(yàn)的終端側(cè)部署

    此前,驍龍峰會(huì)首日,智譜與高通技術(shù)公司宣布合作將GLM-4V端側(cè)視覺大模型,面向驍龍8至尊版進(jìn)行深度適配和推理優(yōu)化,支持豐富的模態(tài)交互方式,進(jìn)一步推動(dòng)模態(tài)
    的頭像 發(fā)表于 11-08 09:55 ?501次閱讀

    AI大模型的最新研究進(jìn)展

    AI大模型的最新研究進(jìn)展體現(xiàn)在多個(gè)方面,以下是對(duì)其最新進(jìn)展的介紹: 一、技術(shù)創(chuàng)新與突破 生成
    的頭像 發(fā)表于 10-23 15:19 ?1174次閱讀

    NVIDIA視覺生成AI的最新進(jìn)展

    NVIDIA Research 發(fā)表 50 篇論文,介紹 AI 軟件創(chuàng)意產(chǎn)業(yè)、自動(dòng)駕駛汽車開發(fā)、醫(yī)療和機(jī)器人領(lǐng)域的潛在應(yīng)用。
    的頭像 發(fā)表于 09-09 10:08 ?806次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    美國(guó)佛羅里達(dá)州奧蘭舉行的 SAP Sapphire 大會(huì)上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterpr
    的頭像 發(fā)表于 09-09 09:37 ?684次閱讀

    NVIDIA加速計(jì)算和生成AI領(lǐng)域的創(chuàng)新

    最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA 加速計(jì)算和生成
    的頭像 發(fā)表于 09-09 09:18 ?817次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù)

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù),以加速新一代數(shù)字人的發(fā)展,并將在平臺(tái)上推出全新的
    的頭像 發(fā)表于 06-04 10:18 ?887次閱讀

    請(qǐng)問移動(dòng)端生成AI如何在Arm CPU上運(yùn)行呢?

    2023 年,生成人工智能 (Generative AI) 領(lǐng)域涌現(xiàn)出諸多用例。這一突破性的人工智能 (
    的頭像 發(fā)表于 05-21 17:07 ?1185次閱讀
    請(qǐng)問移動(dòng)端<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>如何在Arm CPU上運(yùn)行呢?
    主站蜘蛛池模板: 操美女网址 | 日本xxxxbbbb| 日本毛片在线观看 | 欧美一级特黄aa大片 | 国产gav成人免费播放视频 | 国产精品自线在线播放 | 色视频线观看在线播放 | 两人性潮高免费视频看 | 特级生活片 | bt天堂新版中文在线地址 | 80s国产成年女人毛片 | 中国胖女人一级毛片aaaaa | 久久深夜福利 | 色精品一区二区三区 | 91福利国产在线观看网站 | 成人看的午夜免费毛片 | h视频在线看 | 四虎影院观看视频 | 扒开末成年粉嫩的流白浆视频 | 日韩av线观看 | 欧美性猛交xxxx乱大交中文 | 热re久久精品国产99热 | 人人揉揉香蕉大免费不卡 | 日本免费www | 亚洲成人综合网站 | 亚洲精品卡1卡二卡3卡四卡 | 777欧美午夜精品影院 | 亚洲五月综合网色九月色 | 欧美高清一区二区 | 萝l在线精品社区资源 | 国模大胆一区二区三区 | 人人看人人添人人爽 | www射com | 另类视频色综合 | 黄色片不卡 | 欧美zooz人禽交免费观看 | 午夜美女久久久久爽久久 | 久99热| 黄色三级三级三级免费看 | 久久精品人人做人人看 | 看全色黄大色大片免费久久 |