在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能體已經(jīng)能像人一樣刷視頻了?國(guó)內(nèi)聯(lián)匯科技OmAgent智能體試用!

新眾報(bào) ? 來(lái)源:jf_48880855 ? 作者:jf_48880855 ? 2024-11-22 18:59 ? 次閱讀

智能體已經(jīng)能像人一樣刷視頻了?國(guó)內(nèi)知名大模型獨(dú)角獸級(jí)別公司,資深AI玩家聯(lián)匯科技退出了OmAgent智能體,已經(jīng)開(kāi)啟試用。


當(dāng)你正在觀看一部緊張刺激的動(dòng)作電影,忽然好奇:

“那個(gè)角色到底是在哪一集說(shuō)的那句話?”

“這里的背景音樂(lè)是什么?”

又或者在一場(chǎng)足球比賽中,你錯(cuò)過(guò)了那個(gè)決定性的進(jìn)球,卻又想再次回放。諸如此類的需求,如果僅憑人力尋找,無(wú)疑存在極大的工作量。

但是 AI 能夠?yàn)闄C(jī)器配置雙眼與大腦,讓它們能夠看懂視頻、理解劇情,對(duì)于普通人來(lái)說(shuō),這不僅是提高了搜索效率,更是擴(kuò)展我們與數(shù)字世界的互動(dòng)方式。

英偉達(dá)最新發(fā)布的 NVIDIA AI Blueprint 希望幫助人們解決這一問(wèn)題。這是一種預(yù)訓(xùn)練的、可自定義 AI 工作流,他為開(kāi)發(fā)者構(gòu)建和部署用于典型用例的生成式 AI 應(yīng)用程序提供了一套完整的解決方案。

比如在英偉達(dá)提供的試用界面中,你可以選擇三個(gè)視頻片段中的一個(gè)進(jìn)行內(nèi)容問(wèn)答

wKgaoWdAZACAAiaPAAEkwiGwqls755.png

在幾輪測(cè)試過(guò)后,我們發(fā)現(xiàn) Blueprint 對(duì)視頻問(wèn)答還是有不錯(cuò)的效果的。你可以提問(wèn)某個(gè)事件發(fā)生的時(shí)間,也可以提問(wèn)某個(gè)對(duì)象的狀態(tài)。
例如當(dāng)我們提問(wèn) “工人在什么時(shí)候掉落了箱子”,Blueprint 可以正確的回答出時(shí)間區(qū)間。二類似于 “叉車往哪個(gè)方向開(kāi)” 這種基于連續(xù)過(guò)程的問(wèn)題,Blueprint 也可以輕松應(yīng)答。
不過(guò)對(duì)于某些細(xì)節(jié),例如 “誰(shuí)撿起了掉在地上的箱子”,Blueprint 則給出了錯(cuò)誤的答案。

wKgZoWdAZACAbe6-AADGVe1SurQ102.png

尤其令人遺憾的是,在試用過(guò)程中我們不斷遇到流量限制,無(wú)限驗(yàn)證等問(wèn)題,試用體驗(yàn)可以說(shuō)一言難盡。并且目前 Blueprint 仍然處于早期申請(qǐng)使用制階段,沒(méi)有辦法快速進(jìn)行使用。

wKgaoWdAZAGAL0xhAAFFNrr4ZdM801.png

Blueprint 之外,我們還有什么選擇?

經(jīng)過(guò)一番搜索和調(diào)研,我們?cè)?Github 上發(fā)現(xiàn)了 OmAgent 這個(gè)項(xiàng)目,這是一個(gè)多模態(tài)智能體框架,提供了同樣強(qiáng)大的視頻問(wèn)答功能。

wKgZoWdAZAGAS8aLAAFgY5obiRk207.png

項(xiàng)目地址:https://github.com/om-ai-lab/OmAgent

OmAgent 是什么

OmAgent 是一個(gè)開(kāi)源的智能體框架,支持簡(jiǎn)單快速地面向設(shè)備進(jìn)行智能體系統(tǒng)的開(kāi)發(fā),為智能手機(jī)、智能可穿戴設(shè)備、智能攝像頭乃至機(jī)器人等各類硬件設(shè)備賦能。OmAgent 為各種類型的設(shè)備創(chuàng)建了一個(gè)抽象概念,并大大簡(jiǎn)化了將這些設(shè)備與最先進(jìn)的多模態(tài)基礎(chǔ)模型和智能體算法相結(jié)合的過(guò)程,使每個(gè)人都能基于設(shè)備建立最有趣的 AI 應(yīng)用。

wKgaoWdAZAKAaM5MAADlcoPXPys526.png

OmAgent 的設(shè)計(jì)架構(gòu)遵循三個(gè)基本原則:
1. 基于圖的工作流編排,支持分支、循環(huán)、并行等復(fù)雜邏輯操作;2. 原生多模態(tài),提供對(duì)音視圖文等多種模態(tài)數(shù)據(jù)的支持;3. 設(shè)備中心化,提供便捷的設(shè)備連接和交互方法。
簡(jiǎn)單來(lái)說(shuō),開(kāi)發(fā)者可以基于 OmAgent 設(shè)計(jì)開(kāi)發(fā)基于圖工作流編排的面向設(shè)備的原生多模態(tài)智能體。這里的設(shè)備不光包含智能手機(jī),智能可穿戴設(shè)備(智能眼鏡等),智能家居,還包括命令行以及 web 端,開(kāi)發(fā)者只需要專注于智能體本身,而不用分神處理設(shè)備。
OmAgent 項(xiàng)目里提供了 6 個(gè)示例項(xiàng)目,由淺入深展示了如何搭建一個(gè)智能體的完整過(guò)程,其中視頻理解智能體工作流被 EMNLP 2024 主會(huì)收錄,實(shí)現(xiàn)了和 Blueprint Demo 相似的功能。


OmAgent 表現(xiàn)如何?


根據(jù)項(xiàng)目文檔只需要進(jìn)行簡(jiǎn)單的配置就可以將 OmAgent 部署運(yùn)行在本地環(huán)境。我們首先對(duì) Blueprint 提供的測(cè)試視頻進(jìn)行預(yù)處理,在這個(gè)階段視頻會(huì)被分解為若干個(gè)片段,每個(gè)片段會(huì)被大模型進(jìn)行總結(jié),并向量化存儲(chǔ)在數(shù)據(jù)庫(kù)中。接下來(lái)使用之前的問(wèn)題對(duì) OmAgent 進(jìn)行測(cè)試,可以看到智能體可以正確定位事件以及發(fā)生的時(shí)間。
Q: When did the worker drop the box?

A:

wKgZoWdAZAOAD3bnAAFzkSYaMrs552.png

Q: Which direction did the forklift go?

A:

wKgaoWdAZAOASgm2AAGehcmUwq4016.png


Q: Who picked up the box that fell on the ground?

A:

wKgZoWdAZAOARBJBAADmjQr1png710.png

接下來(lái)我們進(jìn)行更復(fù)雜的測(cè)試,OmAgent 可以支持音頻信息以及超長(zhǎng)視頻索引。我們選取了最近大火的劇集《雙城之戰(zhàn)》第二季第一集作為素材,基于其中的畫(huà)面和劇情進(jìn)行提問(wèn)。
Q: 凱特琳收到的鑰匙代表了什么?

A:

wKgaoWdAZASAcdA1AAEdrKqU-UI948.png


Q: 凱特琳和蔚在爭(zhēng)執(zhí)些什么?

A:

wKgZoWdAZASAV-WbAAFZb73r65Q400.png

Q: 視頻最后幾個(gè)議員在討論什么?

A:

wKgaoWdAZASATh9wAAEBsHz15Rs437.png


Q: 議員開(kāi)會(huì)的時(shí)候誰(shuí)闖入了進(jìn)來(lái)?

A:

wKgZoWdAZAWARw98AAFgj5fdgO8724.png

可以看到,即使面對(duì)如此復(fù)雜的視頻素材,OmAgent 依然可以游刃有余。
除了視頻問(wèn)答之外,OmAgent 的最大特點(diǎn)是可以將智能體直接應(yīng)用在硬件設(shè)備上,我們也對(duì)此進(jìn)行了測(cè)試。使用項(xiàng)目提供的 app,我們可以運(yùn)行示例項(xiàng)目中的穿衣搭配推薦智能體。智能體會(huì)根據(jù)你的需求,以及你已有的衣櫥信息,為你推薦合適的穿衣建議。在這個(gè)過(guò)程中智能體會(huì)和用戶進(jìn)行多輪溝通以確定用戶需求,并最終返回最合適的搭配。

如果想了解更多OmAgent智能體技術(shù)信息,可以通過(guò)聯(lián)匯科技官網(wǎng)聯(lián)系!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    274

    瀏覽量

    10981
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3046

    瀏覽量

    3870
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】操作實(shí)戰(zhàn),開(kāi)發(fā)個(gè)編程助手智能

    . 首先要理解智能的相關(guān)概念 ,比如角色,限定,技能:包括插件等,知識(shí):包括知識(shí)庫(kù),文檔等等. 創(chuàng)建步驟: 二.創(chuàng)建智能: 預(yù)覽和
    發(fā)表于 05-27 11:16

    從感知到運(yùn)控:具身智能機(jī)器控制器的雙腦協(xié)同設(shè)計(jì)與場(chǎng)景適配

    ,則是協(xié)調(diào)全身的“大腦”與“小腦”,既要大腦一樣思考決策,又要小腦一樣精準(zhǔn)控制運(yùn)動(dòng)。作為具身智能機(jī)器
    的頭像 發(fā)表于 05-11 17:42 ?205次閱讀
    從感知到運(yùn)控:具身<b class='flag-5'>智能</b>機(jī)器<b class='flag-5'>人</b>控制器的雙腦協(xié)同設(shè)計(jì)與場(chǎng)景適配

    學(xué)習(xí)智能開(kāi)發(fā)

    智能是大模型的應(yīng)用落地,正在學(xué)習(xí)中,這本書(shū)太及時(shí),非常想看看。
    發(fā)表于 03-27 15:48

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?比如部分代碼存放到內(nèi)部FLASH,另部分存放到外部QSPI的FLASH中
    發(fā)表于 03-07 08:09

    為什么要費(fèi)這么大勁讓機(jī)器人像一樣,而不是更實(shí)用的形態(tài)?

    基礎(chǔ)設(shè)施兼容性 :人類社會(huì)的物理環(huán)境(樓梯、門把手、工具、家具等)是為人體結(jié)構(gòu)和動(dòng)作設(shè)計(jì)的。人形機(jī)器更容易直接融入這些環(huán)境,無(wú)需大規(guī)模改造基礎(chǔ)設(shè)施。 操作便利性 :人形機(jī)器可以人類一樣
    的頭像 發(fā)表于 02-10 10:03 ?330次閱讀

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書(shū)

    之極。 《計(jì)算機(jī)視覺(jué)之PyTorch數(shù)字圖像處理》為《具身智能機(jī)器系統(tǒng)》提供感知和識(shí)別能力,而《具身智能機(jī)器系統(tǒng)》則為《計(jì)算機(jī)視覺(jué)之P
    發(fā)表于 01-01 15:50

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    影響與發(fā)展,提供全球及國(guó)內(nèi)行業(yè)趨勢(shì)的見(jiàn)解。書(shū)中詳細(xì)討論新興領(lǐng)域面臨的諸多挑戰(zhàn),從應(yīng)用的不確定性、昂貴的成本到倫理問(wèn)題,為讀者呈現(xiàn)了當(dāng)前形勢(shì)的現(xiàn)實(shí)視角。 接下來(lái),書(shū)中深入探討了具
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    解決許多技術(shù)的和非技術(shù)的挑戰(zhàn),如提高智能的自主性、處理復(fù)雜環(huán)境互動(dòng)的能力及確保行為的倫理和安全性。 未來(lái)的研究需要將視覺(jué)、語(yǔ)音和其他傳感技術(shù)與機(jī)器技術(shù)相結(jié)合,以探索更加先進(jìn)的知識(shí)表示和記憶模塊,利用強(qiáng)化學(xué)習(xí)進(jìn)
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    Intelligence)這概念有深入理解。本書(shū)開(kāi)篇和大部分書(shū)籍文章一樣,都是立足宏觀角度,先把視角引申到世界經(jīng)濟(jì)形勢(shì)。書(shū)中闡述具身智能機(jī)器
    發(fā)表于 12-19 22:26

    AI智能是什么_AI智能如何重塑企業(yè)業(yè)務(wù)流程

    AI技術(shù)的飛速發(fā)展令人矚目。就在企業(yè)領(lǐng)導(dǎo)者們剛開(kāi)始熟悉AI助手時(shí),AI智能Agent(國(guó)際版)已經(jīng)迅速成為討論的焦點(diǎn)。它們之所以受到廣泛關(guān)注,是因?yàn)檎缑课粏T工都將配備AI助手一樣
    的頭像 發(fā)表于 12-19 17:55 ?792次閱讀

    封裝一樣的磁棒電感通用嗎

    電子發(fā)燒友網(wǎng)站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費(fèi)下載
    發(fā)表于 10-28 11:15 ?0次下載

    如何讓智能客服真人一樣對(duì)話?容聯(lián)七陌揭秘:多Agent大模型

    科技云報(bào)到原創(chuàng)。 ? ? 經(jīng)歷多年的“答非所問(wèn)”、“問(wèn)三不知”,很多人已經(jīng)厭倦所謂的“智能客服”。哪怕是技術(shù)
    的頭像 發(fā)表于 09-26 18:41 ?732次閱讀
    如何讓<b class='flag-5'>智能</b>客服<b class='flag-5'>像</b>真人<b class='flag-5'>一樣</b>對(duì)話?容聯(lián)七陌揭秘:多Agent大模型

    請(qǐng)問(wèn)全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?

    全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?
    發(fā)表于 08-09 06:26

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯
    發(fā)表于 07-23 06:22
    主站蜘蛛池模板: 日本v片免费一区二区三区 日本www.色 日本wwwwww | 午夜肉伦伦影院 | 免费日本黄色片 | 免费国内精品久久久久影院 | 黄网免费 | 成 人色 网 站999 | 色播基地 | 亚洲一区二区在线视频 | 欧美不卡一区 | 激情婷婷 | 激情综合网五月婷婷 | 国产美女影院 | 特黄特黄 | 夜夜夜久久久 | 四虎影院www | 国产精品手机在线 | 夜夜操天天射 | 在线观看一二三区 | 加勒比色 | 美女张开大腿让男人捅 | 色噜噜人体337p人体 | 美女免费观看一区二区三区 | 日韩免费 | 亚洲人成网站色在线观看 | 久久精品国产99国产精品免费看 | 色一乱一伦一区一直爽 | 亚洲成人网在线播放 | 狠狠色狠狠色综合久久一 | 免费午夜视频在线观看 | 视频免费播放 | 成人永久免费视频网站在线观看 | 91免费网站在线看入口黄 | 午夜精品福利视频 | 轻点灬大ji巴太粗太长了爽文 | 女性一级全黄生活片免费看 | 免费一级特黄欧美大片勹久久网 | 三级成人网 | www.亚洲日本| 成人国产精品毛片 | 亚洲youjizz| 婷婷毛片 |