在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智能體已經能像人一樣刷視頻了?國內聯匯科技OmAgent智能體試用!

新眾報 ? 來源:jf_48880855 ? 作者:jf_48880855 ? 2024-11-22 18:59 ? 次閱讀

智能體已經能像人一樣刷視頻了?國內知名大模型獨角獸級別公司,資深AI玩家聯匯科技退出了OmAgent智能體,已經開啟試用。


當你正在觀看一部緊張刺激的動作電影,忽然好奇:

“那個角色到底是在哪一集說的那句話?”

“這里的背景音樂是什么?”

又或者在一場足球比賽中,你錯過了那個決定性的進球,卻又想再次回放。諸如此類的需求,如果僅憑人力尋找,無疑存在極大的工作量。

但是 AI 能夠為機器配置雙眼與大腦,讓它們能夠看懂視頻、理解劇情,對于普通人來說,這不僅是提高了搜索效率,更是擴展我們與數字世界的互動方式。

英偉達最新發布的 NVIDIA AI Blueprint 希望幫助人們解決這一問題。這是一種預訓練的、可自定義 AI 工作流,他為開發者構建和部署用于典型用例的生成式 AI 應用程序提供了一套完整的解決方案。

比如在英偉達提供的試用界面中,你可以選擇三個視頻片段中的一個進行內容問答。

wKgaoWdAZACAAiaPAAEkwiGwqls755.png

在幾輪測試過后,我們發現 Blueprint 對視頻問答還是有不錯的效果的。你可以提問某個事件發生的時間,也可以提問某個對象的狀態。
例如當我們提問 “工人在什么時候掉落了箱子”,Blueprint 可以正確的回答出時間區間。二類似于 “叉車往哪個方向開” 這種基于連續過程的問題,Blueprint 也可以輕松應答。
不過對于某些細節,例如 “誰撿起了掉在地上的箱子”,Blueprint 則給出了錯誤的答案。

wKgZoWdAZACAbe6-AADGVe1SurQ102.png

尤其令人遺憾的是,在試用過程中我們不斷遇到流量限制,無限驗證等問題,試用體驗可以說一言難盡。并且目前 Blueprint 仍然處于早期申請使用制階段,沒有辦法快速進行使用。

wKgaoWdAZAGAL0xhAAFFNrr4ZdM801.png

Blueprint 之外,我們還有什么選擇?

經過一番搜索和調研,我們在 Github 上發現了 OmAgent 這個項目,這是一個多模態智能體框架,提供了同樣強大的視頻問答功能。

wKgZoWdAZAGAS8aLAAFgY5obiRk207.png

項目地址:https://github.com/om-ai-lab/OmAgent

OmAgent 是什么

OmAgent 是一個開源的智能體框架,支持簡單快速地面向設備進行智能體系統的開發,為智能手機、智能可穿戴設備、智能攝像頭乃至機器人等各類硬件設備賦能。OmAgent 為各種類型的設備創建了一個抽象概念,并大大簡化了將這些設備與最先進的多模態基礎模型和智能體算法相結合的過程,使每個人都能基于設備建立最有趣的 AI 應用。

wKgaoWdAZAKAaM5MAADlcoPXPys526.png

OmAgent 的設計架構遵循三個基本原則:
1. 基于圖的工作流編排,支持分支、循環、并行等復雜邏輯操作;2. 原生多模態,提供對音視圖文等多種模態數據的支持;3. 設備中心化,提供便捷的設備連接和交互方法。
簡單來說,開發者可以基于 OmAgent 設計開發基于圖工作流編排的面向設備的原生多模態智能體。這里的設備不光包含智能手機,智能可穿戴設備(智能眼鏡等),智能家居,還包括命令行以及 web 端,開發者只需要專注于智能體本身,而不用分神處理設備。
OmAgent 項目里提供了 6 個示例項目,由淺入深展示了如何搭建一個智能體的完整過程,其中視頻理解智能體工作流被 EMNLP 2024 主會收錄,實現了和 Blueprint Demo 相似的功能。


OmAgent 表現如何?


根據項目文檔只需要進行簡單的配置就可以將 OmAgent 部署運行在本地環境。我們首先對 Blueprint 提供的測試視頻進行預處理,在這個階段視頻會被分解為若干個片段,每個片段會被大模型進行總結,并向量化存儲在數據庫中。接下來使用之前的問題對 OmAgent 進行測試,可以看到智能體可以正確定位事件以及發生的時間。
Q: When did the worker drop the box?

A:

wKgZoWdAZAOAD3bnAAFzkSYaMrs552.png

Q: Which direction did the forklift go?

A:

wKgaoWdAZAOASgm2AAGehcmUwq4016.png


Q: Who picked up the box that fell on the ground?

A:

wKgZoWdAZAOARBJBAADmjQr1png710.png

接下來我們進行更復雜的測試,OmAgent 可以支持音頻信息以及超長視頻索引。我們選取了最近大火的劇集《雙城之戰》第二季第一集作為素材,基于其中的畫面和劇情進行提問。
Q: 凱特琳收到的鑰匙代表了什么?

A:

wKgaoWdAZASAcdA1AAEdrKqU-UI948.png


Q: 凱特琳和蔚在爭執些什么?

A:

wKgZoWdAZASAV-WbAAFZb73r65Q400.png

Q: 視頻最后幾個議員在討論什么?

A:

wKgaoWdAZASATh9wAAEBsHz15Rs437.png


Q: 議員開會的時候誰闖入了進來?

A:

wKgZoWdAZAWARw98AAFgj5fdgO8724.png

可以看到,即使面對如此復雜的視頻素材,OmAgent 依然可以游刃有余。
除了視頻問答之外,OmAgent 的最大特點是可以將智能體直接應用在硬件設備上,我們也對此進行了測試。使用項目提供的 app,我們可以運行示例項目中的穿衣搭配推薦智能體。智能體會根據你的需求,以及你已有的衣櫥信息,為你推薦合適的穿衣建議。在這個過程中智能體會和用戶進行多輪溝通以確定用戶需求,并最終返回最合適的搭配。

如果想了解更多OmAgent智能體技術信息,可以通過聯匯科技官網聯系!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能體
    +關注

    關注

    1

    文章

    227

    瀏覽量

    10884
  • 大模型
    +關注

    關注

    2

    文章

    2926

    瀏覽量

    3677
收藏 人收藏

    評論

    相關推薦

    學習智能開發

    智能是大模型的應用落地,正在學習中,這本書太及時,非常想看看。
    發表于 03-27 15:48

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?

    Stm32CubeIDEKeil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?比如部分代碼存放到內部FLASH,另部分存放到外部QSPI的FLASH中
    發表于 03-07 08:09

    為什么要費這么大勁讓機器人像一樣,而不是更實用的形態?

    基礎設施兼容性 :人類社會的物理環境(樓梯、門把手、工具、家具等)是為人體結構和動作設計的。人形機器更容易直接融入這些環境,無需大規模改造基礎設施。 操作便利性 :人形機器可以人類一樣
    的頭像 發表于 02-10 10:03 ?229次閱讀

    【「具身智能機器系統」閱讀體驗】+兩本互為支持的書

    之極。 《計算機視覺之PyTorch數字圖像處理》為《具身智能機器系統》提供感知和識別能力,而《具身智能機器系統》則為《計算機視覺之P
    發表于 01-01 15:50

    【「具身智能機器系統」閱讀體驗】1.初步理解具身智能

    影響與發展,提供全球及國內行業趨勢的見解。書中詳細討論新興領域面臨的諸多挑戰,從應用的不確定性、昂貴的成本到倫理問題,為讀者呈現了當前形勢的現實視角。 接下來,書中深入探討了具
    發表于 12-28 21:12

    【「具身智能機器系統」閱讀體驗】+初品的體驗

    解決許多技術的和非技術的挑戰,如提高智能的自主性、處理復雜環境互動的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術與機器技術相結合,以探索更加先進的知識表示和記憶模塊,利用強化學習進
    發表于 12-20 19:17

    《具身智能機器系統》第1-6章閱讀心得之具身智能機器系統背景知識與基礎模塊

    Intelligence)這概念有深入理解。本書開篇和大部分書籍文章一樣,都是立足宏觀角度,先把視角引申到世界經濟形勢。書中闡述具身智能機器
    發表于 12-19 22:26

    AI智能是什么_AI智能如何重塑企業業務流程

    AI技術的飛速發展令人矚目。就在企業領導者們剛開始熟悉AI助手時,AI智能Agent(國際版)已經迅速成為討論的焦點。它們之所以受到廣泛關注,是因為正如每位員工都將配備AI助手一樣,
    的頭像 發表于 12-19 17:55 ?657次閱讀

    封裝一樣的磁棒電感通用嗎

    電子發燒友網站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費下載
    發表于 10-28 11:15 ?0次下載

    如何讓智能客服真人一樣對話?容聯七陌揭秘:多Agent大模型

    科技云報到原創。 ? ? 經歷多年的“答非所問”、“問三不知”,很多人已經厭倦所謂的“智能客服”。哪怕是技術
    的頭像 發表于 09-26 18:41 ?630次閱讀
    如何讓<b class='flag-5'>智能</b>客服<b class='flag-5'>像</b>真人<b class='flag-5'>一樣</b>對話?容聯七陌揭秘:多Agent大模型

    請問全差分運算放大器般運算放大器一樣設計加法器嗎?

    全差分運算放大器般運算放大器一樣設計加法器嗎?
    發表于 08-09 06:26

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯
    發表于 07-23 06:22

    Meta高管稱大語言模型永遠無法人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產品備受矚目,但其背后的大型語言模型(LLM)永遠無法實現像人類一樣的推理和計劃能力。
    的頭像 發表于 05-27 09:50 ?619次閱讀

    智能傳感器有什么不一樣

    走向市場。 智能傳感器的結構及特點 傳感器的五官一樣,是獲取信息的重要工具。它在工業生產、國防建設和科學技術領域發揮著巨大的作用。但與飛速發展的計算機相比較,作為“五官”的傳感器遠
    的頭像 發表于 05-07 09:23 ?554次閱讀
    主站蜘蛛池模板: 免费看h视频 | 亚洲黄色网址在线观看 | 激情综合网五月婷婷 | 欧美日韩在线成人看片a | 五月婷婷色 | 亚洲人成电影在线播放 | 免费爱爱网址 | 亚洲已满18点击进入在线观看 | 天天爱天天做天天爽 | 性夜影院爽黄a爽在线看香蕉 | 国产成人综合日韩精品婷婷九月 | 国产成人一区二区在线不卡 | 18欧美乱大交 | 欧美成人性色xxxxx视频大 | 激情三级视频 | 小雪被撑暴黑人黑人与亚洲女人 | 欧美成人午夜视频 | 综合色视频 | 成年色黄大色黄大片 视频 成年视频xxxxx免费播放软件 | xxxx性xx另类 | 成人国产精品一级毛片视频 | 亚洲国产成人久久精品图片 | 天堂在线观看视频观看www | 四虎精品影院在线观看视频 | 天堂视频免费 | 加勒比在线免费视频 | 久久久久久久免费 | 国产大片黄在线观看 | 最新版天堂资源官网 | 欧美性黑人极品1819hd | 中文字幕一区二区三区视频在线 | 日本免费黄色网址 | 国产亚洲精品仙踪林在线播放 | 免费伦费一区二区三区四区 | 伊在线视频 | 草馏社区| 色老头网站久久网 | 天天综合网久久 | 久久成人国产精品青青 | 中日韩免费视频 | 中文天堂资源在线www |