微軟OmniParser V2發布：大模型轉化為計算機智能體

近日，微軟官網宣布了一項重要更新。微軟發布了其視覺Agent解析框架OmniParser的最新版本V2。這一新版本具備將包括OpenAI的4o、o1、o3-mini，DeepSeek的R1，Qwen的2.5VL，以及Anthropic的Sonnet在內的大模型，轉化為“計算機使用智能體”(Computer Use Agent)的能力。

與前代版本相比，OmniParser V2在多個方面實現了顯著提升。在檢測更微小、可交互的元素時，V2展現了更高的精度和更快的推理速度。這一提升得益于V2采用了更大規模的交互元素檢測數據集和圖標功能描述數據進行訓練。

此外，OmniParser V2還通過縮小圖標描述模型的輸入圖像尺寸，進一步優化了推理性能。據微軟官方數據，與前代版本相比，V2的推理延遲降低了60%。這一改進使得OmniParser V2在處理復雜視覺任務時更加高效，為用戶提供了更加流暢、實時的交互體驗。

此次OmniParser V2的發布，不僅展示了微軟在人工智能領域的持續創新，也為大模型在計算機智能體領域的應用開辟了新的道路。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6686

瀏覽量
105774
計算機

計算機

+關注

關注
19

文章
7663

瀏覽量
90828
數據集

數據集

+關注

關注
4

文章
1224

瀏覽量
25457
大模型

大模型

+關注

關注
2

文章
3146

瀏覽量
4076

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 羅氏線圈電流傳感器的工作原理、結構特點及應用
Hot javascript的成熟分類

New TL2575HV-12 1A 簡單降壓開關穩壓器數據手冊
New TL2575HV-15 1A 簡單降壓開關穩壓器數據手冊

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
1天前

672 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
1天前

665 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
1天前

599 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
1天前

533 閱讀

DC/DC轉換器電路板安裝過程中的焊接技巧與導通檢查要點

駿龍電子
1天前

665 閱讀

Tiny6410 Linux開發指南詳解

yezi888
5.59 MB

免費

210下載

RChain可并發、組合、無限伸縮的區塊鏈

挽你何用
2.69 MB

2積分

1下載

HoneyProxy HTTP(S)?流量分析

郝埃連
2.70 MB

2積分

1下載

Curve分布式存儲系統

郭中
17.79 MB

2積分

1下載

CatchAdmin權限管理后臺框架

陳杰
0.50 MB

免費

0下載

【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

左岸cpx
1天前

182 閱讀

【M-K1HSE開發板免費體驗】DevEco Studio應用開發體驗(物理機器運行失敗)

jf_1137202360
1天前

138 閱讀

省錢+環保+個性：打造一臺永不“過時”的自定義電腦！

早知
2天前

711 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】+溫度大氣壓檢測及顯示

jinglixixi
2天前

839 閱讀

【RA-Eco-RA6M4開發板評測】+01+開箱測評+UART+PWM+LED

jf_18702540
3天前

819 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

微軟OmniParser V2發布：大模型轉化為計算機智能體

評論