微軟發布PhI-3-Vision模型，提升視覺AI效率

5 月 28 日，微軟在 Build 2024 大會上推出了最新的 Phi-3 系列成員——Phi-3-vision。這一工具主打視覺應用，能有效處理圖片文字信息，且在移動設備上也能運行自如。

Phi-3-vision 是一種小型多模式語言模型（SLM），主要適用于本地人工智能場景。其模型參數高達 42 億，上下文序列包含 128k 個符號，可滿足各種視覺推理和其他任務需求。

Microsoft 通過一篇新發表的論文［PDF］展示了 Phi-3-vision 的強大實力。與其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比，Phi-3-vision 毫不遜色。

此外，Microsoft 還對 Phi-3-vision 進行了多項測試，并將其與其他競品模型進行了比較，包括字節跳動的 Llama3-Llava-Next（8B）、微軟研究院與威斯康星大學、哥倫比亞大學聯合開發的 LlaVA-1.6（7B）以及阿里巴巴通義千問 QWEN-VL-Chat 模型等。結果表明，Phi-3-vision 在多個項目中的表現均十分出色。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6686

瀏覽量
105780
人工智能

人工智能

+關注

關注
1807

文章
49029

瀏覽量
249649
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10799

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

基于睿擎派輕松玩轉CANopen電機控制

RT-Thread官方賬號
1天前

138 閱讀

RK3568開發板暗藏32位兼容開關？飛凌嵌入式帶你一鍵解鎖！

內個老胡
1天前

163 閱讀

AI通話的N種新玩法，讓科幻照進現實

腦極體
1天前

780 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
1天前

839 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
1天前

732 閱讀

鴻蒙系統開發之實現LED燈閃爍教程免費下載

ah此生不換
0.39 MB

免費

0下載

pano VR室內街景

王桂英
81.91 MB

免費

0下載

iMonitor-冰鏡終端行為分析系統

h1654155275.5753
5.04 MB

2積分

1下載

OpenBoard跨平臺交互式白板應用程序

王萍
33.57 MB

2積分

1下載

FXDanmaku高性能彈幕庫

蕭持毅
5.34 MB

2積分

1下載

【「DeepSeek 核心技術揭秘」閱讀體驗】第三章：探索 DeepSeek - V3 技術架構的奧秘

jf_83922529
18小時前

41 閱讀

【EASY EAI Orin Nano開發板試用體驗】EASY-EAI-Toolkit人臉識別

1653149838.791300
18小時前

28 閱讀

【Banana Pi BPI-RV2開發板試用體驗】從零編譯Banana Pi BPI-RV2開發板的openWRT

大菠蘿Alpha
18小時前

41 閱讀

【RA-Eco-RA6M4開發板評測】基于SHELL進行ADC測試

jf_1137202360
18小時前

132 閱讀

【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

左岸cpx
1天前

327 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

微軟發布PhI-3-Vision模型，提升視覺AI效率

評論