在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

微軟發布視覺型AI新模型：Phi-3-vision

5 月 26 日消息，微軟近期推出其小語言 AI 模型新成員“Phi-3-vision”，以卓越的“視覺”處理能力著稱，能夠深度解析圖文信息并在移動設備上穩定運行。

據悉，Phi-3-vision 作為微軟 Phi-3 家族的首款多模態模型，繼承自 Phi-3-mini 的文本理解能力，兼具輕巧便攜特性，適用于移動平臺/嵌入式終端；模型參數規模達 42 億，遠超 Phi-3-mini（3.8B），略遜于 Phi-3-small（7B），上下文長度為 128k token，訓練時間跨度為 2024 年 2 月至 4 月。

值得關注的是，Phi-3-vision 模型的核心優勢在于其強大的“圖文識別”功能，能夠準確理解現實世界圖像的內涵，迅速識別并提取圖片中的文字信息。

微軟強調，Phi-3-vision 尤其適用于辦公場景，開發者針對圖表和方塊圖（Block diagram）識別進行了專門優化，使其能夠根據用戶輸入信息進行推理，并生成一系列決策建議，為企業提供戰略參考，被譽為“媲美大型模型”的效果。

在模型訓練環節，微軟表示 Phi-3-vision 采用了“多元化圖片與文字數據”進行訓練，涵蓋了一系列“精選的公共內容”，如“教科書級”教育素材、代碼、圖文標注數據、現實世界知識、圖表圖片、聊天記錄等，以保證模型輸入內容的豐富性。此外，微軟承諾所用訓練數據“可追溯”且不含任何個人信息，充分保障用戶隱私。

在性能對比方面，微軟提供了 Phi-3-vision 與字節跳動 Llama3-Llava-Next（8B）、微軟研究院與威斯康星大學、哥倫比亞大學聯合研發的 LlaVA-1.6（7B）以及阿里巴巴通義千問 QWEN-VL-Chat 模型等競品的對比圖表，展示了 Phi-3-vision 在多項測試中的優秀表現。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6598

瀏覽量
104064
AI

AI

+關注

關注
87

文章
30896

瀏覽量
269089
模型

模型

+關注

關注
1

文章
3243

瀏覽量
48840

微軟尋求在365 Copilot中引入非OpenAI模型

擔心企業用戶在使用365 Copilot時面臨的成本和速度問題，因此正在尋求更多樣化的技術來源。盡管微軟與OpenAI之間有著緊密的合作關系，并允許微軟定制OpenAI的模型，但微軟仍

發表于 12-25 10:41 ?202次閱讀

微軟預覽版Copilot Vision AI功能上線

微軟公司近日宣布，將面向美國地區的Copilot Pro用戶推出預覽版的Copilot Vision AI功能。這一創新功能旨在通過人工智能技術，進一步提升用戶的網頁瀏覽體驗。 Copilot

發表于 12-09 14:38 ?268次閱讀

用Ollama輕松搞定Llama 3.2 Vision模型本地部署

Ollama的安裝。一，Llama3.2 Vision簡介 Llama 3.2 Vision是一個多模態大型語言模型（LLMs）的集合，它包括預訓練和指令調整的圖像推理生成模型，有兩

發表于 11-23 17:22 ?1052次閱讀

用Ollama輕松搞定Llama 3.2 <b class='flag-5'>Vision</b><b class='flag-5'>模型</b>本地部署

微軟發布Azure AI Foundry，推動云服務增長

。 Azure AI Foundry為用戶提供了一個更為便捷的平臺，使得在支持人工智能的大型語言模型之間切換變得輕松自如。這一創新工具的發布，無疑將極大地降低AI應用的開發門檻，進一步

發表于 11-21 11:32 ?428次閱讀

在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型

2024年4月23日，微軟研究院公布Phi-3系列AI大模型，包含三個版本：mini(3.8B參數)、small(7B參數)以及medium(14B參數)。

發表于 08-30 16:58 ?603次閱讀

在英特爾酷睿Ultra7處理器上優化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

聆思CSK6視覺語音大模型AI開發板入門資源合集（硬件資料、大模型語音/多模態交互/英語評測SDK合集）

本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯視覺語音大模型 AI 開發套件( CSK6-MIX )是圍繞 CSK6011A 芯片設計的具備豐富語音圖像功能

發表于 06-18 17:33

英特爾機器視覺與AI解決方案助力生產力升級

5月21日-22日，北京機器視覺助力智能制造創新發展大會在北京國際會議中心圓滿舉行。本次大會以“Vision+AI引領新質生產力”為核心主題，聚焦“3D視覺與精準成像、

發表于 05-30 17:14 ?536次閱讀

英特爾機器<b class='flag-5'>視覺</b>與<b class='flag-5'>AI</b>解決方案助力生產力升級

微軟發布PhI-3-Vision模型，提升視覺AI效率

Phi-3-vision 是一種小型多模式語言模型（SLM），主要適用于本地人工智能場景。其模型參數高達 42 億，上下文序列包含 128k 個符號，可滿足各種視覺推理和其他任務需求。

發表于 05-28 11:35 ?488次閱讀

英特爾聯手微軟，推動移動設備低功耗計算及AI解決方案

據報道，微軟于4月至5月間相繼推出了多款Phi-3小型語言模型（SLM），這些模型以其“輕便易攜且能在移動設備中運行”以及強大的視覺處理能力

發表于 05-27 15:59 ?368次閱讀

英特爾優化AI產品組合，助力微軟Phi-3家族模型

近日，英特爾宣布針對微軟的Phi-3家族開放模型，成功驗證并優化了其跨客戶端、邊緣及數據中心的AI產品組合。這一重要舉措旨在提供更為靈活和高效的AI

發表于 05-27 11:47 ?668次閱讀

英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

近日，英特爾針對微軟的多個Phi-3家族的開放模型，驗證并優化了其跨客戶端、邊緣和數據中心的AI產品組合。

發表于 05-27 11:15 ?578次閱讀

微軟Build 2024：宣布開放AI GPT-40及Phi-3-visio

5 月 22 日，微軟Build 2024大會在美正式開幕。薩提亞·納德拉CEO、董事長宣布，OpenAI新款旗艦模型GPT-4o已經在Azure AI Studio上線，并開放API服務。

發表于 05-22 11:18 ?506次閱讀

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言

發表于 04-28 10:36 ?567次閱讀

微軟發布phi-3AI模型，性能超越GPT-3.5

微軟稱，帶有38億參數的phi-3-mini經過3.3萬億token的強化學習，其基礎表現已經超過Mixtral 8x7B及GPT-3.5；此外，該模型可在手機等移動設備上運行，并在phi

發表于 04-23 14:32 ?545次閱讀

微軟攜手法國AI初創企業Mistral推動AI模型商業化

微軟近日與法國人工智能初創企業Mistral達成合作協議，旨在推動AI模型的商業化應用。據悉，微軟將提供全方位支持，幫助這家成立僅10個月的公司將其先進的

發表于 02-28 10:23 ?545次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

2024過去了，留下十個科技記憶

腦極體
1天前

541 閱讀

兩款VR頭顯大拆解，都用了哪些芯片？

拍明芯城
1天前

410 閱讀

屏蔽柵MOSFET技術簡介

翠展微電子
1天前

389 閱讀

基于LKS32MC07x系列MCU的超高速清潔電器解決方案

晶豐明源
1天前

420 閱讀

基于瑞薩電子RA6T2 MCU的電機控制讓吸塵器更智能

瑞薩MCU小百科
1天前

347 閱讀

WinCC數據報表實現方法介紹

張燕
3244

10積分

192下載

USB總線接口開發指南

鵬帝321
8.94 MB

免費

0下載

基于ADXL362的小米智能手環完整設計方案

o_dream
26.68 MB

免費

63下載

SciDAVis可視化數據分析程序

李秀珍
9.43 MB

2積分

3下載

person-hunter人流檢測/統計系統

王利祥
3.79 MB

免費

0下載

【飛凌嵌入式OK3588J-C開發板體驗】OK3588J-C開發板的ffmpeg編解碼、HDMI輸入及編碼

dutong0321
1天前

153 閱讀

采集值突然驟降

塵埃sawdsa
20小時前

172 閱讀

2024 電機控制年度技術分享會來啦！！！

ElecFans小喇叭
1天前

471 閱讀

[廣東龍芯2K1000/2K500開發板] OpenWRT 使用說明

jf_38522704
10月前

5446 閱讀

使用單片機驅動DAC088S085無反應

jf_68383328
1天前

629 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

微軟發布視覺型AI新模型：Phi-3-vision

評論

微軟尋求在365 Copilot中引入非OpenAI模型

微軟預覽版Copilot Vision AI功能上線

用Ollama輕松搞定Llama 3.2 Vision模型本地部署

微軟發布Azure AI Foundry，推動云服務增長

在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型

聆思CSK6視覺語音大模型AI開發板入門資源合集（硬件資料、大模型語音/多模態交互/英語評測SDK合集）

英特爾機器視覺與AI解決方案助力生產力升級

微軟發布PhI-3-Vision模型，提升視覺AI效率

英特爾聯手微軟，推動移動設備低功耗計算及AI解決方案

英特爾優化AI產品組合，助力微軟Phi-3家族模型

英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

微軟Build 2024：宣布開放AI GPT-40及Phi-3-visio

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

微軟發布phi-3AI模型，性能超越GPT-3.5

微軟攜手法國AI初創企業Mistral推動AI模型商業化