在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

一個令人驚艷的ChatGPT項目，開源了！

最近在GitHub上發現了一個爆火的開源項目，star數一頓暴增。

好家伙，湊近一看，居然還是由微軟開源，并且和最近炙手可熱的ChatGPT息息相關。

項目的名字叫做：Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

這個項目最早是3月上旬微軟開源的，項目宣布開源后僅用了短短一周，就斬獲了2w+ star。

截止到目前，距離當初項目開源僅僅過去了3周多，倉庫star數則來到了27k+，亦可謂是火箭式上漲。

眾所周知，ChatGPT自2022年11月推出以來，持續走紅。

ChatGPT具備強大的會話能力，可以理解文字、聊天、寫小說、解答問題、編寫代碼... 但是目前還并不能直接處理或生成圖像。

而Visual ChatGPT這個項目則可以把ChatGPT和一系列視覺基礎模型（VFM，Visual Foundation Model）給聯系起來，以便實現在ChatGPT聊天的過程中來發送和接收圖像，也使得ChatGPT能夠處理更為復雜的視覺任務。

講白了，就是通過Visual ChatGPT，可以把一系列視覺基礎模型給接入ChatGPT，使得ChatGPT能勝任更為復雜的視覺處理任務。

Visual ChatGPT的整體技術架構圖如上所示，我們可以清楚地看到ChatGPT和視覺基礎模型（VFM，Visual Foundation Model）分別位于其中的位置。

一方面，ChatGPT(或LLM)作為一個通用接口，繼續發揮它本身的優勢，提供對不同話題的智能理解。

另一方面，基礎視覺模型VFM則通過提供特定領域的深入知識來充當領域專家，它們通過交互管理模塊（Prompt Manger）進行連接和適配。

這樣聊可能比較抽象，我們可以拿官方給的一個例子來進行說明：

1、首先是用戶：輸入一張黃色的向日葵圖片，并且要求ChatGPT根據該圖像預測深度來生成一朵紅花，然后再一步一步將其做成卡通畫。

2、接著是交互管理模塊（Prompt Manger）發揮作用，在它的協調和控制下，VFM模塊開始發揮作用：

首先需要運用深度估計模型來預測并生成圖像的深度信息；

然后需要運用深度圖像模型來生成對應空間深度的紅花圖像；

最后運用Stable Diffusion的風格遷移模型來完成圖像風格的變換。

3、最后Visual ChatGPT系統再將最終結果返回給用戶，完成本次對話。

說到這里，有興趣的小伙伴可以可以看看微軟給出的一篇有關Visual ChatGPT的論文：https://arxiv.org/pdf/2303.04671.pdf

https://arxiv.org/pdf/2303.04671.pdf

里面關于這部分的流程解釋得非常詳細，而且還給出了多輪對話的案例、以及實驗結果，有興趣的小伙伴可以看看。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

開源

開源

+關注

關注
3

文章
3542

瀏覽量
43328
視覺

視覺

+關注

關注
1

文章
153

瀏覽量
24250
ChatGPT

ChatGPT

+關注

關注
29

文章
1585

瀏覽量
8700

原文標題：一個令人驚艷的ChatGPT項目，開源了！

文章出處：【微信號：CodeSheep，微信公眾號：CodeSheep】歡迎添加關注！文章轉載請注明出處。

CodeSheep
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 學術專用版ChatGPT，開源了！
Hot 最可能被ChatGPT取代的10大高危職位

New 什么是守護線程？守護線程的底層原理和使用示例
New 為什么HashMap會產生死循環呢？

精選推薦
更多

文章

資料

帖子

從零開始手把手教你寫一個基于nRF54L15的BLE工程

汪文
8小時前

273 閱讀

nRF Connect SDK(NCS)/Zephyr固件升級詳解 – 重點講述MCUboot和藍牙空中升級

汪文
9小時前

227 閱讀

如何在Linux中配置DNS服務器

馬哥Linux運維
9小時前

249 閱讀

帝奧微AMOLED顯示屏電源管理芯片DIO53010簡介

江蘇帝奧微電子股份有限公司
11小時前

255 閱讀

國產！瑞芯微RK3506（3核[email protected]+雙網口+雙CAN-FD）工業開發板——開發環境搭建（下）

Tronlong創龍科技
11小時前

142 閱讀

matlab數學手冊下載

山中老虎
5554

10積分

377下載

開關電源的隔離式拓撲結構與非隔離式拓撲結構的基礎詳細說明

o_dream
1.13 MB

免費

79下載

dockprom Docker主機和容器的監控解決方案

楊火亭
0.83 MB

2積分

1下載

MGJRequestManager iOS網絡庫

王萍
0.06 MB

2積分

2下載

Banana Pi BPI-M1開發板硬件原理圖

bananapi開源硬件
0.37 MB

免費

65下載

《電子發燒友電子設計周報》聚焦硬科技領域核心價值第10期：2025.05.6--2025.05.9

電子人steve
23小時前

82 閱讀

【RA-Eco-RA4M2開發板評測】+驅動MAX6675 K-Thermocouple-to-Digital Converter

jf_69121293
23小時前

81 閱讀

【米爾-STM32MP257開發板試用體驗】米爾-STM32MP257開發板上alsa的wav音頻播放測試

jf_67024233
23小時前

104 閱讀

你在使用WI-FI6模塊PTR7002時遇到過哪些通信問題？歡迎分享解決方案！

jf_89990961
23小時前

300 閱讀

PROTUES仿真no model specified for adc0809，誰有ADC0809的model？

jf_11371265
23小時前

247 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

一個令人驚艷的ChatGPT項目，開源了！

評論

搜索歷史

一個令人驚艷的ChatGPT項目，開源了！

評論

一個令人驚艷的ChatGPT項目，開源了！