5月28日,北京智源人工智能研究院在2023年中關村論壇并行論壇之一的人工智能大規(guī)模模型發(fā)展論壇上發(fā)布了通用分割模型seggpt (segment everything in contex)。這是一種利用prompt(視覺提示)完成任意分割工作的通用視覺模型。
seggpt是一個基于支持通用視覺模型painter的模型,它優(yōu)化了所有物體的分割。seggpt具有上下文推理功能,即使沒有細微的調(diào)整,只要提供示例,就可以自動進行推理和相應的分割工作。示例包括示例、類、部件、輪廓、文本、面部、醫(yī)療圖像等。它靈活的推論能力足以提供許多視覺線索。自動視頻分割和追蹤功能:seggpt以第一個框架的圖片和對象屏蔽為上下文單位,可以自動分割下一個視頻框架,并使用屏蔽顏色作為對象id自動追蹤。
seggpt與推出ai圖像分割基礎模型sam的meta不同,sam使用的是通過一個點或邊框相互提示預測圖像,識別分割畫面上的特定物體的“one touch touch”方式。seggpt通過提示一個或多個示例圖像和意圖面具來掌握用戶的意圖,并根據(jù)意圖進行分割等操作。只要用戶在畫面上表示識別一種物體,無論是現(xiàn)在的畫面還是其他畫面,都可以定量地識別和分割同類物體。
“一觸即通”或“一通百通”意味著視覺模型理解了形象結(jié)構(gòu)。sam的精細腳注功能與seggpt的通用分割腳注功能相結(jié)合,可以在像素排列中分析任何圖像,以像生物視覺一樣理解任何場景。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關推薦
電子發(fā)燒友網(wǎng)站提供《EE-82:使用ADSP-2181 DSP的IO空間對另一個ADSP-2181進行IDMA引導.pdf》資料免費下載
發(fā)表于 01-14 16:21
?0次下載
NVIDIA近日宣布,其Omniverse?平臺再次實現(xiàn)重大突破,成功推出多個生成式AI模型和藍圖,將Omniverse的應用范圍進一步擴展至物理AI
發(fā)表于 01-13 10:56
?393次閱讀
各位工程師,你們好。我想問ADS1256從一個通道到另一個通道的切換時間是多少?急,謝謝
發(fā)表于 01-06 08:08
隨著人工智能的不斷發(fā)展,現(xiàn)在的視覺機器人,無人駕駛等智能產(chǎn)品的不斷更新迭代,發(fā)現(xiàn)ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領域有哪些參考方案?
發(fā)表于 10-25 19:13
TPA3255,2XBTL 模式,其中一個聲道正常,另一個大動態(tài)時FAULT保護,OTW不亮.兩個聲道帶4R電阻負載測試都正常,280W左右,OTW會亮,幾十秒后超溫亮FAULT燈.
發(fā)表于 10-11 06:43
未來2-3年內(nèi),機器人基礎模型的研究將迎來重大突破,這一時刻被形象地比喻為機器人領域的“GPT-3時刻”。
發(fā)表于 09-20 17:05
?856次閱讀
英偉達科學家9月19日,科技媒體The Decoder發(fā)布了一則引人關注的報道,英偉達高級科學家Jim Fan在近期預測,機器人技術將在未來兩到三年內(nèi)迎來類似GPT-3在語言處理領域的革命性突破,他稱之為機器人
發(fā)表于 09-19 15:13
?653次閱讀
vca821的Vcc是1和14是否可以只對一個引腳供電另一個懸空內(nèi)部是否是通路
發(fā)表于 09-06 07:05
電感的電流能否分流給另一個電感,這個問題涉及到電感器的工作原理、特性以及在電路中的應用。 電感器的基本概念 電感器是一種被動電子元件,其主要功能是存儲能量。電感器由一個或多個導線繞成的
發(fā)表于 08-21 10:02
?542次閱讀
2023年是AI大語言模型爆發(fā)的一年,以OpenAI推出的GPT大模型為起始,整個行業(yè)開始從“推理式AI”向“生成式AI”邁進……
發(fā)表于 07-23 10:33
?271次閱讀
GPT,全稱Generative Pretrained Transformer,是OpenAI公司在自然語言處理(NLP)領域的一項重大創(chuàng)新。這一
發(fā)表于 07-10 10:41
?1505次閱讀
在人工智能領域的浩瀚星空中,OpenAI無疑是那顆最為耀眼的星辰。自其誕生以來,每一次的技術革新都牽動著全球科技愛好者的心弦。特別是當GPT-4在今年5月14日凌晨悄然降臨,以其強大的語言理解和生成能力,再次刷新了人們對于人工智
發(fā)表于 07-03 15:51
?401次閱讀
SPI 數(shù)據(jù)接口將圖像傳送到 OLED 顯示屏。使用 UVC 應用說明中的說明操作 UVC 部件。如何為 SPI OLED 顯示屏添加另一個設備? 謝謝。
發(fā)表于 05-31 06:18
3的出現(xiàn)意味著打開了一個全新的世界,其系列模型在推理,數(shù)學,編碼,多語言理解和視覺方面,都樹立了全新的行業(yè)新基準。 也正是因為Claude 3的出現(xiàn),全球最強AI模型
發(fā)表于 03-06 22:22
?716次閱讀
在tc275上怎么用一個核觸發(fā)另一個核產(chǎn)生軟中斷?
發(fā)表于 02-19 08:14
評論