哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

一句話總結

通過應用視覺專家進行工業異常檢測，以實現明確的異常檢測和高質量的異常描述，還可進行多輪對話，性能表現出色！優于AnomalyGPT等網絡，代碼即將開源！

Myriad

Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

單位：哈工大(左旺孟團隊), 琶洲實驗室

論文：https://arxiv.org/abs/2310.19070

代碼：https://github.com/tzjtatata/Myriad

現有的工業異常檢測（IAD）方法可以預測異常檢測和定位的異常分數。然而，它們很難對異常區域進行多輪對話和詳細描述，例如工業異常的顏色、形狀和類別。

最近，大型多模態（即視覺和語言）模型（LMM）在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了卓越的感知能力，使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而，現有的通用 LMM 中缺乏有關異常檢測的知識，而訓練特定的 LMM 進行異常檢測需要大量的注釋數據和大量的計算資源。

本文提出了一種新穎的大型多模態模型，通過應用視覺專家進行工業異常檢測（稱為Myriad），從而實現明確的異常檢測和高質量的異常描述。

具體來說，采用 MiniGPT-4 作為基礎 LMM，并設計一個專家感知模塊，將視覺專家的先驗知識嵌入到大型語言模型（LLM）可以理解的標記中。

為了彌補視覺專家的錯誤和困惑，引入了域適配器來彌合通用圖像和工業圖像之間的視覺表示差距。此外，提出了一個視覺專家講師，它使 Q-Former 能夠根據視覺專家先驗生成 IAD 領域視覺語言標記。

實驗結果

在MVTec-AD 和 VisA 基準上的大量實驗表明，本文提出的方法不僅在 1-class 和少樣本設置下比最先進的方法表現更好，而且還提供了明確的異常預測以及 IAD 中的詳細描述領域。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

模型

模型

+關注

關注
1

文章
3500

瀏覽量
50113
視覺

視覺

+關注

關注
1

文章
157

瀏覽量
24305
大模型

大模型

+關注

關注
2

文章
3060

瀏覽量
3895

原文標題：工業異常檢測大模型來了！哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

CVer
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot DDFM：首個使用擴散模型進行多模態圖像融合的方法
Hot DepGraph：任意架構的結構化剪枝，CNN、Transformer、GNN等都適用！

New SegVG視覺定位方法的各個組件
New 詳解E2E-MFD多模態融合檢測端到端算法

精選推薦
更多

文章

資料

帖子

從行業痛點到創新解決血氧儀驅動方案--【其利天下】

其利天下技術
12小時前

250 閱讀

CMOS的邏輯門如何應用在電路中

深圳合科泰
14小時前

206 閱讀

用MPS HR1211實現數字PFC+LLC控制器解決方案助力快充適配器

向上
14小時前

224 閱讀

Altera Stratix 10和Agilex 7 FPGA的電源管理及配置問題案例

駿龍電子
14小時前

292 閱讀

告別反復燒錄！LVGL電腦仿真開發，效率飆升10倍！

東璧科苑
15小時前

183 閱讀

PT2262編碼芯片的內部電路分析及仿真

神之小風
444

10積分

200下載

集中式數據中心與邊緣計算白皮書精華集錦

Duke
5796KB

3積分

3下載

html2canvas javascript實現頁面截圖的類庫

南中南
3.19 MB

2積分

6下載

imgproxy快速安全的即時圖像處理

南中南
0.39 MB

免費

0下載

fastcxml xml解析庫

gvxiaot
0.02 MB

免費

0下載

電容三點式無法起振的原因

jf_01102310
1天前

368 閱讀

HarmonyOS NEXT意圖框架習慣推薦二場景開發實現

李洋水蛟龍
1天前

217 閱讀

一種采用NMOS濾出開關電源輸出紋波的電路

chunlai_zhang
1天前

269 閱讀

【米爾-全志T536開發板試用體驗】- 多協議物聯網關的開發測試

ALSET
10天前

297 閱讀

[經驗] RT-Thread 潘多拉 STM32L475

jf_42241628
1天前

510 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

哈工大提出Myriad：利用視覺專家進行工業異常檢測的大型多模態模型

評論