在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何選擇異常檢測算法

Dbwd_Imgtec ? 來源:DeepHub IMBA ? 作者:Dmytro Nikolaiev ? 2021-10-25 09:15 ? 次閱讀

異常檢測(也稱為離群點檢測)是檢測異常實例的任務,異常實例與常規實例非常不同。這些實例稱為異常或離群值,而正常實例稱為內部值。

異常檢測可用于多種應用,例如:

① 欺詐識別

② 檢測制造中的缺陷產品

③ 數據清理——在訓練另一個模型之前從數據集中去除異常值。

你可能已經注意到,一些不平衡分類的問題也經常使用異常檢測算法來解決。例如,垃圾郵件檢測任務可以被認為是一個分類任務(垃圾郵件比普通電子郵件少得多),但是我們可以用異常檢測的方法實現這個任務。

一個相關的任務是奇異值檢測(Novelty Detection)。它與異常檢測的不同之處在于,假設該算法是在干凈的數據集(沒有異常值)上訓練的。它被廣泛應用于在線學習中,當需要識別一個新實例是否是一個離群值時。

另一個相關任務是密度估計。它是估計數據集生成的隨機過程的概率密度函數的任務。密度估計通常用于異常檢測(位于低密度區域的實例很可能是異常)和數據分析。通常使用基于密度(高斯混合模型或 DBSCAN)的聚類算法來解決。

統計方法

檢測離群值最簡單的方法是嘗試統計方法,這是很久以前開發出來的。其中最流行的一種方法被稱為離群值檢測Tukey方法(或四分位數距離IQR) 。

它的本質是計算百分位數和四分位數之間的范圍。位于Q1-1.5 * IQR之前和Q3 + 1.5 * IQR之后的數據點被認為是異常值。下面你可以看到一個使用人的身高數據集的例子。高度低于54.95英寸(139厘米)和高于77.75英寸(197厘米)被認為是異常值。

這種和其他統計方法(用于檢測異常值的 z-score 方法等)通常用于數據清理。

聚類和降維算法

另一種簡單、直觀且通常有效的異常檢測方法是使用一些聚類算法(如高斯混合模型和 DBSCAN)來解決密度估計任務。那么,任何位于低密度區域的實例都可以被認為是異常,我們只需要設置一些密度閾值。

此外,可以使用任何具有 inverse_transform() 方法的降維算法。這是因為異常的重建誤差總是比正常實例的重建誤差大得多。

孤立森林和 SVM

一些監督學習算法也可用于異常檢測,其中最流行的兩種是孤立森林和 SVM。這些算法更適合奇異值檢測,但通常也適用于異常檢測。

孤立森林算法構建了一個隨機森林,其中每個決策樹都是隨機生長的。每走一步,這片森林就會隔離越來越多的點,直到所有點都變得孤立。由于異常位于遠離通常數據點的位置,因此它們通常比正常實例以更少的步驟被孤立。該算法對于高維數據表現良好,但需要比 SVM 更大的數據集。

SVM(在我們的例子中是一類 SVM)也廣泛用于異常檢測。內核化 SVM 可以構建一個有效的“限制超平面”,它將正常點與異常點分開。像任何 SVM 修改一樣,它可以很好地處理高維或稀疏數據,但僅適用于中小型數據集。

局部異常因子

局部異常值因子 (LOF) 算法基于異常位于低密度區域的假設。它不只是設置密度閾值(就像我們可以用 DBSCAN 做的那樣),而是將某個點的密度與其最近鄰居的 k 的密度進行比較。如果這個特定點的密度比它的鄰點低得多(這意味著它離它們很遠),它被認為是一個異常。

該算法既可用于異常檢測,也可用于奇異值檢測。由于其計算簡單且質量好,會被經常使用。

最小協方差行列式

最小協方差行列式(MCD 或其修改型 Fast-MCD)可用于異常值檢測,尤其是在數據清理的時候。它假設內點是從單個高斯分布中生成的,而離群點不是從這個分布中生成的。由于許多數據具有正態分布(或可以簡化為正態分布),因此該算法通常表現良好。在 sklearn 中EllipticEnvelope類就是它的實現。

如何選擇異常檢測算法?

如果你需要清理數據集,你應該首先嘗試經典的統計方法,比如 Tukey Method for Outlier Detection。如果知道數據分布是高斯分布 則可以使用Fast-MCD,。

如果你做異常檢測不是為了數據清理,首先試試簡單快速的LOF。如果它不能很好地工作(或者如果你出于某種原因需要分離超平面)——根據你的任務和數據集嘗試其他算法:

用于稀疏高維數據的單類SVM 或用于連續高維數據的孤立森林

如果可以假設數據是由多個高斯分布的混合生成的,可以試試高斯混合模型

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7232

    瀏覽量

    90708
  • 異常檢測
    +關注

    關注

    1

    文章

    43

    瀏覽量

    9797
  • 模型
    +關注

    關注

    1

    文章

    3460

    瀏覽量

    49772

原文標題:10分鐘掌握異常檢測

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于RV1126開發板的車輛檢測算法開發

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區管理、交通分析等多種場景,是違停識別、堵車識別、車流統計等多種算法的基石算法
    的頭像 發表于 04-14 16:00 ?151次閱讀
    基于RV1126開發板的車輛<b class='flag-5'>檢測算法</b>開發

    基于RV1126開發板的安全帽檢測算法開發

    安全帽佩戴檢測是工地、生產安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監控。AI技術的日漸成熟催生了安全帽佩戴檢測方案,成為了監督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發表于 04-14 15:10 ?132次閱讀
    基于RV1126開發板的安全帽<b class='flag-5'>檢測算法</b>開發

    基于RV1126開發板的人員檢測算法開發

    在RV1126上開發人員檢測AI算法組件
    的頭像 發表于 04-14 13:56 ?139次閱讀
    基于RV1126開發板的人員<b class='flag-5'>檢測算法</b>開發

    基于RV1126開發板的人臉檢測算法開發

    在RV1126上開發人臉檢測算法組件
    的頭像 發表于 04-14 10:19 ?131次閱讀
    基于RV1126開發板的人臉<b class='flag-5'>檢測算法</b>開發

    軒轅智駕紅外目標檢測算法在汽車領域的應用

    在 AI 技術蓬勃發展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是在汽車行業掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產業生態。
    的頭像 發表于 03-27 15:55 ?230次閱讀

    睿創微納推出新一代目標檢測算法

    隨著AI技術的發展,目標檢測算法也迎來重大突破。睿創微納作為熱成像領軍者,憑借深厚的技術積累與創新能力,結合AI技術推出新一代目標檢測算法,以三大核心技術帶來AI視覺感知全場景解決方案突破,助力各產業智能化升級。
    的頭像 發表于 03-20 13:49 ?255次閱讀

    如何制定一套優質的工業視覺檢測算法方案?

    很難與當下主流的AI平臺工具配型,或者是通過單一算法模型進行訓練,通常情況下,工業視覺檢測項目面臨著一系列獨特的難點與挑戰。比如:算法實現難。工業環境中的背景往往非
    的頭像 發表于 11-14 01:05 ?2168次閱讀
    如何制定一套優質的工業視覺<b class='flag-5'>檢測算法</b>方案?

    bq2750x系列中的Impedance Track?電池電量監測算法的理論及實現

    電子發燒友網站提供《bq2750x系列中的Impedance Track?電池電量監測算法的理論及實現.pdf》資料免費下載
    發表于 08-30 10:21 ?1次下載
    bq2750x系列中的Impedance Track?電池電量監<b class='flag-5'>測算法</b>的理論及實現

    旗晟機器人環境檢測算法有哪些?

    硬件支撐,更離不開強大的算法庫作為軟件核心,二者相輔相成,缺一不可。今天就來了解旗晟機器人環境檢測算法。 1、設施異常監測 通過集成高精度傳感器與智能圖像識別技術。它不僅能檢測A字梯是
    的頭像 發表于 07-19 17:54 ?730次閱讀
    旗晟機器人環境<b class='flag-5'>檢測算法</b>有哪些?

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊
    的頭像 發表于 07-16 10:40 ?1541次閱讀

    口罩佩戴檢測算法

    口罩佩戴檢測算法基于YOLOv5在圖像識別檢測領域的優異性能,本文研究基于基于YOLOv5的口罩佩自動戴檢測方法。首先從網絡和真實生活中中尋找并采集不同場景人群口罩佩戴的圖片約500張并自建數據集
    的頭像 發表于 07-01 20:20 ?502次閱讀
    口罩佩戴<b class='flag-5'>檢測算法</b>

    人員跌倒識別檢測算法

    人員跌倒識別檢測算法是基于視頻的檢測方法,通過對目標人體監測,當目標人體出現突然倒地行為時,自動監測并觸發報警。人員跌倒識別檢測算法基于計算機識別技術,配合現場攝像頭,自動識別如地鐵手扶梯/樓梯
    的頭像 發表于 06-30 11:47 ?659次閱讀
    人員跌倒識別<b class='flag-5'>檢測算法</b>

    安全帽佩戴檢測算法

    安全帽佩戴監控是鐵路工程施工人員安全管理中的重點和難點,它對檢測算法的準確 率與檢測速度都有較高的要求。本文提出一種基于神經網絡架構搜索的安全帽佩戴檢測算法 NAS-YOLO。該神經網絡架構由上
    的頭像 發表于 06-26 22:22 ?591次閱讀
    安全帽佩戴<b class='flag-5'>檢測算法</b>

    基于FPGA的實時邊緣檢測系統設計,Sobel圖像邊緣檢測,FPGA圖像處理

    ,所以先擴大系數近似為整數再運算。此處擴大256 倍后取整,將運算結果右移 8 位,提取 Y 分量即可得到灰度圖像,即 3 邊緣檢測算法設計 如圖4所示為待處理的3×3 像素點,使用 Sobel
    發表于 05-24 07:45

    COD檢測儀響應水質異常的速度?

    方面進行考量和優化,以確保及時有效地監測水質異常情況。   首先,監測儀器本身的性能和響應速度直接影響其在檢測水質異常時的效果。應選擇具有快速響應能力的COD
    的頭像 發表于 05-09 16:08 ?402次閱讀
    主站蜘蛛池模板: 久久天天躁狠狠躁夜夜免费观看 | 国产精品视频久久久 | 欧美网站免费 | 日韩黄网 | 天堂在线观看 | mm365快播综合网 | 婷婷久久综合九色综合九七 | 影音先锋午夜资源网站 | 国产特级毛片aaaaaa毛片 | 美女视频网站色软件免费视频 | 天天干天天干 | 国产一级片免费看 | 亚洲最大成人综合网 | 激情婷婷综合久久久久 | 国产精品午夜剧场 | 亚洲毛片儿 | 黄免费网站 | 免费抓胸吻胸激烈视频网站 | 欧美三级一级 | 中文字幕在线播放不卡 | 欧洲精品不卡1卡2卡三卡 | 国产色网站 | 免费一级特黄 欧美大片 | caopon在线| 日本三级网站在线线观看 | 色人在线 | 在线播放一区二区三区 | 亚洲综合精品一区二区三区中文 | 国产福利午夜自产拍视频在线 | 国产男女交性视频播放免费bd | 五月花亚洲| 美女露出尿口让男人桶爽网站 | 在线观看亚洲成人 | 爱爱永久免费视频网站 | 国产综合在线观看 | 躁天天躁中文字幕在线 | 久久的色偷偷 | 91色视| 日本卡一卡2卡3卡4精品卡无人区 | 午夜寂寞在线一级观看免费 | 色琪琪一本到影院 |