在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于圖神經(jīng)網(wǎng)絡(luò)的圖異常值檢測(cè)庫(kù)介紹

TigerGraph ? 來(lái)源:TigerGraph ? 作者:Yingtong Dou ? 2022-12-08 10:34 ? 次閱讀

文章具體介紹了圖神經(jīng)網(wǎng)絡(luò)的基本機(jī)制,以及圖上無(wú)監(jiān)督節(jié)點(diǎn)異常值檢測(cè)的概念和方法。同時(shí)他還分享了在這方面的一些發(fā)現(xiàn)和想法。最后,我們將介紹一個(gè)基于 GNN 的圖異常值檢測(cè)庫(kù) (PyGOD) 及其與 TigerGraph機(jī)器學(xué)習(xí)工作臺(tái)的集成。

圖神經(jīng)網(wǎng)絡(luò) (GNN)

我們先簡(jiǎn)單了解一下現(xiàn)在熱門的圖神經(jīng)網(wǎng)絡(luò) (GNN),這已經(jīng)成為圖數(shù)據(jù)挖掘的一種主導(dǎo)且強(qiáng)大的工具。與圖像數(shù)據(jù)的 CNN 相似,GNN 是一種神經(jīng)網(wǎng)絡(luò),旨在對(duì)圖結(jié)構(gòu)進(jìn)行編碼并通過(guò)迭代聚合其鄰居的嵌入來(lái)學(xué)習(xí)節(jié)點(diǎn)的嵌入 (見圖 1)。大多數(shù) GNN 都持有同源性假設(shè),即相連的節(jié)點(diǎn)是相似的;因此,聚合鄰居的信息將有助于學(xué)習(xí)信息量更大的中心節(jié)點(diǎn)表示。中心節(jié)點(diǎn)表示可用于節(jié)點(diǎn)分類、鏈接預(yù)測(cè)和異常值檢測(cè) (OD) 等下游任務(wù)。

ed7d2b2c-761e-11ed-8abf-dac502259ad0.png

圖1:圖神經(jīng)網(wǎng)絡(luò)

圖上的異常值

異常值是與其余數(shù)據(jù)顯著不同的樣本。作為數(shù)據(jù)挖掘研究的主流方向,異常值檢測(cè)在行業(yè)中也至關(guān)重要。現(xiàn)實(shí)世界數(shù)據(jù)中的異常值通常表示欺詐行為、系統(tǒng)錯(cuò)誤、網(wǎng)絡(luò)入侵或網(wǎng)絡(luò)故障。這些異常值可能導(dǎo)致重大的財(cái)務(wù)損失和安全問(wèn)題。

除了傳統(tǒng)表格數(shù)據(jù)中的異常值外,圖模型還可以提高異常值檢測(cè)的性能,特別是當(dāng)數(shù)據(jù)實(shí)例具有共同的屬性和接近性時(shí)。社交平臺(tái)的機(jī)器人賬戶單個(gè)看可能沒(méi)什么問(wèn)題(如圖 2 所示),但它的轉(zhuǎn)發(fā)行為密集相連,從圖的角度來(lái)看容易發(fā)現(xiàn)其中的異常。

ed9d5d0c-761e-11ed-8abf-dac502259ad0.png

圖2:圖上的異常值

在圖異常值檢測(cè)中,以前的文獻(xiàn)已經(jīng)定義并研究了兩種典型的異常值類型。(1) 結(jié)構(gòu)異常值是指密集相連的節(jié)點(diǎn),相反則是稀疏連接的常規(guī)節(jié)點(diǎn),例如前面提到的社交網(wǎng)絡(luò)問(wèn)題(圖 2 所示)。(2) 上下文異常值是其屬性與相鄰節(jié)點(diǎn)明顯不同的節(jié)點(diǎn)。它的定義與經(jīng)典的基于接近度的異常值檢測(cè)方法中的異常值假設(shè)相似。上下文異常值描繪了與圖中鄰居不同的節(jié)點(diǎn),例如計(jì)算機(jī)網(wǎng)絡(luò)中的受損設(shè)備。

edd2aa8e-761e-11ed-8abf-dac502259ad0.png

圖3:兩種典型的異常值類型

基于 GNN 的節(jié)點(diǎn)異常值檢測(cè)

在 GNN 取得進(jìn)展之前,大家就已經(jīng)利用矩陣分解、密度聚類和關(guān)系學(xué)習(xí)方法來(lái)編碼圖信息并識(shí)別異常值。其他異常值檢測(cè)方法大家可以參考文中鏈接(https://arxiv.org/abs/1404.4679)。

回到 GNN,在獲得節(jié)點(diǎn)表示之后,GNN 會(huì)使用不同的損失函數(shù)(目標(biāo)函數(shù))進(jìn)行優(yōu)化,用于不同的任務(wù)。例如,使用交叉熵?fù)p失來(lái)優(yōu)化 GNN 用于節(jié)點(diǎn)分類任務(wù)。

對(duì)于節(jié)點(diǎn)異常值檢測(cè),常規(guī)做法是將 GNNs 集成到自動(dòng)編碼器中,將 GNN 用作編碼器和解碼器。這種神經(jīng)網(wǎng)絡(luò)架構(gòu)稱為圖自動(dòng)編碼器(簡(jiǎn)稱:GAE)。與香草自編碼器一樣,GAE 通過(guò)重建圖數(shù)據(jù)來(lái)編碼圖信息,即重建節(jié)點(diǎn)特征和邊。在異常值檢測(cè)方面,GAE 可用于編碼正常圖信息,具有高重構(gòu)誤差的節(jié)點(diǎn)將表明其異常程度。圖4就是使用 GAE 進(jìn)行節(jié)點(diǎn)異常值檢測(cè)的第一種模型。

edf8ca7a-761e-11ed-8abf-dac502259ad0.png

圖4:The OD framework of DOMINANT (SDM’ 19)

需要注意的是,使用 GAE 進(jìn)行異常值檢測(cè)對(duì)圖數(shù)據(jù)有兩個(gè)隱含假設(shè):(1)異常值僅占據(jù)少量數(shù)據(jù),而大部分?jǐn)?shù)據(jù)是正常的;(2)正常數(shù)據(jù)具有共同的屬性和結(jié)構(gòu)特征。在此假設(shè)下,GAE 可以用來(lái)檢測(cè)結(jié)構(gòu)和上下文異常值,近兩年來(lái)也已經(jīng)有了許多 GAE 的變體。

基準(zhǔn)測(cè)試的發(fā)現(xiàn)

接下來(lái),跟大家分享一些基于 GNN 的節(jié)點(diǎn)異常值檢測(cè)方法進(jìn)行基準(zhǔn)測(cè)試的一些發(fā)現(xiàn):

1. 許多現(xiàn)有的基于 GNN 的異常值檢測(cè)方法都是基于合成異常值的相對(duì)樸素的假設(shè)來(lái)開發(fā)的;因此,許多方法在檢測(cè)有機(jī)異常值時(shí)效果并不理想。有機(jī)異常值通常非常復(fù)雜,其分布也可能多種多樣。但是,我們的基準(zhǔn)測(cè)試表明,如果有機(jī)異常值遵循預(yù)定義的異常類型,則基于 GNN 的異常值檢測(cè)方法將是有效的。

2. 和大多數(shù)深度學(xué)習(xí)方法一樣,基于 GNN 的異常值檢測(cè)方法在小圖中效果都不是最優(yōu)的。與此同時(shí),大多數(shù)基于 GNN 的異常值檢測(cè)方法在擁有數(shù)千萬(wàn)個(gè)節(jié)點(diǎn)的大圖中都不具有可伸縮性。

3. 無(wú)監(jiān)督的基于 GNN 的異常值檢測(cè)方法的性能嚴(yán)重依賴于超參數(shù),而在無(wú)監(jiān)督學(xué)習(xí)中的超參數(shù)調(diào)整仍然是機(jī)器學(xué)習(xí)研究和實(shí)踐中的挑戰(zhàn)。

4. 大多數(shù)基于 GNN 的異常值檢測(cè)方法更傾向于特定類型的異常值。平衡和優(yōu)化每種異常值類型的檢測(cè)性能并不容易。同時(shí),在預(yù)期中沒(méi)有方法具有一致的性能或者在不同的數(shù)據(jù)集上優(yōu)于其他方法。

基于圖的異常值檢測(cè)指南

基于上述發(fā)現(xiàn),由于其可擴(kuò)展性約束,我們認(rèn)為基于 GNN 的異常值檢測(cè)與工業(yè)應(yīng)用之間仍存在差距。開發(fā)基于 GNN 的自動(dòng)化、可擴(kuò)展和任務(wù)導(dǎo)向的異常值檢測(cè)方法將是一個(gè)具有發(fā)展?jié)摿Φ姆较颉V劣诘降资菓?yīng)用基于 GNN 的異常值檢測(cè)或基于圖的異常值檢測(cè),作者也給出了應(yīng)用指南(圖5),以方便從業(yè)者參考。我們簡(jiǎn)單跟大家分享幾點(diǎn),例如,是否采用圖?可以看異常實(shí)體是否具有共同的特性,異常實(shí)體是否具有集群行為,還有就是成本與效益之間的權(quán)衡。而是否采用GNN?則需要考慮基礎(chǔ)設(shè)施,功能可用性和功能類型,還有與其他模塊和任務(wù)集成。具體指南圖大家可以關(guān)注我們的微信公眾號(hào)查看正文。

ee0fe76e-761e-11ed-8abf-dac502259ad0.png

圖5:基于圖的異常值檢測(cè)指南

從上述指南中,作者強(qiáng)調(diào)了數(shù)據(jù)探索分析和精確問(wèn)題定義對(duì)于應(yīng)用基于圖的異常值檢測(cè)是至關(guān)重要的。

PyGOD 和TigerGraph ML Workbench

最后,作者還跟大家介紹了 PyGOD,這是一個(gè)與圖異常值檢測(cè)基準(zhǔn)測(cè)試一起開發(fā)的 Python 庫(kù)。該庫(kù)基于 PyTorch 和 PyTorch Geometric (PyG) 開發(fā),其 API 樣式遵循流行的機(jī)器學(xué)習(xí)庫(kù) scikit-learn,可以很容易地使用五行代碼檢測(cè)圖中的異常點(diǎn):

ee3ace16-761e-11ed-8abf-dac502259ad0.png

PyGOD是一個(gè)不斷發(fā)展的Python庫(kù),旨在涵蓋更多的檢測(cè)功能和更高的可擴(kuò)展性。TigerGraph ML Workbench能夠?qū)D數(shù)據(jù)從TigerGraph DB轉(zhuǎn)換為PyG數(shù)據(jù)對(duì)象,因此PyGOD可以在TigerGraph中輕松安裝和測(cè)試。

ee6ad408-761e-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:Vol. 38 基于圖神經(jīng)網(wǎng)絡(luò)的圖異常值檢測(cè):簡(jiǎn)介

文章出處:【微信號(hào):TigerGraph,微信公眾號(hào):TigerGraph】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法

    在上一篇文章中,我們介紹了傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法。在本文中,我們會(huì)介紹人工神經(jīng)網(wǎng)絡(luò)的原理和多種神經(jīng)網(wǎng)絡(luò)架構(gòu)方法,供各位老師選擇。 01 人工
    的頭像 發(fā)表于 01-09 10:24 ?845次閱讀
    人工<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的原理和多種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>架構(gòu)方法

    LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)準(zhǔn)備方法

    : 一、數(shù)據(jù)收集與清洗 數(shù)據(jù)收集 : 根據(jù)LSTM神經(jīng)網(wǎng)絡(luò)的應(yīng)用場(chǎng)景(如時(shí)間序列預(yù)測(cè)、自然語(yǔ)言處理等),收集相關(guān)的時(shí)間序列數(shù)據(jù)或文本數(shù)據(jù)。 數(shù)據(jù)可以來(lái)自數(shù)據(jù)庫(kù)、日志文件、傳感器讀數(shù)、用戶行為記錄等多種來(lái)源。 數(shù)據(jù)清洗 : 去除數(shù)據(jù)中的噪聲和
    的頭像 發(fā)表于 11-13 10:08 ?1650次閱讀

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)的區(qū)別

    BP神經(jīng)網(wǎng)絡(luò)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)稱ANNs)之間的關(guān)系與區(qū)別,是神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一個(gè)基礎(chǔ)且重要的話題。本文將從定義、結(jié)構(gòu)、算法、應(yīng)用及未來(lái)發(fā)展等多個(gè)方面,詳細(xì)闡述BP
    的頭像 發(fā)表于 07-10 15:20 ?1894次閱讀

    基于神經(jīng)網(wǎng)絡(luò)的全息生成算法

    全息生成技術(shù)作為光學(xué)與計(jì)算機(jī)科學(xué)交叉領(lǐng)域的重要研究方向,近年來(lái)隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,取得了顯著進(jìn)展。基于神經(jīng)網(wǎng)絡(luò)的全息生成算法,以其強(qiáng)大的非線性擬合能力和高效的計(jì)算性能,為全
    的頭像 發(fā)表于 07-09 15:54 ?822次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?864次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱RNN)實(shí)際上是同一個(gè)概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?1280次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡(jiǎn)稱BP神經(jīng)網(wǎng)絡(luò))是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過(guò)反向傳播算法來(lái)調(diào)整網(wǎng)絡(luò)中的權(quán)重和偏置,以達(dá)到最小化誤差的
    的頭像 發(fā)表于 07-03 11:00 ?1065次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是兩種不同類型的人工神經(jīng)網(wǎng)絡(luò),它們?cè)?/div>
    的頭像 發(fā)表于 07-03 10:12 ?2193次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的一般步驟是什么

    數(shù)據(jù)預(yù)處理、構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)、前向傳播、反向傳播、參數(shù)更新、模型評(píng)估和應(yīng)用等環(huán)節(jié)。 數(shù)據(jù)預(yù)處理 數(shù)據(jù)預(yù)處理是卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的第一步,主要包括數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、歸一化等操作。 1.1 數(shù)據(jù)清洗 數(shù)據(jù)清洗是指去除數(shù)據(jù)集中的噪聲、異常值
    的頭像 發(fā)表于 07-03 09:11 ?1662次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原理,包括其
    的頭像 發(fā)表于 07-02 14:44 ?1070次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)和BP神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Networks,簡(jiǎn)稱BPNN)是兩種
    的頭像 發(fā)表于 07-02 14:24 ?5653次閱讀

    建立神經(jīng)網(wǎng)絡(luò)模型的三個(gè)步驟

    建立神經(jīng)網(wǎng)絡(luò)模型是一個(gè)復(fù)雜的過(guò)程,涉及到多個(gè)步驟和細(xì)節(jié)。以下是對(duì)建立神經(jīng)網(wǎng)絡(luò)模型的三個(gè)主要步驟的介紹: 第一步:數(shù)據(jù)準(zhǔn)備 1.1 數(shù)據(jù)收集 數(shù)據(jù)是神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。首先,你需要收集足夠的
    的頭像 發(fā)表于 07-02 11:20 ?1557次閱讀

    人工神經(jīng)網(wǎng)絡(luò)的工作原理是什么

    和學(xué)習(xí)。本文將詳細(xì)介紹人工神經(jīng)網(wǎng)絡(luò)的工作原理,包括其基本概念、結(jié)構(gòu)、學(xué)習(xí)算法和應(yīng)用領(lǐng)域。 基本概念 1.1 神經(jīng)神經(jīng)元是人工神經(jīng)網(wǎng)絡(luò)的基
    的頭像 發(fā)表于 07-02 10:06 ?1877次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    、語(yǔ)音識(shí)別、自然語(yǔ)言處理等多個(gè)領(lǐng)域。本文將對(duì)幾種主要的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行詳細(xì)介紹,包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗
    的頭像 發(fā)表于 07-01 14:16 ?1262次閱讀

    利用深度循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)心電降噪

    具體的軟硬件實(shí)現(xiàn)點(diǎn)擊 http://mcu-ai.com/ MCU-AI技術(shù)網(wǎng)頁(yè)_MCU-AI 我們提出了一種利用由長(zhǎng)短期記憶 (LSTM) 單元構(gòu)建的深度循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)降 噪心電信號(hào) (ECG
    發(fā)表于 05-15 14:42
    主站蜘蛛池模板: 久久99精品久久久久久臀蜜桃 | 最近高清在线国语 | 4480yy私人午夜a级国产 | 欧美精品一区二区三区在线播放 | ww欧洲ww欧洲视频 | 亚洲男人的天堂久久香蕉 | 1024手机免费看片 | 亚洲成a人片777777久久 | 五月天丁香婷婷开心激情五月 | 一级特黄aaa大片大全 | 永久看日本大片免费 | 色男人社区 | 免费观看黄a一级视频 | 乱说欲小说又粗又长 | 午夜视频在线免费看 | 高清成年美女黄网站色大 | 人人添人人澡人人澡人人人爽 | 日韩1页| 天天添天天操 | 日本免费人成黄页网观看视频 | 91在线播放免费不卡无毒 | 天天综合色天天综合网 | 日本一区二区免费在线观看 | 一 级 黄 色 片生活片 | 欧美精品一二区 | 99青草青草久热精品视频 | 黄色在线观看视频网站 | 中文字幕第一页在线 | 天天摸天天操天天干 | 国产高清免费午夜在线视频 | 亚洲国产成人精品不卡青青草原 | 狠狠五月深爱婷婷网免费 | 亚洲最大毛片 | 天天躁夜夜躁狠狠躁2024 | 午夜黄大色黄大片美女图片 | 天天综合在线视频 | 成人免费一区二区三区 | 91免费网站在线看入口黄 | 免费看黄的视频网站 | 一级女人毛片人一女人 | 福利一区二区在线观看 |