如今引領風潮的圖深度學習與曾經風靡一時的流形學習有何關系?請看本文娓娓道來。
圖神經網絡利用關系的歸納偏置獲取以圖的形式存在的數據。然而,在很多情況下,我們并沒有現成的可用的圖。
那么,在這種情況下,是否還仍然還可以應用圖深度學習呢?在本文中,倫敦帝國理工學院和盧加諾大學的教授Michael Bronstein對近期關于隱圖學習的工作和以前的流形學習技術進行了比較。
在過去的幾年里,人們對用于圖結構數據的機器學習方法的研究興趣大增。這類數據自然而然地出現在社會科學(例如,Twitter 或 Facebook 上的用戶關注圖)、化學(分子可以被建模為原子通過化學鍵相連的圖)、生物(不同生物分子之間的交互作用通常被建模為一個被稱為「相互作用組」的圖)等應用場景下。
圖神經網絡(GNN)是一類當下非常流行的方法,它們通過共享參數的局部操作對圖進行學習,這些操作會在相鄰節點之間交換信息。然而,在某些場景下,我們并不能奢求擁有一個作為輸入的圖。這種情況在許多生物學問題中屢見不鮮,在最好的情況下,由于發現交互作用的實驗開銷相當大并且充滿噪聲,「蛋白質-蛋白質」交互網絡等圖往往也只有部分數據被觀測到。
因此,我們對于根據數據推理出圖并且將圖神經網絡應用在該圖上十分感興趣,在本文中,我們將這一過程稱為「隱圖學習」(latent graph learning)。
隱圖可能是面向特定應用的,并且針對下游任務進行了優化。此外,由于這樣的圖可能會傳達關于數據的重要理解并提供解釋某些結論的方式,有時它們可能甚至會比任務本身更加重要。我們可以將隱圖學習看做學習一個帶有空邊集的圖。
在這種情況下,輸入為一些高維特征空間中的點云。
與 PointNet 等針對集合的深度學習方法(它們將一些共享的、可學習的點層面函數應用于每個節點上)不同,我們還試圖在點之間傳遞信息。這是通過在一個根據點特征本身構建的圖上傳遞消息實現的。
本文介紹的第一種此類架構為 MIT 的 Yue Wang 研發的「動態圖卷積網絡」(DGCNN,這篇論文在計算圖形學研究社區十分有名,并常常被用作點云方法的對比基線)。
受到計算圖形學領域中進行 3D 點云分析的工作的啟發,DGCNN 試圖將圖用作點云底層的局部平滑流形結構的一種粗糙的表征。
Yue Wang 觀察到的一個關鍵結論是,在整個神經網絡的處理過程中,該圖并不需要保持不變。而且事實上,顧名思義,「動態圖卷積網絡」可以、也應該被動態地更新。圖 1 說明了 DGCNN 在計算圖形學中十分有用的原因:
圖 1:動態圖卷積網絡利用飛機圖像構建了一個被用于特征傳播的 K 最近鄰圖。這種圖依賴于特定的任務,會被每一層網絡更新。
圖中的不同顏色表明了點距離紅點的距離(黃色表示與紅點距離較近的點)。
本圖說明在分割任務中,較深的層中的圖捕獲了語義關系(例如,一對翅膀、飛機引擎等)而不是幾何關系。
DGCNN 其中的一個不足之處在于,它使用了同一個空間構建圖以及圖上的特征。如圖 2 所示,在慕尼黑工業大學的 Anees Kazi 與 Luca Cosmo 近期發表的工作中,作者提出了一種名為「可微圖模塊」(DGM)的新型架構,它通過將構建圖和構建特征的過程解耦對 DGCNN 進行了擴展:
圖 2:可微圖模塊(DGM)提出了一種構建圖及其特征的機制,從而利用輸入數據在圖上進行信息傳播。
在被用于醫學領域的問題(例如,根據腦成像數據預測疾病)時,DGM 表現出了非常優異的性能。在這些任務中,我們擁有包括人口統計學特征(例如,年齡、性別等)、腦成像特征在內的多個病人的電子病歷數據,并試圖預測某個病人是否患有神經系統疾病。
論文「Disease prediction using graph convolutional networks: application to autism spectrum disorder and Alzheimer’s disease 」使用在一個根據人口統計學特征手動構建的「患者圖」上的信息傳播將 GNN 應用于此類任務。
DGM 在學習圖的任務上具有一定優勢,它可能傳達了對于某些特征如何在特定的診斷任務中互相依賴的理解。除此之外,DGM 還在點云分類任務中稍稍優于 DGCNN。
DGCNN 和 DGM 在概念上與一類被稱為「流形學習」或「非線性降維」相似,這類方法在 2000 年代時是機器學習領域中非常流行的課題,并且至今仍然被用于數據可視化。
流形學習的基本假設是:數據有一種內在的低維結構。
如下圖所示,盡管我們可以在某個空間中使用數百個甚至數千個維度表征數據,但數據的自由度實際上也許是十分有限的:
圖 3:盡管在這個數據集中的手的圖像是高維的(64*64=4,096 維),但是他們本質上是低維的,而且可以通過僅僅兩個自由度來解釋:手腕的旋轉和手指的延伸情況。
流形學習算法可以捕獲數據集的這種低維的內在結構,并且在歐氏空間中表征它。該圖取自論文「A Global Geometric Framework for Nonlinear Dimensionality Reduction」的補充材料。
流形學習旨在通過底層的「流形」(嚴格地說,這里指的并不是微分幾何意義上的術語「流形」,例如不同的點上的局部維度可能不同。
然而,使用這種比喻較為方便。)捕獲這些自由度,并且將數據的維度降到其本質的維度上。
流形學習與 PCA 等線性降維方式的重要區別在于,由于數據的非歐結構,用線性投影的方式恢復出流形是不可能的:
圖 4:線性降維(左圖)vs 流形學習。Joshua Tenenbaum 創造的「Swiss roll」曲面及其 1D 展開形式在流形學習論文中經常被用作示例。
各種流形學習算法的不同之處在于它們恢復「流形」的方式,但它們的大致框架相同。首先,它們會創建一種數據的表征,通常這是通過構建一個捕獲了局部結構的 k 最近鄰圖完成的。接著,它們會計算一種數據的低維表征(嵌入),并試圖保留原始數據的結構。
而這一步正是大多數流形學習方法各不相同的地方。
例如,Isomap試圖保留圖的測地線距離;局部線性嵌入找到了一種鄰接點的局部表征;而拉普拉斯特征映射使用了圖拉普拉斯算子的特征函數作為低維嵌入。這種新的表征將原始的非歐結構「展平」到了一個易于處理的歐氏空間中。
最后,一旦我們計算出表征,就可以將某種機器學習算法(通常為聚類算法)應用于該表征上。
圖 5:流形學習方法的框架:首先,將數據表征為一個圖。接著,計算出該圖的低維嵌入。最后,將某種機器學習算法應用于該低維表征上。
該過程也存在著一些挑戰,例如:構建圖的過程與應用機器學習算法的過程是解耦的,有時還需要進行精細的參數調優(如近鄰節點的數量或鄰域半徑),從而確定如何構建圖,使得下游任務表現優異。
也許,流形學習算法的一個更為嚴重的缺點是,數據很少表現為低維的原始形式。
例如,當我們處理圖像時,需要在預處理步驟中使用各種手動構造的特征提取技術。
圖深度學習通過使用一個圖神經網絡代替這個三階段的過程為其提供了一種現代化的視角。
例如,在動態圖卷積網絡或 DGM 中,構建圖和學習的過程都是同一個架構中的某一部分:
圖 6:可以將隱圖學習看做一種現代環境下的流形學習問題,其中將圖作為一個端到端的 GNN 工作流程的一部分進行學習,并為某些下游任務對其進行優化。
這類方法吸引人的地方在于,它們可以將處理單個數據點的過程與處理它們所在空間的過程在同一個工作流程中結合起來。
以圖像為例,我們可以使用傳統的卷積神經網絡從每張圖像中提取視覺特征,并且使用圖神經網絡建模它們之間的關系。
Jan Svoboda 在論文「 PeerNets: Exploiting peer wisdom against adversarial attacks」中用到了這種方法,他為卷積神經網絡提出了一種基于圖的正則化層「PeerNet」,它可以實現在多張圖像之間交換信息。
PeerNet 與非局部(Non-local)均值濾波器在它們從多個位置聚合信息的方式上有一些相似之處,而 PeerNet 的不同之處在于它從多張圖像而不是單張圖像中聚合信息。
這種正則化技術顯著地降低了對抗性干擾的影響,而標準的卷積神經網絡則很容易受其影響。
圖 7:PeerNet 是一種標準的卷積神經網絡中的基于圖的正則化層,它從多張圖像中聚合相似的像素,從而降低對于對抗性干擾的敏感度。隱圖學習還有許多其它有趣的應用,小樣本學習便是其中之一。
在小樣本學習中,基于圖的技術可以幫助使用少量示例訓練的模型泛化。如今,由于數據標注的開銷十分巨大,小樣本學習在計算機視覺領域變得越來越重要。生物學是隱圖學習另一個重要的應用場景,人們通常通過實驗觀察蛋白質等生物分子的表達水平,并試圖重建它們的相互作用和信息傳遞網絡。
此外,隱圖學習還可以被用于對物理系統的分析,其中圖可以描述多個物體之間的相互作用。具體而言,研究復雜粒子相互作用的高能物理學家們近期對基于圖的方法展現出了濃厚的興趣。最后,隱圖學習在自然語言處理(NLP)領域中也得到了重要的應用,其中圖神經網絡可以被看做 Transformer 架構的拓展。
許多上述的任務也提出了引入圖結構的先驗知識的問題,這仍然是一個有待解決的開放性問題:例如,我們也許會希望迫使圖遵循某些特定的構建規則,或者與某些統計模型兼容。
在論文「Learning deep generative models of graphs」中,作者在嚴格遵循某些構建規則的情況下,生成化學鍵的分子結構圖。我們相信,盡管隱圖學習并不是一個完全新穎的概念,但是它為一些老的問題提供了新的視角。
它肯定是一種有趣的圖機器學習問題,為圖神經網絡的研究者們提供了新的舞臺。
責任編輯:lq
-
數據
+關注
關注
8文章
7220瀏覽量
89974 -
機器學習
+關注
關注
66文章
8458瀏覽量
133245 -
深度學習
+關注
關注
73文章
5523瀏覽量
121727
原文標題:“看不見”的圖深度學習=流形學習 2.0?
文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
BP神經網絡與深度學習的關系
NPU與機器學習算法的關系
NPU在深度學習中的應用
深度學習模型有哪些應用場景
深度學習中的時間序列分類方法
深度學習中的無監督學習方法綜述
深度學習與nlp的區別在哪
深度學習中的模型權重
深度學習常用的Python庫
深度學習與傳統機器學習的對比
深度解析深度學習下的語義SLAM

評論