在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

deepwalk算法核心的步驟

智能生物識別說 ? 來源:快商通AI ? 作者:快商通AI ? 2021-10-14 09:59 ? 次閱讀

在數據量越來越大的今天,word2vec是通過字詞的共現關系來學習字詞的向量表示,Graph Embeding的思想類似于word2vec,通過圖中節點與節點的共現關系來學習節點的向量表示,構成文本序列從而計算相互關聯出現的詞的概率,從而計算詞向量表示文本。那么在圖模型中的關鍵的問題就是如何來描述節點與節點的共現關系,于是方法是利用DeepWalk來采樣這樣的文本序列,通過隨機游走(RandomWalk)的方式在圖中進行節點采樣,從而就能夠輸入序列計算圖的向量表示。所以deepwalk算法核心的步驟就是兩步:

RandomWalk

Skip-Gram

RandomWalk是一種可重復訪問已訪問節點的深度優先遍歷算法。給定當前訪問起始節點,從其鄰居中隨機采樣節點作為下一個訪問節點,重復此過程,直到訪問序列長度滿足預設條件。

spacer.gif算法過程就是輸入一個圖,輸出節點表示的矩陣,簡單對步驟進行解析:

初始化:從 $\mathcal{U}^{|V| \times d}$ 樣本空間中采樣,embedding的大小為 $d$

構建一棵二叉樹Hierarchical Softmax

開始做 $\gamma$ 步的隨機游走,這里的 $\gamma$ 是初始化好的超參數

打亂采樣得到的節點

這個循環是開始以每個節點為根節點開始做長度為 $t$ 的隨機游走,這里的 $t$ 為初始化的超參數。然后按窗口 $w$ 進行SkipGram學習文本序列

SkipGram

一般提到word2vec有兩種主要的算法,Cbow和Skip-Gram,都是在統計語言模型的基礎上計算一個詞在文本中出現的概率用來作為這個詞的表示向量,于是優化目標就是最大化$Pr(w_n|w_0,w_1,...,w_{n-1})$ 。 $w$ 表示的就是詞。

SkipGram就是用當前詞來預測上下文。丟掉了詞序并且不考慮與當前詞的距離。優化目標是最大化同一個句子中同時出現的詞的共現概率:

預測給到的詞從整個詞表vocabulary中選擇,因此在輸出的時候會計算softmax進行選擇,維度為 $|V|$ ,計算的維度會非常大,因此采用Hierarchical Softmax來構建二叉樹進行選擇,每個詞就只需要計算 $log_2^{|V|}$ 次。

Node2Vec

node2vec依然采用的是隨機游走的方式獲取頂點的臨近頂點序列,但不同的是node2vec采用的是一種有偏的隨機游走。給定當前頂點 $v$,訪問下一個頂點的概率是:

$\pi{vx}$ 是頂點 $v$ 到頂點 $x$ 之間的轉移概率, $Z$ 是歸一化參數。 node2vec引入兩個超參數 $p$ 和 $q$ 來控制隨機游走的策略,假設當前隨機游走經過邊 $(v, x) $ 到達頂點 $t$ ,設 $\pi{vx}=\alpha{pq}(t, x)\cdot w{vx}$ , $w_{vx}$ 是頂點 $v$ 和 $x$ 之間的邊權。

$d{tx}$ 為頂點 $t$ 和頂點 $x$ 之間的最短路徑距離。參數$p$和參數$q$的意義:控制重復訪問剛剛訪問過的頂點的概率。$p$作用于$d{tx}=0$,表達的意義就是頂點$x$就是訪問當前頂點$v$之前剛剛訪問過的頂點。如果$p$較高,則訪問剛剛訪問過的頂點的概率會變低,反之變高。$q$控制著游走是向外還是向內,如果$q>1$,隨機游走傾向于訪問和節點$t$相接近的頂點(類似于$BFS$)。如果$q<1$,則傾向于訪問遠離$t$的頂點(類似于$DFS$)。

Graph Convolutional Network

Graph Embedding的意義就在于能夠利用圖結構處理非結構化數據,因此在cv和nlp領域能夠更進一步結合先驗知識進行特征學習,因此是深度學習領域的重要發展方向。定義圖$G=(V,E)$,$V$為節點的集合,$E$為邊的集合,對于每個節點$i$, 均有其特征$x_i$,特征矩陣可以用$X_{N*D}$來表示,其中$N$表示節點數,$D$表示每個節點的特征編碼尺寸,在nlp應用中就是embedding_size。對于圖的理解有一個經典的思想:

圖中的每個結點無時無刻不因為鄰居和更遠的點的影響而在改變著自己的狀態直到最終的平衡,關系越親近的鄰居影響越大。

實際上從鄰居節點獲取信息的思想在很多領域都有應用,例如:word2vec和pagerank。很多參考的理解描述了更加細節的數學原理:從傅立葉變換到拉普拉斯算子到拉普拉斯矩陣。很難理解。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4631

    瀏覽量

    93434
  • 節點
    +關注

    關注

    0

    文章

    220

    瀏覽量

    24541
收藏 人收藏

    評論

    相關推薦

    人臉識別技術的算法原理解析

    在數字化時代,人臉識別技術已經成為身份驗證和安全監控的重要手段。這項技術的核心在于算法,它們能夠從圖像中提取關鍵信息,并與數據庫中的信息進行匹配,以識別個體。 1. 人臉識別技術概述 人臉識別技術
    的頭像 發表于 02-06 17:50 ?369次閱讀

    IGBT雙脈沖測試原理和步驟

    IGBT(Insulated Gate Bipolar Transistor,絕緣柵雙極型晶體管)作為電力電子裝置中的核心器件,其性能的穩定性和可靠性對整個系統的運行至關重要。為了驗證IGBT的性能
    的頭像 發表于 02-02 13:59 ?140次閱讀

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+介紹基礎硬件算法模塊

    作為嵌入式開發者往往比較關注硬件和軟件的協調。本書介紹了除法器,信號發生器,濾波器,分頻器等基本算法的電路實現,雖然都是基礎內容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現,過去的研發
    發表于 11-21 17:05

    AIGC算法解析及其發展趨勢

    、AIGC算法解析 核心基礎 人工智能算法 :AIGC技術的基礎和靈魂,如深度學習、機器學習等算法,使機器能夠模擬人類的思考和行為過程,從而自主地完成各種任務。這些
    的頭像 發表于 10-25 15:35 ?576次閱讀

    圖像識別算法核心技術是什么

    圖像識別算法是計算機視覺領域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內容。圖像識別算法核心技術包括以下幾個方面: 特征提取 特征提取是圖像識別算法的基礎,
    的頭像 發表于 07-16 11:02 ?784次閱讀

    opencv圖像識別有什么算法

    圖像識別算法: 邊緣檢測 :邊緣檢測是圖像識別中的基本步驟之一,用于識別圖像中的邊緣。常見的邊緣檢測算法有Canny邊緣檢測器、Sobel邊緣檢測器和Laplacian邊緣檢測器。 特征點檢測 :特征點檢測是識別圖像中的關鍵點,
    的頭像 發表于 07-16 10:40 ?1232次閱讀

    ai大模型和算法有什么區別

    復雜的問題。這些模型通常需要大量的數據和計算資源來訓練和優化。例如,深度學習中的神經網絡就是一種典型的AI大模型。 算法則是一系列解決問題的步驟和規則,它們可以應用于各種領域,包括人工智能。算法可以是簡單的,也可以是復
    的頭像 發表于 07-16 10:09 ?2435次閱讀

    BP神經網絡預測模型的建模步驟

    BP(Backpropagation)神經網絡是一種多層前饋神經網絡,其核心思想是通過反向傳播算法來調整網絡中的權重和偏置,從而實現對輸入數據的預測或分類。BP神經網絡預測模型的建模是一個系統而復雜
    的頭像 發表于 07-11 16:57 ?1749次閱讀

    bp神經網絡預測模型建模步驟

    BP神經網絡(Backpropagation Neural Network)是一種多層前饋神經網絡,其核心思想是通過反向傳播算法來調整網絡中的權重和偏置,從而實現對輸入數據的預測或分類。本文將詳細
    的頭像 發表于 07-11 10:52 ?647次閱讀

    深度學習的基本原理與核心算法

    處理、語音識別等領域取得了革命性的突破。本文將詳細闡述深度學習的原理、核心算法以及實現方式,并通過一個具體的代碼實例進行說明。
    的頭像 發表于 07-04 11:44 ?2567次閱讀

    神經網絡反向傳播算法的原理、數學推導及實現步驟

    傳播算法的原理、數學推導、實現步驟以及在深度學習中的應用。 神經網絡概述 神經網絡是一種受人腦啟發的計算模型,由大量的神經元(或稱為節點)組成,每個神經元與其他神經元通過權重連接。神經網絡可以分為輸入層、隱藏層和輸出層。輸入層接收外部輸入數據
    的頭像 發表于 07-03 11:16 ?993次閱讀

    神經網絡反向傳播算法原理是什么

    介紹反向傳播算法的原理、數學基礎、實現步驟和應用場景。 神經網絡簡介 神經網絡是一種受人腦啟發的計算模型,由大量的神經元(或稱為節點)組成。每個神經元接收輸入信號,通過激活函數處理信號,并將輸出信號傳遞給下一層神經元。神經網絡通常由輸入層、
    的頭像 發表于 07-02 14:16 ?782次閱讀

    運動控制算法有哪些

    運動控制算法是機器人學和自動化領域中的核心技術之一,它們負責規劃和執行機器人或自動化設備的精確運動。以下是一些常見的運動控制算法,以及它們的基本原理和應用場景。 PID控制算法
    的頭像 發表于 06-13 09:17 ?2943次閱讀

    機器學習六大核心算法深度解析

    算法歷程:線性回歸是一種古老的統計方法,它試圖找到最佳擬合數據的直線或超平面,最早可以追溯到19世紀初的高斯最小二乘法理論。
    發表于 04-23 16:25 ?2023次閱讀
    機器學習六大<b class='flag-5'>核心算法</b>深度解析

    計算機視覺領域的十大核心技術算法

    圖像分割算法是計算機視覺領域的基礎算法之一,它的主要任務是將圖像分割成不同的區域或對象。常見的圖像分割算法包括基于閾值的分割、基于區域的分割、基于邊緣的分割和基于圖割的分割等。
    發表于 02-25 09:38 ?1143次閱讀
    主站蜘蛛池模板: 国产精品高清久久久久久久 | 免费人成在线观看网站品爱网日本 | 婷婷丁香激情 | 一及黄色 | 天堂网2021天堂手机版丶 | 日本午夜影院 | 日本在线视频一区 | 国内自拍露脸普通话对白在线 | 国内黄色录像 | 久久这里只有精品免费播放 | 天天免费 | 黄色成人在线网站 | 毛片不卡一区二区三区 | 五月婷婷六月丁香激情 | 九九热精品视频在线播放 | 激情五月婷婷基地 | dy888午夜秋霞影院不卡 | 美女扒开尿口给男的桶个爽 | 韩国xxxxxxxx69| 欧美日韩国产在线一区 | 免费高清视频免费观看 | 欧美黄色免费大片 | 99国内视频 | 伊人久久大香线蕉综合爱婷婷 | 国产高清免费不卡观看 | 三级黄网站 | 日日操狠狠操 | 日本视频网站在线www色 | 国产一级片免费看 | 成人激情在线 | 国产黄mmd在线观看免费 | 色www亚洲国产张柏芝 | 一级片在线免费 | 午夜看片网站 | 夜夜春夜夜爽 | 性做久久久久久 | 国产福利不卡一区二区三区 | 伊人最新网址 | 欧美系列在线播放 | 欧美另类网| 精品国产1000部91麻豆 |