在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于注意力機制的用戶行為建??蚣芗捌湓谕扑]領域的應用

DPVg_AI_era ? 2018-01-25 17:59 ? 次閱讀

本文提出一種基于注意力機制的用戶異構行為序列的建??蚣?,并將其應用到推薦場景中。我們將不同種類的用戶行為序列進行分組編碼,并映射到不同子空間中。我們利用self-attention對行為間的互相影響進行建模。最終我們得到用戶的行為表征,下游任務就可以使用基本的注意力模型進行有更具指向性的決策。我們嘗試用同一種模型同時預測多種類型的用戶行為,使其達到多個單獨模型預測單類型行為的效果。另外,由于我們的方法中沒有使用RNN,CNN等方法,因此在提高效果的同時,該方法能夠有更快的訓練速度。

研究背景

一個人是由其所表現出的行為所定義。而對用戶精準、深入的研究也往往是很多商業問題的核心。從長期來看,隨著人們可被記錄的行為種類越來越多,平臺方需要有能力通過融合各類不同的用戶行為,更好的去理解用戶,從而提供更好的個性化服務。

對于阿里巴巴來說,以消費者運營為核心理念的全域營銷正是一個結合用戶全生態行為數據來幫助品牌實現新營銷的數據&技術驅動的解決方案。因此,對用戶行為的研究就成為了一個非常核心的問題。其中,很大的挑戰來自于能否對用戶的異構行為數據進行更精細的處理。

在這樣的背景下,本文提出一個通用的用戶表征框架,試圖融合不同類型的用戶行為序列,并以此框架在推薦任務中進行了效果驗證。另外,我們還通過多任務學習的方式,期望能夠利用該用戶表征實現不同的下游任務。

相關工作

異構行為建模:通常通過手動特征工程來表示用戶特征。這些手工特征以聚合類特征或無時序的id特征集合為主。

單行為序列建模:用戶序列的建模通常會用RNN(LSTM/GRU)或者CNN + Pooling的方式。RNN難以并行,訓練和預測時間較長,且LSTM中的Internal Memory無法記住特定的行為記錄。CNN也無法保留特定行為特征,且需要較深的層次來建立任意行為間的影響。

異構數據表征學習:參考知識圖譜和Multi-modal的表征研究工作,但通常都有非常明顯的映射監督。而在我們的任務中,異構的行為之間并沒有像image caption這種任務那樣明顯的映射關系。

本文的主要貢獻如下:

嘗試設計和實現了一種能夠融合用戶多種時序行為數據的方法,較為創新的想法在于提出了一種同時考慮異構行為和時序的解決方案,并給出較為簡潔的實現方式。

使用類似Google的self-attention機制去除CNN、LSTM的限制,讓網絡訓練和預測速度變快的同時,效果還可以略有提升。

此框架便于擴展??梢栽试S更多不同類型的行為數據接入,同時提供多任務學習的機會,來彌補行為稀疏性。

ATRank方案介紹

基于注意力機制的用戶行為建??蚣芗捌湓谕扑]領域的應用

整個用戶表征的框架包括原始特征層,語義映射層,Self-Attention層和目標網絡。

語義映射層能讓不同的行為可以在不同的語義空間下進行比較和相互作用。Self-Attention層讓單個的行為本身變成考慮到其他行為影響的記錄。目標網絡則通過Vanilla Attention可以準確的找到相關的用戶行為進行預測任務。通過Time Encoding + Self Attention的思路,我們的實驗表明其的確可以替代CNN/RNN來描述序列信息,能使模型的訓練和預測速度更快。

1. 行為分組

某個用戶的行為序列可以用一個三元組來描述(動作類型,目標,時間)。我們先將用戶不同的行為按照目標實體進行分組,如圖中最下方不同顏色group。例如商品行為,優惠券行為,關鍵字行為等等。動作類型可以是點擊/收藏/加購、領取/使用等等。

每個實體都有自己不同的屬性,包括實值特征和離散id類特征。動作類型是id類,我們也將時間離散化。三部分相加得到下一層的向量組。

即,某行為的編碼 = 自定義目標編碼 + lookup(離散化時間) + lookup(動作類型)。

由于實體的信息量不同,因此每一組行為編碼的向量長度不一,其實也代表行為所含的信息量有所不同。另外,不同行為之間可能會共享一些參數,例如店鋪id,類目id這類特征的lookup table,這樣做能減少一定的稀疏性,同時降低參數總量。

分組的主要目的除了說明起來比較方便,還與實現有關。因為變長、異構的處理很難高效的在不分組的情況下實現。并且在后面還可以看到我們的方法實際上并不強制依賴于行為按時間排序。

2. 語義空間映射

這一層通過將異構行為線性映射到多個語義空間,來實現異構行為之間的同語義交流。例如框架圖中想表達的空間是紅綠藍(RGB)構成的原子語義空間,下面的復合色彩(不同類型的用戶行為)會投影到各個原子語義空間。在相同語義空間下,這些異構行為的相同語義成分才有了可比性。

類似的思路其實也在knowledge graph representation里也有出現。而在NLP領域,今年也有一些研究表明多語義空間的attention機制可以提升效果。個人認為的一點解釋是說,如果不分多語義空間,會發生所謂語義中和的問題。簡單的理解是,兩個不同種類的行為a,b可能只在某種領域上有相關性,然而當attention score是一個全局的標量時, a,b在不那么相關的領域上會增大互相影響,而在高度相關的領域上這種影響則會減弱。

盡管從實現的角度上來說,這一層就是所有行為編碼向一個統一的空間進行映射,映射方法線性非線性都可以,但實際上,對于后面的網絡層來說,我們可以看作是將一個大的空間劃分為多語義空間,并在每個子空間里進行self-attention操作。因此從解釋上來說,我們簡單的把這個映射直接描述成對多個子語義空間進行投影。

3. Self Attention層

Self Attention層的目的實際上是想將用戶的每一個行為從一個客觀的表征,做成一個用戶記憶中的表征??陀^的表征是指,比如A,B做了同樣一件事,這個行為本身的表征可能是相同的。但這個行為在A,B的記憶中,可能強度、清晰度是完全不一樣的,這是因為A,B的其他行為不同。實際上,觀察softmax函數可知,某種相似行為做的越多,他們的表征就越會被平均。而帶來不一樣體驗的行為則會更容易保留自己的信息。因此self attention實際上模擬了一個行為被其他行為影響后的表征。

另外,Self Attention可以有多層??梢钥吹?,一層Self-Attention對應著一階的行為影響。多層則會考慮多階的行為影響。這個網絡結構借鑒的是google的self-attention框架。

具體計算方式如下:

記S是整個語義層拼接后的輸出,Sk是第k個語義空間上的投影,則經過self-attention后第k個語義空間的表征計算公式為:

這里的attention function可以看做是一種bilinear的attention函數。最后的輸出則是這些空間向量拼接后再加入一個前饋網絡。

4. 目標網絡

目標網絡會隨著下游任務的不同而定制。本文所涉及的任務是用戶行為預測及推薦場景的點擊預測的任務,采用的是point-wise的方式進行訓練和預測。

框架圖中灰色的bar代表待預測的任意種類的行為。我們將該行為也通過embedding、projection等轉換,然后和用戶表征產出的行為向量做vanilla attention。最后Attention向量和目標向量將被送入一個Ranking Network。其他場景強相關的特征可以放在這里。這個網絡可以是任意的,可以是wide & deep,deep FM,pnn都行。我們在論文的實驗中就是簡單的dnn。

離線實驗

為了比較框架在單行為預測時的效果,我們在amazon購買行為的公開數據集上的實驗。

訓練收斂結果如下圖:

基于注意力機制的用戶行為建??蚣芗捌湓谕扑]領域的應用

用戶平均AUC如下圖:

基于注意力機制的用戶行為建模框架及其在推薦領域的應用

實驗結論:在行為預測或推薦任務中,self-attention + time encoding也能較好的替代cnn+pooling或lstm的編碼方式。訓練時間上能較cnn/lstm快4倍。效果上也能比其他方法略好一些。

Case Study

為了深究Self-Attention在多空間內的意義,我們在amazon dataset上做了一個簡單的case study。如下圖:

從圖中我們可以看到,不同的空間所關注的重點很不一樣。例如空間I, II, III, VIII中每一行的attention分的趨勢類似。這可能是主要體現不同行為總體的影響。另一些空間,例如VII,高分attention趨向于形成稠密的正方形,我們可以看到這其實是因為這些商品屬于同樣的類目。

下圖則是vanilla attention在不同語義空間下的得分情況。

基于注意力機制的用戶行為建模框架及其在推薦領域的應用

多任務學習

論文中,我們離線收集了阿里電商用戶對商品的購買點擊收藏加購、優惠券領取、關鍵字搜索三種行為進行訓練,同樣的也對這三種不同的行為同時進行預測。其中,用戶商品行為記錄是全網的,但最終要預測的商品點擊行為是店鋪內某推薦場景的真實曝光、點擊記錄。優惠券、關鍵字的訓練和預測都是全網行為。

我們分別構造了7種訓練模式進行對比。分別是單行為樣本預測同類行為(3種),全行為多模型預測單行為(3種),全行為單模型預測全行為(1種)。在最后一種實驗設置下,我們將三種預測任務各自切成mini-batch,然后統一進行shuffle并訓練。

實驗結果如下表:

基于注意力機制的用戶行為建模框架及其在推薦領域的應用

all2one是三個模型分別預測三個任務,all2all是單模型預測三個任務,即三個任務共享所有參數,而沒有各自獨占的部分。因此all2all與all2one相比稍低可以理解。我們訓練多任務all2all時,將三種不同的預測任務各自batch后進行充分隨機的shuffle。文中的多任務訓練方式還是有很多可以提升的地方,前沿也出現了一些很好的可借鑒的方法,是我們目前正在嘗試的方向之一。

實驗表明,我們的框架可以通過融入更多的行為數據來達到更好的推薦/行為預測的效果。

總結

本文提出一個通用的用戶表征框架,來融合不同類型的用戶行為序列,并在推薦任務中得到驗證。

未來,我們希望能結合更多實際的商業場景和更豐富的數據沉淀出靈活、可擴展的用戶表征體系,從而更好的理解用戶,提供更優質的個性化服務,輸出更全面的數據能力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 行為識別
    +關注

    關注

    0

    文章

    13

    瀏覽量

    2569

原文標題:【AAAI oral】阿里北大提出新attention建??蚣?,一個模型預測多種行為

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    DeepMind為視覺問題回答提出了一種新的硬注意力機制

    然而,基于梯度的學習框架(如深度學習)中存在一個關鍵的缺點:因為選擇要處理的信息的過程是離散化的,因此也就是不可微分的,所以梯度不能反向傳播到選擇機制中來支持基于梯度的優化。目前研究人員正在努力來解決視覺
    的頭像 發表于 08-10 08:44 ?6355次閱讀

    淺談自然語言處理中的注意力機制

    本文深入淺出地介紹了近些年的自然語言中的注意力機制包括從起源、變體到評價指標方面。
    的頭像 發表于 01-25 16:51 ?6542次閱讀
    淺談自然語言處理中的<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>

    深度分析NLP中的注意力機制

    注意力機制越發頻繁的出現在文獻中,因此對注意力機制的學習、掌握與應用顯得十分重要。本文便對注意力機制
    的頭像 發表于 02-17 09:18 ?4054次閱讀

    注意力機制的誕生、方法及幾種常見模型

    簡而言之,深度學習中的注意力機制可以被廣義地定義為一個描述重要性的權重向量:通過這個權重向量為了預測或者推斷一個元素,比如圖像中的某個像素或句子中的某個單詞,我們使用注意力向量定量地估計出目標元素與其他元素之間具有多么強烈的相關
    的頭像 發表于 03-12 09:49 ?4.2w次閱讀

    基于注意力機制的深度興趣網絡點擊率模型

    和自適應激活函數,根據用戶歷史行為和給定廣告自適應地學習用戶興趣。引人注意力機制,區分不同特征對預測結果的影響程度,從而增強模型的可解釋性。
    發表于 03-12 10:55 ?5次下載
    基于<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>的深度興趣網絡點擊率模型

    基于注意力機制的深度學習模型AT-DPCNN

    情感分析是自然語言處理領域的一個重要分支,卷積神經網絡(CNN)文本情感分析方面取得了較好的效果,但其未充分提取文本信息中的關鍵情感信息。為此,建立一種基于注意力機制的深度學習模型A
    發表于 03-17 09:53 ?12次下載
    基于<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>的深度學習模型AT-DPCNN

    基于多層CNN和注意力機制的文本摘要模型

    基于注意力機制的編解碼模型文本摘要、杌器翻譯等序列到序列任務上得到了廣泛的應用。深度學習框架中,深層神經網絡能夠提取輸λ數據不冋的特征表
    發表于 04-07 11:35 ?2次下載
    基于多層CNN和<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>的文本摘要模型

    結合注意力機制的跨域服裝檢索方法

    針對跨域服裝檢索中服裝商品圖像拍攝嚴格約束光照、背景等條件,而用戶圖像源自復雜多變的日常生活場景,難以避免背景干擾以及視角、姿態引起的服裝形變等問題。提出一種結合注意力機制的跨域服裝檢索方法。利用
    發表于 05-12 14:19 ?2次下載

    基于情感評分的分層注意力網絡框架

    編碼器分別對詞向量和句向量進行編碼,并通過注意力機制加杈求和以獲得文檔的最終表示。設計輔助網絡對文本的詞、句進行情感評分,利用該評分調整注意力權重分布。探究文本的情感信息對分類性能的
    發表于 05-14 11:02 ?5次下載

    基于注意力機制等的社交網絡熱度預測模型

    基于注意力機制等的社交網絡熱度預測模型
    發表于 06-07 15:12 ?14次下載

    基于多通道自注意力機制的電子病歷架構

    基于多通道自注意力機制的電子病歷架構
    發表于 06-24 16:19 ?75次下載

    基于注意力機制的跨域服裝檢索方法綜述

    基于注意力機制的跨域服裝檢索方法綜述
    發表于 06-27 10:33 ?2次下載

    基于注意力機制的新聞文本分類模型

    基于注意力機制的新聞文本分類模型
    發表于 06-27 15:32 ?30次下載

    計算機視覺中的注意力機制

    在自然語言處理、圖像識別及語音識別等各種不同類型的機器學習任務中。注意力機制本質上與人類對外界事物的觀察機制相似。通常來說,人們觀察外界事物的時候,首先會比較關注比較傾向于觀察事物
    發表于 05-22 09:46 ?1次下載
    計算機視覺中的<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>

    PyTorch教程11.4之Bahdanau注意力機制

    電子發燒友網站提供《PyTorch教程11.4之Bahdanau注意力機制.pdf》資料免費下載
    發表于 06-05 15:11 ?0次下載
    PyTorch教程11.4之Bahdanau<b class='flag-5'>注意力</b><b class='flag-5'>機制</b>
    主站蜘蛛池模板: 精品二区| 依人成人 | 亚洲综合激情 | 中文字幕第8页 | 国产一卡二卡3卡4卡四卡在线视频 | 一道精品视频一区二区三区男同 | 男人的天堂一区二区视频在线观看 | bt天堂bt在线网| 一区二区视频网 | 2021最新久久久视精品爱 | 91在线国内在线播放大神 | 韩国美女丝袜一区二区 | 天天爽天天干 | 午夜免费福利网站 | 免费边摸边吃奶边叫床视频gif | 亚洲欧洲精品成人久久曰影片 | 性色网站| 亚洲欧美性另类春色 | h文 超乳 奶水 | www亚洲欲色成人久久精品 | 国产高清成人mv在线观看 | 色狠狠一区二区 | 666夜色666夜色国产免费看 | 欧美性天堂 | 永久免费视频 | 特级全黄一级毛片免费 | 午夜 在线播放 | 午夜小视频在线观看 | 亚洲福利一区福利三区 | 中文字幕有码在线视频 | 在线色片| 九九热免费在线观看 | ggg成人| 久久夜色精品国产亚洲噜噜 | sihu免费观看在线高清 | 天天摸天天做天天爽在线 | 久久综合五月婷婷 | 深夜视频在线播放视频在线观看免费观看 | 国产精品高清一区二区三区不卡 | 亚洲欧洲一区二区三区在线 | 欧美zooz人与禽交 |