在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里最新論文解讀:考慮時空域影響的點擊率預估模型DSTN

WpOh_rgznai100 ? 來源:lq ? 2019-07-18 10:19 ? 次閱讀

【導語】:在本文中,阿里的算法人員同時考慮空間域信息和時間域信息,來進行廣告的點擊率預估。

什么是時空域?我們可以分解為空間域(spatial domain)和時間域(temporal domain)。空間域的意思即是說,在一屏的推薦中,內容是相互關聯的,當推薦了第一條廣告之后,第一條廣告會對第二條廣告的點擊率產生影響,從而影響第二條推薦的廣告。時間域的意思即是說,用戶之前的點擊或未點擊的廣告會影響當次的推薦。

本文介紹的論文題目為是《Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction》,論文的下載地址為:https://arxiv.org/abs/1906.03776

1、背景

CTR預估問題在廣告領域十分重要,吸引了工業界和學術界學者的研究。之前我們也介紹過許多比較成功的方法,如LR、FM、Wide&Deep、DeepFM等。

但上述的方法,存在一個共同的問題,即當我們要預估對一個廣告的點擊概率時,只考慮該廣告的信息,而忽略了其他廣告可能帶來的影響。如用戶歷史點擊或者曝光未點擊的廣告、當前上下文已經推薦過的廣告等。因此,將這些廣告作為輔助信息,加入到模型中,也許可以提升CTR預估的準確性。

總結一下,輔助廣告總共有三種類型:上下文廣告、用戶點擊過的廣告、用戶未點擊的廣告,如下圖所示:

這里還是想強調一下上下文廣告這個概念,之前的模型可能一次計算所有廣告的點擊率,然后按點擊率進行排序,取top-K進行展示。但這里我們把一次推薦K個廣告過程看作K個單次推薦的過程集合。先推薦第一個位置的廣告,再推薦第二個位置的廣告,,依次類推。在推薦第三個廣告時,推薦的第一個廣告和第二個廣告便是我們這里所說的上下文廣告。

為了將這些信息加入到模型中,必須要注意以下幾點:

1)每種類型的輔助廣告數量可能相差很多,模型必須適應這些所有可能的情況。2)輔助的廣告信息可能與目標廣告是不相關的,因此,模型需要具備提取有效信息,而過濾無用信息的能力。舉例來說,用戶點擊過的廣告可能有咖啡廣告、服裝廣告和汽車廣告,當目標廣告是咖啡相關的廣告時,過往點擊中咖啡相關的廣告可能是起比較大作用的信息。3)不同類型的輔助廣告信息,有時候起到的作用可能是不同的,模型需要能夠有能力對此進行判別。

總的來說,就是模型需要有能力有效處理和融合各方面的信息。

本文提出了DSTN(Deep Spatio-Temporal neural Networks)模型來處理和融合各種輔助廣告信息,下一節,咱們就來介紹一下模型的結構。

2、模型架構

這里講了三種不同的DSTN的架構,分別是DSTN - Pooling Model、DSTN - Self-Attention Model和DSTN - Interactive Attention Model。但這三種模型的Embedding部分是同樣的,所以咱們先講Embedding層,再分別介紹幾種模型的結構。

2.1 Embedding Layer

Embedding Layer的結構如下:

可以看到,輸入有四部分信息,分別是目標廣告的信息、上下文廣告信息、點擊廣告信息、曝光未點擊廣告信息。目標廣告信息包括用戶特征、query特征(如果是搜索場景的話)、目標廣告特征;上下文廣告信息包括上下文廣告特征;用戶點擊過和未點擊過的廣告信息包括廣告特征以及對應的query特征。

這些特征可以歸為三類:

單值離散特征:如用戶ID、廣告ID等,這類特征直接轉換為對應的Embedding。

多值離散特征:如廣告的標題,經過分詞之后會包含多個詞,每個詞在轉換為對應的Embedding之后,再經過sum pooling的方式轉換為單個向量。

連續特征:對于連續特征如年齡,這里會進行分桶操作轉換為離散值,然后再轉換為對應的Embedding。

不同的特征轉換成對應的Embedding之后,進行拼接操作,如目標廣告信息中,會將用戶ID、用戶年齡、廣告ID、廣告名稱等等對應的Embedding進行拼接;上下文廣告信息中的每一個廣告,會將廣告ID和廣告名稱對應的Embedding進行拼接等等。

最終,對目標廣告信息會得到一個t維的vector,計作xt;對于上下文廣告信息,我們會得到nc個c維的vector,每一個計作xci;對于點擊廣告序列,我們會得到nl個l維的vector,每一個計作xlj;對于未點擊序列,會得到nu個u維的vector,每個計作xuq。

介紹完了Embedding,接下來介紹幾種不同的上層結構。

2.2 DSTN - Pooling Model

第一種結構稱為DSTN - Pooling Model,其模型結構如下:

這種方式就是對上下文廣告序列、點擊廣告序列和未點擊廣告序列中的vector進行簡單的sum-pooling,轉換為一個vector:

然后各部分進行拼接,經過全連接神經網絡之后,在輸出層經過一個sigmoid轉換為點擊的概率:

損失函數的話選擇logloss:

這種方式,實現比較簡單,但是存在一定的缺點,當對應一個廣告位置,有多個候選目標廣告時,只有目標廣告信息xt發生變化,其他信息都沒有發生變化,這說明我們添加的輔助廣告信息僅僅是一個靜態信息。同時,由于使用了sum-pooling的方式,一些有用的信息可能會被噪聲所覆蓋。舉例來說,如果目標廣告是咖啡相關的, 點擊序列中有一個咖啡相關的廣告,有10個服飾相關的廣告,那么這個咖啡相關廣告的信息很容易被忽略。

2.3 DSTN - Self-Attention Model

對于sum-pooling帶來的缺陷,文中提出了第二種結構,稱為DSTN - Self-Attention Model,這里的Self-Attention是針對每一種特定的輔助廣告信息的,也就是說,上下文廣告之間進行Self-Attention,點擊廣告序列之間進行Self-Attention等等。

如果是上下文廣告之間進行Self-Attention,其最終輸出為:

通過公式可以看出,這里并不是我們所熟知的Transformer里面的self-attention,第一次看也沒注意,第二次細看才發現,所以有時候盡管名字一樣,但內容也許千差萬別。

這里的self-attention的含義是,將每一個廣告對應的embedding vector輸入到一個f中,得到一個標量輸出βci,這里的f可以是一個多層全連接神經網絡。然后通過softmax歸一化到0-1之間,得到每一個廣告的權重aci,隨后基于權重進行加權求和。

使用self-attention的好處是可以對序列中的不同廣告賦予不同的權重,能夠在一定程度上解決sum-pooling的問題,但其仍然存在一定的缺陷。首先,self-attention中計算的權重,沒有考慮target ad的信息,也就是說,針對不同的target ad,其attention權重保持不變。其次,歸一化后的權重aci,其求和是等于1的,這樣,當所有的廣告都與目標廣告關系不大時,部分廣告的權重由于歸一化也會變得很大。最后,每種類型的輔助廣告的數量也是會產生影響的,但由于對權重進行了歸一化,這個信息相當于也丟失了。

2.4 DSTN - Interactive Attention Model

因此,再針對上面的不足,提出了DSTN - Interactive Attention Model。其模型結構如下:

相對于self-attention,這里的權重aci沒有經過歸一化,其計算過程加入了目標廣告的信息,計算公式如下:

這樣,針對不同的目標廣告,不同類型的輔助廣告信息的權重會不斷變化,同時權重也沒有進行歸一化,避免了歸一化帶來的種種問題。

3、實驗結果

論文對比了多種模型的實驗結果:

4、模型部署

看論文的時候,比較關心的一點就是模型的性能問題,因為模型中的一部分輸入是上下文廣告信息,更準確的前面推薦的廣告的信息。假設我們有5個廣告位需要推薦,比較容易想到的做法過程如下:

1、得到所有的候選廣告集,并得到對應的特征,此時的上下文廣告信息為空。2、模型計算所有廣告的點擊概率。3、選擇點擊率最高的一個廣告。隨后把這個廣告加入到上下文廣告信息中。4、對于剩下的廣告,再計算所有廣告的點擊概率。5、重復第3步和第4步,直到得到5個展示的廣告。

我們通過第2步得到了第一個位置的廣告,重復執行3和4步4次得到剩下4個位置的廣告。

這么做無疑是十分耗時的,線上性能難以保證。因此,文中提到了一種折中的做法,每次從候選集中選擇2-3個廣告。其示意圖如下:

5、總結

感覺本文還是有一定借鑒意義的,最主要的是在推薦過程中考慮推薦結果之間的相互關系,這么做的話個人感覺可以消除點擊率預估中的坑位偏置。因為如果上下文信息有兩個廣告的話,模型會感知到這是對第三個坑位的廣告進行推薦。同時上下文信息的加入,在一定程度上也能提升推薦結果的多樣性,避免太多同質信息推薦出來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4798

    瀏覽量

    102434
  • 模型
    +關注

    關注

    1

    文章

    3470

    瀏覽量

    49861

原文標題:阿里最新論文解讀:考慮時空域影響的點擊率預估模型DSTN

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    如何提高網站的點擊率

    他網站有多少點擊率你的也有多少.  5、就是在163,tom,sina,阿里以商會友,這樣的論壇里發貼子,發一些吸引人氣的貼子,然后就把網址貼上去吸引他進去,這樣一天瀏覽看你的人
    發表于 07-28 00:18

    點擊率最高太陽能應用電路圖精華集錦

    點擊率最高太陽能應用電路圖精華集錦
    發表于 08-20 17:26

    阿里深度學習的“金剛鉆”——千億特征XNN算法及其落地實踐

    ,并使得這些信息變得可追蹤,使得整個離線訓練時的點擊率預估的情況與線上真實的點擊率相匹配,而不存在PCOPC準度偏高或偏低的情況。※整個算法體系的設計需要適應千億規模的特征和萬億規模的樣本。※
    發表于 04-24 16:43

    詳解信號的時域和空域

    一、時域與空域特性以遠場模型(平面波)為例,假設均勻線陣接收的為窄帶信號,假設相鄰振元間隔為d,入射角θ為:從空域坐標來看,相鄰振元的間隔為:dsinθ等價到時間軸來看,采樣點的間距為:dsinθ,對應時間間隔為:
    發表于 06-28 08:25

    阿里開源自研語音識別模型DFSMN使用技巧指南

    重磅!阿里開源自研語音識別模型DFSMN,準確高達9604%
    發表于 09-16 06:53

    教程:如何使用FPGA加速廣告推薦算法

    的重要成員 CTR 預估模型,下面先讓大家對 CTR 預估模型有一個初步認識。 先了解兩個名詞CTR(Click-Through-Rate)點擊率
    發表于 09-27 11:35

    萌新!怎么用Labview做一個類似于能看到一個視頻播放量點擊率各種數據的東西!

    學校要求做一個Labview的課程設計,因為之前做過一段時間電商運營,就想看能不能做一個類似的數據收集。例如:發了一條視頻,我后臺有軟件能看見視頻的播放量,點擊率等各種數據。能不能用labview做一個這樣的程序出來。
    發表于 10-26 16:20

    DSTN-LCD,DSTN-LCD是什么意思

    DSTN-LCD,DSTN-LCD是什么意思     DSTN(Dual Scan Tortuosity Nomograph)雙掃描扭曲陣列,它是通過雙掃描方式來掃描扭曲向列型液
    發表于 03-27 11:50 ?1592次閱讀

    基于時空域特性的幀間快速編碼算法

    針對屏幕內容視頻幀間編碼的高復雜度問題,提出了一種基于時空域特性的幀間快速編碼算法。首先,根據運動靜止檢測算法將待編碼幀分為靜止幀和運動幀;然后,對運動和靜止幀分別采用不同的編碼策略。對于靜止幀,在
    發表于 11-28 17:13 ?0次下載
    基于<b class='flag-5'>時空域</b>特性的幀間快速編碼算法

    自主駕駛小車 科技創新論文下載

    自主駕駛小車 科技創新論文下載
    發表于 12-25 17:25 ?0次下載

    阿里開源自主研發AI語音識別模型

    阿里巴巴達摩院機器智能實驗室語音識別團隊,推出了新一代語音識別模型——DFSMN,不僅被谷歌等國外巨頭在論文中重點引用,更將全球語音識別準確紀錄提升至96.04%。
    的頭像 發表于 06-10 10:08 ?5885次閱讀

    深度推薦系統與CTR預估2019年值得精讀的論文

    FaceBook推薦最新論文,通過建模與系統協同設計提出一種butterfly-shuffle的機制來提升模型并行化,離線訓練上在沒有任何超參調優下收斂速度與準確優于DCN,并開源了代碼。
    的頭像 發表于 07-13 07:42 ?5529次閱讀
    深度推薦系統與CTR<b class='flag-5'>預估</b>2019年值得精讀的<b class='flag-5'>論文</b>

    基于注意力機制的深度興趣網絡點擊率模型

    廣告點擊率(CTR)是互聯網公司進行流量分配的重要依據,針對目前點擊率預估精度較低的問題,結合通用的神經網絡解決方案,構建一種基于注意力機制的深度興趣網絡(ADIN)模型。設計一個局部
    發表于 03-12 10:55 ?5次下載
    基于注意力機制的深度興趣網絡<b class='flag-5'>點擊率</b><b class='flag-5'>模型</b>

    聯合時空域信息的重建視頻增強方法

    。為此,提出了一種聯合時空域信息的重建視頻增強方法。首先,使用自適應網絡,根據前后重建幀預測得到當前幀的虛擬幀;該虛擬幀攜帶了大量時域信息,當前幀在空域又有髙度相關性,因此,提岀使用漸進融合網絡進一步融合兩
    發表于 06-04 15:38 ?10次下載

    基于時空特性的ST-LSTM網絡位置預測模型

    針對現有位置預測研究多數忽略時間和空間之間關聯性的問題,提岀一種基于時空特性的長短期記憶模型( ST-LSTM)。基于LSTM網絡添加單獨處理用戶移動行為時空信息的時空門,并
    發表于 06-11 11:28 ?13次下載
    主站蜘蛛池模板: 天天干干天天 | 亚洲系列中文字幕一区二区 | 噜噜色小说 | www性| 激情综合丝袜美女一区二区 | 800免费资源网 | 成人亚洲欧美综合 | 天天干天天爽天天操 | 曰本女人一级毛片看一级毛 | 91久久青草精品38国产 | 资源在线www天堂 | 久久午夜宅男免费网站 | 午夜在线观看福利 | 色一区二区| 97色在线视频 | 国产资源在线观看 | 色多多www视频在线观看免费 | 免费看又爽又黄禁片视频1000 | 中文久草 | 色综合天天操 | 天天干干干干 | 国产精品资源在线观看网站 | 午夜影视在线免费观看 | 日韩欧美一卡二区 | 老师叫我揉她内裤越快越好 | 中文字幕一二三区乱码老 | 黄色网页在线播放 | 亚洲成a人片在线观看88 | 在线观看日本亚洲一区 | 欧美三级一区二区三区 | 国内视频一区二区三区 | 日本黄大乳片免费观看 | 观看在线人视频 | 日本加勒比在线视频 | 男啪女视频免费观看网站 | 国产一级特黄 | 国产小视频免费在线观看 | 久久久久大香线焦 | 色偷偷成人网免费视频男人的天堂 | 午夜香港三级在线观看网 | 天天躁狠狠躁狠狠躁夜夜躁 |