在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何計(jì)算用戶的偏好標(biāo)簽

lviY_AI_shequ ? 來(lái)源:未知 ? 作者:李倩 ? 2018-09-04 17:18 ? 次閱讀

一、用戶畫像—計(jì)算用戶偏好標(biāo)簽

下面介紹如何計(jì)算用戶的偏好標(biāo)簽。

在上一篇寫用戶畫像的文章 “用戶畫像—打用戶行為標(biāo)簽”中,主要講了如何對(duì)用戶的每一次操作行為、業(yè)務(wù)行為進(jìn)行記錄打上相應(yīng)的標(biāo)簽。在這篇博客中,主要講如何對(duì)這些明細(xì)標(biāo)簽進(jìn)行計(jì)算以及偏好的產(chǎn)品、內(nèi)容的類目。

關(guān)于用戶標(biāo)簽權(quán)重的計(jì)算,在這篇文章里面講過(guò)了:

用戶畫像之標(biāo)簽權(quán)重算法

這里再詳細(xì)介紹一下:

用戶標(biāo)簽權(quán)重 = 行為類型權(quán)重 × 時(shí)間衰減 × 用戶行為次數(shù) × TF-IDF計(jì)算標(biāo)簽權(quán)重

公式中各參數(shù)的釋義如下:

行為類型權(quán)重:用戶瀏覽、搜索、收藏、下單、購(gòu)買等不同行為對(duì)用戶而言有著不同的重要性,一般而言操作復(fù)雜度越高的行為權(quán)重越大。該權(quán)重值一般由運(yùn)營(yíng)人員或數(shù)據(jù)分析人員主觀給出;

時(shí)間衰減:用戶某些行為受時(shí)間影響不斷減弱,行為時(shí)間距現(xiàn)在越遠(yuǎn),該行為對(duì)用戶當(dāng)前來(lái)說(shuō)的意義越小;

行為次數(shù):用戶標(biāo)簽權(quán)重按天統(tǒng)計(jì),用戶某天與該標(biāo)簽產(chǎn)生的行為次數(shù)越多,該標(biāo)簽對(duì)用戶的影響越大;

TF-IDF計(jì)算標(biāo)簽權(quán)重:每個(gè)標(biāo)簽的對(duì)用戶的重要性及該標(biāo)簽在全體標(biāo)簽中重要性的乘積得出每個(gè)標(biāo)簽的客觀權(quán)重值;

為計(jì)算用戶偏好標(biāo)簽,需要在用戶行為標(biāo)簽的基礎(chǔ)上計(jì)算用戶行為標(biāo)簽對(duì)應(yīng)的權(quán)重值,而后對(duì)同類標(biāo)簽做權(quán)重匯總,算出用戶偏好的標(biāo)簽。關(guān)于用戶行為標(biāo)簽如何打,在這篇博客里面有介紹過(guò)了

用戶畫像—打用戶行為標(biāo)簽

下面介紹如何在用戶行為標(biāo)簽表的基礎(chǔ)上加工用戶偏好標(biāo)簽:

1、用戶標(biāo)簽權(quán)重表結(jié)構(gòu)設(shè)計(jì)

字段定義:

用戶id(user_id):用戶唯一id;

標(biāo)簽id(tag_id):圖書id;

標(biāo)簽名稱(tag_name):圖書名稱;

用戶行為次數(shù)(cnt):用戶當(dāng)日產(chǎn)生該標(biāo)簽的次數(shù),如用戶當(dāng)日瀏覽一本圖書4次,則記錄4;

行為日期(date_id):產(chǎn)生該條標(biāo)簽對(duì)應(yīng)日期;

標(biāo)簽類型(tag_type_id):在本案例中通過(guò)與圖書類型表相關(guān)聯(lián),取出每本圖書對(duì)應(yīng)的類型,如《鋼鐵是怎么煉成的》對(duì)應(yīng)“名著”;

用戶行為類型(act_type_id):即用戶的購(gòu)買、瀏覽、評(píng)論等操作行為,在本例中通過(guò)預(yù)設(shè)數(shù)值1~7來(lái)定義用戶對(duì)應(yīng)的行為類型。1:購(gòu)買行為,2:瀏覽行為,3:評(píng)論行為,4:收藏行為,5:取消收藏行為,6:加入購(gòu)物車行為,7:搜索行為;

2、在用戶行為標(biāo)簽基礎(chǔ)上加工權(quán)重表

加工標(biāo)簽權(quán)重表時(shí),需要根據(jù)用戶不同行為對(duì)應(yīng)的權(quán)重建立一個(gè)權(quán)重維表:

向維表中插入數(shù)據(jù):

3、對(duì)每個(gè)用戶偏好的每個(gè)標(biāo)簽加總求權(quán)重值,對(duì)權(quán)重值做倒排序,取top N

二、用戶畫像—數(shù)據(jù)指標(biāo)與表結(jié)構(gòu)設(shè)計(jì)

本段文章介紹一下畫像中需要開(kāi)發(fā)的數(shù)據(jù)指標(biāo)與開(kāi)發(fā)過(guò)程中表結(jié)構(gòu)的設(shè)計(jì)。

首先介紹畫像開(kāi)發(fā)的數(shù)據(jù)指標(biāo),畫像開(kāi)發(fā)過(guò)程中通用類的指標(biāo)體系包括用戶屬性類、用戶行為標(biāo)簽類、用戶活躍時(shí)間段類、用戶消費(fèi)能力類、用戶偏好類等

數(shù)據(jù)指標(biāo)體系

用戶屬性指標(biāo)

用戶屬性指標(biāo)根據(jù)業(yè)務(wù)數(shù)據(jù)來(lái)源,盡可能全面地描述用戶基礎(chǔ)屬性,這些基礎(chǔ)屬性值是短期內(nèi)不會(huì)有改變的。如年齡、性別、手機(jī)號(hào)歸屬地、身份證歸屬地等

用戶登錄活躍指標(biāo)

看用戶近期登錄時(shí)間段、登錄時(shí)長(zhǎng)、登錄頻次、常登陸地等指標(biāo)

用戶消費(fèi)能力指標(biāo)

看用戶的消費(fèi)金額、消費(fèi)頻次、最近消費(fèi)時(shí)間。進(jìn)一步結(jié)合用戶登錄活躍情況,可以對(duì)用戶做RFM分層。

用戶流失層級(jí)

根據(jù)用戶的活躍度及消費(fèi)情況,判斷用戶的流失意向。可及時(shí)對(duì)有流失趨向的用戶做營(yíng)銷召回

用戶年齡段劃分

在做營(yíng)銷活動(dòng)或站內(nèi)推送時(shí),可對(duì)不同年齡段做針對(duì)性運(yùn)營(yíng)

用戶行為標(biāo)簽

記錄用戶在平臺(tái)上每一次操作行為,及該次行為所帶來(lái)的標(biāo)簽。后續(xù)可根據(jù)用戶的行為標(biāo)簽計(jì)算用戶的偏好標(biāo)簽,做推薦和營(yíng)銷等活動(dòng)

表結(jié)構(gòu)設(shè)計(jì)

對(duì)于畫像數(shù)據(jù)的存儲(chǔ),除了用戶屬性這種基本上短期不會(huì)有變化的數(shù)據(jù),其他相關(guān)數(shù)據(jù)的更新頻率一般都比較高,為周更新或日更新

畫像數(shù)據(jù)更新較為頻繁,通常使用分區(qū)來(lái)將數(shù)據(jù)從物理上轉(zhuǎn)移到離用戶最近的地方。

一般對(duì)日期字段進(jìn)行分區(qū),當(dāng)然事實(shí)上分區(qū)是為了優(yōu)化查詢性能,否則使用數(shù)據(jù)的用戶也不需要關(guān)注這些字段是否分區(qū)。

例如說(shuō)創(chuàng)建一個(gè)用戶行為標(biāo)簽表:

CREATE TABLE userprofile( user_id string, tag_id string, tag_name string, cnt string, act_type_id string, tag_type_id string ) PARTITION BY (date_id string);

分區(qū)表改變了Hive對(duì)數(shù)據(jù)的存儲(chǔ)方式,如果沒(méi)做分區(qū),創(chuàng)建的這個(gè)表目錄為:

hdfs://master_server/user/hive/warehouse/userprofile

創(chuàng)建日期分區(qū)后,Hive可以更好地反映分區(qū)結(jié)構(gòu)子目錄:

hdfs://master_server/user/hive/warehouse/userprofile/date_id='2018-05-01'

在userprofile表下面,每個(gè)日期分區(qū)的數(shù)據(jù)可以存儲(chǔ)截止到當(dāng)日的全量歷史數(shù)據(jù),方便使用者查找。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1469

    瀏覽量

    34670
  • 標(biāo)簽
    +關(guān)注

    關(guān)注

    0

    文章

    142

    瀏覽量

    18128

原文標(biāo)題:用戶畫像—計(jì)算用戶偏好標(biāo)簽及數(shù)據(jù)指標(biāo)與表結(jié)構(gòu)設(shè)計(jì)

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于偏好不一致熵的偏好決策方法

    不一致程度;然后,根據(jù)偏好決策中不同屬性對(duì)決策的重要性不同的特點(diǎn),提出了一種加權(quán)的樣本偏好不一致熵,并結(jié)合屬性偏好不一致熵在度量屬性重要性方面的能力,給出了一種基于屬性偏好不一致熵的權(quán)
    發(fā)表于 12-05 11:50 ?0次下載

    基于用戶QoS偏好的WEB服務(wù)灰色關(guān)聯(lián)分析方法

    為方便用戶選擇最優(yōu)Web服務(wù),利用灰色系統(tǒng)理論對(duì)Web服務(wù)質(zhì)量QoS屬性因子進(jìn)行分析,提出了一種基于用戶QoS偏好的Web服務(wù)灰色關(guān)聯(lián)分析方法。考慮到Web服務(wù)QoS的不確定性,該方法使用區(qū)間
    發(fā)表于 12-05 15:35 ?0次下載

    面向評(píng)分?jǐn)?shù)據(jù)中用戶偏好發(fā)現(xiàn)的隱變量模型構(gòu)建

    電子商務(wù)應(yīng)用中產(chǎn)生了大量用戶評(píng)分?jǐn)?shù)據(jù),而這些數(shù)據(jù)中富含了用戶觀點(diǎn)和偏好信息,為了能夠從這些數(shù)據(jù)中準(zhǔn)確地推斷出用戶偏好,提出一種面向評(píng)分?jǐn)?shù)據(jù)中
    發(fā)表于 12-06 10:59 ?0次下載
    面向評(píng)分?jǐn)?shù)據(jù)中<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>發(fā)現(xiàn)的隱變量模型構(gòu)建

    基于偏好矩陣遺傳算法求解長(zhǎng)期車輛合乘問(wèn)題

    針對(duì)長(zhǎng)期車輛合乘問(wèn)題( LTCPP),提出帶有偏好矩陣的遺傳算法(PMGA),將擁有私家車且目的地相同的用戶群體分配到產(chǎn)生總花費(fèi)最少的合乘小組。首先,建立計(jì)算基于全體用戶費(fèi)用成本的目標(biāo)
    發(fā)表于 12-06 11:15 ?0次下載

    基于用戶偏好的隨機(jī)游走模型

    、項(xiàng)目相似度進(jìn)行計(jì)算;其次,將項(xiàng)目進(jìn)行聚類,通過(guò)用戶評(píng)分計(jì)算用戶對(duì)項(xiàng)目類的偏好和不同項(xiàng)目類下的用戶
    發(fā)表于 12-08 17:01 ?0次下載
    基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的隨機(jī)游走模型

    基于用戶行為偏好的服務(wù)選擇策略

    在云計(jì)算模型中,用戶的需求是服務(wù)資源預(yù)留的主要依據(jù)。而現(xiàn)實(shí)中,用戶的喜好往往是隨著時(shí)間的推移變化的,例如新的云服務(wù)出現(xiàn)后,用戶根據(jù)自己的體驗(yàn),往往會(huì)選擇新的云服務(wù)。 本文提出
    發(fā)表于 12-11 11:18 ?0次下載
    基于<b class='flag-5'>用戶</b>行為<b class='flag-5'>偏好</b>的服務(wù)選擇策略

    偏好數(shù)據(jù)庫(kù)中挖掘Ceteris Paribus偏好

    針對(duì)傳統(tǒng)的推薦系統(tǒng)需要用戶給出明確的偏好矩陣(U-I矩陣),進(jìn)而使用自動(dòng)化技術(shù)來(lái)獲取用戶偏好的問(wèn)題,提出了一種從偏好數(shù)據(jù)庫(kù)中挖掘出Agent
    發(fā)表于 12-13 15:13 ?0次下載
    從<b class='flag-5'>偏好</b>數(shù)據(jù)庫(kù)中挖掘Ceteris Paribus<b class='flag-5'>偏好</b>

    基于時(shí)間衰減協(xié)同偏好獲取方法

    針對(duì)現(xiàn)有的推薦系統(tǒng)多采用近鄰用戶偏好行為來(lái)預(yù)測(cè)當(dāng)前用戶偏好,而不考慮用戶偏好會(huì)隨著時(shí)間的變
    發(fā)表于 12-15 16:14 ?0次下載

    基于用戶偏好的協(xié)同過(guò)濾算法

    基于評(píng)分的用戶相似度;其次,依據(jù)用戶項(xiàng)目評(píng)分和項(xiàng)目類別信息挖掘用戶對(duì)項(xiàng)目類別的興趣度以及用戶項(xiàng)目偏好,并以此
    發(fā)表于 12-20 10:54 ?0次下載

    基于標(biāo)簽主題的協(xié)同過(guò)濾推薦算法研究

    語(yǔ)義主題,從語(yǔ)義層面計(jì)算用戶對(duì)各資源的偏好概率,將計(jì)算出的偏好概率與協(xié)同過(guò)濾算法計(jì)算出的資源相似
    發(fā)表于 03-07 13:58 ?0次下載
    基于<b class='flag-5'>標(biāo)簽</b>主題的協(xié)同過(guò)濾推薦算法研究

    什么是用戶畫像?用戶畫像的四階段

    用戶畫像的焦點(diǎn)工作就是為用戶打“標(biāo)簽”,而一個(gè)標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識(shí),如年齡、性別、地域、用戶
    的頭像 發(fā)表于 09-14 15:39 ?9895次閱讀

    內(nèi)容中心網(wǎng)絡(luò)中基于用戶偏好的協(xié)作緩存策略

    針對(duì)內(nèi)容中心網(wǎng)絡(luò)( CCN)中節(jié)點(diǎn)默認(rèn)緩存所有經(jīng)過(guò)的內(nèi)容,未能實(shí)現(xiàn)對(duì)內(nèi)容選擇性緩存與最佳放置的問(wèn)題,提出一種基于用戶偏好的協(xié)作緩存策略( CCUP)。首先,考慮用戶對(duì)內(nèi)容類型的喜好和內(nèi)容流行度作為
    發(fā)表于 12-19 15:23 ?4次下載
    內(nèi)容中心網(wǎng)絡(luò)中基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的協(xié)作緩存策略

    一種基于用戶偏好的權(quán)重搜索及告警選擇方法

    用戶在現(xiàn)有交互方式下選擇最為嚴(yán)重的告警時(shí)完全依據(jù)其個(gè)人偏好,而未考慮處理不同告警所需成本的差異性問(wèn)題。為此,提出一種基于用戶偏好的權(quán)重搜索及告警選擇方法。挖掘
    發(fā)表于 04-29 16:26 ?4次下載
    一種基于<b class='flag-5'>用戶</b><b class='flag-5'>偏好</b>的權(quán)重搜索及告警選擇方法

    時(shí)序地理社交網(wǎng)絡(luò)下基于動(dòng)態(tài)偏好的組查詢

    在新生活體驗(yàn)與社交影響的驅(qū)動(dòng)下,用戶偏好隨時(shí)間不斷改變。為彌補(bǔ)現(xiàn)有的地理社交網(wǎng)絡(luò)模型往往無(wú)法獲取用戶動(dòng)態(tài)偏好的不足,構(gòu)建了能夠襝測(cè)用戶動(dòng)態(tài)偏
    發(fā)表于 05-11 16:38 ?11次下載

    可反映用戶偏好的多目標(biāo)任務(wù)調(diào)度算法

    UPTSA算法能尋找反映用戶偏好的最優(yōu)解,并設(shè)計(jì)梯形遷移率計(jì)算模型擴(kuò)大其搜索鄰域,避免陷人局部最優(yōu)解實(shí)例分析結(jié)果表明, UPTSA算法能有效求解云制造環(huán)境下的多目標(biāo)任務(wù)調(diào)度問(wèn)題,為用戶
    發(fā)表于 05-25 14:05 ?3次下載
    主站蜘蛛池模板: 亚洲伦理中文字幕一区 | 狠狠丁香激情久久综合 | 欧美成人在线网站 | 午夜色在线| 国产精品嫩草影院午夜 | 国产精品国产三级国快看 | 婷婷色爱区综合五月激情韩国 | 欧美日韩一区二区三区视频在线观看 | 人人玩人人添天天爽 | 亚洲伦理中文字幕一区 | 午夜影院一区二区三区 | 国产高清美女一级a毛片 | 五月婷婷激情在线 | 中韩日欧美电影免费看 | 久操伊人| 香蕉久久夜色精品国产小说 | 精品卡1卡2卡三卡免费网站视频 | 丁香伊人五月综合激激激 | 黄在线看| 人人舔 | 国产视频观看 | 日本成人a视频 | 欧美婷婷 | 亚洲资源最新版在线观看 | 中文字幕视频一区 | 四虎国产 | 国产v精品成人免费视频400条 | 免费福利片2022潦草影视午夜 | 人人看人人做人人爱精品 | 天堂种子 | 日本色片视频 | 国产精品www视频免费看 | 欧美午夜色大片在线观看免费 | 美女网站一区二区三区 | 免费看污视频软件 | 亚洲 欧美 自拍 另类 欧美 | 九月婷婷综合婷婷 | 亚洲午夜视频在线观看 | 日韩一区二区在线观看 | 911精品国产91久久久久 | china3p单男精品自拍 |