在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

打在用戶身上標簽的權重是如何確定的?

lviY_AI_shequ ? 來源:未知 ? 作者:李倩 ? 2018-08-09 11:07 ? 次閱讀

感謝大家長期以來對文章的關注,最近工作比較忙,好久沒更新了。接下來的幾篇文章想和大家分享下關于用戶畫像的一些東西。今天我們先從用戶畫像的標簽權重開始聊起吧。

用戶畫像:即用戶信息標簽化,通過收集用戶社會屬性、消費習慣、偏好特征等各個維度數據,進而對用戶或者產品特征屬性的刻畫,并對這些特征分析統計挖掘潛在價值信息,從而抽象出一個用戶的信息全貌,可看做是企業應用大數據的根基,是定向廣告投放與個性化推薦的前置條件。

先舉個場景,程序員小Z在某電商平臺上注冊了賬號,經過一段時間在該電商平臺的web端/app端進行瀏覽、所搜、收藏商品、下單購物等系列行為,該電商平臺數據庫已全程記錄該用戶在平臺上的行為,通過系列建模算法,給程序員小Z打上了符合其特征的標簽(如下圖所示)。此后程序員小Z在該電商平臺的相關推薦版塊上總能發現自己想買的商品,總能在下單前猶豫不決時收到優惠券的推送,總是在平臺上越逛越喜歡....

上面的例子是用戶畫像一些應用場景。而本文主要分享的是打在用戶身上標簽的權重是如何確定的。

如上圖所示,一個用戶標簽表里面包括常見的字段如:用戶id、用戶姓名、標簽id、標簽名稱、用戶與該標簽發生行為的次數(如搜索了兩次“大數據”這個關鍵詞)、行為類型(不同的行為類型對應用戶對商品不同的意愿強度,如購買某商品>收藏某商品>瀏覽某商品>搜索某商品),行為時間(越久遠的時間對用戶當前的影響越小,如5年前你會搜索一本高考的書,而現在你會搜索一本考研的書)。最后非常重要的一個字段是標簽權重,該權重影響著對用戶屬性的歸類,屬性歸類不準確,接下來基于畫像對用戶進行推薦、營銷的準確性也就無從談起了。下面我們來講兩種權重的劃分方法:

1、基于TF-IDF算法的權重歸類

TF-IDF算法是什么思想,這里不做詳細展開,簡而言之:一個詞語的重要性隨著它在該文章出現的次數成正比,隨它在整個文檔集中出現的次數成反比。

比如說我們這里有3個用戶和4個標簽,標簽和用戶之間的關系將會在一定程度上反應出標簽之間的關系。這里我們用w(P , T)表示一個標簽T被用于標記用戶P的次數。TF(P , T)表示這個標記次數在用戶P所有標簽中所占的比重,公式如下圖:

對上面的圖來說,用戶1身上打了標簽A 5個,標簽B 2個,標簽C 1個,那么用戶1身上的A標簽TF=5/(5+2+1) 。相應的IDF(P , T)表示標簽T在全部標簽中的稀缺程度,即這個標簽的出現幾率。如果一個標簽T出現幾率很小,并且同時被用于標記某用戶,這就使得該用戶與該標簽T之間的關系更加緊密。

然后我們根據TF * IDF即可得到該用戶該標簽的權重值。到這里還沒結束,此時的權重是不考慮業務場景,僅考慮用戶與標簽之間的關系,顯然是不夠的。還需要考慮到該標簽所處的業務場景、發生的時間距今多久、用戶產生該標簽的行為次數等等因素。我用個圖總結下:

關于時間衰減的函數,根據發生時間的先后為用戶行為數據分配權重。

時間衰減是指用戶的行為會隨著時間的過去,歷史行為和當前的相關性不斷減弱,在建立與時間衰減相關的函數時,我們可套用牛頓冷卻定律數學模型。牛頓冷卻定律描述的場景是:一個較熱的物體在一個溫度比這個物體低的環境下,這個較熱的物體的溫度是要降低的,周圍的物體溫度要上升,最后物體的溫度和周圍的溫度達到平衡,在這個平衡的過程中,較熱物體的溫度F(t)是隨著時間t的增長而呈現指數型衰減,其溫度衰減公式為:

F(t)=初始溫度×exp(-冷卻系數×間隔的時間)

其中α為衰減常數,通過回歸可計算得出。例如:指定45分鐘后物體溫度為初始溫度的0.5,即 0.5=1×exp(-a×45),求得α=0.1556。

2、基于相關系數矩陣的權重歸類

這個相關系數矩陣聽title挺困難,其實道理十分簡單。舉個例子:用戶1身上打上了5個A標簽、2個B標簽、1個C標簽;用戶2身上打上了4個A標簽,3個B標簽;用戶3身上打上了4個C標簽、1個D標簽。

用個圖形象表示一下:

那么同時打上A、B標簽的用戶有兩個人,這就說明AB之間可能存在某種相關性,當用戶量、標簽量級越多時,標簽兩兩之間的相關性也越明顯。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4631

    瀏覽量

    93421
  • 權重
    +關注

    關注

    0

    文章

    12

    瀏覽量

    7596
  • 標簽
    +關注

    關注

    0

    文章

    137

    瀏覽量

    17939

原文標題:用戶畫像之標簽權重算法

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    怎樣分析一個網站的權重

    怎樣分析一個網站的權重 權重分析方式之一  網站收錄量和網站收錄速度。關于網站收錄,北京網站推廣一般通過site這個語法去查詢,而收錄速度就是我們所說的當天收錄,比如說A5和A5論壇里面就是秒收
    發表于 04-19 14:58

    這款智能紋身可將健康傳感器放在用戶皮膚上?

    像智能手表這樣的健康追蹤設備存在一個共同的問題:它們并不是真的附著在你身上,你只能依賴于一個短暫的電池和一個無線連接,即使是一個自供電的補丁也有其局限性。而這正是哈佛和麻省理工學院認為他們可以提供幫助的地方:他們開發出了一種智能紋身,可以有效地將健康傳感器放置在用戶的皮膚
    發表于 05-20 07:28

    如何在用戶空間操作IIO設備

    關注、星標嵌入式客棧,精彩及時送達[導讀] 朋友們,大家好,我是逸珺。今天分享一下如何在用戶空間操作IIO設備。IIO設備能實現很多有價值的應用,有興趣的一起來看看~什么是IIO設備 II...
    發表于 09-08 08:02

    如何讓CubeMX生成帶有給IO的用戶標簽的代碼?

    我使用的是最新版本 6.4.0。我為某些 IO 配置使用了用戶標簽,但是在生成代碼時,代碼沒有使用用戶標簽;對于前 PC4,我使用 LED_1 作為
    發表于 12-01 06:20

    如何從esp32內獲取mac地址,然后自動打印成標簽貼在機身上呢?

    如何從esp32內獲取mac地址,然后自動打印成標簽貼在機身上呢這玩意沒有自動化的一套東西很麻煩啊
    發表于 03-06 07:23

    一種基于標簽概率相關性的微博推薦方法

    方法利用標簽之間的概率相關性,構造標簽相似性矩陣。然后通過相關性標簽權重加權方案,加強標簽權重
    發表于 11-17 14:54 ?13次下載
    一種基于<b class='flag-5'>標簽</b>概率相關性的微博推薦方法

    基于標簽傳播的社交網絡的社區發現模型

    團(UMC)并對每個UMC中的節點賦予唯一標簽來減少冗余標簽,提高社區發現的效率以及穩定性。標簽更新時以UMC作為核心單位采用親密度的方式由中心向四周更新UMC鄰接節點的標簽
    發表于 01-04 16:49 ?0次下載
    基于<b class='flag-5'>標簽</b>傳播的社交網絡的社區發現模型

    如何計算用戶的偏好標簽

    行為類型權重用戶瀏覽、搜索、收藏、下單、購買等不同行為對用戶而言有著不同的重要性,一般而言操作復雜度越高的行為權重越大。該權重值一般由運營
    的頭像 發表于 09-04 17:18 ?1.1w次閱讀

    如何使用標簽權重進行協同過濾推薦算法的資料說明

    針對傳統協同過濾推薦 算法中由于相似度計算導致推薦精度不足的問題,提出一種基于標簽權重相似度量方法的協同過濾推薦算法。首先,通過改進當前算法中標簽權重的計算,并構成
    發表于 05-14 17:34 ?1次下載
    如何使用<b class='flag-5'>標簽</b><b class='flag-5'>權重</b>進行協同過濾推薦算法的資料說明

    電子標簽的核心部分是什么

    電子標簽由芯片及天線組成,附著在物體上標識目標對象,每個電子標簽具有唯一的電子編碼,存儲著被識別物體的相關信息。
    發表于 04-20 16:44 ?2407次閱讀
    電子<b class='flag-5'>標簽</b>的核心部分是什么

    貼片電阻上標注的數字是什么意思?資料下載

    電子發燒友網為你提供貼片電阻上標注的數字是什么意思?資料下載的電子資料下載,更有其他相關的電路圖、源代碼、課件教程、中文資料、英文資料、參考設計、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發表于 04-15 08:47 ?10次下載
    貼片電阻<b class='flag-5'>上標</b>注的數字是什么意思?資料下載

    可解決高沖突證據合成問題的證據權重確定方法

    為對證據源進行合理修正,解決高沖突證據合成時存在的問題,提岀了一種新的證據權重確定方法。首先利用證據之間的局部沖突和相似性求出各個證據的全局沖突系數;其次取全局沖突系數的反值作為證據的權重并利用該
    發表于 04-22 14:07 ?0次下載
    可解決高沖突證據合成問題的證據<b class='flag-5'>權重</b><b class='flag-5'>確定</b>方法

    一種基于用戶偏好的權重搜索及告警選擇方法

    問題的復雜性建立評估函數,并給出偏好權重的選擇策略。對不同告警及其對應的用戶偏好權重建立效用函數,確定需優先解決的告警,并在成本約束下完成基于用戶
    發表于 04-29 16:26 ?4次下載
    一種基于<b class='flag-5'>用戶</b>偏好的<b class='flag-5'>權重</b>搜索及告警選擇方法

    PCB中過孔為什么不能打在焊盤上

    過孔為什么不能打在焊盤上,我就想打,怎么辦?很多新手在剛接觸到PCB的時候經常會出現這個問題,由于板子空間過小,器件密集導致空間狹小,無法引線扇孔,通常就會選擇把過孔打在焊盤上,這樣子雖然使自己連線
    的頭像 發表于 11-03 15:37 ?1.6w次閱讀

    在用機器人與未來機器人并行推進的權重關系

    在用機器人與未來機器人并行推進的權重關系
    的頭像 發表于 08-01 08:14 ?550次閱讀
    <b class='flag-5'>在用</b>機器人與未來機器人并行推進的<b class='flag-5'>權重</b>關系
    主站蜘蛛池模板: 中年艳妇乱小玩 | 亚洲吊丝网| 国产片一区二区三区 | 久久久久久久蜜桃 | 天天干天天拍天天射天天添天天爱 | 亚洲国产精品热久久2022 | 国产视频福利 | 中文字幕一区二区三区免费看 | 色视频在线观看免费 | 亚洲一区免费视频 | www.色婷婷.com| 亚洲一区二区免费视频 | 91大神亚洲影视在线 | 亚洲专区一路线二 | 久久深夜福利 | 久热福利 | 国产三片理论电影在线 | 国产1024一区二区你懂的 | 五月天精品 | 国产哺乳期奶水avav | 免费人成黄页在线观看1024 | 亚洲娇小性色xxxx | 曰本aaaaa毛片午夜网站 | 国产免费一区二区三区在线 | 91中文在线 | 久久e| 视频在线观看h | 男女视频在线看 | 欧美熟夫 | 欧美在线播放 | 午夜性视频播放免费视频 | 超级淫小黄文大全很污的那种 | 午夜精品一区二区三区在线视 | 操操插插 | 日本一道dvd在线中文字幕 | 天天天天干 | 久综合 | 国产免费人人看大香伊 | 美女扒开内裤无遮挡禁18 | 沟沟人体一区二区 | 天天射狠狠干 |