在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據標簽體系要如何建立?

數據分析與開發 ? 來源:數據社 ? 作者:數據社 ? 2021-02-08 11:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為什么要先介紹標簽體系?

一個推薦系統效果好與壞最基本的保障、最基礎的是什么?如果讓我來回答,一定是標簽體系。我這里說的標簽主要是針對物料的,對于電商平臺來說就是商品;對于音樂平臺來說就是每一個首歌,對于新聞資訊平臺來說就是每一條新聞。

以京東的標簽體系中的京東超市為例用思維導圖來拆解,后面我們會詳細的介紹如何構建標簽體系。

這里對京東超市標簽拆解粒度到三只松鼠年貨大禮包的實體級別,實際上各個公司的標簽體系大致都是如下構成

19cf7ca8-5fd2-11eb-8b86-12bb97331649.png

一、二、三級分類體系都很好理解,參考京東超市的拆解,相信大家就會明白。標簽體系中實體標簽和概念標簽不好理解。

實體標簽

必須是名詞,且必須是唯一指代。

學術性的解釋逼格高,但是不容易理解,回答下面的問題

老板問:蘋果,是實體標簽嗎?

給你三秒鐘思考

你回答:是!

老板說:錯!

你懵逼:靠!為啥不是?

實體標簽的要求:名詞,且唯一指代。

蘋果,是名詞,但不是唯一指代,蘋果 = 科技公司、手機、水果、牛仔褲

概念標簽

難道我就不能用“蘋果”了嗎?當然可以用,只不過要給它另外起個名字:概念標簽。

概念標簽通常表示的是“一類”或“某種相似”的內容,例如

1b082110-5fd2-11eb-8b86-12bb97331649.png

主題詞

這里以之家的標簽體系舉例,要給買車用戶推薦評測導購(一級)的文章,用戶畫像中車的品牌(二級)偏好太粗,而實體標簽如奔馳GLC又太細,填補這中間的粒度空白,滿足用戶購車意圖的畫像,就加入“代步優選”的主題詞,這樣不僅保持了推薦的多樣性,又不至于過分精準而導致的極度收斂。

1b70a7a8-5fd2-11eb-8b86-12bb97331649.png

以上大致介紹了一下標簽體系,那么我們接下介紹一下如何構建標簽體系以及其構建過程中應遵循的一些原則。

標簽體系構建原則

原則一、放棄?而全的框架,以業務場景倒推標簽需求

原則二、標簽生成自助化,解決效率和溝通成本

原則三、有效的標簽管理機制

分別解釋以下為什么提煉出這三個原則,分別用于解決什么問題?

關于第一項原則:

每個公司的產品、運營、商務對標簽的訴求有較大的差異,同時不同的運營團隊的訴求也存在很大差異,?而全的標簽框架實際是站在用戶視角搭建的,但是標簽的真正應用者是業務方,所以應該從業務視角來實現。

因此最佳的處理方式是,我們應該放棄頂層的用戶抽象視角,針對各業務線或部門的訴求和實際的應用場景,分別將標簽聚類起來提供給相應部門。

之家就是非常典型的情況,商業同學更關心用戶的消費能力相關的標簽;自駕游負責同學更關心用戶的位置和出行相關的標簽;車友圈的同學更關注用戶的社交活躍相關的標簽;所以不可能一套標簽覆蓋整個運營團隊, 這種以業務場景倒推標簽需求的方法,能夠與業務場景貼合更緊密,可用性上升。

關于第二項原則:

1.標簽生成的自助化能夠讓溝通成本降最低。前面講到各業務線對標簽的定義的理解不同,需要標簽系統建設團隊花費大量的時間溝通。如果能夠讓業務方自己定義規則,這必然是溝通成本最低的方式。

2.標簽生成的自助化,可重復修改的規則,降低無效標簽的堆積。業務一直在發展,如果規則一成不變則很難跟上業務節奏的變化。我曾拜訪過一家電商,他們發現半年前定義“母嬰客戶群”的轉化率一直在降低,因此根據實際情況重新修改和定義了“母嬰客戶群”規則,并命名為“母嬰客戶群(新)”,這時之前的規則是無效的,且會一直占據計算資源……諸如此類,如果支持規則重復修改的話,這一類無效標簽就會大量地消失。

3.釋放數據團隊人力,釋放業務團隊的想象力。數據團隊應該花較多的精力在企業的整個數據中臺或新業務模型方面,而不是處理各業務線的標簽訴求和標簽維護上,自動化的標簽生成能夠極大限度地節省人力和釋放團隊想象力。

關于第三項原則:

1.規則及元信息維護:標簽相關的規則和元信息要盡可能的暴露給使用者,讓使用者在使用的時候,能清楚知道標簽的規則是什么、創建者是誰、維護者是誰、標簽的更新頻率周期等,而不是沒有規則,或者將規則存在標簽建設團隊內部的一個 word 文檔中。

2.調度機制及信息同步:標簽之間有一些關聯,標簽之間的鏈條斷裂,是否有個調度機制或者信息同步機制讓大家的工作不被影響。

3.高效統一的輸出接口:將所有的業務信息和用戶數據信息匯總在一起,有統一的輸出接口,改變之前需要針對不同的業務系統開發不同接口的情況。

我們回顧標簽體系構建的三原則,本質上是解決了價值、手段、可持續性三方面的問題:以業務場景倒推需求,讓業務方用起來作為最終目標,讓標簽系統價值得以實現;標簽生成的自助化,它解決的是我們用什么樣的手段去實現價值;有效的標簽管理機制,意味著一套標簽體系能否可持續性地在一家企業里面運作下去。

總之,對企業最重要的是:一套標簽系統能不能在業務上用起來,能不能覆蓋更廣泛的需求,而不是一個大而全的框架。

標簽體系構建的方法

標簽體系的實施架構

標簽體系架構可以分為三個部分:數據加工層,數據服務層,數據應用層。每個層面面向用戶對象不一樣,處理事務有所不同。層級越往下,與業務的耦合度就越小。層級越往上,業務關聯性就越強

數據加工層。數據加工層收集,清洗和提取來處理數據。M公司有多個產品線:電商交易,電子書閱讀,金融支付,智能硬件等等。每個產品線的業務數據又是分屬在不同位置。為了搭建完善的用戶標簽體系,需要盡可能匯總最大范圍內的數據。同時每個產品線的也要集合所有端的數據,比如:App,web,微信,其它第三方合作渠道。

收集了所有數據之后,需要經過清洗:去重,去刷單數據,去無效數據,去異常數據等等。然后再是提取特征數據,這部分就要根據產品和運營人員提的業務數據要求來做就好。

數據業務層。數據加工層為業務層提供最基礎數據能力,提供數據原材料。業務層屬于公共資源層,并不歸屬某個產品或業務線。它主要用來維護整個標簽體系,集中在一個地方來進行管理。

在這一層,運營人員和產品能夠參與進來,提出業務要求:將原材料進行切割。主要完成以下核心任務:

定義業務方需要的標簽。

創建標簽實例。

執行業務標簽實例,提供相應數據。

數據應用層。應用層的任務是賦予產品和運營人員標簽的工具能力,聚合業務數據,轉化為用戶的槍火彈藥,提供數據應用服務。

業務方能夠根據自己的需求來使用,共享業務標簽,但彼此業務又互不影響。實踐中可應用到以下幾塊:

智能營銷

Feed流推薦

個性化消息push

標簽體系的設計

1.業務梳理

以業務需求為導向,可以按下面的思路來梳理標簽體系:

有哪些產品線?產品線有哪些來源渠道?一一列出。

每個產品線有哪些業務對象?比如用戶,商品

最后再根據對象聚合業務,每個對象涉及哪些業務?每個業務下哪些業務數據和用戶行為?

結果類似如下:

1dd995c2-5fd2-11eb-8b86-12bb97331649.jpg

2.標簽分類

按業務需求梳理了業務數據后,可以繼續按照業務產出對象的屬性來進行分類,主要目的:

方便管理標簽,便于維護和擴展。

結構清晰,展示標簽之間的關聯關系。

為標簽建模提供子集。方便獨立計算某個標簽下的屬性偏好或者權重。

梳理標簽分類時,盡可能按照MECE原則,相互獨立,完全窮盡。每一個子集的組合都能覆蓋到父集所有數據。標簽深度控制在四級比較合適,方便管理,到了第四級就是具體的標簽實例。

1f48204a-5fd2-11eb-8b86-12bb97331649.jpg

3.標簽的模型

按數據的實效性來看,標簽可分為

靜態屬性標簽。長期甚至永遠都不會發生改變。比如性別,出生日期,這些數據都是既定的事實,幾乎不會改變。

動態屬性標簽。存在有效期,需要定期地更新,保證標簽的有效性。比如用戶的購買力,用戶的活躍情況。

從數據提取維度來看,標簽數據又可以分為類型。

事實標簽。既定事實,從原始數據中提取。比如通過用戶設置獲取性別,通過實名認證獲取生日,星座等信息。

模型標簽。沒有對應數據,需要定義規則,建立模型來計算得出標簽實例。比如支付偏好度。

預測標簽。參考已有事實數據,來預測用戶的行為或偏好。比如用戶a的歷史購物行為與群體A相似,使用協同過濾算法,預測用戶a也會喜歡某件物品。

4.標簽的處理

為什么要從兩個維度來對標簽區分?這是為了方便用戶標簽的進一步處理。

靜態動態的劃分是面向業務維度,便于運營人員理解業務。這一點能幫助他們:

理解標簽體系的設計。

表達自己的需求。

事實標簽,模型標簽,預測標簽是面向數據處理維度,便于技術人員理解標簽模塊功能分類,幫助他們:

設計合理數據處理單元,相互獨立,協同處理。

標簽的及時更新及數據響應的效率。

以上面的標簽圖表為例,面臨以下問題:

屬性信息缺失怎么辦?比如,現實中總有用戶未設置用戶性別,那怎么才能知道用戶的性別呢?

行為屬性,消費屬性的標簽能不能靈活設置?比如,活躍運營中需要做A/B test,不能將品牌偏好規則寫死,怎么辦?

既有的屬性創建不了我想要的標簽?比如,用戶消費能力需要綜合結合多項業務的數據才合理,如何解決?

模型標簽的定義解決的就是從無到有的問題。建立模型,計算用戶相應屬性匹配度。現實中,事實標簽也存在數據缺失情況。

比如用戶性別未知,但是可以根據用戶瀏覽商品,購買商品的歷史行為來計算性別偏好度。當用戶購買的女性化妝品和內衣較多,偏好值趨近于性別女,即可以推斷用戶性別為女。

模型計算規則的開放解決的是標簽靈活配置的問題。運營人員能夠根據自己的需求,靈活更改標簽實例的定義規則。比如圖表中支付頻度實例的規則定義,可以做到:

時間的開放。支持時間任意選擇:昨天,前天,近x天,自定義某段時間等等。

支付筆數的開放。大于,等于,小于某個值,或者在某兩個值區間。

標簽的組合解決就是標簽擴展的問題。除了原有屬性的規則定義,還可以使用對多個標簽進行組合,創建新的復合型標簽。比如定義用戶的消費能力等級。

標簽最終呈現的形態要滿足兩個需求:

標簽的最小顆粒度要觸達到具體業務事實數據,同時支持對應標簽實例的規則自定義。

不同的標簽可以相互自由組合為新的標簽,同時支持標簽間的關系,權重自定義。

原文標題:干貨!如何建立數據標簽體系

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7250

    瀏覽量

    91514

原文標題:干貨!如何建立數據標簽體系

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    超高頻RFID電子標簽如何存儲數據

    在科技飛速發展的今天,超高頻 RFID(射頻識別)電子標簽正逐漸走進我們的生活,廣泛應用于物流、零售、醫療等眾多領域。它就像一個小小的 “智能身份證”,能夠為物品提供獨一無二的標識,并存儲豐富的信息。那么,超高頻 RFID 電子標簽是如何存儲
    的頭像 發表于 06-17 16:23 ?322次閱讀

    智慧工地精準人員定位標簽挑選指南

    在智慧工地管理體系里,定位標簽作為定位系統的核心組件,承擔著標識與追蹤目標對象的關鍵作用。它借助無線信號或其他通信方式,與定位基站、信標等設備實現數據交互,進而達成對人員、車輛等目標對象的位置追蹤
    的頭像 發表于 05-30 16:44 ?189次閱讀
    智慧工地精準人員定位<b class='flag-5'>標簽</b>挑選指南

    NXP eIQ Time Series Studio 工具使用攻略(九)-數據標簽

    其中"Data Labeling",數據標簽工具使用戶能夠通過可視化界面將相應的數據標簽(如電弧或無電弧)應用于當前數據圖形的不同部分,從而
    的頭像 發表于 05-22 09:51 ?701次閱讀
    NXP eIQ Time Series Studio 工具使用攻略(九)-<b class='flag-5'>數據</b><b class='flag-5'>標簽</b>

    不需要點表≠無規則!深控技術工業網關的智能數據映射技術

    在工業數據采集領域,“無點表”常被誤解為數據采集的“無序化”,而深控技術通過動態數據建模與語義化標簽自動生成技術,重新定義了工業數據治理的規
    的頭像 發表于 04-11 15:21 ?201次閱讀
    不需要點表≠無規則!深控技術工業網關的智能<b class='flag-5'>數據</b>映射技術

    RFID在防偽標簽中的應用

    RFID是一種通過無線電波進行數據讀寫和物體識別的技術。它由電子標簽、讀寫器和天線組成,能夠實現非接觸式的數據交互。相比傳統的條形碼技術,RFID具有更高的效率、更強的抗污染能力和更遠的讀取距離
    的頭像 發表于 04-10 16:12 ?298次閱讀
    RFID在防偽<b class='flag-5'>標簽</b>中的應用

    RFID托盤標簽的應用

    RFID托盤標簽是一種專門用于物流和倉儲管理中托盤識別的電子標簽。它通過無線電波進行數據讀寫和物體識別,能夠實現非接觸式的數據交互。與傳統的條形碼相比,RFID托盤
    的頭像 發表于 04-08 17:13 ?271次閱讀
    RFID托盤<b class='flag-5'>標簽</b>的應用

    RFID托盤標簽的介紹及應用

    RFID托盤標簽是一種專門用于托盤管理和物流追蹤的RFID標簽,它通過無線通信方式實現數據的自動采集和傳輸,廣泛應用于倉儲、物流、供應鏈管理等領域,可根據應用環境要求選擇PVC材質或ABS材質或
    的頭像 發表于 03-19 09:29 ?359次閱讀
    RFID托盤<b class='flag-5'>標簽</b>的介紹及應用

    RFID扎帶標簽的概述

    RFID扎帶標簽,也被稱為RFID綁帶標簽,是一種智能識別技術。它采用射頻識別(RFID)技術,通過將標簽綁在扎帶上,實現對物品的追蹤和管理。這種標簽通常由一塊有著一定容量的芯片和一根
    的頭像 發表于 03-05 16:42 ?611次閱讀
    RFID扎帶<b class='flag-5'>標簽</b>的概述

    FPC柔性電子標簽介紹和應用

    什么是FPC標簽?FPC標簽,即柔性電子標簽,基于柔性印刷電路板(FlexiblePrintedCircuit,FPC)技術制作而成。與傳統剛性標簽不同,FPC
    的頭像 發表于 03-03 14:40 ?722次閱讀
    FPC柔性電子<b class='flag-5'>標簽</b>介紹和應用

    2.45G有源通風口型標簽產品

    有源通風口型標簽。這款標簽不僅支持太陽能充電,還具備2.45G射頻收發、文件數據存儲、環境監測數據上報以及標簽盤點防碰撞等功能,它將為我們的
    的頭像 發表于 02-05 09:31 ?331次閱讀
    2.45G有源通風口型<b class='flag-5'>標簽</b>產品

    DAC81408的建立時間為12uS,如何理解數據手冊中的12uS建立時間這個參數呢?

    數據手冊中,DAC81408的建立時間為12uS 而爬升速率0~5V為1V/uS,如果控制輸出從0V跳變至5V,以此時間計算,時間為5uS,小于12uS的建立時間典型值 如上圖所示為
    發表于 12-09 08:33

    今天給大家演示一下ABS抗金屬資產管理標簽的應用 #抗金屬標簽 #資產管理標簽

    電子標簽
    深圳市融智興科技有限公司
    發布于 :2024年11月19日 15:52:12

    如何選用RFID標簽打印機

    一、RFID打印機基本原理 RFID打印機利用RFID天線與RFID標簽進行無線通信,實現對標簽識別和內存數據的讀出或寫入操作,同時將數據內容可視化打印在
    的頭像 發表于 09-09 16:26 ?756次閱讀
    如何選用RFID<b class='flag-5'>標簽</b>打印機

    InRouter與Juniper SRX如何建立IPSec隧道配置?

    Task Force (IETF) 定義的安全標準框架,在公網上為兩個私有網絡提供安全通信通道,通過加密通道保證連接的安全——在兩個公共網關間提供私密數據封包服務IPSEC是一套比較完整成體系的VPN
    發表于 07-25 07:32

    數字孿生實現哪些功能

    數字孿生是一種創新的概念,它涉及將實體系統或過程的物理部分與其數字化鏡像相結合。實現數字孿生,通常需要包括以下方面的功能和步驟: 1.數據采集與傳感器技術 數據采集:利用各種傳感器和
    的頭像 發表于 07-01 15:58 ?1124次閱讀
    數字孿生<b class='flag-5'>要</b>實現哪些功能
    主站蜘蛛池模板: 日本怡红 | 女性一级全黄生活片 | 亚洲国产第一区二区香蕉 | 亚洲人成影网站~色 | aa黄色毛片| 91在线视频免费 | 免费看黄的视频网站 | 国产区一区二区三区 | 伊人久久精品成人网 | 天天干天天爽天天操 | 1000部又爽又黄的做黄禁片 | 天天干天天干天天干天天干天天干 | 国产一区二区三区夜色 | 在线看视频你懂的 | 你懂的 在线观看 | 女性一级全黄生活片 | 日本免费在线视频 | 亚洲综合国产一区二区三区 | 日本成人免费在线视频 | 国模大尺度酒店私拍视频拍拍 | 国产精品一区二区三区免费视频 | 我不卡老子影院午夜伦我不卡四虎 | 午夜影院普通 | 亚洲伊人99综合网 | 韩国最新三级网站在线播放 | 成人综合在线观看 | 在线观看视频你懂的 | 欧美极品色影院 | 99久久精品免费看国产免费 | 久久草在线精品 | 狠狠色网| 男操女视频网站 | 亚洲邪恶天堂影院在线观看 | 久久久久国产一级毛片高清版 | 午夜黄色 | 国产精品久久1024 | 欧美日韩一卡2卡三卡4卡新区 | 天天天天射 | 毛片基地在线 | 五月婷婷在线播放 | 午夜毛片免费看 |