全球最具影响力的数据智能产业服务和职业发展平台

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

从0-1构建用户标签体系

[复制链接]
发表于 2019-9-8 20:13:31 | 显示全部楼层 |阅读模式
标签是什么

用户标签是对用户行为特征的抽象,用以描述具有某一相同特征的用户群体,如“大学生”这个标签,其实就是对所有在上大学的学生群体的抽象,通过标签可以找到某一群用户。

标签是如何产生的

用户依托于特定的载体,对其在特定的业务场景行为的特征提取,即为用户标签。


  • 载体:移动终端、PC等可以进行操作交互的平台,同时可以对用户操作行为数据进行沉淀并存储
  • 场景:基于时间和空间维度,用户产生某个行为的位置以及时间
  • 行为:用户在特定场景下,通过载体完成了哪些行为,通过行为的特征提取,才能形成不同维度的标签


标签体系的架构
[backcolor=rgba(89, 155, 171, 0.6)][backcolor=rgba(89, 155, 171, 0.75)]数据层
1.数据源

数据源即用户生成用户标签的数据来源,以运营商用户数据为例,用户的行为数据来源于前台业务系统、上网行为数据采集系统、语音通话业务系统等等。

2.数据处理

数据通过各业务系统获取后,往往是杂乱无章的,需要对数据进行一定的处理,主要包含:数据整合、数据清洗、特征提取三个步骤。

  • 数据整合

将不同业务系统中用户数据通过某一个关键字段关联,形成维度更全的数据,还以运营商数据为例,通常通过用户手机号码将用户基础信息、通话信息、上网信息以及位置信息等等进行关联,形成一个全维度的用户数据体系。

  • 数据清洗

不同业务系统的用户数据包含的数据字段较多,通过分析发现很多数据字段对于生成用户标签没有过多的参考作用,同时在对数据进行处理过程中会发现一些数据质量的问题,如数据缺失,数据异常等等。

数据清洗的作用就是去除无效数据,保留有价值数据。通过数据清洗,提升生成用户标签的准确性。

  • 特征提取

特征提取,即对处理过的用户数据进行特征识别,寻找有价值的字段数据,如针对于用户上网行为偏好标签的定义,需要提取用户上网行为字段的数据,通过对该字段数据的解析分析用户上网行为偏好。

[backcolor=rgba(89, 155, 171, 0.6)][backcolor=rgba(89, 155, 171, 0.75)]功能层
1.标签生命周期管理
  • 标签新增(定义)

标签类型:定性标签、定量标签、衍生标签

定性标签,又可以称为静态标签,指不会随着时间以及用户行为变化而变化的标签,如用户的性别标签、年龄标签,这些标签都是不会随着时间或用户行为而变化的。

定量标签,又可以称为动态标签,指挥随着时间以及用户行为变化的标签,如用户活跃度标签,会根据特定时间段内用户特定行为的变化而变化。

衍生标签,又可以称为预测标签,指基于用户行为对用户未来行为进行预测的标签,如用户在过去一段时间经常访问汽车类APP,那么可以依据用户行为给用户打上有买车需求的标签。

标签口径,与业务场景的深度结合

根据标签类型的不同,定义标签的规则也会不同,定性标签以事实为依据,而定量以及衍生标签则需要结合具体的业务场景而定义,这就需要标签的具体使用者即业务方深度参与定制,因为只有具体使用标签的人才会对业务、对行业有深刻的认知,基于这样的前提定义的标签的准确性以及价值才会最高。

标签的标注方法

基于标签的类型以及标签的口径,标签的标注主要有两种方式:基于人工的标注以及基于机器的标注。

基于人工的标注方式更多依赖于人的经验,通过人为定义给出标注规则。

基于机器的标注方式更多依赖于机器学习算法,通过将影响因子提供给机器算法模型,通过机器的自学习给出不同权重并形成标签。

  • 标签更新

基于人工的标注方式,标签的更新往往通过标签实际效果以及具体使用标签人的经验对标签标注规则进行更新。

基于机器的标注方式更为智能,通过数据的不断更新,机器会根据标签的反馈效果自动更新标签的规则。

  • 标签下线

对于无价值以及无时效性的标签进行下线操作,减少无效数据冗余,也减少标签使用者的选择成本。

2.标签可视化
  • 标签分类

标签的分类维度以及分类级别往往取决于标签的具体应用场景,如对用户APP偏好的标签分类,通常根据APP的类型分为工具类、购物类、社交类等多个类别。如对用户访问内容的标签分类,则会更为深入,如对新闻资讯类内容的访问,又细分为时政要闻、体育资讯、科技资讯等等颗粒度更新的标签。

  • 标签检索

基于标签类型以及标签分类维度,帮助具体使用标签的用户找到符合需求的标签。

[backcolor=rgba(89, 155, 171, 0.6)][backcolor=rgba(89, 155, 171, 0.75)]应用层

标签体系是对底层数据的整合与精细化管理,其作用是为上层应用提供数据支持的。

1.用户画像

在精细化运营的时代,新用户的获取成本越来越高,产品以及运营的关注重点已经从对新客的获取转移到对存量用户的运营上。通过标签体系的搭建,可以形成更精确的用户画像,对用户群体进行分层,对不同类型的用户群进行针对性的运营和服务,提升存量用户的活跃以及付费转化。

2.精准营销

精准营销场景更多体现在需要用户付费购买的产品上,与传统全量用户营销不同,精准营销可以通过标签定位目标用户群,针对不同目标用户群营销不同类型的产品及服务,极大程度提升用户的转化率以及营销效率。

3.个性化推荐

个性化推荐的场景更多出现在内容社区、电商平台,给不同的用户推荐不同的内容或商品,提升用户感知,提高用户付费转化率。

4.第三方应用

标签体系的搭建除了可以提供给内部业务部门做运营、分析使用,也可以作为数据基础服务提供给第三方用户使用,对第三方来说,看中的是数据的价值。


楼主热帖
168大数据(www.bi168.cn)是国内首家系统性关注大数据科学与人工智能的社区媒体!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2019-9-22 20:35 , Processed in 0.152889 second(s), 21 queries , Xcache On.

Powered by BI168社区

© 2012-2014 海鸥科技

快速回复 返回顶部 返回列表