168大数据

标题: 底层数据库规划之一搭建标签体系 [打印本页]

作者: 168主编    时间: 2019-9-11 19:03
标题: 底层数据库规划之一搭建标签体系
前面将数据及其来源进行了梳理,让我们对B2C网站可能出现的数据有了大概了解。但如何对这些数据进行组织、描述、分类,以便于日常使用呢?
一、从查询说起
常用查询方式主要有条件查询、模糊查询。
1.条件查询相对比较简单,通过选择一定条件,实现查询/筛选功能。例如下图中的红色框部分。
2.模糊查询又称作关键字/自定义查询,主要通过关键字匹配,实现查询功能。如下图中的蓝色框部分。
图1 查询的常用方式
无论何种查询方式,都是通过程序语句对后台数据库进行查询操作,所以我们需要对数据在入库前进行命名描述、分类汇总,才能通过各种查询方式得到想要的结果,这一步骤就称为标签处理。
二、那什么是标签呢?
在梳理数据时,我们了解这些数据分别代表的意义,但只了解意义远远不够,更需要站在业务应用角度,去判断、理解数据所代表的意义。
例:如果单纯从用户背景资料(性别、生日等)分析,不同性别用户对产品需求会有差异。但运营需要更进一步分析,希望数据能更多更有用信息,所以在数据准备上,可以将性别、年龄与用户行为进行交叉分析,以便得出更为精确的结果。
图2 基于用户背景资料与用户行为的交叉分析
“性别、年龄”对我们是可见的,即可以通过这两项找到相应的用户。但对数据库而言“性别、年龄”仅仅是文字表现,是通过该文字表现关联到用户,所以它们就像每个人的名字,可以关联到相应的人一样,而这就是标签
因此,标签只是一种内容组织方式,是一种关联性很强的关键字,能很方便的帮助我们找到合适的内容及内容分类
三、标签和标签体系
标签解决的是描述(或命名)的问题,但在实际应用中,还需要解决数据之间的关联。所以,我们通常将标签作为一个体系来设计,从而解决数据之间的关联问题。
一般来说,将能关联到具体用户数据的标签,称为叶子标签。对叶子标签进行分类汇总的标签,称为父标签。父标签和叶子标签共同构成标签体系,但两者是相对概念。例如:下表中,地市、型号在标签体系中相对于省份、品牌,是叶子标签。
表1:某网站标签体系示例
一级标签
二级标签
三级标签
四级标签
移动属性
用户所在地
省份
地市
手机品牌
品牌
型号
业务属性
用户等级
普通
音乐普通会员
音乐高级会员
音乐VIP会员
四、用户标签体系与商品标签体系
B2C网站解决用户买东西的问题,所以网站涉及到两套独立标签体系:用户标签体系和商品标签体系。
1.用户标签体系
对用户进行分类、识别的体系,包括用户基本属性标签(性别、年龄、家庭状况等)、用户行为标签(点击行为、订购行为等)、用户运营标签(运营渠道标签、活动标签等)。
表2:用户标签体系示例
一级标签
二级标签
三级标签
四级标签
基本属性
性别
年龄段
18岁以下
……
55岁以上
行为属性
Web行为
Web登录行为
收藏
到货通知
购买
2.商品标签体系
对商品进行分类的体系,包括商品基本属性标签(名称、类别、规格等)、商品关联标签(类别关联、规格关联等)、商品情感标签(甜美、可爱等)
表3:商品标签体系示例
一级标签
二级标签
三级标签
四级标签
基本属性
类别
数码产品
母婴产品
规格
L
M
S
3.两者关系
用户标签和商品标签并非相互独立,会因为用户点击、购买等行为产生关联。
图3 用户标签与产品标签之间的关联
五、以标签管理系统结束
标签体系相对比较复杂,那如何对标签体系进行科学管理,例如“标签的增加、删除、修改、查询等”工作?这就是我们接下来要讨论的“标签管理系统”。






欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2