只需一步,快速开始
您需要 登录 才可以下载或查看,没有帐号?立即注册
模型设计,通俗理解就是如何去设计表,使得表与表之间的关系组成一张有规律的大网。
假设有这么个需求:领导想看所有店铺在昨天一天内成交的金额 维度:店铺,日期 事实:成交 度量:金额
实际设计中可能会从某个维度表中再分拆一个子维度表,如商品维度表,可以再拆分品类维度表,用外键依附于商品维度表,这种呈现方式称为雪花模型。
参考: What is the data vault and why do we need it 其中重点摘录 1. 这种模型能最大限度的适应业务系统关系和关系间的变化。 如:订单-客户 以往是 N:1 关系,但是目前已经有了拼单玩法,就变成了 1:N,如果业务变化后,我们 只需要在Link表里增加记录或者列即可,不需推倒重来 2. DV不推荐做脏数据处理,它仅仅反映上游系统数据的真实性,也就是说数据正确与否都应该记录到数仓里面并让他反映出来
假设我们有一张商品表: ID ITEM_ID ITEM_NAME 0000001 20391 Iphone 11-新货上市!速购! 0000002 20391 Iphone 11-双卡双待!来买! 0000003 20391 Iphone 11-亏本卖!店主不要钱! 这里的代理键就是ID,业务主键就是ITEM_ID。
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
查看 »
与数十万数据精英亲密接触
关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号 ) |申请友情链接
GMT+8, 2024-5-6 20:28
Powered by BI168大数据社区
© 2012-2014 168大数据