最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

维度模型设计4步骤

[复制链接]
跳转到指定楼层
楼主
发表于 2019-5-15 16:46:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
主要讨论的概念如下1. 维度模型设计的4步过程
2. 事实表粒度
3. 事务类型事实表
4. 可加、不可加以及抽取的事实

  • 维度属性,包括指标、数字话描述以及多层次
  • 日历日期维度,加上当天时间维度
  • 因果维度,例如:促销维度
  • 退化维度,例如:交易数据号码
  • 维度模型中的空值
  • 维度模型的可扩展性
  • 无事实的事实表
  • 代理键,自然间,持久键
  • 基于雪花模式的维度属性
  • 包含太多维度的蜈蚣事实表


维度模型设计的4步过程


维度模型设计的4步过程

第一步:选择业务过程
通过业务对业务需求以及可用数据源的综合考虑,了解需求,分析需求背后的业务过程,决定对那个业务过程开展建模工作。
关注最为关键、最易实现的用户业务业务过程。最易涉及一系列的考虑,包括数据可用性与质量,以及组织的准备工作等。

第二步:声明粒度
以最低的原子粒度处理数据。原子粒度具有强大的多维性。可以适应商业用户比较随意的查询请求
尽可能最细粒度来处理数据,不是因为需要查询单独的某行,而是因为查询需要非常精确的方式对细节切分

第三步:确定维度
详细的粒度说明了确定了事实表的主要维度。然后可以将更多维度增加到事实表上,只要这些额外的维度自然承担主维度合并的某个值。如果附加的维度会产生与粒度不符的其他事实行,则取消该维度或者重新考虑粒度声明

第四步:确定事实
1,可加事实。我们可以尝试将这类事实物理存储。存储就意味可以能和ETL过程保持一致性。
2,不可加事实。例如利润率,他不能从任何维度被汇总。单价是另外一种不可加事实。




零售模式中的可度量事实

3,事务事实表。表示事务型业务过程具有以下特征:
原子事务事实表的粒度可在事务环境下被简洁地描述,例如,每个事务一行或者每个事务线一行。
此类事实表记录的是一个事务过程,通常比较稀疏,但是又可能回很庞大,数亿行,甚至更多
事务事实表趋向多维化
事务事件返回的度量通常是可加的,只要它们通过数量来扩展,而不是获取单位来度量。

小结:



维度设计4不过程的关键输入

在设计之初,估计事实表的行数是非常有必要的。作为设计者始终通过多角度测量来确定计算是否合理。



作者:数据僧
链接:https://www.jianshu.com/p/029cb71706ff
来源:简书



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-26 14:11

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表