最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

数据仓库(五)维度模型设计的4步过程

[复制链接]
跳转到指定楼层
楼主
发表于 2019-12-2 12:01:24 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
一、选择业务过程
业务过程室友组织完成的微观活动。例如获得订单,开具发票,接受付款、注册学生、处理索赔等。业务过程包含以下公共特征,理解他们有助于区分组织中不同的业务过程;


业务过程通常用行为动词表示。因为他们通常表示业务执行的活动。与之相关的维度描述与某个业务过程时间关联的描述环境。


业务过程通常由某个操作系统支撑,例如账单或购买系统。


业务过程建立或获取关键性能度量。有时这些度量事业务过程的直接结果,度量从其他时间获得。分析人员总是想通过过滤器和约束不同组合,来审查和评估这些度量。


业务过程通常由输入激活,产生输出度量。在许多组织中,包含一系列过程,他们即是某些过程的输出,也是某些过程的输入。即一系列过程产生一些列的事实表。


您需要仔细了解业务以区分组织的业务过程,因为商业用户难以快速回答下列问题他们对哪些业务过程感兴趣,用户希望在DW/BI系统中分析来自业务过程的性能度量。


有时业务用户谈论的是业务战略规划,而不是业务过程。这些往往是由管理层为提高竞争优势而制定的抽象企业规划。为将这些规联系到DW/BI小组利用的表示项目工作单元的业务过程中,需要将业务规划分解到基本业务过程中。这意味着需要深入挖掘,理解数据和操作型系统,以支持对规划进行分析的需求。


我们也需要了解业务过程不是什么。企业业务部门或企业功能职责并不等于业务过程。将注意力放在业务过程,而不是放在功能化的部门,可以更方便地获得一致得企业信息。如果以部门为边界建立维度模型,则不可避免地会将不同标号的数据及数据值重复使用。确保一致性的最好方法是一次性发布数据。


二、声明粒度
声明粒度意味着精确定义某个事实表的每一行表示什么。粒度传递的是与事实表度量有关的细节级别。它回答‘如何描述事实表中每行内容?’这一问题。粒度由获取业务过程事件的操作型系统的物理实现确定。


经典的粒度声明如下:


客户销售事务上的每个产品扫描到一行中


医生开的票据的内容项采用一行表示


机场登机口处理的每个登机牌采用一行表示


昂库中每种材料库存水平的每日快照常采用一行表示


每个银行账户每月的情况用一行表示


上述声明粒度试一业务术语表示的。也许您一直期望粒度是指对事实表主键的传统声明。虽然最终的粒度与主键是等价的,但将维度集合列出,然后假定这一集合就是粒度声明的方法是不正确的。无论何时,都应该以业务术语来表示粒度的。


维度建模者有时会忽略声明粒度这一在四步设计过程中从表面上看起来可有可无的额步骤。请不要这样做。声明粒度是不容忽略的关键步骤。多年来,从对大量维度设计调试的情况来看,最常见的错误就是在设计过程之初,没有为事实表声明粒度。如果不能清楚地定义粒度,整个设计就像建立在流沙上,对候选维度的讨论处于兜圈子的状态,不适当的事实将隐藏在设计中。不适当的维度始终笼罩着DW/BI实现。设计组的每个人都要对事实表的粒度达到共识,这一点非常重要。讨论到此,您可能会发现第三步或第四步设计过程中对粒度的说明是错误的。您必须返回第二步。重新正确地定义粒度,然后考虑第三步或第四步的问题。


三、确定维度
维度要解决的问题事 ”业务人员如何描述来自业务过程度量事件的数据?“ 应当使用健壮的维度集合来装饰事实表,这些维度表示承担每个度量环境中的所有可能的单值描述符。如果粒度清楚,维度通常易于区分,因为他们表示的是”谁、什么、何处、合适、为何、如何”关联的时间。常见的维度实例包括日期、产品、客户、雇员、设备等。在选择每个维度时,应该列出所有具体的、文本类型的属性以充实每个维度表。


四、确定事实
可以通过回答“过程的度量是什么?"这一问题来确定事实。商业用户非常愿意分析这些性能度量。设计中的所有候选事实必须符合二第二步的粒度定义。明显属于不同粒度的事实必须放在不同的事实表中。典型事实是可加性数值,例如订货数量是以美元计的成本总额等。


需要综合考虑也二五用户需求和数据来源的实际情况,并与四个步骤联系起来,强烈建议坚决抵制仅仅考虑数据来源来建模数据。将注意力放在数据上可莪能不会像与商业用户交流那样复杂,淡数据不能替代业务用户的输入。遗憾的是,许多组织仍然在采用这种看似最省力的数据驱动的方法,当然这样做基本不能取得成功。
————————————————
版权声明:本文为CSDN博主「嗨胖」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_39714046/article/details/94858703

楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-3 17:24

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表