最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

[DW] 译文 | IBM高级工程师谈数据湖管理

[复制链接]
跳转到指定楼层
楼主
发表于 2017-4-1 19:12:40 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2017-4-1 19:33 编辑

转自:灯塔大数据;微信:DTbigdata

 “在我看来,数据湖是一种参考架构,在保证信息管理秩序和信息安全的条件下,提供了获取数据的有效途径。”
 
    何为数据湖


  数据湖参考架构实际是指分析系统必备的技术能力,不依赖于任何其他技术。这种技术独立是非常重要的,现在有很多公司都投资了数据平台,希望能够将这些数据平台的技术纳入他们的解决方案。此外,技术是在不断进步的,选择哪种技术通常取决于待处理数据的数量、种类和产生速度。
  分析系统的成功与否并不仅仅取决于它所采用的技术。数据湖参考架构明确了数据管理过程和各种定义的界限,确保技术之外的人力和业务系统能够展开高效合作,为数据应用创建自助的、安全的环境。

  基于数据湖的数据管理

  管理的重要性不言而喻。詹姆斯·瓦特发明蒸汽机的时候,同时发明了飞球式调速器管理系统,调节“引擎”平衡,保证工作效率。“引擎”可以是一个工作流程、一个机构组织,或者信息流。对于管理来说,“引擎”就是管理的目标对象, 明确管理对象是管理的重点。
  根据不同公司数据管理对象的不同,数据湖的管理方式多种多样。举例来说,IT部门的数据湖“引擎”是各种技术。业务部门也可以将数据湖视为创新引擎的一部分,帮助他们创造新的数据价值。确定数据湖管理项目的第一步就是考虑数据湖不同用户群的需求,再考虑什么样的机制能够在不同需求之间达到兼顾平衡。
  举例来说,向数据湖提供数据的系统所有者需要维护来自其系统的数据目录条目,然后他们就可以获得对该数据的质量和稳定性的分析,这有助于他们为用户提供更好的服务。
  数据科学家在处理敏感数据时可能会受到各种限制,但是另一方面,他们可以得到丰富的数据目录,在需要使用特定数据集时,他们也能更容易获得批准。他们同时还能为该数据目录提供数据和内容。
  他们贡献的内容越多,他们获取数据的过程就越容易。通过建立供应商需求和消费者需求之间的平衡,可以实现投入与产出的平衡,创造可持续的生态系统。

  数据湖管理者

  除了从用户角度设计管理项目之外,我们还需要确定由谁来控制数据湖,因为数据湖的控制者会影响数据湖的管理方式。如果是IT部门控制数据湖,那么正常的IT管理方式就能够满足数据湖管理的要求。
  如果是业务部门管理数据湖,那么我们就需要通过数据服务和元数据,抽离出数据湖的运行机制,明确不同数据种类的区别,创建数据湖视图,来帮助业务部门理解和操作。然后,通过目录中的元数据将此视图映射到实际的数据和技术中,并且数据湖服务将使用元数据设置来驱动数据湖的运作。

  一旦“引擎”确定之后,管理项目就可以进入正常的设计阶段:



  • 设定数据湖元数据、格式和最佳实践标准;
  • 检验、监测上述标准的执行;
  • 采取合理方式处理数据异常情况、回答合规问题,并根据反馈进行项目调整。

  管理平衡与价值

  最后,我想再次强调反馈在实现平衡和价值方面的重要性。管理项目必须是动态的,它必须体现出其自身的价值。反馈机制的重要性也不容忽视,它会提醒项目管理者作出及时调整,应对随时发生的变化。


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-16 02:15

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表