最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

量身打造数据团队——手把手教你建立数据型公司系列(三)

[复制链接]
跳转到指定楼层
楼主
发表于 2019-10-18 10:28:21 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 168主编 于 2019-10-18 11:08 编辑

大家都承认数据的重要性,但数据团队的关键作用也许在很多公司都没有体现出来。大多数企业只依赖其数据团队来统计用户量或跟踪用户信息,只有少数企业利用数据开展改进产品的实验,而能利用数据分析来调整目标和流程的企业则更屈指可数。也许你需要量身打造一个适合公司发展阶段的数据团队了。

  这是《手把手教你建立数据型公司系列》的第三篇。在上一篇文章中,我们介绍了为何数据科学如此重要、数据科学家的职责,以及数据科学的发展前景。在今天的文章中,我们将深入探究建立数据处理团队的主要目标、整体架构,以及在各个特定开发阶段的主要任务。本文研究成果来自红杉美国数据科学团队。

  以下是本文的内容要点:

   数据处理团队的三大目标:评估健康状况;交付适当产品;制定产品目标、流程和战略。

   充分构建数据基础设施,在产品生命周期的不同阶段,聘用合适的数据处理人才,有助于开展整个数据分析过程。

   随着时间的推移,从用户统计到最终制定产品流程和策略,数据处理团队的任务应随之不断变化。

  

  建立数据处理团队的主要目标

  企业竞争力越来越取决于如何成功地分析海量的、非结构化的数据集,以及如何利用这些分析推动企业创新。因此,企业的当务之急便是建立数据处理团队,专注于从数据中汲取商业价值。

  建立数据处理团队首先要明确以这三方面为主要目标:

   评估健康状况

  监控关键产品的指标;了解这些指标变化背后的因素,并识别出异常值;形成企业报告并可视化。

   交付适当产品

  设计和评估实验;细分用户,建立用户行为模型;利用人工智能和机器学习改进产品生产系统。

  制定产品目标、流程和策略

  深入探索和分析用户体验过程;提出切实可行的策略并预测效果。

  数据处理团队架构

  要实现上述三大主要目标,则需建立恰当的数据基础设施。图1展示了整个数据处理团队的架构。

  

  (图1)

  第一步是记录下用户与产品的所有交互行为——用户每次点击、悬停、打开、关闭和登录等,以及第三方提供的所有数据。一般来说,随着用户数量和用户参与度的增加,这些数据的规模会迅速扩大。

  尽管这些数据不一定都有意义,但记录用户足迹是整个过程中的关键步骤。由于很多企业并不清楚自己最终需要什么样的数据,所以最简单的方法便是记录所有。之后,某些特定类型的数据需要经过处理才会变得有用,比如欺诈检测和直播视频。

  原始数据可以通过ETL(萃取、转置、加载的过程)至数据仓库,数据仓库则以更为结构化的形式(通常由结构化查询语言SQL支持)存储数据。一些较大的企业选择将所有传入的数据以原始形式储存在数据池中(一个存储所有数据的集中式存储库),这样一来,企业便可以利用最新的逻辑,对下游的数据存储进行补充。

  许多大中型企业拥有多个数据仓库和数据池,但如果没有构建数据集,数据的直接分析就会变得困难。因此,构建数据集往往需要针对特定使用目的进行另一个萃取、转置、加载过程。之后,输出的数据将被存储在一个分析数据库中,用于更深入地分析,从而形成报告并将其可视化,并构建起人工智能和机器学习(AI/ML)模型。

  这些深入了解将有助于制定流程和策略,可视化和报告则将有助于监控产品的开发进度,而AI/ML模型将有助于实现自动化并预测其效果。

  此外,测试-学习方法是构建任何数据型产品的关键,它可以基于追踪的用户行为数据,开发并定制产品。根据对关键指标的影响,企业运行、评估和实施大量的产品实验(比如,A/B测试)。在这些实验中,特征标记将对用户进行细分,以确保不同的用户群组数据将会得到不同的处理。

  随着数据处理的规模化和标准化,多种与数据相关的专业岗位将会诞生,包括数据分析师、数据工程师、数据基础设施工程师、数据架构师和数据科学家。在不同项目中,创建者、终端用户和数据产品各不相同(详见图2)。

  

  (图2)

  数据处理团队的演进

  数据处理团队的功能应随着产品的发展而演进。例如,在早期阶段,聘请专门从事分析千万级字节数据的数据工程师可能作用不大,但随着产品的推广,他们的作用则会日益彰显。构建数据处理团队应着眼于中短期需求,数据基础设施的建设则应以长期需求为基础。

  下面,我们来谈什么是数据团队在各个特定开发阶段的主要任务。

  

  (图3)

   阶段一

  起初,当企业在统计用户数量时,出色的技术执行能力是企业的核心技能,比如建立基础设施生成可信的KPI、创建用户跟踪数据,并形成最初的报告。对于大多数公司来说,产品团队即为最初的数据团队。因为产品团队负责定义度量标准,并且随着产品使用量的增加,计算和存储与这些度量标准相关的数据。

   阶段二

  随着企业和产品的发展,完善信息板和报告变得越来越重要。这时,数据工程便成为独立于产品工程的核心功能,而构建基础设施的目的则是专门支持ETL和报告的功能。尤为重要的是,数据团队需要对产品进行深入了解,并提出看法。除了监控KPI、向企业其他部门提供分析报告之外,数据团队的核心职责还包括进行特别分析,识别出度量偏差的根本原因。

   阶段三

  一旦产品使用量达到一定规模,需要进行统计意义上的实验来改进产品体验,这时,对于数据分析师和数据工程师来说,统计技能就至关重要。于数据分析师而言,精心设计实验、从统计角度正确解释结果是核心要求。在后端的实验框架中,则需要考虑用户跟踪(避免同一用户的数据参与到多个相关实验中)和其他能够快速分析结果的统计特性。

   阶段四

  最后,数据科学团队最重要的目标是设置企业目标、流程和策略。设定正确的目标需要基于对业务整体目标的理解。制定流程需要基于探索性分析的能力,识别出问题和机遇,并将想法与结果联系在一起。具体来说,便是需要分析出任何现象背后的驱动因素、可用来做出改变的杠杆,并将这些想法与实践结合起来。

  除此之外,为产品团队制定策略需要强大的分析能力,理解并分析所有相关的现象,即所谓的“点”,并识别和弄清这些点是如何相互连接的。只有在此基础上,才能提出有意义的策略。最后,还要清晰、有效地与高层领导沟通,这对于最终基于数据来设定目标、流程和战略具有不可忽视的作用。

  壹

  你需要一个数据科学家团队——手把手教你建立数据型公司系列(二)| 投资

  贰

  未来,只有这样的公司才有机会赢——手把手教你建立数据型公司系列(一)

  叁

  你会是第一个看见“西班牙船帆”的人吗?| 投资人说

  肆

  周逵:投资创新和投资增长,助力中国新经济产业发展 | 投资人说

  伍

  白雪公主计划 :Airbnb就这样提升了消费者体验 | 红杉Selection


楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-19 22:55

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表