马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
0x00 前言最近遇到了一些朋友在群里讨论数据有哪些工作内容,看了一些讨论后总感觉不是很全面。今晚就顺便整理一波居士自己对数据工作内容的理解,这次会从数据团队的角度出发有哪些工作内容,希望能帮助大家理清思路。 0x01 数据团队的工作内容鉴于很多从业人员和招聘信息上对一些名词的理解是不同的,居士对每个工作内容都会加入一些自己的说明。个人意见,仅供参考: 数据平台建设
主要包括的大数据平台搭建和二次开发 数据系统开发: 主要包括调度系统、元数据系统、数据接入系统等开发 大数据平台运维: 一般来讲主要是大数据集群的运维和运营 ETL开发: 主要负责数据的接入和清洗工作
数据公共服务
数据分析相关
数据挖掘相关
数据产品
本来想画一个思维导图来组织内容,但是还没有想清楚比较好的组织方式,因此先罗列出来,后续再来改进。 0x02 闲谈受欢迎程度从受欢迎程度上来讲,机器学习相关的工作内容受欢迎程度最高,因为它的技术深度更深,同时更为流行。 大数据平台开发在13年-15年的时候,受欢迎程度同样很高的,近些年热度稍减。而且,随着 hadoop 生态系统的成熟,大部分大数据平台开发的同学会逐步变为数据平台运营。 相对来讲,数据仓库属于一直不温不火的状态,但是随着数据行业逐渐理性,大家不再只关注搭建数据平台,而是开始关注数据的管理,数据仓库也开始受到了一定的重视。居士明显感觉了不少公司在经历了数据平台建设后,开始关注数据仓库的搭建。 重要程度从重要程度上来讲,居士认为数据质量是最重要的,数据的准确性是保证所有数据价值的生命线,如果数据质量不能得到保证,那么一切数据结论都是不可信的。 因此,从数据质量的角度来看,数据仓库是最重要的,好的数据仓库设计能保证公司的数据质量。 0xFF 总结关于数据团队的思考,将会是一个系列的文章,很多观点可能不成熟,但是居士会不断更新自己对于这个话题的认知,同时不断更新这个系列的文章。 那么,你自己的工作是属于文中描述的哪一部分或者是哪几部分呢,你对数据团队的工作内容又有什么自己的看法呢? 来源:木东居士
|