168大数据

标题: 《企业大数据系统构建实战:技术、架构、实施与应用》一大数据组织架构体系 [打印本页]

作者: 168主编    时间: 2018-12-16 09:22
标题: 《企业大数据系统构建实战:技术、架构、实施与应用》一大数据组织架构体系
本帖最后由 168主编 于 2018-12-16 09:27 编辑

本节书摘来自华章计算机《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第2章,第2.1节,作者 吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问“华章计算机”公众号查看。
第2章企业大数据职能规划
第1章我们介绍了企业大数据在宏观和微观层面的定位,立足于解答企业大数据的商业模式、市场机会、延伸价值、内部功能定义等问题。当企业已经确定要实施大数据战略时,应该如何针对性地建立职能架构体系以保证企业大数据的有效实施和落地?各个职能部门的职责范畴如何定义?不同体系和部门间如何协同和流程化工作?
本章将详细讲解企业大数据职能规划体系,包括如何定义大数据部门在企业中的角色,常见的大数据职能及职责分工,不同职位的职责划分以及大数据制度和流程建设等问题。
2.1 大数据组织架构体系
要建立适合企业的大数据组织架构,首先要明确大数据部门在企业中的角色。不同的角色对应到企业内部会有不同的架构方式和职能定位。
2.1.1 大数据部门在企业中的角色
大数据部门泛指大数据中心、大数据部门、大数据组甚至是个体员工,它代表一类群体的角色扮演。按照大数据部门在企业中的不同角色和存在特征,可比喻为以下四类:路人、侍从、灯塔、先知。
1.路人
路人是指大数据部门处于企业边缘,其存在属于可有可无的境况,这是一种危险的企业处境。
目前很多企业的大数据部门都处于这类角色中,其实质是由于企业主观上对数据不敏感、不听、不信以及缺乏数据工作文化等原因,以及客观上缺乏有效的流程和制度约束、有经验的数据工作人员以及有价值的数据产出,导致大数据部门的存在与否无关紧要。
这类角色通常在企业中有以下几种行为和职能特征:
对于大数据部门是否处于这种状态,通常只需回答一个问题:“如果没有大数据部门,企业会损失什么?”如果无法准确回答或含糊其辞,那么这个答案就是肯定的。
2.侍从
侍从,即随从侍奉,这体现了大数据部门角色定位于企业辅助层面。侍从的角色相对于路人有明显的提升,该角色已经处于有明确工作需求的状态;但与此同时,大数据部门的这种状态也存在明显的问题:缺乏独立和自主性,侍从从来都不会自己决定去做什么,而是等待被分配工作和任务。同样,在企业中的大数据部门也无法决定企业在业务层面应该做什么、怎么做等问题。这种角色通常提供的职能包括如下几个方面:
(1)数据管理
数据管理工作包括:数据配置管理、数据权限管理、用户权限管理、数据导入管理、数据导出管理。
(2)数据查询
很多企业的数据都在IT中心进行统一管理,而大数据部门也属于IT眼中的“业务部门”。由于大数据部门天生具有接触数据和处理数据的需求,因此很多时候也会被开放某些附属库、从属库或复制库的权限。某些情况下,大数据部门也会承担类似“取数”的功能,这类需求在某些情况下会频繁发生,例如:
限制业务部门的“取数”权限从企业宏观来讲利于数据安全把控,这是实现数据安全的途径之一。但从整体来看,如何平衡安全和工作效率,并释放人力和时间资源到更好的工作或项目机会上,需要进行权衡。毕竟,数据安全不只有权限控制这一种方法,而且只有这一种方法也无法完全保证数据安全。
(3)数据校验
这里的数据校验是指用一定的方法保证多数据源之间的完整性、一致性、准确性、及时性和有效性。
数据校验通常存在于大型企业中,这类企业往往存在多平台、多系统、多生产环境和多测试环境,此时如何保证多个系统对于同一业务主体的测量满足上述条件就要通过数据校验工作来实现。
数据校验(某些公司也称为数据治理)是保证和提升数据质量的重要步骤之一,如果该过程缺乏有效执行,将很有可能导致“Rubbish in,Rubbish out”的局面,后续所有数据工作的价值将无从谈起。
(4)数据统计
大多数日常报表需要通过技术开发形成产品报表体系,以提供日常业务支持。当有突发性事件或活动时,需要人工整理和汇总报表。日常报表完成后,通过自动发送邮件或短信、在线访问、离线客户端访问等接入。
根据数据日常报表提供频率和周期不同,日常报表可分为日报、周报、月报、季报、半年报和年报。报告内容因公司需求而异,但基本框架是统计周期内企业整体、各运营环节KPI陈列、对比和简单分析,目的是通过周期性数据进行业务诊断,发现业务效果趋势和异常点,为业务优化执行提供基本支持。
根据数据日常报表支持对象在企业内部分工不同,日常报表可分为针对决策层的报表和针对执行层的报表。针对决策层的报表侧重于宏观的、整体的效果汇总和结果分析,借助对比、趋势和主要维度下钻等方式进行初步分析并定位结论和问题点;针对执行层的报表侧重于微观的、个体的效果分析,各业务执行层只针对各自业务维度进行分析,并提供实际可行的操作型建议。
对于数据指标的设定,既要包括公司核心结果指标如利润,又要包括各个业务节点的过程类或间接辅助类指标,以更全面地评估和定性整体及各业务线的工作结果。
3.灯塔
灯塔意味着企业的工作方向或职能开展需要大数据部门进行指导,此时大数据部门承担着以下三类角色和功能:
大多数企业中的大数据部门都有类似于数据挖掘、数据分析、专项分析类的职责,这类工作的核心价值通常不是产生多少模型、几种算法、多少报告等,而是直接对于企业整体销售和利润的提升,或在保持相同销售和利润水平下对成本的控制和缩减。当然,某些企业内部会由于各种原因,比较注重知识产权、专利申请、科学研究、学术报告和期刊等的影响力,这些视具体情况而定。
这类角色通常通过一定的模型、算法、流程和机制对数据进行解析,大多数的工作都是通过专项数据挖掘或分析的形式开展。
数据专项挖掘分析是指针对某一特定课题或需求,采用专项分析或长期课题分析的形式对数据进行深入挖掘和分析,以提炼出相应结果或方法论供业务参考或使用。数据专项挖掘分析是数据发挥价值的重要手段,更是数据辅助支持作用的关键,大多数公司的数据工作意义都来源于此。
为了提高数据工作的针对性,数据专项挖掘通常按业务模块划分,常见的数据专项挖掘分析模块包括市场分析、营销分析、运营分析、会员分析、用户体验分析、销售分析、移动分析、O2O分析、库存分析、供应链分析等。不同分析模块课题依业务需求而定。
4.先知
在上述三类角色中,我们讨论的知识前提都是数据依托于业务主体开展工作。但无论开展的工作是预测性的、剖析性的还是知识挖掘性的,可以说没有业务就没有数据发挥作用的土壤,更无法落地应用和实施。因此,从某种程度上看,数据是一定要依托于业务主体而存在。那么数据真的只能处于依托作用或依托于业务而存在吗?
在大数据时代的当下,身边所有介质所产生的任何属性、行为、结果等都可以通过一定的形式进行记录。现在除了传统的结构化数据外,还包括半结构化和非结构化的数据形式或类别,例如日志、文本、视频、语音、图片、文档、XML、HTML等。这些数据形式或状态可以被人类识别并加以有效分析、整合和利用,既然人类可以做到,那么理论上在一定条件下计算机也有机会这样开展工作。
人类开展工作的前提是从出生开始便不断接收外界各种信息源的刺激和学习,相对的,计算机所能接收到的信息相对于人类接收到的数据和信号而言,都是碎片化并且微乎其微的。基于计算机视觉、模式识别、自然语言处理、机器学习、深度学习等领域的人工智能正在被人们进行广泛的研究。假如通过一定途径将人类接收到的所有信息都能传递给计算机,那么计算机便可识别、加工、分析、应用和预测这些信号。因此,解决了这些问题之后,计算机智能便可脱离业务主体而存在,甚至在一定程度上,它可以创造业务、思考业务和优化业务并找到最优化方法进行求解。
目前,这类角色在企业和社会中还没有大规模的综合性应用案例,但在很多垂直领域中已经有所突破,例如机器翻译、语音识别、图片识别、自动规划、智能无人汽车、智能博弈等;而在学术和知识研究领域也有各自阵地,包括深度学习、神经网络、机器学习等。未来,数据的价值将借助于传感器、海量数据、数据推演的模型和算法、自动程序设计、自动控制以及硬件集成等方式独立开展行动。
2.1.2 常见的大数据职能及职责
常见的大数据组织架构分为四种类型,根据不同公司的性质可分为分散型架构、集中型架构、复合型架构和矩阵型架构。
1.分散型架构
在分散型数据架构中,数据作为单独的部门位于各个业务中心之下,职责是提供本中心的数据支持。如图2-1所示,营销中心、运营中心、会员中心和IT中心都有自己的数据部门,各个部门相互独立。
分散型数据架构常见于企业创建数据体系的初期,初衷是先将数据置于某个中心之下,待数据工作正常开展并卓有成效之后,再在其他部门成立数据部门并辅助业务工作。
分散型数据架构下,各大数据部门的职责是高度相似的,包括:
这种数据架构的优势非常明显:前期投入较小,只需人员成本和极少的系统成本便可开展工作;数据从业人员由于处于业务工作体系内,对业务熟悉度较高,数据落地价值更大;另外,相同体系下的各个部门协同工作效率更高,利于业务方数据理解和执行。当然,这种架构的缺点也是显而易见的:
2.集中型架构
集中型数据架构与分散型数据架构相反,它是把所有的数据工作汇总到一个中心集中统筹规则,通常该中心是信息技术中心或IT中心。图2-2为典型的集中型数据架构图。
该架构下由于所有的数据都集中到IT中心,因此大数据部门工作职能高度集中,主要包括:
这种数据架构体系有效地解决了数据源不一致和数据口径定义的问题。由于所有数据从生产到应用都由该中心统一负责,数据质量度较高。这种数据架构的主要问题是业务理解与支持较弱:
为了解决集中型数据架构带来的业务应用问题,行之有效的一种方法是派驻数据分析师入驻到各个业务中心。这能在很大程度上缓解技术类中心“不懂业务”的被动局面,但对数据分析师个人素质和能力有较高要求:
上述方式可以有效保证数据质量和业务应用效果,但同时我们需要考虑数据之外的问题:如何管理分散到各个业务中心的分散人员?如何协同各部门工作?如何避免交叉管理问题?
在集中型数据架构下,分散到各业务中心的分析师的组织架构仍然属于技术中心。
3.复合型架构
复合型数据架构是建立在分散和集中基础上的复合组织架构。数据端集中到统一中心之下管理,该中心通常是IT或数据中心;业务端分散到各业务中心之下设立数据支持部门,如图2-3所示。
复合型数据架构既能保证数据的质量标准化,又能保证各个业务节点的数据落地应用,同时还可以结合各业务共同需求以及公司战略发展需求开发全局应用的智能产品。不同中心间的分工如下:
(1)IT/数据中心
(2)各业务中心
各业务中心除对接各自中心的需求以外,还需要与IT/数据中心协同工作:
4.矩阵型架构
矩阵型数据结构常见于第三方服务或外部服务公司,属于项目管理类企业的常见架构,对于这种企业而言,项目制的工作方式是企业业务运作的基本模式,如图2-4所示。
这种模式或职能结构具有以下特点:
这种整体与局部的有效统一使得所有的大数据工作环境都相对可控,利于企业利益最大化,但同时也存在一些不可避免的问题:
对于矩阵型的大数据工作架构,不同部门间的职能分配如下:
(1)大数据项目管理中心
核心职能:
非核心职能:
大数据项目管理中心和各项目中心的职能中,除资源管理和项目管理外,其他职能可能会根据公司实际运营情况有所差异,某些公司甚至会采用各项目组独立核算成本的方式。
(2)各项目中心
很多公司为了避免项目的失控并保证公司利益最大化,都会设置项目内的双管理(两个项目负责人)检查的制度,这样不但可以保证各利益方相互监督,同时又能最大限度地避免利益主体抱团。






欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2