最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

传统行业与供应链数据分析的“势”、“道”、“术”

[复制链接]
发表于 2018-9-13 11:03:27 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
所谓数据分析的势、道、术,就是指数据分析的方向、方法和工具,也是提出问题、分析问题、解决问题的思维逻辑。供应链上的数据是从制造型企业,到物流企业,再到零售业的过程。而这三者均是传统型企业,而如今更多的商流数据是通过互联网,而实际的企业经营、运营数据仍旧是在供应链上的各个企业手中。本文从一个传统型行业如物流、零售、制造业等的角度来看数据分析,而并非如今数据分析做的很火的互联网或金融行业的角度。




“势”——数据分析的方向,此处不是指数据分析行业的发展方向,而说的是数据分析的分析方向,抑或说一个物流公司的角度如何做数据分分析。对于一个传统行业的公司,数据分析应当从三个方面进行。
首先,市场端的数据分析。这类的数据分析主要是针对零售业、电商等2C类企业。市场端的数据分析主要是两个方面,一个是外部的:客户数据;一个是内部的:产品数据。
所谓客户数据,若是2B的企业便是客户的体量、客户的数量分布、基础信息等等。若是2C的企业(如快递、零售等),可以研究人口的分布,网购人群的情况。阿里有阿里指数、百度有百度指数,目前其数据开放的越来越少了,但是还是可以看出主要的人群,以及相关产业的区域分布。以物流企业为例,通过探知货物类型,加之以现场调研,便可以得出大致的货品类型,而进行有针对性的物流服务;若是2B的企业(如大零担、三方、专线等),可以通过分析目标企业的市场分布,有针对性的在工业园区进行地推、宣传。如今工商企业对企业信用数据的公开,就有像天眼查、企查查等这类查询工商企业信息的网站,通过地址信息确定坐标,进而分析企业的集中地区,找出地推区域,进而有针对性的进行2B的业务拓展工作。如图则是四川成都市的食品制造业企业热力图。




通过地图,我们可以清晰的看到成都市食品制造型企业的集中区域,虽然企业名录可能不够全,但是整体的分布结构是一定的,因而最终的市场分析结果是可用的。而这也是大数据的概念中的更注重数据结构,而一定程度的忽略数据质量。
其次,是经营数据,此部分数据多是财务数据,是直接反映企业经营情况的数据,适用于供应链上各种类型企业。
经营数据主要是财务报表中的收入、成本、毛利等等,一般小企业多看的是利润表,大企业会看资产负债表和现金流量表。所谓利润表可以直接反映企业的经营情况,也就是企业是赚了、还是赔了。此部分主要是财务数据的分析,做经营数据分析的部门一般是公司的财务部。经营数据主要是收入、成本(直接成本、间接成本)、费用。其中成本和费用有着一定的关系,因为间接成本中的人力成本增加便会在一定程度上造成费用的增加。
当然,经营数据的分析有着很多方法,也有很多的管理会计方面的书籍可以参考。在财务数据分析中,最最基本的就是看财务报表,常见的财务报表便是三张:资产负债表、现金流量表和利润表。这三张报表至关重要,而其中逻辑也是纷繁复杂,这部分的数据分析对于财务人员来说比较专业,但财务电算化虽然已经推行多年,但是其具体的使用效果也有待提高,更多新的数据分析技术也有待运用到财务数据分析中。当然也有一些其他的财务分析方法,如图便是著名的杜邦分析法:





注:图片来自百度百科
最后,便是运营数据,目前对于运营数据,不同行业的运营数据分析能力参差不齐,而不同行业对运营一词的定义也有所不同,这类数据主要是集中在成本控制,客户运营、会员运营等。
例如,对于物流行业来说,大部分企业其实还停留在KPI的搜集和整理上,没能做到通过数据进行事前预测。除非像京东、苏宁等其销售段就是自身的物流,可以通过销售情况进行预测。第三方物流的货量过多依赖于其客户的计划,而客户往往只会给相对的淡季旺季,而缺少明确的货量预测。大部分企业运营分析相对匮乏,需要建立一个可视化仪表盘对数据进行实时监控和钻取。
而仪表盘的好坏,最需要注意的便是其内在的逻辑和数据对业务的帮助,而其实现技术则在其二。目前,仪表盘的实现技术包括Power BI、D3.JS、highcharts甚至Excel等等。
所谓企业数据分析的道,即为企业数据分析的方法。对于企业而言,数据分析需要与业务紧密结合,一切脱离业务的数据分析,都是耍流氓。而要数据紧贴业务,则数据分析人员需要对整个业务流程了解,明白所有数据的出处、流向。此概念类似于在做企业信息资源规划(IRP)的过程中的数据流图。虽然这个概念已经有一段时间,但是目前国内的中小企业而言,仍旧难以落地实施,其标准化过程仍旧艰难重重。
提到数据分析的方法,很多人还会提到数据分析的基本流程。此处将整个流程分成了两个部分,一方面是对业务流程的梳理、一方面是对数据模型的建立,这两个过程中其实是贯穿在整个数据分析流程中的,而整个数据分析流程又是一个PDCA的闭环过程。






对于企业数据分析,尤其是传统行业企业,第一个层次是业务流程的梳理。要对业务流程数据进行标准化,这其中不仅仅是数据格式的标准化,更是对数据出处的标准化,对数据字段名称概念的标准化。这样,便才可以达到“数出一门”。而另一个维度来看,是财务数据关系的梳理,梳理公司业务中的收入、成本、毛利、利润、间接成本、费用等细项之间的关系。梳理这个主要原因是不同公司的费用、成本归属不同,寻求合理的费用归属,会对公司的经营分析工作带来极大的便利;反之,则会造成费用项不清,数据难以支持实际经营的分析。
通过对业务数据、财务数据的梳理,将这些数据标准化,然后进行分析,这时变需要用到各种常用的分析方法。
对于数据分析的方法,可以从两个层次来谈,有一部分前辈认为可以叫为数据分析和数据挖掘。我不太喜欢搞太多概念性的东西,还是实在一点好,姑且就是数据分析的方法,只不过有一些新的人工智能方法应用而已。
首先说常用的几种方法:
1、交叉表分析
交叉列表分析法是指同时将两个或两个以上有一定联系的变量及其变量值按照一定的顺序交叉排列在一张统计表内,使各变量值成为不同变量的结点,从中分析变量之间的相关关系,进而得出科学结论的一种数据分析技术。
简单的说就是将一份数据的两个列做交叉进行分析。比如一列数字是性别,一列数字是消费金额,做成交叉表就是男性和女性分别的消费总额是多少。所谓交叉表说的高大上,平时也可以叫透视表分析。其实excel的透视表基本可以满足,稍微大型一些数据,用SQL语句也完全可以查询出来。
2、聚类分析
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
聚类分析最经典的案例要算啤酒与尿布的购物篮算法,至于其中的故事,网上有好多,此处不予赘述。购物篮分析最常用的便是Apriori算法,现在使用R语言或者Python便可以轻松调用其相关算法包,进行支持度和置信度的计算。
2、回归分析
回归分析常用在预测模型当中,回归分析主要是分析两个事物之间的相关情况,然后寻求其中的规律,如线性回归、logistic回归等等。
3、杜邦分析
杜邦分析一般是财务上常用的分析方法,其将利润或者毛利进行细致拆分,通过各个指标的变化比较,来分析其多总体的影响。一般情况,杜邦分析多采用多个企业或项目进行比较,对于单个企业或项目的杜邦分析,意义较小。
4、RFM分析
RFM分析是在客户运营和会员运营方面最最常用的方法,通过看客户在一段时间内的购买次数、最近购买时间和购买金额,来对客户进行分类,对客户进行打标签,进而对其进行有针对性的精准营销。
当然,数据分析的方法模型,不仅仅限于这几种,对于数据分析来说,涉及供应链不同环节的企业,分析方法和分析指标也有所区别,其数据分析的侧重点也有所不同。
提到数据分析用到的工具,其实做数据开发的朋友们用的最多,且技术更加娴熟。对于业务数据分析人员来说,多数时间接触的,便是Excel和SQL,通常是在数据库中以SQL进行取数,然后进行Excel做报表,最后呈现形式可能是Excel或者是PPT。
而在数据分析过程中,还有一些BI工具非常好用,如微软的Power BI,还有Tableau等BI工具,这种BI工具是数据分析可视化的利器,可以非常快的上手,以简单拖拽的形式进行取数。





注:图片来自百度
个人认为,数据可视化工具最最重要的作用,是更加直观的去观察数据,而不是去炫科技,很多朋友在初步接触可视化工具时,会产生这样的误区,过于追捧图表的美观、颜色,而并没有注意其中的数据的意义,反倒喧宾夺主。若为了展示,专业的美工会比数据分析师做的图更加漂亮,数据分析师当以数据直观展示为主,下面是在实际画图中,图表选型的方法:






注:图片来自百度
在企业数据分析工具的选择中,还需要尽量简单,比如说选择的图表,若用powerBI进行图表绘制,多数是要保存成图片粘贴在PPT或者Excel中,因为在实际工作中,并不是所有领导的电脑都会安装这种软件。当然若购买其Server服务另算,tableau也是同理。对于大部分中小企业而言,仍旧是Excel图表最为实用,Office在企业电脑中的装机普及率远高于任何其他数据分析软件。
对于Excel来说,使用数据透视表和数据透视图,也可以做出数据联动效果。运用超链接,可以制作出数据下钻的效果。虽然其制作过程非常繁琐,且在数据量大的时候,会造成表格巨大,难以打开。此时可以使用VBA进行解决,使用VBA代替其中的部分公式链接,便可大大缩小excel体积,且在展示的时候得到良好的效果。
而对于大数据来说,很多企业采用数据库的形式和自建BI(或找供应商)的方法,其底层的数据库可能是常用的MySQL,也可能是服务器集群。对于业务数据分析师来说,主要是使用SQL和NoSQL语言进行取数,然后进行变换的交叉分析,具体分析则可能使用Excel或者Python的pandas,numpy等。
零零散散,将数据分析的势、道、术说了一遍,借以总结自己的部分工作,也为了和同行多多交流,如有疏漏,欢迎指正。

作者:张文迪
来源:数据分析网


楼主热帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-19 00:36

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表