最具影响力的数字化技术在线社区

168主编 发表于 2019-3-4 14:07:46

简单相关分析的五步骤

简单相关分析的基本步骤如下:

                      下面以腰围、体重、脂肪比重为例,来说明应该怎样进行相关分析。

第一步绘制散点图
在SPSS中,绘制散点图非常简单。操作步骤如下:1)点击图形à图表构建程序。2)在库中选择散点图,双击简单散点图。3)分别将腰围和体重,拖入X轴和Y轴,确定即可。


                              观察散点图,可知:腰围与体重应该是存在线性相关性的,或者说,腰围对体重是有影响的。不过,这相关程度(或影响程度)有多大,则需要进一步计算相关系数来度量。
第二步选择系数公式
正态性检验因为,Pearson相关系数要求变量服从正态分布,所以在计算相关系数之前,需要先确定两变量是否都服从正态分布,或者近似正态分布。
如果采用其它相关系数(参考“相关系数种类”小节),则可以省略正态性检验。
在SPSS中,判断两变量是否服从正态分布操作步骤如下:1)点击分析一一描述统计一一探索,进入探索界面。2)将待判断的变量选入因变量列表。3)打开绘制界面,选中带检验的正态图,确定。 确定后得到如下的正态性检验结果:


在SPSS中,采用的是K-S检验以及Shapiro-Wilk检验的的结果,当Sig>0.05时,表明该变量服从正态分布,否则为非正态分布。
注:当样本量大于50时用K-S检验结果,样本量小于50时用Shapiro-Wilk检验结果。 如表所示,显然腰围和体重两个变量都是服从正态分布的,所以可以采用Pearson相关系数。下面在计算相关系数时,将采用Pearson相关系数。 第三步计算相关系数

在SPSS中,计算相关系数的操作步骤如下:1)打开数据文档,点击分析一一相关一一双变量,进入相关分析界面。2)将要判断的几个变量全部选入变量列表,确定,即可得到相关系数矩阵。
确定后得到如下的相关系数矩阵:

显然,相关系数矩阵是对称矩阵,而且对角线上的相关系数全为1(即变量自身的相关系数为1)。从上表中可知,腰围和体重的相关系数r=0.853,存在强相关;脂肪比重和体重的相关系数r=0.697,存在中度相关。 第四步显著性检验
在SPSS中,不但计算出变量间的相关系数,同时还进行了显著性检验(即计算了统计量t,且查询出对应的概率P值,见显著性一行)。
在相关系数矩阵中,查看显著性一行,腰围和体重对应的概率P=0.000(因精度的原因,看起来概率为0),显然P<0.05,即根据显著性检验,也可知腰围和体重、脂肪比重和体重,都存在显著的线性相关关系。 第五步进行业务判断
根据前面的相关分析,可得到数据分析结论:1、根据显著性判断,可知腰围与体重、脂肪比重与体重,都存在显著线性相关性。2、根据相关系数,可知腰围与体重存在强相关,脂肪比重与体重存在中度相关。 然后,再从业务上对分析结果进行解读,并给出相应的业务策略或建议:1、业务解读:腰围对体重的影响很大,脂肪比重对体重的影响较大。2、业务建议:要减轻体重,最好先减小腰围,少吃脂肪类食物。
这样,就实现了从数据到业务的完整的相关分析过程。作者:傅一航
来源:大数据专家傅一航

页: [1]
查看完整版本: 简单相关分析的五步骤