最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
开启左侧

简单相关分析的五步骤

[复制链接]
发表于 2019-3-4 14:07:46 | 显示全部楼层 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

简单相关分析的基本步骤如下:


1.webp.jpg


                       

下面以腰围、体重、脂肪比重为例,来说明应该怎样进行相关分析。



第一步绘制散点图

在SPSS中,绘制散点图非常简单。操作步骤如下:

1)  点击图形à图表构建程序。

2)  在库中选择散点图,双击简单散点图。

3)  分别将腰围和体重,拖入X轴和Y轴,确定即可。


2.webp.jpg



                              

观察散点图,可知:腰围与体重应该是存在线性相关性的,或者说,腰围对体重是有影响的。不过,这相关程度(或影响程度)有多大,则需要进一步计算相关系数来度量。


第二步选择系数公式
正态性检验

因为,Pearson相关系数要求变量服从正态分布,所以在计算相关系数之前,需要先确定两变量是否都服从正态分布,或者近似正态分布。


如果采用其它相关系数(参考“相关系数种类”小节),则可以省略正态性检验。


在SPSS中,判断两变量是否服从正态分布操作步骤如下:

1)  点击分析一一描述统计一一探索,进入探索界面。

2)  将待判断的变量选入因变量列表。

3)  打开绘制界面,选中带检验的正态图,确定。

3.webp.jpg 4.webp.jpg

确定后得到如下的正态性检验结果:


5.webp.jpg 6.webp.jpg


在SPSS中,采用的是K-S检验以及Shapiro-Wilk检验的的结果,当Sig>0.05时,表明该变量服从正态分布,否则为非正态分布。


注:当样本量大于50时用K-S检验结果,样本量小于50时用Shapiro-Wilk检验结果。

如表所示,显然腰围和体重两个变量都是服从正态分布的,所以可以采用Pearson相关系数。下面在计算相关系数时,将采用Pearson相关系数。

第三步计算相关系数

在SPSS中,计算相关系数的操作步骤如下:

1)  打开数据文档,点击分析一一相关一一双变量,进入相关分析界面。

2)  将要判断的几个变量全部选入变量列表,确定,即可得到相关系数矩阵。

7.webp.jpg 8.webp.jpg

确定后得到如下的相关系数矩阵:


9.webp.jpg


显然,相关系数矩阵是对称矩阵,而且对角线上的相关系数全为1(即变量自身的相关系数为1)。从上表中可知,腰围和体重的相关系数r=0.853,存在强相关;脂肪比重和体重的相关系数r=0.697,存在中度相关。

第四步显著性检验

在SPSS中,不但计算出变量间的相关系数,同时还进行了显著性检验(即计算了统计量t,且查询出对应的概率P值,见显著性一行)。


在相关系数矩阵中,查看显著性一行,腰围和体重对应的概率P=0.000(因精度的原因,看起来概率为0),显然P<0.05,即根据显著性检验,也可知腰围和体重、脂肪比重和体重,都存在显著的线性相关关系。

第五步进行业务判断

根据前面的相关分析,可得到数据分析结论:

1、根据显著性判断,可知腰围与体重、脂肪比重与体重,都存在显著线性相关性。

2、根据相关系数,可知腰围与体重存在强相关,脂肪比重与体重存在中度相关。

然后,再从业务上对分析结果进行解读,并给出相应的业务策略或建议:

1、  业务解读:腰围对体重的影响很大,脂肪比重对体重的影响较大。

2、  业务建议:要减轻体重,最好先减小腰围,少吃脂肪类食物。

10.webp.jpg

这样,就实现了从数据到业务的完整的相关分析过程。

作者:傅一航
来源:大数据专家傅一航

楼主热帖
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-18 09:31

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表