相关性模型-相关系数-创新互联

相关系数可用来衡量两个变量之间的相关性大小,根据数据满足的不同条件,选择不同的相关系数进行计算分析。

创新互联是专业的天峻网站建设公司,天峻接单;提供成都做网站、网站制作,网页设计,网站设计,建网站,PHP网站建设等专业做网站服务;采用PHP框架,可快速的进行天峻网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,专业的做网站团队,希望更多企业前来合作!

两种常用的相关系数:皮尔逊person和斯皮尔曼spearman。

总体和样本:

相关性模型-相关系数

  

皮尔逊相关系数:(要求数据要都是符合正态分布的数据,而且数据需线性相关)

必须先确认两个变量时线性相关的( 画样本散点图先观察是否线性),然后此系数才能告诉他们相关程度如何。如果计算的相关系数为0,只能说明非线性相关。

相关性模型-相关系数

不能说协方差大的两个变量比协方差小的两个变量更相关,因为没有消除变量的量纲的影响。皮尔逊相关系数就是协方差消除量纲后的结果。

相关性模型-相关系数

样本皮尔逊相关系数同总体皮尔逊相关系数:

相关性模型-相关系数

由于皮尔逊相关系数只是衡量已知线性相关的两个变量的相关程度,其他情况不适用:

相关性模型-相关系数

  相关性模型-相关系数

 对相关性大小的解释:

根据具体事情具体分析,没有标准大小的阈值规定。比起相关系数大小,我们更关注其显著性。(假设检验)

对皮尔逊相关系数进行假设检验:

如:求出相关系数r=0.3,问是否和0(非线性相关)有显著差异?

经假设检验求出03与0有显著差异的,就可说明变量的相关性是显著的;若求出0.3和0没有显著差异,可说明变量并不相关,相关系数不显著。

 步骤:

相关性模型-相关系数

对皮尔逊相关系数构造统计变量,知道统计量的分布,就可以画出统计变量的概率密度函数。将计算出的皮尔曼相关系数带入统计变量,得到一个检验值,根据置信水平画出统计变量接受域和拒绝域,看检验值是否落在接受域。

相关性模型-相关系数

相关性模型-相关系数

  相关性模型-相关系数

 除了根据表格找接受域拒绝域的临界值之外,更好用的方法:

相关性模型-相关系数

  对皮尔逊相关系数假设检验的条件:

相关性模型-相关系数

检验数据是否是正态分布:

①JB检验:

相关性模型-相关系数

  相关性模型-相关系数

②夏皮洛-威尔克检验

相关性模型-相关系数

 ③QQ图(要求数据量要非常大)

相关性模型-相关系数

斯皮尔曼相关系数:

相关性模型-相关系数

 小样本情况:

相关性模型-相关系数

 大样本情况:

相关性模型-相关系数

总结:

相关性模型-相关系数


文章题目:相关性模型-相关系数-创新互联
文章位置:http://pwwzsj.com/article/hpdjd.html