虚假相关导致的错误结论是什么意思?

警惕虚假相关导致的错误结论

有时两变量之间并不存在相关关系,但却可能出现较高的相关系数。

如存在另一个共同影响两变量的因素。在时间序列资料中往往就会出现这种情况,有人曾对教师薪金的提高和酒价的上涨做了相关分析,计算得到一个较大的相关系数,这是否表明教师薪金提高导致酒的消费量增加,从而导致酒价上涨呢?经分析,事实是由于经济繁荣导致教师薪金和酒价的上涨,而教师薪金增长和酒价之间并没有什么直接关系。

原因的混杂也可能导致错误的结论。如有人做过计算,发现在美国,经济学学位越高的人,收入越低,笼统地计算学位与收入之间的相关系数会得到负值。但分别对大学、政府机构、企业各类别,计算学位与收入之间的相关系数得到的则是正值,即对同一行业而言,学位高,收入也高。

另外,注意不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持。雨下得多,农作物长得好,在缺水地区,干旱季节雨是一种福音,但雨量太大,却可能损坏庄稼。又如,广告投入多,销售额上涨,利润增加,但盲目加大广告投入,却未必使销售额再增长,利润还可能减少。正相关达到某个极限,就可能变成负相关。这个道理似乎人人都明白,但在分析问题时却容易忽视。

什么是相关系数

相关表和相关图虽然可以直观地展现变量之间的相关关系,但对变量相关程度的描述比较模糊,无法确切地表明两个变量之间相关的程度,不够精确。对于不同类型的变量数据,我们可以采用各种不同的相关系数来具体度量变量间相关的程度。

著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。

依据相关现象之间的不同特征,其统计指标的名称有所不同。

如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);

将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;

将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.iqinshuo.com/6768.html