相关性不等于因果关系——两个很好的例子

Buy owner data from various industry. Like home owner, car owner, business owner etc type owner contact details
Post Reply
shapanssgr
Posts: 8
Joined: Sat Dec 07, 2024 8:27 am

相关性不等于因果关系——两个很好的例子

Post by shapanssgr »

不久前,我在 LinkedIn 上看到一篇帖子,讲的是两组看似相关的数据如何直接等同于收入……我羞愧地低下了头。

我将通过一些例子来说明相关性如何暗示一种联系。

在使用两个不同事物的视觉效果时确实需要小心,通常还有另一个第三个变量在起作用,它会对两个值产生影响,女士们先生们,这被称为混杂因素。

相关性和因果关系的坏例子。
我从Tyler Vigens 的网站上获取了一些统计数据,并重现了人们认为相关性较高的变量的影响。

我相信在看到这张精彩的图片之前,我们都会同意,街机 使用此服务的好处 游戏收入和计算机科学博士学位之间绝对没有任何关系。事实上,它们之间没有关系。但如果以一种有意义的方式呈现,你可能会让某人相信,如果街机游戏收入增加,计算机科学博士学位也会增加。

这样想想,如果我提出这样的想法:网站内容的数量会直接影响收入,SEO 人员就会打我的脸并把我塞进传真机里。

这就是混杂因素出现的地方。

Image

在我上面的打脸例子中,混杂因素代表了大量变量和努力,例如关键词研究、内容创作和少量公关,以及许多其他变量。所有这些都有助于网站成功。

现在来看一个相关性的好例子
很自然地,人们会认为在炎热的天气里人们会购买更多的冰淇淋,对吧?对吧?好吧,我在Maths Is Fun上看到了一个数据集,它完美地证明了这篇文章的观点。

好吧,天哪,亲爱的读者,看来你是对的。看来气温升高时冰淇淋的销量确实会上升。

这被称为回归图,它使用统计数据来计算直线的系数,也称为“最佳拟合线”或斜率。

此值显示事物之间的相关性,值可以是 1 到 -1 之间的任何值。两个极端都显示高度正相关或负相关。

上图确实表明 ,随着气温升高,冰淇淋销量也会上升。根据这个数据集,我们可以说这是正确的,准确率为 91%。当然会有一个峰值,如果气温达到 40 摄氏度,许多人就不会出门去冒险变成西红柿了,这也是混杂因素的另一个很好的例子。
Post Reply