本福特法则的例子:为什么以“1”开头的数字出现频率最高?

在进入正题之前,大家可以先思考两个问题。

第一个问题:如果你看到一本书的前几页比后面的书页被翻得更烂,你会想到什么?

第二个问题:从全世界所有城市的海拔高度数据中,提取出每个数据的第一位数字。比如海拔4567米,提取出的第一位数字就是“4”。那么在所有数字里面,1到9哪一个数字出现的次数最多,所有数字的分布又会是怎样的?

对于第一个问题,大部分人都会想:这是一本无聊的书,人们看了开头就看不下去了,所以把前面的书页翻得很烂,后面还是很新——如果你只想到这么多,那么你可能就错过了一个流芳百世的机会。

对于第二道题,大部分人认为:第一位数字的分布应该是平均的,第一位数字不可能是0,那么只能是1到9,每一个数字出现的频率应该是1/9,就是11%左右——如果你也是这么认为的,那么你就大错特错了。

通过真正的数据统计分析可以发现,这些海拔高度数据的第一位数字的分布其实不是平均分布。它们的分布实际上是这样的:数字1出现的概率在30%左右,远远高于数字2的18%、数字3的13%……9出现的概率大概只有不到5%。

这就是著名的“本福特法则”。从实际生活中得出的数据里,以1为首的数字的出现概率约为总数的三成,接近期望值1/9的3倍。

本福特法则其实不是一个新的法则,在100多年前,数学家们就发现了这一现象。

1881年,有一个叫西蒙·纽康的加拿大天文学家,他发现对数表以1起首的那几页比其他页被翻得更烂。但西蒙和大多数人一样,当时也没有往深处想,所以他错过了一个在科学史上留名的机会。

直到半个世纪以后,大概1938年的时候,美国工程师,同时也是物理学家的法兰克·本福特重新发现了这个现象,但他比西蒙认真多了,他立刻想到:这个现象会不会和数字1有关系,以1开头的数字多,所以人们查对数表的时候翻的次数就多,以1开头的书页就比别的书页被翻得更烂。

他接下来收集了更多数据进行分析,发现还真是那么回事儿,于是本福特法则诞生了,法兰克也在科学史上留下了自己的名字。

但这是为什么呢?

虽然本福特发现了这个现象,但他当时并没能很好地解释这个现象,数学家、科学家们也一直不是很清楚。

直到1961年,有个美国科学家提出:本福特法则其实是数字叠加造成的现象。比如我们假设股市指数一开始是1000点,以每年10%的速度在上升,那么要用7年多的时间,指数才能升到2000点以上。而从2000点上升到3000点,如果也是以10%的速度上升的话,只需要4年多的时间。同样,从10000点到20000点又需要7年多,从20000点到30000点只需要4年多的时间。所以,以1开头的股票指数数据比以其他数字开头的股票数据要多很多。

这个说法有一定道理,因为科学家也发现,并不是所有数字都符合本福特法则。只有那些统计数字,比如说人口、海拔、股票才符合本福特法则;按规律排列的数字,比如发票或者身份证编号,经过人工修饰生成的数字都不符合本福特法则。

版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。http://www.iqinshuo.com/3618.html