世界是随机的:大数据时代的概率统计学
上QQ阅读APP看书,第一时间看更新

1.2 随机事件:翻飞的硬币

我的家乡邻近长白山,那一年,我终于登上了长白山,见到了传说中的天池。站在山顶向下望,天池宛若一面蓝色的魔镜,静如止水,莫过如此。上山之前,很多人说,想看到天池要靠运气,没多一会儿,我就明白了此言不虚。刚刚还晴空万里、阳光普照,转瞬间就是大雾弥漫,我和父亲母亲只能手拉着手站在原地,生怕在白茫茫的雾气中走失。再过一会儿,雾气缓缓消散,正当大家拿出相机要继续拍照时,乌云袭来,风雨大作,我们纷纷披上雨衣,站在寒风中瑟瑟发抖。那是我第一次感到大自然的风云变幻。

自古至今,人们都在试图回答一个哲学命题:我们生活在一个确定的世界还是不确定的世界?我们很确信,苹果熟透了,会从树上掉下来,但我们又不能确定,抛起的硬币落到地上时,哪一面会朝上。对此,哲学领域有两种不同的论断。

决定论:它是指自然界和人类社会普遍存在着客观规律和必然的因果联系,也就是说,如果我们能够发现和理解所有的客观规律和因果联系,自然界和人类社会的任何变化都是可以预知的,我们之所以还做不到,是因为我们对客观规律的认识还不够。

非决定论:与决定论相对,非决定论否认自然界和人类社会普遍存在着客观规律和必然的因果联系,认为事物的发展变化是没有客观规律的,是由事物内在的“自由意志”决定的,也就是说,人们可以自由支配自己的行为,却无法预言客观事物的发展变化和其他人的行为。

我们似乎更容易认同非决定论,毕竟世界如此纷繁复杂,我们只能控制自己,很难预知未来。但我们不能轻易否定决定论,抛开两个论断的对错之争,决定论为我们认识世界提供了新的思路。下面,我们就来做一个“抛硬币”的思想实验。

思想实验:抛硬币

抛硬币是大家十分熟悉的小把戏,足球比赛前,裁判会用抛硬币的方式让双方挑边,大家似乎默认抛出的硬币落到手上或地上时,正面和反面朝上的可能性是相同的。但是,决定论的支持者们对此表示怀疑,他们提出了如下的思想实验。

实验1.0

假定有一台超高速摄像机和一台超级力学计算器,摄像机自带摇臂,可以跟拍动态画面,并对拍摄到的画面进行实时分析,分辨画面中的物体,提取物体的运动参数,这些参数又被实时的传输到力学计算器,力学计算器可以根据此前的数据计算出物体下一时刻的运动状态。

我们用超高速摄像机对准手上的硬币,然后,抛起硬币!超高速摄像机与硬币一起向上升,又一起向下降,最后,在硬币即将落到手上时,力学计算器输出了计算结果:正面向上。你展开手掌,露出了硬币,果然是正面。

我们在实验中加入了一位超级观察员——由超高速摄像机和超级力学计算器组合而成。只要你不是魔术师,也不刻意作弊,在硬币即将落到手上时,超级观察员一定可以准确地告诉你硬币的哪一面向上。请问:抛硬币的结果是随机的吗?

我的回答依然是:随机的。原因是,硬币在运动过程中,可能受到各种因素的干扰,力学计算器只能做出短时间的预测,所以,超级观察员只能在硬币即将落到手上时,才能计算出硬币哪一面向上,因此,在硬币抛起时,即使是超级观察员也无法预测硬币的哪一面向上。为了反驳这两点,我们将思想实验升级为2.0版。

实验2.0

在实验1.0的基础上,我们加入如下条件:一是每次硬币抛掷的周围环境都一样;二是你的手升级为超级机器手,内置力学传感器,你抛起硬币时对硬币施加的力全部会被记录在传感器的芯片中,同时,超级机器手还可以自由设定抛硬币使用的力,也就是说,你可以复现曾经出现过的硬币抛掷过程。再次请问:抛硬币的结果是随机的吗?

这时,我有些语塞了,在这样的条件下,如果我们利用超级机器手重复此前的某一次抛掷,那就意味着,在硬币刚刚抛出时,我们就知道了结果,这时,抛硬币的结果是确定的!如果我们利用这套装置不断进行抛硬币练习,就会收集越来越多的硬币抛掷结果,然后,这只超级机器手就会成为一个开关,它既可以再现过去的抛掷过程,准确预言抛掷结果,也可以进行一次新的抛掷,让结果随机出现。这只超级机器手掌控着一切,仿佛“造物主”一样!

决定论的极限表达是“造物主”,造物主知晓一切,造物主决定一切,造物主预知一切。这种宗教化的解释自然不在我们的讨论范围内,但“决定论”赋予我们一个很有价值的思想:不断探索自然,不断寻找客观规律。试想,在牛顿发现万有引力之前,已有千千万万个苹果落到了地上,难道我们该认为,这些苹果拥有“自由意志”,竟然不约而同地冲向地面吗?这个看似必然发生的事件,正是万有引力定律引起的,对这个确定性事件的解释,让我们对大自然的认识更加深刻,也正是“决定论”指引我们不断探索下去。

度量随机事件

我们从思想实验中跳脱出来,回到现实世界。在现实世界中,每时每刻都在发生各种各样的事情,有的事像苹果落地一样,有确凿无疑的结果,而有的事却像抛硬币一样,无法预知结果。数学家们既不是决定论者,也不是非决定论者,他们从数学的角度审视万事万物,概率论由此而来。

抽象地讲,概率论站在无知者和造物主之间审视世界,力图从现实世界中发现客观规律,帮助我们更深刻的认识现实世界。

在概率论的世界里,抛硬币、掷骰子等被统称为随机试验,每一个随机试验都会有一个或多个可能的结果,一个结果或某些结果的组合称为随机事件。

举例来说,抛硬币是一个随机试验,抛硬币可能的结果有两个:正面和反面。我们用一个大写字母来代表随机事件,那么,我们可以得到如下的四个随机事件。

A:抛硬币出现正面

B:抛硬币出现反面

C:抛硬币出现正面或反面

D:抛硬币既不出现正面也不出现反面

随机事件C和随机事件D往往会给初学概率论的人带来困扰,随机事件C根本就不是“随机”事件,分明就是一定会发生的确定性事件,随机事件D正相反,是一定不会发生的事件,自然也不是“随机”事件。概率论是一门完备的科学,它要涵盖所有的事件,而不是只研究那些“随机”事件,为此,我们需要一个度量随机事件的工具——概率。

概率,用于度量随机事件发生的可能性,是个定量指标,用大写字母P来表示。例如,随机事件A发生的概率是50%,可以写成:

PA)=50%

概率有以下两个特性:

(1)概率是非负的,即对于任意随机事件A, PA)≥0;

(2)对于任一随机试验,我们假定所有可能的结果有n种(n>0),分别记为A1, A2, …, An,如果这些结果两两之间都不可能同时出现,则PA1)+PA2)+…+PAn)=1。

事实上,在概率论所描述的数学世界中,所有的事件都是随机事件,如果一个事件不可能发生,我们认为它发生的概率是0,如果一个事件必然发生,我们认为它发生的概率是1。下面我们举两个有争议的例子。

随机事件A:公鸡下蛋。

这违背常识,不可能发生,PA)=0。

随机事件B:人终有一死。

这是个客观事实,必然发生,PB)=1。

就大多数人的认知,这两个概率是正确的。可是,生物学家或许会质疑这两个概率,甚至罗列一长串的生物新技术来反驳这两个概率。没错,我承认这两个概率可能是错误的,正如崔健唱的那样:“不是我不明白,这世界变化快。”世界在变化,概率也在变化,唯一不变的是:所有的事件都是随机事件。