LOADING

加载过慢请开启缓存 浏览器默认开启

贝叶斯:认识真实的世界(1)

2025/6/12 Tech

写在前面

在开始这篇文章以前,笔者有一些话不得不一吐为快

中国的义务教育缺乏逻辑学,这已经是一个公认的事实。无论在什么社交平台上,无论对于什么现象或话题,我们都能看到大量词不达意、胡搅蛮缠的发言,而人云亦云、对这些发言深信不疑者更是不在少数。大多数人缺乏自己的思考与推断,只是不停地重述着从别人那里得来的某个观点,已经让一小部分有独立思考能力的人受尽折磨,不堪其扰

于是笔者决定用这篇文章作为某种“启蒙”。我们常听别人说“先问是不是,再问为什么”,这句话让我们注重对客观世界的观察是否正确。本文则强调后半句话,告诉大家:在完成了对客观世界的观察后,该如何通过紧密的逻辑完成信息推断,得出合理的结论

本文基于贝叶斯公式——这个高中生都能烂熟于心的概率公式,期望用它来完成一系列与概率有关的逻辑推理与信息推断

希望能够用轻松的方式,改变你认识的世界
$$
P(A|B) = P(A)\frac{P(B|A)}{P(B)}
$$

黑白思维vs概率思维

我们或多或少都见过那种固执己见的人。对于某个现象,他们总能不假思索地给出自己的解释,并对此深信不疑。即使旁人给出了不同的观点,或者又出现了新的现象,他们也从不会去思考其它可能性

对于这样的人,我会说他们拥有黑白思维

黑白思维:对于某个现象,先入为主地给出自己的一个观点或解释,然后收集能够佐证自己观点的证据,最后加深对自己观点的信心

你可能已经发现这种思维方式的问题了:一开始的观点就是最后的结论,观察到的证据没有起到任何作用。我可以毫不客气地说,对于这样的思维方式,一切观测的信息量都几乎为0

与黑白思维相对的,是我提倡的概率思维

概率思维:对于某个现象,考虑几种观点或解释,思考它们成立的概率,最后取一个概率最大的观点作为结论

问题来了,你怎么知道哪个概率最大?你用什么手段确定它的概率最大?

所以,下面介绍一种朴素的概率思维:最大似然估计

最大似然估计

似然概率

现在有一个现象A,对于这个现象,我们提出原因1、原因2、原因3这三种可能的原因。分别在这三种原因下,现象A发生的概率就叫做似然概率

  • P(现象A|原因1)
  • P(现象A|原因2)
  • P(现象A|原因3)

似然概率的意义是原因对现象的“解释力”。似然概率越高,代表在这种原因下发生现象A的可能性越大,就是这种原因对现象的解释力更大

哪个原因解释得最好?

最大似然估计,就是找一个对该现象解释得最好的原因作为最后的原因,也就是找一个似然概率最大的原因

最大似然估计体现了最朴素的概率思维,最符合我们的直觉。从这一步开始,面对生活中的一切现象,你就已经培养起了最基本的逻辑能力,再也不会固步自封

你为什么害怕坐飞机

想象这样一个场景

假期伊始的你正在飞机上,准备去度假享受美好时光。突然飞机剧烈颠簸起来,你害怕极了,大脑一片空白,心脏快要跳到嗓子眼

即使理性提醒你飞机坠落的概率极低,但是你仍然无比担心飞机出现事故,为什么?因为你的大脑自动帮你计算了似然概率,进行了最大似然估计

P(剧烈颠簸 | 飞机即将坠落) = 1,只要飞机坠落,一定会出现剧烈颠簸

P(剧烈颠簸 | 飞机只是遇见气流) = 0.1,如果飞机遇见气流,只有比较小的概率会出现剧烈颠簸

因此你的直觉告诉你危险,因为它认为飞机即将坠落这个原因能更好地解释剧烈颠簸,自动把剧烈颠簸归因为飞机即将坠落

那么,这种论断是否正确呢?

一段时间后,这次飞机正常降落了,并没有出现事故,你也安全抵达了目的地。你可能会觉得很幸运地没有遇到事故,可如果我告诉你这不是幸运,而是几乎必然出现的结果呢?

让我们接下来正式进入贝叶斯定理

贝叶斯定理

让我们回到刚才的飞机上,你肯定已经发现了最大似然估计在逻辑上的某点不合理之处

P(剧烈颠簸 | 飞机即将坠落) = 1,这个条件概率引导了我们的直觉,让我们觉得自己身处险境。然而,仔细想一想我们所处的境遇

现象:飞机出现颠簸

原因

  • 飞机即将坠落
  • 飞机只是遇见气流

我们已知的是飞机出现颠簸,未知的是原因,因此条件概率应该这么写:

P(飞机即将坠落 | 剧烈颠簸) = ?,在剧烈颠簸的情况下,飞机即将坠落的可能性是多少呢?

P(飞机只是遇见气流 | 剧烈颠簸) = ?,在剧烈颠簸的情况下,飞机只是遇见气流的可能性是多少呢?

发现最大似然估计的不合逻辑之处了吗?它只关注了原因对现象的解释力,而实际上原因究竟是什么,取决于上面的两个条件概率

用贝叶斯定理解答上面的两个式子吧
$$
P(飞机即将坠落|剧烈颠簸) = P(飞机即将坠落)\frac{P(剧烈颠簸|飞机即将坠落)}{P(剧烈颠簸)}
$$

$$
P(飞机只是遇见气流|剧烈颠簸) = P(飞机只是遇见气流)\frac{P(剧烈颠簸|飞机只是遇见气流)}{P(剧烈颠簸)}
$$

先验概率

用贝叶斯定理展开条件概率后,右侧的部分就是似然概率/定值,而左边的部分代表的是这个原因本身发生的概率,我们称为先验概率

先验概率,是在我们拿到观测之前,对于该原因本身成立概率的评估,这就是该原因的基础概率

后验概率

好了,我们该对P(飞机即将坠落 | 剧烈颠簸) 和P(飞机只是遇见气流 | 剧烈颠簸) 这两个条件概率改个称呼了,从今以后它们就叫做后验概率,即,在得到了某观测后,认为是某原因的概率
$$
后验概率 = 先验概率\frac{似然概率}{P(观测)}
$$
后验概率的相对大小取决于先验概率×似然概率

别再害怕坐飞机

好了,让我们回到你飞机颠簸的那个时刻,你本能地依旧很害怕,但是如果你冷静地掏出纸笔来计算一下在当前现象下飞机坠毁的概率,能让你镇定不少

从我国有民航开始,只发生过9起有人员伤亡的空难,从统计数据来讲,飞机坠落的概率极低:

P(飞机即将坠落) = $2 \cdot 10^{-7}$

飞机遇到气流就比这要常见多了:

P(飞机遇见气流) = 0.2

有了先验概率,让我们来计算后验概率的相对大小
$$
P(飞机即将坠落|剧烈颠簸) = 2 \cdot 10^{-7} \cdot 1 = 2 \cdot 10^{-7}
$$

$$
P(飞机只是遇见气流|剧烈颠簸) = 0.2 \cdot 0.1 = 0.02
$$

所以飞机只是遇见气流的可能性远远大于飞机即将坠落的可能性,你不必担心

奥卡姆剃刀与贝叶斯定理

这部分做为一个小科普吧

“奥卡姆剃刀”是14世纪逻辑学家奥卡姆提出的一个法则:如非必须,勿增实体

如果关于一个或多个现象,有许多种理论都能做出同样准确的解释,那么应该挑选那个最简单的

是不是感觉和贝叶斯有异曲同工之妙

如果用贝叶斯来解释,就是在似然概率相同的情况下,选择先验概率较大的原因。因为先验概率较大说明该原因更容易发生,也就是更简单