贝叶斯定理厉害在哪里？

贝叶斯定理之所以重要，不只是因为它是一个概率公式，而是因为它提供了一种非常通用的思考框架：

在信息不完全的情况下，先给出一个初步判断，再根据新信息不断修正这个判断。

这也是它能广泛应用在：

投资
医疗检测
机器学习
搜索与垃圾邮件过滤
自动驾驶
日常判断与决策

等领域的原因。

一、贝叶斯定理到底有什么用

文章一开始强调了一个关键点：

现实中的很多问题，不是“已知全部条件后计算概率”，而是：

只掌握了部分信息，却仍然要对事情做判断。

这类问题，本质上都是“逆概率”问题。

正向概率 vs 逆概率

如果我们知道一个抽奖桶里有：

2 个白球
8 个黑球

那么抽到白球的概率很好算，这是正向概率。

但如果我们并不知道桶里有什么，只是摸出了一个球，然后试图根据这个球的颜色去推测桶里白球和黑球的比例，这就是逆概率。

贝叶斯定理擅长处理的，就是这类：

信息不全
需要推断原因或状态
需要随着新证据不断更新判断

的问题。

二、贝叶斯定理的核心思想

先看公式：

如果只记公式，往往容易忘；但如果记住它背后的结构，就很好理解了。

可以把它理解成三部分

1. 先验概率（Prior）

在没有看到新信息前，对某件事先做出的初步判断。

2. 可能性函数 / 似然（Likelihood）

新信息出现后，这个信息会把原先判断往哪个方向推。

3. 后验概率（Posterior）

把新信息纳入后，对这件事重新更新得到的概率。

所以，贝叶斯定理最适合记成一句话：

后验概率 = 先验概率 × 新信息带来的修正

或者更口语一点：

先猜一个，再根据证据改。

三、作者举的入门例子：女神冲你笑，喜欢你的概率会更新吗

文中用了一个轻松的例子来解释贝叶斯思维。

已知：

事件 A：女神喜欢你
事件 B：女神经常冲你笑

那么问题就是：

在“女神经常冲你笑”这个信息出现后，她喜欢你的概率会不会提升？

作者先设一个主观先验：

原本喜欢你的概率先假设为 50%

然后引入一个新判断：

女神平时对别人不太笑，却经常对你笑
说明这个信息对“她喜欢你”是有增强作用的

于是后验概率被更新成更高值。

这个例子虽然不严肃，但很适合记住贝叶斯的本质：

新信息不是凭空替代旧判断，而是在旧判断的基础上进行更新。

再看这一张图，会更直观：

以及这个图示：

四、全概率公式：为什么经常要和贝叶斯一起出现

在实际计算里，贝叶斯公式中常常需要先求一个总概率 P(B)。

这时会用到全概率公式。

五、案例一：两个糖果碗的问题

题目是：

1 号碗：30 个巧克力，10 个水果糖
2 号碗：20 个巧克力，20 个水果糖
随机选一个碗，摸出一个巧克力

问：

这颗巧克力来自 1 号碗的概率是多少？

图示如下：

作者把这个问题拆成：

A1：来自 1 号碗
A2：来自 2 号碗
B：摸出的是巧克力

然后利用贝叶斯定理和全概率公式去算：

最终结果是：

在摸出巧克力之后，这颗糖来自 1 号碗的概率从原本的 50%，更新成了 60%。

这个例子很适合记住一点：

证据不会凭空决定答案，但会改变原先判断的权重。

六、案例二：医疗检测为什么不能只看“准确率”

这是贝叶斯最经典、也最容易颠覆直觉的应用之一。

题目设定：

某疾病发病率：0.001
检测准确率：0.99
误报率：5%

现在一个人检测结果为阳性，问：

他真的得病的概率有多大？

公式和图如下：

最后算出来的结果非常反直觉：

即使检测准确率高达 99%，一个检测阳性的人，真正患病的概率也只有 1.94%。

为什么会这样？

因为：

真正患病的人本来就极少
虽然检测对患者很准，但对大量正常人来说，哪怕只有 5% 误报，也会积累出大量假阳性

这个案例说明：

不能只看检测“准确率”，还必须看疾病本身的基准发生率（先验概率）。

这也是为什么很多疾病筛查：

第一次阳性不能直接确诊
需要复检
甚至需要送更高等级实验室再次确认

因为多次检测，本质上是在不断引入新证据，持续更新后验概率。

七、案例三：贝叶斯垃圾邮件过滤

垃圾邮件过滤器也是贝叶斯很经典的应用。

原理很简单：

某些词在垃圾邮件中出现得更频繁
当这些词不断同时出现时，邮件属于垃圾邮件的后验概率会越来越高

作者提到，贝叶斯过滤器的优势在于：

能处理改写过的垃圾邮件
错判率低
初始值不用特别精确，也能在持续更新中逐渐逼近真实

这也是为什么贝叶斯方法在机器学习里如此重要：

它特别适合处理“先有不完全判断，再用数据不断修正”的任务。

八、生活中的贝叶斯思维

作者最后把贝叶斯定理和日常认知联系起来，这部分很值得保留。

核心意思是：

人脑很多时候本来就在用“贝叶斯式更新”做判断。

比如小孩学词语时：

先根据情境猜一个意思
再通过反馈不断修正
用对了就强化
用错了就调整

作者把它概括成和大脑决策机制很接近的过程：

所以在生活中，贝叶斯思维可以简化成三步：

1. 分解问题

先弄清楚：

你到底在判断什么
已知条件是什么
新信息是什么

2. 给出一个初步判断

这不是瞎猜，而是结合经验、常识、已有知识给一个先验判断。

3. 根据新信息持续更新

如果新证据支持原先判断，就提高其可信度；如果新证据不支持，就降低可信度，甚至改写原来的判断。

这也是一句很经典的话：

大胆假设，小心求证。

NeoXmind 数字花园

探索