贝叶斯定理之所以重要,不只是因为它是一个概率公式,而是因为它提供了一种非常通用的思考框架:

在信息不完全的情况下,先给出一个初步判断,再根据新信息不断修正这个判断。

这也是它能广泛应用在:

  • 投资
  • 医疗检测
  • 机器学习
  • 搜索与垃圾邮件过滤
  • 自动驾驶
  • 日常判断与决策

等领域的原因。

一、贝叶斯定理到底有什么用

文章一开始强调了一个关键点:

现实中的很多问题,不是“已知全部条件后计算概率”,而是:

只掌握了部分信息,却仍然要对事情做判断。

这类问题,本质上都是“逆概率”问题。

正向概率 vs 逆概率

如果我们知道一个抽奖桶里有:

  • 2 个白球
  • 8 个黑球

那么抽到白球的概率很好算,这是正向概率

但如果我们并不知道桶里有什么,只是摸出了一个球,然后试图根据这个球的颜色去推测桶里白球和黑球的比例,这就是逆概率

贝叶斯定理擅长处理的,就是这类:

  • 信息不全
  • 需要推断原因或状态
  • 需要随着新证据不断更新判断

的问题。

二、贝叶斯定理的核心思想

先看公式:

如果只记公式,往往容易忘;但如果记住它背后的结构,就很好理解了。

可以把它理解成三部分

1. 先验概率(Prior)

在没有看到新信息前,对某件事先做出的初步判断。

2. 可能性函数 / 似然(Likelihood)

新信息出现后,这个信息会把原先判断往哪个方向推。

3. 后验概率(Posterior)

把新信息纳入后,对这件事重新更新得到的概率。

所以,贝叶斯定理最适合记成一句话:

后验概率 = 先验概率 × 新信息带来的修正

或者更口语一点:

先猜一个,再根据证据改。

三、作者举的入门例子:女神冲你笑,喜欢你的概率会更新吗

文中用了一个轻松的例子来解释贝叶斯思维。

已知:

  • 事件 A:女神喜欢你
  • 事件 B:女神经常冲你笑

那么问题就是:

在“女神经常冲你笑”这个信息出现后,她喜欢你的概率会不会提升?

作者先设一个主观先验:

  • 原本喜欢你的概率先假设为 50%

然后引入一个新判断:

  • 女神平时对别人不太笑,却经常对你笑
  • 说明这个信息对“她喜欢你”是有增强作用的

于是后验概率被更新成更高值。

这个例子虽然不严肃,但很适合记住贝叶斯的本质:

新信息不是凭空替代旧判断,而是在旧判断的基础上进行更新。

再看这一张图,会更直观:

以及这个图示:

四、全概率公式:为什么经常要和贝叶斯一起出现

在实际计算里,贝叶斯公式中常常需要先求一个总概率 P(B)。

这时会用到全概率公式

相关图示如下:

直观理解就是:

某个结果 B 的总概率,等于它在各种可能来源下出现的概率加总起来。

这也是贝叶斯在很多应用题里必须配套使用的工具。

五、案例一:两个糖果碗的问题

题目是:

  • 1 号碗:30 个巧克力,10 个水果糖
  • 2 号碗:20 个巧克力,20 个水果糖
  • 随机选一个碗,摸出一个巧克力

问:

这颗巧克力来自 1 号碗的概率是多少?

图示如下:

作者把这个问题拆成:

  • A1:来自 1 号碗
  • A2:来自 2 号碗
  • B:摸出的是巧克力

然后利用贝叶斯定理和全概率公式去算:

最终结果是:

在摸出巧克力之后,这颗糖来自 1 号碗的概率从原本的 50%,更新成了 60%。

这个例子很适合记住一点:

证据不会凭空决定答案,但会改变原先判断的权重。

六、案例二:医疗检测为什么不能只看“准确率”

这是贝叶斯最经典、也最容易颠覆直觉的应用之一。

题目设定:

  • 某疾病发病率:0.001
  • 检测准确率:0.99
  • 误报率:5%

现在一个人检测结果为阳性,问:

他真的得病的概率有多大?

公式和图如下:

最后算出来的结果非常反直觉:

即使检测准确率高达 99%,一个检测阳性的人,真正患病的概率也只有 1.94%。

为什么会这样?

因为:

  • 真正患病的人本来就极少
  • 虽然检测对患者很准,但对大量正常人来说,哪怕只有 5% 误报,也会积累出大量假阳性

这个案例说明:

不能只看检测“准确率”,还必须看疾病本身的基准发生率(先验概率)。

这也是为什么很多疾病筛查:

  • 第一次阳性不能直接确诊
  • 需要复检
  • 甚至需要送更高等级实验室再次确认

因为多次检测,本质上是在不断引入新证据,持续更新后验概率。

七、案例三:贝叶斯垃圾邮件过滤

垃圾邮件过滤器也是贝叶斯很经典的应用。

原理很简单:

  • 某些词在垃圾邮件中出现得更频繁
  • 当这些词不断同时出现时,邮件属于垃圾邮件的后验概率会越来越高

作者提到,贝叶斯过滤器的优势在于:

  • 能处理改写过的垃圾邮件
  • 错判率低
  • 初始值不用特别精确,也能在持续更新中逐渐逼近真实

这也是为什么贝叶斯方法在机器学习里如此重要:

它特别适合处理“先有不完全判断,再用数据不断修正”的任务。

八、生活中的贝叶斯思维

作者最后把贝叶斯定理和日常认知联系起来,这部分很值得保留。

核心意思是:

人脑很多时候本来就在用“贝叶斯式更新”做判断。

比如小孩学词语时:

  • 先根据情境猜一个意思
  • 再通过反馈不断修正
  • 用对了就强化
  • 用错了就调整

作者把它概括成和大脑决策机制很接近的过程:

所以在生活中,贝叶斯思维可以简化成三步:

1. 分解问题

先弄清楚:

  • 你到底在判断什么
  • 已知条件是什么
  • 新信息是什么

2. 给出一个初步判断

这不是瞎猜,而是结合经验、常识、已有知识给一个先验判断。

3. 根据新信息持续更新

如果新证据支持原先判断,就提高其可信度; 如果新证据不支持,就降低可信度,甚至改写原来的判断。

这也是一句很经典的话:

大胆假设,小心求证。