贝叶斯定理之所以重要,不只是因为它是一个概率公式,而是因为它提供了一种非常通用的思考框架:
在信息不完全的情况下,先给出一个初步判断,再根据新信息不断修正这个判断。
这也是它能广泛应用在:
- 投资
- 医疗检测
- 机器学习
- 搜索与垃圾邮件过滤
- 自动驾驶
- 日常判断与决策
等领域的原因。
一、贝叶斯定理到底有什么用
文章一开始强调了一个关键点:
现实中的很多问题,不是“已知全部条件后计算概率”,而是:
只掌握了部分信息,却仍然要对事情做判断。
这类问题,本质上都是“逆概率”问题。
正向概率 vs 逆概率
如果我们知道一个抽奖桶里有:
- 2 个白球
- 8 个黑球
那么抽到白球的概率很好算,这是正向概率。

但如果我们并不知道桶里有什么,只是摸出了一个球,然后试图根据这个球的颜色去推测桶里白球和黑球的比例,这就是逆概率。

贝叶斯定理擅长处理的,就是这类:
- 信息不全
- 需要推断原因或状态
- 需要随着新证据不断更新判断
的问题。
二、贝叶斯定理的核心思想
先看公式:

如果只记公式,往往容易忘;但如果记住它背后的结构,就很好理解了。
可以把它理解成三部分
1. 先验概率(Prior)
在没有看到新信息前,对某件事先做出的初步判断。
2. 可能性函数 / 似然(Likelihood)
新信息出现后,这个信息会把原先判断往哪个方向推。
3. 后验概率(Posterior)
把新信息纳入后,对这件事重新更新得到的概率。
所以,贝叶斯定理最适合记成一句话:
后验概率 = 先验概率 × 新信息带来的修正
或者更口语一点:
先猜一个,再根据证据改。
三、作者举的入门例子:女神冲你笑,喜欢你的概率会更新吗
文中用了一个轻松的例子来解释贝叶斯思维。
已知:
- 事件 A:女神喜欢你
- 事件 B:女神经常冲你笑
那么问题就是:
在“女神经常冲你笑”这个信息出现后,她喜欢你的概率会不会提升?

作者先设一个主观先验:
- 原本喜欢你的概率先假设为 50%
然后引入一个新判断:
- 女神平时对别人不太笑,却经常对你笑
- 说明这个信息对“她喜欢你”是有增强作用的
于是后验概率被更新成更高值。



这个例子虽然不严肃,但很适合记住贝叶斯的本质:
新信息不是凭空替代旧判断,而是在旧判断的基础上进行更新。
再看这一张图,会更直观:

以及这个图示:

四、全概率公式:为什么经常要和贝叶斯一起出现
在实际计算里,贝叶斯公式中常常需要先求一个总概率 P(B)。
这时会用到全概率公式。
相关图示如下:



直观理解就是:
某个结果 B 的总概率,等于它在各种可能来源下出现的概率加总起来。
这也是贝叶斯在很多应用题里必须配套使用的工具。
五、案例一:两个糖果碗的问题
题目是:
- 1 号碗:30 个巧克力,10 个水果糖
- 2 号碗:20 个巧克力,20 个水果糖
- 随机选一个碗,摸出一个巧克力
问:
这颗巧克力来自 1 号碗的概率是多少?
图示如下:

作者把这个问题拆成:
- A1:来自 1 号碗
- A2:来自 2 号碗
- B:摸出的是巧克力
然后利用贝叶斯定理和全概率公式去算:


最终结果是:
在摸出巧克力之后,这颗糖来自 1 号碗的概率从原本的 50%,更新成了 60%。

这个例子很适合记住一点:
证据不会凭空决定答案,但会改变原先判断的权重。
六、案例二:医疗检测为什么不能只看“准确率”
这是贝叶斯最经典、也最容易颠覆直觉的应用之一。
题目设定:
- 某疾病发病率:0.001
- 检测准确率:0.99
- 误报率:5%
现在一个人检测结果为阳性,问:
他真的得病的概率有多大?
公式和图如下:


最后算出来的结果非常反直觉:
即使检测准确率高达 99%,一个检测阳性的人,真正患病的概率也只有 1.94%。

为什么会这样?
因为:
- 真正患病的人本来就极少
- 虽然检测对患者很准,但对大量正常人来说,哪怕只有 5% 误报,也会积累出大量假阳性
这个案例说明:
不能只看检测“准确率”,还必须看疾病本身的基准发生率(先验概率)。
这也是为什么很多疾病筛查:
- 第一次阳性不能直接确诊
- 需要复检
- 甚至需要送更高等级实验室再次确认
因为多次检测,本质上是在不断引入新证据,持续更新后验概率。
七、案例三:贝叶斯垃圾邮件过滤
垃圾邮件过滤器也是贝叶斯很经典的应用。
原理很简单:
- 某些词在垃圾邮件中出现得更频繁
- 当这些词不断同时出现时,邮件属于垃圾邮件的后验概率会越来越高
作者提到,贝叶斯过滤器的优势在于:
- 能处理改写过的垃圾邮件
- 错判率低
- 初始值不用特别精确,也能在持续更新中逐渐逼近真实
这也是为什么贝叶斯方法在机器学习里如此重要:
它特别适合处理“先有不完全判断,再用数据不断修正”的任务。
八、生活中的贝叶斯思维
作者最后把贝叶斯定理和日常认知联系起来,这部分很值得保留。
核心意思是:
人脑很多时候本来就在用“贝叶斯式更新”做判断。
比如小孩学词语时:
- 先根据情境猜一个意思
- 再通过反馈不断修正
- 用对了就强化
- 用错了就调整
作者把它概括成和大脑决策机制很接近的过程:

所以在生活中,贝叶斯思维可以简化成三步:
1. 分解问题
先弄清楚:
- 你到底在判断什么
- 已知条件是什么
- 新信息是什么
2. 给出一个初步判断
这不是瞎猜,而是结合经验、常识、已有知识给一个先验判断。
3. 根据新信息持续更新
如果新证据支持原先判断,就提高其可信度; 如果新证据不支持,就降低可信度,甚至改写原来的判断。
这也是一句很经典的话:
大胆假设,小心求证。