有哪些必赢的赌局？

题目

赌局规则如下：

两人各自亮出硬币的一面
如果两人都是正面，那么 A 给 B 3 元
如果两人都是反面，那么 A 给 B 1 元
剩下的情况（即一正一反），B 给 A 2 元

直觉误区：它看起来像一个“公平概率题”

一个很常见的错误解法是：

两人都正面的概率是 $1/4$
两人都反面的概率是 $1/4$
一正一反的概率是 $1/2$

于是 B 的期望收益似乎是：

E (B) = \frac{1}{4} \times 3 + \frac{1}{4} \times 1 - \frac{1}{2} \times 2 = 0

因此表面上看，这好像是个公平游戏。

关键纠正：这不是抛硬币，而是“选策略”

这道题真正的问题在于：

亮出正面还是反面，不是随机抛硬币，而是参与者可以自行控制的策略选择。

所以它不是一个普通的概率题，而是一个经典的：

零和混合策略博弈问题。

也就是说，双方不是被动接受概率，而是在选择：

我多大概率出正面？
多大概率出反面？

一、把问题写成策略模型

设：

A 出正面的概率为 $p_{1}$
B 出正面的概率为 $p_{2}$

那么 A 的期望收益为：

E (A) = - 3 p_{1} p_{2} - (1 - p_{1}) (1 - p_{2}) + 2 [p_{1} (1 - p_{2}) + (1 - p_{1}) p_{2}]

对应地，B 的期望收益为：

E (B) = 3 p_{1} p_{2} + (1 - p_{1}) (1 - p_{2}) - 2 [p_{1} (1 - p_{2}) + (1 - p_{1}) p_{2}]

因为是零和博弈，所以：

E (B) = - E (A)

二、这个游戏的核心：混合策略纳什均衡

这类题的关键不是“算一次期望”，而是找：

双方在什么概率策略下，谁都没有动力单方面改变自己的选择。

这就是混合策略纳什均衡。

原答案给出的结论是：

(p_{1}, p_{2}) = (\frac{3}{8}, \frac{3}{8})

也就是说：

A 以 $3/8$ 的概率出正面
B 也以 $3/8$ 的概率出正面

这是这个博弈的唯一混合策略纳什均衡。

三、为什么是 $3/8$ ：直观理解

混合策略均衡的一个常见思路是：

让对手无论选哪种纯策略，得到的期望都一样。

这样对手就不会偏向某一边，也就达成均衡。

对 A 来说，需要让 B 觉得：

选正面
或选反面

得到的期望是一样的。

原答案给出的方程是：

- 3 p_{1} + 2 (1 - p_{1}) = - 1 (1 - p_{1}) + 2 p_{1}

左边表示 B 出正面时，A 的收益；右边表示 B 出反面时，A 的收益。

解得：

p_{1} = \frac{3}{8}

同理也可以推出：

p_{2} = \frac{3}{8}

四、均衡下谁占优

如果 A 采用均衡策略 $p_{1} = 3/8$ ，并设 B 以任意概率 $y$ 出正面，那么 B 的期望收益是：

E (B) = (\frac{3}{8}) \cdot 3 y + (\frac{5}{8}) (1 - y) - 2 [(\frac{3}{8}) (1 - y) + (\frac{5}{8}) y]

化简后得到：

E (B) = - \frac{1}{8}

也就是说：

无论 B 怎么选，只要 A 采用了最优混合策略，B 的平均收益都是每轮亏 $1/8$ 元。

于是 A 的平均收益就是：

E (A) = \frac{1}{8}

五、这道题真正说明了什么

这题最值得记的，不是某个具体结果，而是下面这个判断：

1. 不能把“策略选择”误当成“自然概率”

如果双方的行为是可控的，那么概率就不再是题目直接给定的，而是参与者自己决定的。

2. 零和博弈里的关键不是算静态期望

而是找出：

最优策略
对手最优应对
最终均衡点

3. “看起来公平”不等于真的公平

表面上按 $1/4, 1/4, 1/2$ 去算是公平的，但一旦允许双方主动选策略，游戏结构就变了。

六、原答案补充的一个公平版本

原文还给了一个对照规则：

两硬币同一面，则 A 给 B 2 元
一正一反，则 B 给 A 2 元

在这个版本下，作者认为：

对 A、B 都公平，即不论采取何种策略，都无法保证赢，期望等于零。

这个对照很有启发性：

有的博弈一眼看着对称，实际上不公平
有的规则改动一点，就真的变成公平博弈

七、这篇笔记最值得记住的结论

1. 这道题不是概率题，而是博弈论题

重点不在随机，而在策略。

2. 误区在于默认双方“各 50% 出正反面”

实际上，参与者完全可以调整自己的出手概率。

3. 该博弈的唯一混合策略纳什均衡是：

p_{1} = p_{2} = \frac{3}{8}

4. 在最优策略下，A 才是长期占优的一方

A 每轮平均赢：

\frac{1}{8}

B 每轮平均输：

- \frac{1}{8}

5. “必赢”在这里不是每局都赢

而是：

长期重复博弈下，只要使用最优混合策略，期望上稳定占优。

NeoXmind 数字花园

探索

有哪些必赢的赌局？

题目

直觉误区：它看起来像一个“公平概率题”

关键纠正：这不是抛硬币，而是“选策略”

一、把问题写成策略模型

二、这个游戏的核心：混合策略纳什均衡

三、为什么是 $3/8$ ：直观理解

四、均衡下谁占优

五、这道题真正说明了什么

1. 不能把“策略选择”误当成“自然概率”

2. 零和博弈里的关键不是算静态期望

3. “看起来公平”不等于真的公平

六、原答案补充的一个公平版本

七、这篇笔记最值得记住的结论

1. 这道题不是概率题，而是博弈论题

2. 误区在于默认双方“各 50% 出正反面”

3. 该博弈的唯一混合策略纳什均衡是：

4. 在最优策略下，A 才是长期占优的一方

5. “必赢”在这里不是每局都赢

关系图谱

目录

NeoXmind 数字花园

探索

有哪些必赢的赌局？

题目

直觉误区：它看起来像一个“公平概率题”

关键纠正：这不是抛硬币，而是“选策略”

一、把问题写成策略模型

二、这个游戏的核心：混合策略纳什均衡

三、为什么是 3/8：直观理解

四、均衡下谁占优

五、这道题真正说明了什么

1. 不能把“策略选择”误当成“自然概率”

2. 零和博弈里的关键不是算静态期望

3. “看起来公平”不等于真的公平

六、原答案补充的一个公平版本

七、这篇笔记最值得记住的结论

1. 这道题不是概率题，而是博弈论题

2. 误区在于默认双方“各 50% 出正反面”

3. 该博弈的唯一混合策略纳什均衡是：

4. 在最优策略下，A 才是长期占优的一方

5. “必赢”在这里不是每局都赢

关系图谱

目录

三、为什么是 $3/8$ ：直观理解