Nash Equilibrium 纳什均衡

一句话定义

纳什均衡 (Nash equilibrium) 是博弈中每个参与者都在给定其他参与者策略下做出最优选择的状态——此时没有任何一方能通过单方面改变策略来提高自己的收益。

概念解析 Explanation

为什么 CFA 要考纳什均衡?

寡头垄断 (Oligopoly) 市场中,少数几家企业的决策相互依赖——你的最优行动取决于对手怎么做。这正是博弈论 (game theory) 的应用场景,而纳什均衡是分析寡头行为最核心的工具。

核心概念

博弈的三要素

  1. 参与者 (Players):做决策的主体(如两家寡头企业)
  2. 策略集 (Strategy set):每个参与者可选的行动方案
  3. 收益 (Payoff):每种策略组合下各参与者获得的结果

收益矩阵 (Payoff Matrix):将所有策略组合及其收益列成表格,是分析博弈的基本工具。

Dominant Strategy 占优策略:无论对手选什么,某策略始终是自己的最优选择。

  • 如果两个参与者都有占优策略 → 该策略组合就是纳什均衡
  • 如果只有一方有占优策略 → 对方据此反应,得出纳什均衡
  • 如果都没有占优策略 → 需要逐一排除非最优响应来寻找均衡

关键区分

  • 占优策略:不管对手怎么选,我都选这个(无条件最优)
  • 纳什均衡:给定对手的选择,我不想改变(条件最优)
  • 占优策略均衡一定是纳什均衡,但纳什均衡不一定需要占优策略

囚徒困境 Prisoner’s Dilemma

博弈论中最经典的模型,也是理解纳什均衡的最佳入门:

设定

两个嫌疑人被分开审讯,各自可以选择”沉默”或”坦白”:

B 沉默B 坦白
A 沉默A: -1, B: -1A: -10, B: 0
A 坦白A: 0, B: -10A: -5, B: -5

(数字为刑期,负数越小越好)

分析过程

A 的决策

  • 若 B 沉默 → A 坦白 (0) 优于沉默 (-1) ✓
  • 若 B 坦白 → A 坦白 (-5) 优于沉默 (-10) ✓
  • A 的占优策略 = 坦白

B 的决策(对称):

  • B 的占优策略 = 坦白

纳什均衡 = (坦白, 坦白),双方各判 5 年。

关键启示

纳什均衡不一定是最优结果!双方都沉默 (-1, -1) 明显更好,但在非合作博弈中无法实现——每方都有偏离的激励。这解释了为什么寡头垄断中的勾结 (collusion) 不稳定:即使合作(如 OPEC 限产)对所有人更好,但每家都有作弊(偷偷增产)的激励。


寡头垄断定价模型 Oligopoly Models

纳什均衡是理解以下寡头模型的共同框架:

graph TD
    NE["纳什均衡<br/>Nash Equilibrium<br/>核心分析框架"] --> K["Kinked Demand<br/>折弯需求曲线"]
    NE --> C["Cournot Model<br/>古诺模型"]
    NE --> S["Stackelberg Model<br/>斯塔克伯格模型"]
    NE --> CO["Collusion<br/>勾结/卡特尔"]

    K -->|"竞争者跟降不跟涨<br/>→ 价格粘性"| R1["解释寡头市场<br/>价格稳定现象"]
    C -->|"同时决定产量<br/>→ 均衡价格介于<br/>垄断与竞争之间"| R2["双寡头产量竞争<br/>的纳什均衡"]
    S -->|"先后决策<br/>→ 先行者优势"| R3["Leader-Follower<br/>序贯博弈均衡"]
    CO -->|"联合定价 → 短期最优<br/>但有作弊激励"| R4["囚徒困境<br/>勾结不稳定"]

    style NE fill:#e3f2fd
    style K fill:#fff3e0
    style C fill:#fff3e0
    style S fill:#fff3e0
    style CO fill:#fce4ec
模型决策变量决策时序均衡特征
Cournot产量同时均衡价格介于垄断与完全竞争之间
Stackelberg产量先后先行者 (leader) 利润 > 跟随者 (follower)
Kinked demand价格价格粘性(竞争者跟降不跟涨)
Collusion价格/产量合作利润最大化但不稳定(囚徒困境)

计算示例 Worked Example

如何找纳什均衡(CFA 考试标准解法)

问题:移动支付行业中有两家寡头企业 X 和 Y。反垄断监管后,两家面临以下策略和预期利润(单位:十亿美元):

Y 开放平台Y 接入监管
X 开放平台X: 5, Y: 6X: 5.8, Y: 7
X 接入监管X: 6.3, Y: 5.8X: 4, Y: 6.5

Step 1 分析 X 的最优响应:

  • 若 Y 开放平台 → X 选接入监管 (6.3 > 5) ✓
  • 若 Y 接入监管 → X 选开放平台 (5.8 > 4) ✓
  • X 没有占优策略(两种情况下的最优选择不同)

Step 2 分析 Y 的最优响应:

  • 若 X 开放平台 → Y 选接入监管 (7 > 6) ✓
  • 若 X 接入监管 → Y 选接入监管 (6.5 > 5.8) ✓
  • Y 的占优策略 = 接入监管(无论 X 选什么,Y 都选这个)

Step 3 推导纳什均衡:

  • Y 一定选接入监管(占优策略)
  • X 知道 Y 会选接入监管 → X 选开放平台 (5.8 > 4)

纳什均衡 = (X 开放平台, Y 接入监管),利润为 (5.8, 7)

解题三步法

  1. 逐行比较:固定对手策略,找自己的最优响应(在矩阵中标记 ✓)
  2. 找占优策略:如果某方在所有情况下都选同一策略 → 占优策略
  3. 确定均衡:有占优策略的一方先锁定,另一方据此反应 → 纳什均衡

易混淆点 Common Confusions

考试中最容易出错的地方

1. 纳什均衡 ≠ 最优结果

  • 纳什均衡是稳定的(没人想单方面偏离),但不一定是最好
  • 囚徒困境中的纳什均衡 (坦白, 坦白) 比合作 (沉默, 沉默) 差
  • CFA 考的是”哪个是纳什均衡”,不是”哪个结果最好”

2. 占优策略 vs 纳什均衡

  • 占优策略:无条件最优(不管对手选什么)
  • 纳什均衡:有条件最优(给定对手的选择)
  • 不是所有博弈都有占优策略,但几乎都有纳什均衡

3. 博弈矩阵的阅读方式

  • 每个格子有两个数字:(行方收益, 列方收益)
  • 找行方最优响应时:固定列,比较同一列中行方的数字
  • 找列方最优响应时:固定行,比较同一行中列方的数字
  • 常见错误:比较方向搞反

4. Collusion 为什么不稳定?

  • 勾结 = 所有企业合作以最大化集体利润
  • 但每家企业都有作弊的激励(偷偷降价/增产可以抢占份额)
  • 这就是囚徒困境:个体理性导致集体次优
  • OPEC 成员经常超额生产就是典型例子

5. Cournot 均衡的定位

  • Cournot 均衡价格介于完全竞争价格和垄断价格之间
  • 不要记成等于垄断价格或等于竞争价格
  • 企业数量越多 → 越接近竞争价格;越少 → 越接近垄断价格

考试要点 Exam Focus

必考

  • 纳什均衡定义:没有任何一方能通过单方面改变策略来提高收益
  • 会读收益矩阵 (payoff matrix),能找出占优策略和纳什均衡
  • 囚徒困境:个体最优 → 集体次优,解释寡头勾结不稳定
  • 四种寡头模型(Cournot、Stackelberg、Kinked demand、Collusion)的关键区别
  • Cournot 均衡价格介于竞争与垄断之间

涉及科目 Appears In

  • 经济学 R12 (Firms and Market Structures) — 寡头垄断的核心分析框架