Mean 均值(平均数)

一句话定义

均值 (mean) 是衡量数据集中趋势最常用的指标。CFA 考试中涉及五种均值——算术平均、几何平均、调和平均、截尾均值和缩尾均值——它们各自适用于不同的金融场景,选错均值会导致系统性偏差。

概念解析 Explanation

为什么要学这么多种均值?一个直觉:

  • 投资经理 A 三年收益 +50%、-50%、+50%
    • 算术平均 = 16.7%(看上去赚了不少?)
    • 几何平均 = -0.77%(实际财富缩水了!)

不同均值回答的是不同的问题。选错均值,结论可能完全相反。


一、Arithmetic Mean 算术平均(AM)

公式

其中:

  • = 第 个观测值(observation
  • = 观测值个数(number of observations)

Weighted Arithmetic Mean 加权算术平均

其中:

  • = 第 个观测值的权重(weight for observation

何时使用

场景说明
估计下一期的期望收益AM 是总体均值的无偏估计量(unbiased estimator)
横截面平均如计算某个月多只基金的平均收益
加权平均组合收益 = 各资产收益的加权平均;WACC = 各融资来源成本的加权平均

优缺点

  • 优点:数学性质好(无偏估计量)、计算简单、使用所有数据点
  • 缺点对异常值极为敏感——一个极端值就能大幅拉偏均值

计算示例

问题:某基金过去 5 年的年收益率为 12%、-3%、-5%、10%、-10%。计算算术平均收益。

解读:如果要预测下一年的期望收益,用算术平均 0.8%。


二、Geometric Mean 几何平均(GM)

公式

其中:

  • = 第 期的收益率(return for period
  • = 总期数(number of periods)

何时使用

场景说明
计算多期复合年化收益”过去 10 年年化收益多少?” → 用 GM
评估历史投资表现GM 反映的是实际财富增长速度
增长率的平均GDP 增长率、EPS 增长率等的多年平均

AM vs GM 的核心区别

  • AM 回答:下一期的期望收益是多少?(forward-looking)
  • GM 回答:过去 n 期的年化复合收益是多少?(backward-looking)
  • GM 永远 ≤ AM(除非每期收益完全相同)

计算示例

问题:某投资三年收益率分别为 -9.34%、23.45%、8.92%。计算几何平均年化收益。

Step 1 转为增长因子:

Step 2 连乘:

Step 3 开 n 次方减 1:

验证:1 美元 × 美元,与连乘结果一致。

对比 AM。AM (7.68%) > GM (6.83%),符合 AM ≥ GM 规律。


三、Harmonic Mean 调和平均(HM)

公式

其中:

  • = 观测值个数(number of observations)
  • = 第 个观测值(observation ,必须为正数)

何时使用

场景说明
Dollar-cost averaging 的平均买入价格定额投资时,每次买的股数不同,应用 HM 而非 AM
平均 P/E ratio(等权组合)对”比率”求平均时,HM 更合理

为什么 Dollar-Cost Averaging 用调和平均?

定额投资 = 每次投相同金额(如每月 1,000 美元),所以:

  • 价格低时,买的份数(低价的权重更大)
  • 价格高时,买的份数(高价的权重更小)

AM 对每个价格等权,高估了平均成本。HM 自动给低价更大权重,反映真实成本。

计算示例

问题:投资者每月投入 1,000 美元购买某基金,连续 4 个月的基金净值分别为 20、12、17、23 美元。计算平均买入价格。

Step 1 调和平均公式:

Step 2 计算分母:

Step 3 结果:

验证

  • 总投资 = 4,000 美元
  • 总购买份数 =
  • 平均成本 = 美元 ✓

对比 AM 美元。AM 高估了实际平均买入成本。


四、Trimmed Mean & Winsorized Mean 截尾与缩尾均值

Trimmed Mean 截尾均值

做法:排序后删除两端各 的极端值,对剩余值求算术平均。

示例:10% Trimmed Mean 对 20 个观测值 → 删除最大的 2 个和最小的 2 个,对中间 16 个求均值。

Winsorized Mean 缩尾均值

做法:排序后将两端各 的极端值替换为最近的非极端边界值,对全部值求算术平均。

示例:10% Winsorized Mean 对 20 个观测值 → 最小的 2 个替换为第 3 小的值,最大的 2 个替换为第 3 大的值,然后对全部 20 个求均值。

关键区别

Trimmed MeanWinsorized Mean
处理方式删除极端值替换极端值
样本量减少( 变小)不变(仍为
适用异常值是数据错误时异常值是真实但极端的观测时

计算示例

数据(已排序):2, 3, 5, 7, 8, 10, 12, 15, 18, 95

AM = (被异常值 95 严重拉高)

10% Trimmed Mean:删除最小的 2 和最大的 95 →

10% Winsorized Mean:将 2→3,95→18 →

Median =

什么时候用?

当数据存在异常值且你不想完全放弃那些极端观测时,Winsorized Mean 是最好的折中方案。Trimmed Mean 更激进——直接丢弃数据。


五种均值大小关系 Size Relationship

必考不等式

当数据不全相等时: 三者相等当且仅当所有数值完全相同。

graph TD
    HM["调和平均 HM<br/>(最小)"] -->|"≤"| GM["几何平均 GM<br/>(居中)"] -->|"≤"| AM["算术平均 AM<br/>(最大)"]
    style HM fill:#e8f5e9
    style GM fill:#fff3e0
    style AM fill:#fce4ec

直觉理解

  • AM 对所有值等权,大数拉高均值
  • GM 取对数后平均再还原,抑制了大数的影响
  • HM 取倒数后平均再还原,进一步放大了小数的权重
  • 所以 HM 最小、AM 最大

数值验证:以 为例:

  • AM =
  • GM =
  • HM =
  • 验证:

数据波动性的影响

  • 数据的离散程度越大(波动越大),AM 与 GM 的差距越大
  • 近似关系:(其中 为方差)
  • 这解释了为什么高波动资产的几何平均收益远低于算术平均收益

快速决策表 Quick Reference

flowchart TD
    START["要算什么样的'平均'?"] --> Q1{"多期投资收益?"}
    START --> Q2{"预测未来收益?"}
    START --> Q3{"定额投资买入价?"}
    START --> Q4{"数据有异常值?"}
    START --> Q5{"组合/加权收益?"}

    Q1 -->|"过去 n 年年化多少?"| GM["<b>Geometric Mean</b><br/>复合增长率"]
    Q2 -->|"下一期期望多少?"| AM["<b>Arithmetic Mean</b><br/>无偏估计量"]
    Q3 -->|"平均买入成本?"| HM["<b>Harmonic Mean</b><br/>低价权重更大"]
    Q4 -->|"删除极端值"| TM["<b>Trimmed Mean</b>"]
    Q4 -->|"替换极端值"| WM["<b>Winsorized Mean</b>"]
    Q5 -->|"各成分有权重"| WAM["<b>Weighted AM</b><br/>Σ wᵢXᵢ"]

    style GM fill:#fff3e0
    style AM fill:#fce4ec
    style HM fill:#e8f5e9
    style TM fill:#e3f2fd
    style WM fill:#e3f2fd
    style WAM fill:#f3e5f5
你想知道…用哪个均值为什么
”这只基金过去 10 年年化收益多少?“GM反映实际复合增长
”明年期望收益是多少?“AM总体均值的无偏估计
”定投的平均买入成本是多少?“HM等额投资 → 低价买得多
”剔除极端值后的平均水平?“Trimmed直接删除异常观测
”保留全部样本但降低极端影响?“Winsorized替换而非删除
”组合中各资产的加权平均收益?“Weighted AM按权重汇总

易混淆点 Common Confusions

考试中最容易出错的地方

1. AM vs GM 的使用场景

  • 要预测未来 → AM(forward-looking, unbiased estimator)
  • 要评估过去 → GM(backward-looking, compound growth)
  • 常见错误:用 AM 来描述”过去 10 年的年化收益”——应该用 GM

2. 为什么 Dollar-Cost Averaging 不用 AM?

  • 定额投资的核心是每次投相同金额,不是每次买相同份数
  • 如果每次买相同份数 → 平均成本 = AM
  • 如果每次投相同金额 → 平均成本 = HM
  • CFA 考的是后者(定额投资),所以用 HM

3. Trimmed vs Winsorized 混淆

  • Trimmed:删除(delete)→ 样本量减少
  • Winsorized:替换(replace)→ 样本量不变
  • 两者方向一致:都是减少异常值影响,但 Trimmed 更激进

4. GM 的计算陷阱

  • 必须用 连乘后开方再减 1
  • 不能直接对收益率取几何平均(如 )——收益率可能为负!
  • 收益率为 -100%(即 )时 GM 无意义(投资清零了)

5. AM 总是大于 GM?

  • 不是”大于”,是”大于等于”
  • 当且仅当所有数值完全相同时 AM = GM = HM
  • 波动越大 → AM 和 GM 差距越大

6. Median vs Mean 的选择

  • 数据严重偏斜或有极端异常值 → Median 比 AM 更有代表性
  • 正态分布数据 → AM = Median,用哪个都一样
  • CFA 中:收入分布(右偏)通常用 Median 描述

考试要点 Exam Focus

必考

  • HM ≤ GM ≤ AM 不等式(数据不全相等时严格成立)
  • AM 是总体均值的无偏估计量,用于预测未来期望收益
  • GM 用于多期复合收益,反映实际财富增长
  • HM 用于 dollar-cost averaging(定额投资的平均成本)
  • Trimmed = 删除极端值;Winsorized = 替换极端值
  • :波动越大,GM 比 AM 低越多
  • 组合收益 = 各资产收益的加权算术平均

涉及科目 Appears In

  • 数量方法 R1 (Rates and Returns), R3 (Statistical Measures of Asset Returns)
  • 组合管理 — 组合期望收益 = 加权算术平均;历史业绩评估用几何平均
  • 权益投资 — EPS 增长率的几何平均;P/E 组合用调和平均