Mean 均值(平均数)
一句话定义
均值 (mean) 是衡量数据集中趋势最常用的指标。CFA 考试中涉及五种均值——算术平均、几何平均、调和平均、截尾均值和缩尾均值——它们各自适用于不同的金融场景,选错均值会导致系统性偏差。
概念解析 Explanation
为什么要学这么多种均值?一个直觉:
- 投资经理 A 三年收益 +50%、-50%、+50%
- 算术平均 = 16.7%(看上去赚了不少?)
- 几何平均 = -0.77%(实际财富缩水了!)
不同均值回答的是不同的问题。选错均值,结论可能完全相反。
一、Arithmetic Mean 算术平均(AM)
公式
其中:
- = 第 个观测值(observation )
- = 观测值个数(number of observations)
Weighted Arithmetic Mean 加权算术平均:
其中:
- = 第 个观测值的权重(weight for observation )
何时使用
| 场景 | 说明 |
|---|---|
| 估计下一期的期望收益 | AM 是总体均值的无偏估计量(unbiased estimator) |
| 横截面平均 | 如计算某个月多只基金的平均收益 |
| 加权平均 | 组合收益 = 各资产收益的加权平均;WACC = 各融资来源成本的加权平均 |
优缺点
- 优点:数学性质好(无偏估计量)、计算简单、使用所有数据点
- 缺点:对异常值极为敏感——一个极端值就能大幅拉偏均值
计算示例
问题:某基金过去 5 年的年收益率为 12%、-3%、-5%、10%、-10%。计算算术平均收益。
解读:如果要预测下一年的期望收益,用算术平均 0.8%。
二、Geometric Mean 几何平均(GM)
公式
其中:
- = 第 期的收益率(return for period )
- = 总期数(number of periods)
何时使用
| 场景 | 说明 |
|---|---|
| 计算多期复合年化收益 | ”过去 10 年年化收益多少?” → 用 GM |
| 评估历史投资表现 | GM 反映的是实际财富增长速度 |
| 增长率的平均 | GDP 增长率、EPS 增长率等的多年平均 |
AM vs GM 的核心区别
- AM 回答:下一期的期望收益是多少?(forward-looking)
- GM 回答:过去 n 期的年化复合收益是多少?(backward-looking)
- GM 永远 ≤ AM(除非每期收益完全相同)
计算示例
问题:某投资三年收益率分别为 -9.34%、23.45%、8.92%。计算几何平均年化收益。
Step 1 转为增长因子:
Step 2 连乘:
Step 3 开 n 次方减 1:
验证:1 美元 × 美元,与连乘结果一致。
对比 AM:。AM (7.68%) > GM (6.83%),符合 AM ≥ GM 规律。
三、Harmonic Mean 调和平均(HM)
公式
其中:
- = 观测值个数(number of observations)
- = 第 个观测值(observation ,必须为正数)
何时使用
| 场景 | 说明 |
|---|---|
| Dollar-cost averaging 的平均买入价格 | 定额投资时,每次买的股数不同,应用 HM 而非 AM |
| 平均 P/E ratio(等权组合) | 对”比率”求平均时,HM 更合理 |
为什么 Dollar-Cost Averaging 用调和平均?
定额投资 = 每次投相同金额(如每月 1,000 美元),所以:
- 价格低时,买的份数多(低价的权重更大)
- 价格高时,买的份数少(高价的权重更小)
AM 对每个价格等权,高估了平均成本。HM 自动给低价更大权重,反映真实成本。
计算示例
问题:投资者每月投入 1,000 美元购买某基金,连续 4 个月的基金净值分别为 20、12、17、23 美元。计算平均买入价格。
Step 1 调和平均公式:
Step 2 计算分母:
Step 3 结果:
验证:
- 总投资 = 4,000 美元
- 总购买份数 = 份
- 平均成本 = 美元 ✓
对比 AM: 美元。AM 高估了实际平均买入成本。
四、Trimmed Mean & Winsorized Mean 截尾与缩尾均值
Trimmed Mean 截尾均值
做法:排序后删除两端各 的极端值,对剩余值求算术平均。
示例:10% Trimmed Mean 对 20 个观测值 → 删除最大的 2 个和最小的 2 个,对中间 16 个求均值。
Winsorized Mean 缩尾均值
做法:排序后将两端各 的极端值替换为最近的非极端边界值,对全部值求算术平均。
示例:10% Winsorized Mean 对 20 个观测值 → 最小的 2 个替换为第 3 小的值,最大的 2 个替换为第 3 大的值,然后对全部 20 个求均值。
关键区别
| Trimmed Mean | Winsorized Mean | |
|---|---|---|
| 处理方式 | 删除极端值 | 替换极端值 |
| 样本量 | 减少( 变小) | 不变(仍为 ) |
| 适用 | 异常值是数据错误时 | 异常值是真实但极端的观测时 |
计算示例
数据(已排序):2, 3, 5, 7, 8, 10, 12, 15, 18, 95
AM = (被异常值 95 严重拉高)
10% Trimmed Mean:删除最小的 2 和最大的 95 →
10% Winsorized Mean:将 2→3,95→18 →
Median =
什么时候用?
当数据存在异常值且你不想完全放弃那些极端观测时,Winsorized Mean 是最好的折中方案。Trimmed Mean 更激进——直接丢弃数据。
五种均值大小关系 Size Relationship
必考不等式
当数据不全相等时: 三者相等当且仅当所有数值完全相同。
graph TD HM["调和平均 HM<br/>(最小)"] -->|"≤"| GM["几何平均 GM<br/>(居中)"] -->|"≤"| AM["算术平均 AM<br/>(最大)"] style HM fill:#e8f5e9 style GM fill:#fff3e0 style AM fill:#fce4ec
直觉理解:
- AM 对所有值等权,大数拉高均值
- GM 取对数后平均再还原,抑制了大数的影响
- HM 取倒数后平均再还原,进一步放大了小数的权重
- 所以 HM 最小、AM 最大
数值验证:以 为例:
- AM =
- GM =
- HM =
- 验证: ✓
数据波动性的影响:
- 数据的离散程度越大(波动越大),AM 与 GM 的差距越大
- 近似关系:(其中 为方差)
- 这解释了为什么高波动资产的几何平均收益远低于算术平均收益
快速决策表 Quick Reference
flowchart TD START["要算什么样的'平均'?"] --> Q1{"多期投资收益?"} START --> Q2{"预测未来收益?"} START --> Q3{"定额投资买入价?"} START --> Q4{"数据有异常值?"} START --> Q5{"组合/加权收益?"} Q1 -->|"过去 n 年年化多少?"| GM["<b>Geometric Mean</b><br/>复合增长率"] Q2 -->|"下一期期望多少?"| AM["<b>Arithmetic Mean</b><br/>无偏估计量"] Q3 -->|"平均买入成本?"| HM["<b>Harmonic Mean</b><br/>低价权重更大"] Q4 -->|"删除极端值"| TM["<b>Trimmed Mean</b>"] Q4 -->|"替换极端值"| WM["<b>Winsorized Mean</b>"] Q5 -->|"各成分有权重"| WAM["<b>Weighted AM</b><br/>Σ wᵢXᵢ"] style GM fill:#fff3e0 style AM fill:#fce4ec style HM fill:#e8f5e9 style TM fill:#e3f2fd style WM fill:#e3f2fd style WAM fill:#f3e5f5
| 你想知道… | 用哪个均值 | 为什么 |
|---|---|---|
| ”这只基金过去 10 年年化收益多少?“ | GM | 反映实际复合增长 |
| ”明年期望收益是多少?“ | AM | 总体均值的无偏估计 |
| ”定投的平均买入成本是多少?“ | HM | 等额投资 → 低价买得多 |
| ”剔除极端值后的平均水平?“ | Trimmed | 直接删除异常观测 |
| ”保留全部样本但降低极端影响?“ | Winsorized | 替换而非删除 |
| ”组合中各资产的加权平均收益?“ | Weighted AM | 按权重汇总 |
易混淆点 Common Confusions
考试中最容易出错的地方
1. AM vs GM 的使用场景
- 要预测未来 → AM(forward-looking, unbiased estimator)
- 要评估过去 → GM(backward-looking, compound growth)
- 常见错误:用 AM 来描述”过去 10 年的年化收益”——应该用 GM
2. 为什么 Dollar-Cost Averaging 不用 AM?
- 定额投资的核心是每次投相同金额,不是每次买相同份数
- 如果每次买相同份数 → 平均成本 = AM
- 如果每次投相同金额 → 平均成本 = HM
- CFA 考的是后者(定额投资),所以用 HM
3. Trimmed vs Winsorized 混淆
- Trimmed:删除(delete)→ 样本量减少
- Winsorized:替换(replace)→ 样本量不变
- 两者方向一致:都是减少异常值影响,但 Trimmed 更激进
4. GM 的计算陷阱
- 必须用 连乘后开方再减 1
- 不能直接对收益率取几何平均(如 )——收益率可能为负!
- 收益率为 -100%(即 )时 GM 无意义(投资清零了)
5. AM 总是大于 GM?
- 不是”大于”,是”大于等于”
- 当且仅当所有数值完全相同时 AM = GM = HM
- 波动越大 → AM 和 GM 差距越大
6. Median vs Mean 的选择
- 数据严重偏斜或有极端异常值 → Median 比 AM 更有代表性
- 正态分布数据 → AM = Median,用哪个都一样
- CFA 中:收入分布(右偏)通常用 Median 描述
考试要点 Exam Focus
必考
- HM ≤ GM ≤ AM 不等式(数据不全相等时严格成立)
- AM 是总体均值的无偏估计量,用于预测未来期望收益
- GM 用于多期复合收益,反映实际财富增长
- HM 用于 dollar-cost averaging(定额投资的平均成本)
- Trimmed = 删除极端值;Winsorized = 替换极端值
- :波动越大,GM 比 AM 低越多
- 组合收益 = 各资产收益的加权算术平均
涉及科目 Appears In
- 数量方法 R1 (Rates and Returns), R3 (Statistical Measures of Asset Returns)
- 组合管理 — 组合期望收益 = 加权算术平均;历史业绩评估用几何平均
- 权益投资 — EPS 增长率的几何平均;P/E 组合用调和平均