Correlation 相关系数

一句话定义

相关系数 (correlation coefficient) 是协方差的标准化版本,衡量两个变量之间线性关系的强度和方向,取值范围为 ,无单位。

概念解析 Explanation

为什么需要相关系数? 协方差告诉我们两个变量是同向还是反向运动,但其数值大小取决于变量的单位,无法比较不同变量对之间关系的强弱。相关系数通过除以两个变量各自的标准差来标准化,使得:

  • 无单位:可以跨不同变量对进行比较
  • 有界,有明确的解读

解读指南

  • :完美正线性关系(散点图上所有点在一条正斜率直线上)
  • :完美负线性关系
  • :无线性关系(但可能存在非线性关系!)
  • 0 < |\rho| < 0.3$:弱相关
  • 0.3 < |\rho| < 0.7$:中度相关
  • :强相关

重要警告

  • Correlation ≠ Causation:相关不代表因果
  • Spurious correlation 虚假相关:两个不相关的变量可能因第三变量或纯粹巧合而显示高相关
  • 相关系数只能捕捉线性关系;散点图可以揭示非线性关系
  • 异常值可以极大地影响相关系数

核心公式 Formula

Covariance 协方差

Correlation 相关系数

反解:

检验 的 t 统计量

Spearman 秩相关(非参数):

图解 Visual

graph LR
    A["协方差 Cov(X,Y)<br/>有单位,数值难以比较"] -->|"÷ σ_X × σ_Y"| B["相关系数 ρ<br/>无单位,[-1, +1]"]
    B -->|"ρ > 0"| C["正相关<br/>同涨同跌"]
    B -->|"ρ < 0"| D["负相关<br/>一涨一跌"]
    B -->|"ρ = 0"| E["无线性关系"]

计算示例 Worked Example

问题:Stock A 收益方差 0.0028,Stock B 收益方差 0.0124,两者协方差 0.0058。求相关系数并解读。

Step 1 标准差:

Step 2 相关系数:

解读:接近 +1,说明 A 和 B 之间存在非常强的正线性关系——当一只股票的收益高于其均值时,另一只几乎总是也高于均值。从分散化角度看,这两只股票组合在一起几乎无法降低风险。

考试要点 Exam Focus

必考

  • 相关系数 = 协方差/两个标准差之积
  • 取值范围 ,无单位
  • 不代表”无关”,只代表”无线性关系”
  • 组合方差公式中,相关系数是核心参数:
  • 越低 → 分散化效果越好
  • 简单回归中

涉及科目 Appears In

  • 数量方法 R3 (Statistical Measures), R5 (Portfolio Math), R9 (Tests of Independence), R10 (Regression)
  • 组合管理 — 有效前沿、资产配置
  • 权益投资 — 因子模型中的相关性
  • 标准差 — 相关系数的分母组成部分
  • Beta
  • 分散化 — 利用低相关性降低组合风险