数量方法 Quantitative Methods
考试占比 Exam Weight: 6-9% | Readings: 1-11
科目概览 Overview
数量方法是 CFA Level I 的数学基础科目,覆盖从利率、TVM 到统计学、假设检验和回归分析。这是公式最多的科目,但概念间的逻辑链条清晰。掌握本科目不仅服务于考试本身,还为 Fixed Income(债券定价)、Equity(DDM 估值)、Portfolio Management(组合方差)和 Derivatives(二叉树定价)提供核心工具。
graph LR ROOT((数量方法<br/>Quantitative Methods)) ROOT --- A["收益率与TVM<br/>Rates & TVM"] A --- A1("利率分解 Interest Rate Decomposition") A --- A2("HPR与年化 HPR & Annualization") A --- A3("TVM计算 TVM Calculations") A --- A4("年金与永续 Annuity & Perpetuity") ROOT --- B["统计学 Statistics"] B --- B1("集中趋势 Central Tendency") B --- B2("离散度 Dispersion") B --- B3("偏度与峰度 Skewness & Kurtosis") B --- B4("相关系数 Correlation") ROOT --- C["概率与组合 Probability & Portfolio"] C --- C1("期望值与方差 Expected Value & Variance") C --- C2("贝叶斯公式 Bayes") C --- C3("概率树 Probability Tree") C --- C4("组合收益与风险 Portfolio Risk & Return") ROOT --- D["推断统计 Inferential Statistics"] D --- D1("抽样方法 Sampling") D --- D2("CLT 中心极限定理") D --- D3("置信区间 Confidence Interval") D --- D4("假设检验 Hypothesis Testing") ROOT --- E["回归与技术 Regression & Tech"] E --- E1("线性回归 Linear Regression") E --- E2("ANOVA 方差分析") E --- E3("模拟方法 Simulation") E --- E4("大数据 Big Data")
R1: 利率与收益率 Rates and Returns
1.1 利率的三重身份
利率 (interest rate) 可以从三个角度理解:
| 角度 | 含义 |
|---|---|
| Required rate of return 必要收益率 | 投资者愿意出借资金所要求的最低回报 |
| Discount rate 折现率 | 将未来现金流折算为现值时使用的比率 |
| Opportunity cost 机会成本 | 选择消费而放弃投资所损失的收益 |
1.2 利率分解 Interest Rate Decomposition
名义利率可以分解为多个风险溢价的叠加:
直觉理解
Real risk-free rate 反映人们对”现在消费 vs 未来消费”的时间偏好 (time preference)。其余每一项溢价都是对投资者承担某种特定风险的补偿。
精确关系 (Fisher equation):
近似关系:
1.3 持有期收益率 Holding Period Return (HPR)
例题:买入价 20,期末价 22,期间收到 1 股利。
多期 HPR 用复利连乘:
1.4 各类均值 Types of Means
算术平均 Arithmetic Mean (AM)
- 用途:包含所有观测值,是总体均值的无偏估计量
- 特点:受异常值影响大
几何平均 Geometric Mean (GM)
- 用途:计算多期复合年化收益率
- 特点:反映真实的累积增长
例题:三年收益率分别为 -9.34%、23.45%、8.92%。
调和平均 Harmonic Mean (HM)
- 用途:计算定额投资(dollar-cost averaging)的平均成本
- 特点:只能用于正数
例题:每月投 1,000 买基金,三个月单价分别为 8、9、10。
必考关系
当数据不全相等时:HM < GM < AM(调和 < 几何 < 算术) 仅当所有数值相同时三者相等。
graph LR HM["调和平均 HM"] -->|"<="| GM["几何平均 GM"] -->|"<="| AM["算术平均 AM"] style HM fill:#e8f5e9 style GM fill:#fff3e0 style AM fill:#fce4ec
| 均值类型 | 适用场景 | 示例 |
|---|---|---|
| Arithmetic Mean | 估计期望收益(含异常值) | 预测下一年的平均收益 |
| Geometric Mean | 多期复合收益 | 计算过去 5 年的年化收益 |
| Harmonic Mean | 定额投资的平均成本 | Dollar-cost averaging 的平均买入价 |
| Trimmed Mean | 排除异常值 | 去除最高和最低 5% 后的均值 |
| Winsorized Mean | 替代异常值 | 将极端值替换为边界百分位数 |
1.5 货币加权与时间加权收益率
Money-Weighted Rate of Return (MWRR)
MWRR 本质上就是内部收益率 (IRR)——使得所有现金流入的现值等于所有现金流出的现值的折现率。
- 受现金流进出时点影响
- 如果大额资金恰好在高收益期前投入,MWRR > TWRR
Time-Weighted Rate of Return (TWRR)
三步法:
- 在每次外部现金流发生时分割子期间
- 计算每个子期间的 HPR
- 将所有子期间的 (1 + HPR) 连乘,再取几何平均
考试必考对比
- TWRR 是投资管理行业首选,衡量基金经理的选股能力(不受投资者存取款影响)
- MWRR 在基金经理能控制现金流进出时更合适
- 若资金在高收益期前涌入:MWRR > TWRR
- 若资金在低收益期前涌入:MWRR < TWRR
例题:投资者在 t=0 以 100 买入 1 股,t=1 时以 120 再买 1 股(当年股利 2/股),t=2 时以 130 卖出两股(股利 2/股)。
TWRR 计算:
- HPR₁ = (120 + 2) / 100 - 1 = 22%
- HPR₂ = (260 + 4) / 240 - 1 = 10%
- TWRR =
MWRR 计算:
- CF₀ = +100, CF₁ = +118, CF₂ = -264
- 求解 IRR = 13.86%
MWRR (13.86%) < TWRR (15.84%),因为更多资金在第二年(低收益期 10%)投入。
1.6 年化收益与连续复利
年化收益 (Annualized Return):
例题:90 天赚了 0.75%。
连续复利收益 (Continuously Compounded Return):
- 连续复利收益的关键特性:跨期可加。从 t=0 到 t=2 的连续复利收益 = t=0 到 t=1 + t=1 到 t=2。
例题:100 买入,120 卖出。
1.7 其他收益率概念
| 概念 | 定义 |
|---|---|
| Gross return | 扣除交易佣金后、扣除管理费前的总收益 |
| Net return | 扣除管理费和行政费后的收益 |
| Pretax nominal return | 税前名义收益 |
| After-tax nominal return | 税后名义收益 |
| Real return | 扣除通胀后的收益,衡量购买力变化 |
| Leveraged return | 使用杠杆放大后的收益率 |
精确实际收益:
杠杆收益公式:
其中 是自有资金, 是借入资金, 是借款利率。
R2: 货币时间价值 The Time Value of Money in Finance
跨科关联
TVM 是整个 CFA 课程的基石:Fixed Income 的债券定价、Equity 的 DDM 估值、Corporate Finance 的 NPV/IRR 决策全部依赖 TVM。
2.1 核心公式
连续复利:,
2.2 固定收益证券定价
零息债券 (Zero-Coupon Bond):
例题:面值 1,000,到期 15 年,YTM = 4%。
附息债券 (Coupon Bond):
用计算器:N = 期数,I/Y = 折现率,PMT = 票息,FV = 面值,CPT PV。
价格与收益率反向关系
价格上升 → 收益率下降;收益率上升 → 价格下降。这是 Fixed Income 的核心原理。
2.3 永续年金与普通年金
永续年金 (Perpetuity):
例题:优先股每年派息 5,要求回报率 8%。
年金支付额 (Annuity Payment):
2.4 股票估值模型 (DDM)
Gordon Growth Model(恒定增长 DDM):
其中 是下期预期股利, 是股权要求回报率, 是永续增长率。
要求:
例题:预期股利 1.62,增长率 8%,要求回报率 12%。
反解求隐含回报率:
反解求隐含增长率:
2.5 现金流可加性与无套利
Cash Flow Additivity Principle:任何现金流序列的现值 = 各组成部分现值之和。
这是 no-arbitrage principle(一价定律)的基础:两组相同的未来现金流必须有相同的当前价值。
远期利率推导:
例题:,,求 (一年后的一年期远期利率)。
远期汇率的无套利关系:
R3: 资产收益的统计度量 Statistical Measures of Asset Returns
3.1 集中趋势 Measures of Central Tendency
| 指标 | 定义 | 特点 |
|---|---|---|
| Arithmetic Mean | 受异常值影响 | |
| Median 中位数 | 排序后的中间值 | 不受异常值影响 |
| Mode 众数 | 出现频率最高的值 | 可无/可多个 |
| Trimmed Mean | 去除两端极值后的均值 | 减少异常值影响 |
| Winsorized Mean | 将极端值替换为边界值后的均值 | 替代而非删除 |
分位数 (Quantiles):
- Quartile(四分位)、Quintile(五分位)、Decile(十分位)、Percentile(百分位)
- Interquartile Range (IQR) = Q3 - Q1
3.2 离散度 Measures of Dispersion
在投资中,集中趋势衡量 reward,离散度衡量 risk。
Range = Max - Min
Mean Absolute Deviation (MAD):
Sample Variance :
为什么除以 n-1?
使用 (自由度)而非 作为分母,是因为用 会系统性地低估总体方差(特别是小样本)。 使样本方差成为总体方差的无偏估计量 (unbiased estimator)。
标准差 :
例题:5 位基金经理的年化收益为 30%、12%、25%、20%、23%。
变异系数 Coefficient of Variation (CV):
衡量每单位收益承担的风险。CV 越低越好。
例题:T-bills 均值 0.25%,标准差 0.36%;S&P 500 均值 1.09%,标准差 7.30%。 T-bills 的单位收益风险更低。
Target Downside Deviation(半偏差):
其中 是目标收益。注意分母仍是 (全样本量减一),即使只用了低于目标的观测值。
3.3 偏度与峰度 Skewness and Kurtosis
Skewness(偏度)衡量分布的不对称性:
- Positive skew(右偏):右尾长 → Mean > Median > Mode
- Negative skew(左偏):左尾长 → Mean < Median < Mode
- Symmetric:Mean = Median = Mode
记忆口诀
均值被偏度的方向”拉走”,中位数永远在均值和众数之间。
Kurtosis(峰度)衡量尾部厚度:
| 类型 | Excess Kurtosis | 特征 |
|---|---|---|
| Mesokurtic | = 0 | 正态分布 |
| Leptokurtic | > 0 | 尖峰、肥尾,极端值概率更大 |
| Platykurtic | < 0 | 扁平、薄尾 |
Excess Kurtosis = Kurtosis - 3(正态分布的 kurtosis = 3)
风险管理视角
实际金融收益通常具有负偏度 + 正超额峰度(即左偏 + 肥尾),这意味着极端亏损的概率比正态分布预测的更大。风险管理者重点关注尾部风险。
3.4 相关系数 与协方差
Covariance 协方差:
协方差的数值大小取决于单位,难以直接比较。
Correlation 相关系数(标准化的协方差):
性质:
- :完美正相关
- :完美负相关
- :无线性关系(但可能有非线性关系!)
- 无单位
例题:Stock A 方差 0.0028,Stock B 方差 0.0124,协方差 0.0058。
Correlation ≠ Causation
相关性不意味着因果关系。Spurious correlation(虚假相关)可能由第三变量或纯粹巧合导致。
R4: 概率树与条件期望 Probability Trees and Conditional Expectations
4.1 期望值与方差
期望值 (Expected Value):
方差(基于概率模型):
样本方差 vs 概率模型方差
样本方差除以 ;概率模型方差用概率加权求和(没有 ,因为描述的是完整分布)。
例题:Stock A 在三种经济情景下的表现:
| 情景 | 概率 | 收益 |
|---|---|---|
| Boom | 30% | 20% |
| Normal | 50% | 12% |
| Slow | 20% | 5% |
4.2 概率树 Probability Tree
概率树将复杂的联合概率分解为一系列条件概率的乘积,适合可视化多层决策/事件。
Conditional expected value 条件期望值:取决于某个先决事件的结果。当新信息到达时,分析师用条件期望值更新预测。
4.3 贝叶斯公式 Bayes’ Formula
直觉:根据新证据 B 的出现,更新对事件 A 发生概率的判断。
例题:经济表现好的概率 60%(若表现好,股票上涨概率 70%);经济表现差的概率 40%(若表现差,股票上涨概率 20%)。已知股票上涨了,求经济表现好的概率。
P(stock up) = 0.60(0.70) + 0.40(0.20) = 0.42 + 0.08 = 0.50
Prior 从 60% 更新到了 84%——股票上涨这一信息大幅提升了我们对经济向好的信心。
R5: 组合数学 Portfolio Mathematics
5.1 组合收益与方差
Portfolio expected return 组合期望收益:
Two-asset portfolio variance 两资产组合方差:
等价于:
分散化的数学基础
只要 ,组合标准差就低于各资产标准差的加权平均。 越低,分散化效果越好。当 时可以构造零风险组合。这是 分散化 的数学本质。
三资产组合方差:
一般规则: 个资产有 个方差项和 个唯一协方差项。
例题:60% 国内股票、30% 国内债券、10% 国际股票。协方差矩阵如下:
| 股票 | 债券 | 国际 | |
|---|---|---|---|
| 股票 | 400 | 44 | 180 |
| 债券 | 44 | 70 | 35 |
| 国际 | 180 | 35 | 450 |
5.2 Shortfall Risk 与 Roy’s Safety-First Criterion
Shortfall risk 缺口风险:组合收益低于目标值的概率。
Safety-First Ratio (SFRatio):
其中 是最低可接受收益(threshold)。
Roy’s criterion:选择 SFRatio 最大的组合(即缺口风险最小的组合)。
例题:目标收益 3%,三个组合:
| 组合 | E(R) | SFRatio | |
|---|---|---|---|
| A | 9% | 12% | (9-3)/12 = 0.50 |
| B | 11% | 20% | (11-3)/20 = 0.40 |
| C | 6.6% | 8.2% | (6.6-3)/8.2 = 0.44 |
选择 Portfolio A(SFRatio 最大 = 0.50)。
R6: 模拟方法 Simulation Methods
6.1 对数正态分布
若 服从正态分布,则 服从对数正态分布 (lognormal distribution)。
对数正态分布用于建模资产价格:
- 不会为负(资产价格 ≥ 0)
- 右偏(大幅上涨可能,但下跌有限于本金)
若连续复利收益独立同分布 (i.i.d.),则价格为对数正态分布。
6.2 Monte Carlo Simulation
步骤:
- 指定风险因子的概率分布及参数
- 随机生成大量风险因子值
- 用定价模型计算每组随机值对应的证券价值
- 重复成百上千次,统计分布特征
优点:可以模拟历史中未出现的极端情景(what-if 分析) 缺点:结果只与假设一样好;复杂度高;是统计方法而非解析方法
应用:复杂衍生品定价、VaR 估计、养老金资产负债模拟、策略回测。
6.3 Bootstrap Resampling
Bootstrap:从已有样本中有放回地反复抽取子样本,计算统计量的分布。
- 优点:不需要关于总体分布的假设;能为复杂统计量构建置信区间
- 缺点:受限于原始样本的分布范围
R7: 估计与推断 Estimation and Inference
7.1 抽样方法
| 方法 | 类型 | 描述 | 抽样误差 |
|---|---|---|---|
| Simple random | 概率 | 每个个体等概率被选中 | 基准 |
| Systematic | 概率 | 每隔 n 个抽一个 | 近似随机 |
| Stratified random | 概率 | 按特征分层,每层随机抽样 | 通常更小 |
| Cluster | 概率 | 随机选簇,簇内全部或随机抽样 | 通常更大 |
| Convenience | 非概率 | 方便获取的数据 | 可能很大 |
| Judgmental | 非概率 | 研究者主观选取 | 取决于判断质量 |
7.2 中心极限定理 (CLT)
CLT 核心表述
对于均值为 、方差为 的总体,当样本量 足够大(通常 )时,样本均值 的抽样分布近似正态分布: 无论总体本身是什么分布。
这意味着:
- 样本均值的期望值 = 总体均值
- 样本均值的方差 = (样本越大,估计越精确)
Standard Error of the Sample Mean 样本均值的标准误:
例题:30 个月度收益,均值 2%,样本标准差 20%。
7.3 Resampling: Jackknife vs Bootstrap
| 方法 | 原理 | 优点 | 缺点 |
|---|---|---|---|
| Jackknife | 每次移除一个观测值,计算 n 个样本均值 | 计算简单;可去除偏差 | 精度有限 |
| Bootstrap | 有放回抽取大量等大样本 | 可为复杂统计量构建 CI | 计算量大;受限于样本 |
R8: 假设检验 Hypothesis Testing
跨科关联
假设检验 不仅在数量方法中考,也是理解 Economics 中政策检验、Equity 中 Alpha 检验的基础。
8.1 假设检验基本框架
七步流程:
- State the hypotheses( 和 )
- Select the appropriate test statistic
- Specify the significance level
- State the decision rule
- Collect sample and calculate the test statistic
- Make a decision (reject or fail to reject )
- Make a decision based on the test results
Null hypothesis :希望被拒绝的假设(始终包含”=”) Alternative hypothesis :希望被支持的假设
8.2 Type I & Type II Errors
| 为真 | 为假 | |
|---|---|---|
| 不拒绝 | 正确决策 | Type II Error () |
| 拒绝 | Type I Error () | 正确决策 (Power) |
- Significance level = P(Type I Error) = P(拒绝真的 )
- Power = 1 - \betaH_0$)
- 降低 (更严格)→ 增大 → Power 降低
- 增大样本量 → 可同时降低 Type I 和 Type II Error
统计用语
我们说 “fail to reject “,不说 “accept ”。
p-value:使得 被拒绝的最小显著性水平。若 ,则拒绝 。
8.3 检验统计量
常用 z 临界值:
| 显著性水平 | 单尾 | 双尾 |
|---|---|---|
| 10% | 1.28 | 1.65 |
| 5% | 1.65 | 1.96 |
| 1% | 2.33 | 2.58 |
8.4 各类检验汇总
flowchart TD A["要检验什么?"] --> B{"关于均值?"} A --> C{"关于方差?"} B -->|"单总体均值"| D["t-test<br/>df = n-1"] B -->|"两总体均值差异"| E{"样本独立?"} E -->|"独立"| F["t-test (差异检验)<br/>df = n₁+n₂-2"] E -->|"不独立"| G["Paired t-test<br/>df = n-1"] C -->|"单总体方差"| H["Chi-square test<br/>df = n-1"] C -->|"两总体方差比较"| I["F-test<br/>df = n₁-1, n₂-1"] style D fill:#e3f2fd style F fill:#e3f2fd style G fill:#e3f2fd style H fill:#fff3e0 style I fill:#fce4ec
| 检验对象 | 检验方法 | 检验统计量 | 自由度 |
|---|---|---|---|
| 单总体均值 | t-test | ||
| 两总体均值(独立) | t-test | ||
| 配对比较 | Paired t-test | ||
| 单总体方差 | Chi-square | ||
| 两总体方差 | F-test | (大的放分子) |
z-test vs t-test
理论上,已知 用 z-test,未知 用 t-test。但当 时,t 分布近似正态分布,两者结果几乎一样。实务中几乎总是用 t-test(因为 几乎永远未知)。
例题:单总体均值检验
250 天的期权组合日均收益 0.1%,样本标准差 0.25%。检验均值是否 ≠ 0(,双尾)。
6.33 > 1.96H_0$,日均收益显著不为零。
Chi-square test 例题:
某基金宣称月度收益标准差为 4%。24 个月数据显示 s = 3.8%。,双尾检验。
df = 23,临界值:,
11.689 < 20.76 < 38.076H_0$。
8.5 参数检验 vs 非参数检验
| Parametric 参数检验 | Nonparametric 非参数检验 | |
|---|---|---|
| 假设 | 需要分布假设(如正态) | 很少或不需要分布假设 |
| 适用 | 连续数据、满足假设时 | 排序数据、不满足参数假设时 |
| 示例 | t-test, z-test, F-test | Runs test, Spearman rank |
| Power | 假设成立时更强 | 通常较弱 |
R9: 独立性的参数与非参数检验 Parametric and Non-Parametric Tests of Independence
9.1 相关系数的检验
检验 (两变量正态分布时):
,双尾检验。
例题:,,。
(df=40, two-tailed 5%) = 2.021。2.363 > 2.021H_0$,相关系数显著不为零。
9.2 Spearman 秩相关
非参数方法,用于排序数据或检验非线性关联:
其中 是两组排名的差。
检验统计量与 Pearson 相同:( 时近似 t 分布)
9.3 列联表检验 Contingency Table (Chi-Square Test of Independence)
目的:检验两个分类变量是否独立。
其中
若 ,拒绝独立性假设。
R10: 简单线性回归 Simple Linear Regression
10.1 回归模型基础
- : 因变量 (dependent variable)
- : 自变量 (independent variable)
- : 截距 (intercept)
- : 斜率 (slope coefficient)
- : 残差 (error term)
OLS(普通最小二乘法)估计:
关键性质
回归线一定经过 这个点。
例题:Cov(S&P 500, ABC) = 0.000336, Var(S&P 500) = 0.000522, Mean S&P = -2.70%, Mean ABC = -4.05%。
斜率 0.64 的含义:S&P 500 超额收益每变化 1%,ABC 超额收益预期变化 0.64%。这就是 ABC 的 Beta。
10.2 回归假设
- X 和 Y 之间存在线性关系
- 残差方差恒定(Homoskedasticity 同方差性)
- 残差彼此独立(无自相关)
- 残差服从正态分布
违反这些假设时,残差图 (residual plot) 会出现模式:
- 非线性 → 残差呈 U 形
- 异方差 → 残差的散布随 X 增大
- 非独立 → 残差呈周期性模式
10.3 ANOVA 方差分析与拟合优度
Total variation 分解:
| 来源 | 自由度 df | 平方和 | 均方 |
|---|---|---|---|
| Regression (explained) | 1 | SSR | MSR = SSR/1 = SSR |
| Error (unexplained) | n-2 | SSE | MSE = SSE/(n-2) |
| Total | n-1 | SST |
Coefficient of Determination :
- 表示自变量解释了因变量总变异的百分比
- 简单回归中 (相关系数的平方)
Standard Error of Estimate (SEE):
SEE 越小,模型拟合越好。
F-statistic(回归整体显著性):
,。单尾检验: 则拒绝 。
在简单回归中,F 检验等价于对斜率的 t 检验()。
例题:ANOVA 表解读
36 个观测值的 ANOVA 表:SSR = 0.0076,SSE = 0.0406,SST = 0.0482。
10.4 斜率系数的假设检验
。
例题:,,,检验 。 (df=34, two-tailed 5%) = 2.03。2.46 > 2.03H_0$。
10.5 预测值与置信区间
置信区间:
其中 是预测的标准误, 是 下的临界 t 值。
10.6 回归的函数形式
flowchart TD A["数据关系是线性的吗?"] -->|"是"| B["Lin-Lin Model<br/>Y = b₀ + b₁X<br/>b₁ = Y的绝对变化/X的绝对变化"] A -->|"Y呈指数增长"| C["Log-Lin Model<br/>ln(Y) = b₀ + b₁X<br/>b₁ = Y的相对变化/X的绝对变化"] A -->|"X变化率影响Y"| D["Lin-Log Model<br/>Y = b₀ + b₁ln(X)<br/>b₁ = Y的绝对变化/X的相对变化"] A -->|"弹性关系"| E["Log-Log Model<br/>ln(Y) = b₀ + b₁ln(X)<br/>b₁ = Y的相对变化/X的相对变化(弹性)"] style B fill:#e8f5e9 style C fill:#e3f2fd style D fill:#fff3e0 style E fill:#fce4ec
| 模型 | 形式 | 斜率解读 |
|---|---|---|
| Lin-Lin | X 变 1 单位 → Y 变 单位 | |
| Log-Lin | X 变 1 单位 → Y 变 | |
| Lin-Log | X 变 1% → Y 变 单位 | |
| Log-Log | X 变 1% → Y 变 (弹性) |
R11: 大数据技术入门 Introduction to Big Data Techniques
11.1 Fintech
Fintech 指应用于金融服务业的技术创新,包括:
- 处理大规模多源数据的能力提升
- AI/ML 等分析工具的应用
11.2 Big Data 的 3V 特征
| 特征 | 含义 |
|---|---|
| Volume 体量 | 数据量级从 GB → TB → PB |
| Velocity 速度 | 数据生成和传输的速度(低延迟 vs 高延迟) |
| Variety 多样性 | 结构化 / 半结构化 / 非结构化 |
数据来源:
- 传统:财务报表、经济统计、市场数据
- Alternative data:社交媒体、卫星图像、信用卡数据(corporate exhaust)、IoT 传感器
Data Science 处理流程:Capture → Curation → Storage → Search → Transfer
11.3 AI 与机器学习
| 概念 | 定义 |
|---|---|
| Artificial Intelligence | 模拟人类认知的计算机系统 |
| Neural Networks | 模仿人脑结构的 AI 方法 |
| Machine Learning | 算法从数据中自动学习模式 |
| Deep Learning | 多层神经网络,从简单模式到复杂模式 |
ML 流程:Training dataset → Validation dataset → Test dataset
| ML 类型 | 特征 |
|---|---|
| Supervised Learning | 有标签的输入输出数据 |
| Unsupervised Learning | 无标签,发现数据结构 |
| Deep Learning | 多层神经网络 |
常见问题:
- Overfitting 过拟合:模型在训练数据上表现好但泛化差(把噪音当信号)
- Underfitting 欠拟合:模型过于简单,无法捕捉真实模式
- Black box 问题:结果不可解释
11.4 投资管理中的应用
| 应用 | 描述 |
|---|---|
| Text Analytics | 分析非结构化文本/语音数据 |
| NLP | 自然语言处理:情感分析、监管合规 |
| Risk Governance | 风险评估、压力测试 |
| Algorithmic Trading | 基于规则的自动交易执行 |
| High-Frequency Trading | 利用日内微小价差的算法交易 |
核心公式速查表 Formula Quick Reference
收益率
| 公式 | 表达式 |
|---|---|
| HPR | |
| Annualized Return | |
| Continuously Compounded | |
| Geometric Mean | |
| Harmonic Mean |
TVM
| 公式 | 表达式 |
|---|---|
| FV | |
| PV | |
| Perpetuity PV | |
| Gordon Growth | |
| Forward Rate |
统计
| 公式 | 表达式 |
|---|---|
| Sample Variance | |
| CV | |
| Correlation | |
| Portfolio Variance (2) | |
| SFRatio |
假设检验
| 公式 | 表达式 |
|---|---|
| Test Statistic | (sample stat - hypothesized value) / SE |
| Standard Error | |
| Chi-square | |
| F-stat | |
| Correlation test |
回归
| 公式 | 表达式 |
|---|---|
| Slope | |
| Intercept | |
| SEE | |
| F-stat | |
| t-test for slope |