基础概念
多因子模型(Multiple-Factor Model, MFM)正是基于 APT 模型的思想发展出来的完整的风险模型。
多因子模型定量刻画了股票预期收益率与股票在每个因子上的因子载荷(风险敞口),以及每个因子每单位因子载荷(风险敞口)的因子收益率之间的线性关系。
简化 Barra多因子模型
Barra因子模型是用于量化金融领域的一种多因子模型,它被广泛应用于投资组合管理、风险管理和绩效评估等领域,旨在帮助投资者理解和解释资产收益的波动性及其背后的驱动因素。
Barra因子模型基于资本资产定价模型(CAPM)和其他因子模型,将资产收益率分解为多个影响因素,通常包括风格因子、行业因子和国家因子等。这些因子可以捕捉到不同资产收益率变动的主要来源,帮助投资者更好地理解投资组合的风险和收益来源。计算个股收益率之间的相关系数,为给定的资产或者投资组合做风险归因。
在(风险)多因子模型中,因子暴露(factor exposure)和因子收益率(factor return)是两个核心的概念。
所谓因子,就是一个可以描述股票某方面特征的因素,比如行业因子描述了股票是否属于这个行业,P/E 因子描述股票 Price-to-Earnings ratio。
- 因子暴露就是股票在因子所代表的特征上的取值,比如一个股票的 P/E 为 15.9,那么它对 P/E 因子的因子暴露就是 15.9。
- 对于一个给定的因子,按照某种权重组合所有股票便形成了一个基于该因子构建的投资组合,该投资组合的收益率就被定义为这个因子的收益率
风险因子大多来源于股票的基本面数据,很多因子之间存在一定的线性相关性。为了正确的评价一个风险因子是否有效以及在什么程度上有效,必须保证围绕该因子来构建的投资组合可以最大程度的剥离因子之间的相关性。换句话说,针对某因子构建的投资组合应该避免在其他因子上有任何暴露。
步骤
-
因子选择:选择适当的因子,通常包括风格因子(如市值、价值、成长等)、行业因子(如金融、能源、科技等)和其他宏观经济因子。
-
因子收益率估计:使用历史数据估计每个因子的收益率,通常采用回归分析等统计方法。
-
估计因子暴露及因子收益主要有两种方法:
一种是时间序列回归,通过个股收益率序列对因子收益回归,估计因子暴露;
一种是横截面回归,在每一期通过个股收益率对因子暴露回归,估计因子收益率 -
在时间序列回归的估计窗口内,因子暴露是固定的,而因子收益率是变化的。因此,这样估计得到的因子暴露对于市场的变化反应较慢。
-
而在横截面回归中,因子暴露会根据公司特征的变化及时变化,每一期的因子暴露和因子收益率都是变化的,从而能够及时的反映市场变化情况。(barra)
-
因子权重计算:根据因子收益率估计结果,计算每个因子在资产收益率中的权重。
-
投资组合风险分析:将投资组合的收益率分解为各个因子的收益率贡献,分析投资组合在不同因子暴露下的风险。
-
风险调整收益率:根据因子暴露和因子收益率,计算投资组合的风险调整收益率,以便比较不同投资组合的绩效。
华泰多因子建模的步骤
因子筛选、收益预测、风险预测、组合优化
1. 数据处理及因子筛选
- 基础数据采集:确定初始因子,进行因子搜集或者基于基础数据集计算
- 数据探查与异常值捕捉:对相应的分布以及极值进行探索,并选择性更改(去极值、缺失值处理、标准化)
- 数据标准化:(1)因子载荷原始值标准化(2)因子载荷排序值标准化
- 识别有效因子:IC、IR、分层回测
- 行业中性处理是将标准化 z-score 对行业虚拟变量回归的方法,取回归的残差作为因子值,行业划分采用申万一级行业。风格中性处理则是将标准化 z-score 对市值对数和 beta 进行回归,取回归的残差作为因子值。
2. 收益分析
- 大类因子分析:对具有高度相关性的因子进行因子合成。同类型因子的相关性检验、等权法、历史收益率加权法、历史信息比例加权法、主成分分析。
- 因子共线性分析:在进行多元回归之前,为保证模型估计的有效性,需要进行共线性的分析,剔除干扰因子
- 残差异方差分析:对于异方差问题,可以采用个股流通市值的平方根作为权重进行加权最小二乘法回归。
- 多元线性回归:通过多元线性回归计算每一期的因子收益;
- 估计因子预期收益:因子收益的方向需要根据实际经济含义进行约束计算股票预期收益:根据因子收益和每个股票的因子载荷计算出个股的预期收益率。历史均值法、指数加权移动平均法、时间序列预测法、 滤波法提取趋势项。
3. 风险预测
- 计算因子收益率协方差矩阵:根据因子收益率的历史序列,计算出因子的协方差阵;
- 残差风险估计:计算出个股的残差风险。
4.组合优化
- 确定组合的收益目标:一种是确定目标收益,然后最小化风险;或确定风险目标,最大化收益;
- 行业权重约束:根据风险目标确定行业风险的暴露。如果组合存在基准组合,则需要根据基准组合在各个行业的权重分布,确定行业偏离约束
- 因子暴露约束:多因子模型本身是一个追求宽度的模型,所以为避免在某些因子上暴露过大导致风险过高,需要对因子暴露进行一定的约束
- 个股上下限约束:因为卖空约束以及避免在个股上暴露过高的风险,所以需要对个股权重的上下限进行约束
- 二次规划求解组合权重分配:第T +1期的股票预期收益、因子收益协方差矩阵、预期残差风险,都计算出来之后,关于股票的预期风险和收益的基础数据就全部得到了。接下来需要做的就是在这些数据的基础上, 结合投资组合的风险-收益目标,以及各种约束条件,进行股票选择和权重分配。