2025年金融工程研究报告:股票多因子系列(五),Barra CNE6纯因子风险模型搭建与应用

  • 来源:江海证券
  • 发布时间:2025/12/17
  • 浏览次数:254
  • 举报
相关深度报告REPORTS

金融工程研究报告:股票多因子系列(五),Barra CNE6纯因子风险模型搭建与应用.pdf

金融工程研究报告:股票多因子系列(五),BarraCNE6纯因子风险模型搭建与应用。Barra风险模型是业界进行投资组合管理过程中,运用最为广泛的风险模型之一。本文在系列报告前两篇的基础上,进一步完善并复现了Barra多因子风险模型。具体而言,本文先详细阐释了风险模型的重要性并同时介绍了风险模型的搭建与求解方法。然后从单因子检验、纯因子模型搭建、残差因子选股能力、宽基指数风格暴露与绩效归因角度对Barra风险模型进行实践应用。风险模型的重要性。风险模型之所以重要是因为投资者可以通过其对资产收益率进行降维,进而可以方便地计算出资产之间的协方差矩阵,而后者正是投资组合优化中必不可少的输入之一。其次...

1 Barra 风险模型回顾与概述

在系列报告的前两篇中,我们分别对 Barra CNE6 中的量价大类与基本面 大类因子进行了介绍,详细阐述了因子的构造逻辑与计算方式,并基于分层 回测法与 IC、IR 检验对这些大类因子进行了实证检验。本文及后续报告将主 要围绕纯因子模型的求解以及个股协方差矩阵的估计展开,进一步深入探讨 Barra 风险模型的理论知识与实践应用。

1.1 为什么风险模型重要

无论是在学术界还是业界,对于风险的度量与处置,始终是研究与讨论 的核心热点之一。这其中,多因子模型是目前运用最广泛的风险模型,其具 备可解释性较好、形式简洁灵活、扩展性较高等特点,在学术界与业界中均 有着丰富的应用与研究成果。

1.2 Barra CNE6 模型介绍

2004 年,MSCI 收购了 Barra 公司并成立了 MSCI Barra,旨在为全球投资 者提供专业的因子模型体系服务。2018 年,Barra CNE6(中国股票多因子模 型)问世,其包含两个子模型——长期模型 CNLT 与交易模型 CNTR,前者更 适用于长线投资者,而后者在前者的基础上加入了 4 个额外的风格因子以捕 捉短期风险1。2025 年 1 月,MSCI 又推出了最新一代 Barra 中国股票因子模型(CNE7),旨在帮助国内投资者更好地了解驱动中国 A 股风险和回报的源 头。CNE7 相较于 CNE6 来说有以下几点创新:

1) 新增风格因子: 国有持股因子,旨在捕捉国有股份的占比; 股票拥挤度因子,旨在评估股票和投资组合的“泡沫程度”或拥 挤度; 机器学习因子,旨在了解和捕捉因子暴露与个股收益之间的非 线性关系;

2) 现有因子体系优化:增强动量和残余波动率等现有因子,旨在改善 IPO 对因子的影 响; 增强成长性和股息率因子,旨在提升其稳健性和表现; 增强质量因子,旨在维持与其他模型的一致性; 增强价值因子,旨在将账面市值比和盈利率合并为一个因子;基于中国本土行业分类法的行业结构;

3) 模型技术优化: 自适应因子协方差,旨在帮助投资者在管理投资组合时更好地 应对多个周期中不断变化的市场机制;

1.3 Barra CNE6 模型求解

本节我们介绍 Barra CNE6 的求解过程。传统的 OLS 模型假设残差变量满 足 独 立 且 同 方 差 , 而 实 际 情 况 下 , 残 差 变 量 往 往 存 在 异 方 差 (heteroscedasticity)与自相关(autocorrelation)的特性。

2 Barra 风险模型实践与应用

2.1 模型测试细节

因子选取与合成

受限于数据的可得性,我们在计算 Barra 各级因子的时候,剔除了与分 析师预期相关的因子,因此模型中一级大类因子由 9 个变为 8 个,二级因子 由 20 个变为 19 个,三级因子由 46 个变为 39 个。同时,由于 Barra CNE6 并 未给出各子级因子合成上一级因子的权重,因此,在合成各级因子时,我们 统一采取等权合成的方式。

数据选取

我们选取除北交所外,沪深 A 股中剔除 ST 股、停牌股后的所有个股 2005-01-01 至 2025-10-10 的量价数据与基本面数据来计算各风格因子的因子 暴露。得到因子暴露序列并对齐后,因子暴露序列时间区间为 2010-01-12 至 2025-10-10。

单因子分层回测

我们使用分层回测的方式对因子进行检验,具体步骤如下: 在?时刻,对截面上所有股票池内的股票按照因子值大小从高到低 进行排序并分为 10 组。若因子为正向因子——在该因子上的暴露 越大,所获得的超额收益越多,则做多因子值最大的一组(top 组) 同时做空因子值最小的一组(Bottom 组),反之亦然。 除了使用单因子回归检验因子有效性外,还可以通过因子的信息系 数 IC(Information Coefficient)以及 信息比率 IR(Information Ratio)来检测因子的有效性。 使用分组回测的年化收益率、年化波动率、夏普比率、最大回撤、 单调性等对因子有效性进行评判。

2.2 大类风格因子单因子检验

综合以上回测结果,不难发现,各大类因子选股区分度较为一般,Rank IC、IR 都处于较低水平。从分层回测的显著性来看,较为显著的大类因子仅为 Growth、Momentum、Volatility 和 DividendYield,其余因子对截面个股收 益率则无明显解释力度。 原因在于,首先,风格因子多为风险因子而不是收益因子,它描述了某 种市场风格而并不一定具备较好的选股能力;其次,在单因子回测时,无法 排除其他因子对回测因子的干扰,即无法保证因子投资组合对其他因子的暴 露为 0,同时也无法保证因子投资组合在回测因子上的暴露始终为 1。

2.3 大类因子纯因子模型

根据式(1.9)我们可以计算出截面上每一期各大类因子的纯因子收益率, 将其累乘即可得到纯因子组合的历史净值。同时,我们还可以计算出每期截 面回归后纯因子模型的 ? ?。图 19 展示了纯因子模型滚动一年的 ? ?均值,全 样本回归 ? ?的均值约为 11.45%,最大值为 18.39%,最小值为 6.38%。 从历史净值走势图来看,Size、Liquidity、Momentum 因子呈现出稳健 的 反 向 预 测 能 力, 年 化 收 益 分 别 为-2.75%、-5.90%、-5.57%;Volatility、 Value 是较为明显的正向因子,年化收益分别为 1.93%、1.38%;而 Growth、 Quality 与 DividendYield 则呈现为阶段性的正向或负向因子。

2.4 残差因子选股能力分析

根据 Barra CNE6,股票截面收益率可以为行业因子、风格因子和国家因 子三部分共同因子解释,剥离这 3 部分后的残差部分,即为个股的特质收益 率。上节谈到,Barra 纯因子模型 ? ?均值仅为 11.45%,因此,残差部分是否 还存在显著的非线性因素导致模型整体的 ? ?偏低呢?为此,我们尝试使用 回归后残差作为选股因子进行分层回测,观察其分组单调性以及选股能力。

从分层回测走势图不难看出,组合绩效中中间层(第 5、6、7 组)表现 明显好于 Top 组与 Bottom 组,且 Top 组与 Bottom 组间收益差距较小,表明 残差因子与个股收益率间存在非常明显的非线性关系,且残差因子的选股能 力强劲,中间层第 5 组年化收益达 17.98%,夏普率为 0.68,相较于第 10 组 超额年化收益为 13.58%,超额夏普率为 1.50。以上回测显示,Barra CNE6 体 系对个股收益率的解释力度并不完备,若要提升模型的解释力度,可考虑引 入非线性因子。

3 宽基指数风格暴露与绩效归因

3.1 宽基指数风格暴露分析

我们对上证 50、沪深 300、中证 500、中证 A500、中证 1000 以及创业 板指今年以来(截止至 2025 年 10 月 10 日)的收益率进行拆分,得到其风 格暴露时间序列,取均值后作为各宽基指数今年以来的风格暴露值。 对比上证 50 与沪深 300 指数,可以发现两者风格暴露分布较为类似, 皆在 Size、DividendYield 上有较为明显的正向暴露;在 Liquidity 与 Volatility 上呈现负暴露,两者皆具有大市值、高分红、低波低流动性的特点。两者区 别在于上证 50 在 Size 与 Value 因子的正向暴露更大,而沪深 300 则更具成 长性。

反观中证 500 与中证 A500 指数,风格暴露差异显著。由于编制方案不 同,中证 A500 更强调行业均衡,不仅在行业分布上与中证全指保持一致 (行业中性)同时更偏好细分行业龙头企业。因此,中证 A500 的 Size 风格 呈现正暴露而中证 500 更偏小市值风格,除此以外,中证 A500 更突出成长 性与高股息特征,而中证 500 则更具流动性与波动性。

中证 1000 与创业板指同样风格迥异,中证 1000 负向市值暴露显著,具 备高波动、高流动性的风格;创业板指则更偏大市值风格,同时具备低价值、 高成长、高波动、强动量的特征。两者相同的是,分红水平都较低。

3.2 宽基指数收益归因

进一步地,我们将各指数今年以来收益按照风格因子、行业因子、国家 因子与残差因子进行区分和归因,探究各指数的收益来源与驱动因素。 上证 50 与沪深 300 因风格暴露相似,收益归因也类似,今年以来较全 市场组合(国家因子)超额收益为负。风格因子中,Size 与 Volatility 贡献了 显著的负收益、Liquidity 则贡献了明显的正收益;行业因子中,银行、非银 金融、食品饮料是拖累超额收益的主要原因之一,有色金属与电子则有一定 的正收益;残差因子无明显收益。

中证 500 风格因子、行业因子、残差因子收益为正,因此超额收益也为 正,中证 A500 受风格因子与行业因子拖累,超额收益为负。这其中,Size 与 Volatility 仍是决定风格因子收益的主要因素,中证 A500 因为更偏大市值、 低波动导致风格因子收益为负,中证 500 则恰好相反。行业因子方面,中证 500 中收益贡献最多的前三行业分别是有色金属、电子、机械,中证 A500 是有色金属、电子、通信。此外,由于在食品饮料行业上暴露过大,导致了 中证 A500 行业因子收益为负且弱于中证 500。 中证 1000 今年以来收益与全市场组合(国家因子)几乎一致,风格因 子与行业因子均取得正收益,而残差因子则为负收益。创业板指今年以来超 额收益显著达 18.23%,风格因子、行业因子、残差因子收益在所统计指数中 均处于最高水平,风格因子中 Volatility、Growth、Value 正收益显著,行业 因子中通信、电子、电力设备及新能源正收益显著。除此之外,残差因子也 贡献了 10.88%的超额收益。 综上可以发现,今年以来,录得正超额的指数有中证 500(3.41%)、创 业板指(18.23%),负超额的指数有中证 1000(-0.22%)、中证 A500(- 1.60%)、沪深 300(-4.30%)、上证 50(-10.27%),其中小市值、高波动、低 流动性、高成长性、低股息风格较为受益,较市场组合有明显的正向超额。 行业因子层面,有色金属、电子、通信、电力设备及新能源明显领跑市场。

4 总结

Barra 风险模型是业界进行投资组合管理过程中,运用最为广泛的风险 模型之一。本文在系列报告前两篇的基础上,进一步完善并复现了 Barra 多 因子风险模型。具体而言,本文首先详细阐释了风险模型的重要性并同时介 绍了风险模型的搭建与求解方法。接着,在 Barra CNE6(CNTR)的基础上, 我们等权合成了大类风格因子并基于此构建了纯因子模型,同时也检验了回 归残差的选股能力。最后,我们使用纯因子模型计算常见宽基指数的风格暴 露并对它们今年以来的收益进行归因。 前文提到,风险模型之所以重要是因为投资者可以通过其对资产收益率 进行降维,进而可以方便地计算出资产之间的协方差矩阵,而后者正是投资 组合优化中必不可少的输入之一。其次,在构建风险模型的过程中,Barra CNE6 使用带约束的加权最小二乘法解决了共线性与异方差的问题,并得到 了纯因子投资组合,其满足围绕某个因子所构建的投资组合仅对该因子的暴 露为 1,而对其他因子的暴露为 0,从而能更好地评估因子收益率的实际大 小。

实操层面,受限于数据的可得性,我们在等权合成大类因子的过程中, 剔除了与分析师一致预期相关联的因子,最终生成了 8 大类因子(Size、 Volatility、Liquidity、Momentum、Quality、Value、Growth、Dividend Yield)。 首先,我们对大类因子进行了单因子检验,结果发现各大类因子并无明显选 股能力,且显著性与有效性都较低。在构建纯因子模型后,各大类因子显著 性明显提升,其中 Size、Liquidity、Momentum 因子呈现出稳健的反向预测 能力,年化收益分别为-2.75%、-5.90%、-5.57%;Volatility、Value 是较为明 显的正向因子,年化收益分别为 1.93%、1.38%;而 Growth、Quality 与 DividendYield 则呈现为阶段性的正向或负向因子。纯因子模型回归 ? ?的均 值约为 11.45%,表明模型对个股收益率的解释力度并不高。因此,我们对模 型回归后的残差因子的选股能力进行检验,结果显示,残差因子与个股收益 率间存在非常明显的非线性关系,且残差因子的选股能力强劲,中间层第 5 组年化收益达 17.98%,夏普率为 0.68,相较于第 10 组超额年化收益为 13.58%,超额夏普率为 1.50。

最后,我们利用所搭建的风险模型对常见宽基指数的风格暴露与收益分 别进行计算与归因。结果发现,今年以来,录得正超额的指数有中证 500 (3.41%)、创业板指(18.23%),负超额的指数有中证 1000(-0.22%)、中证 A500(-1.60%)、沪深 300(-4.30%)、上证 50(-10.27%),其中小市值、高 波动、低流动性、高成长性、低股息风格较为受益,较市场组合有明显的正向超额。行业因子层面,有色金属、电子、通信、电力设备及新能源明显领 跑市场。 在后续研究过程中,还可以考虑通过以下方式提升 Barra CNE6 风险模型 解释力度: 1) 合成大类因子时的加权方式。Barra CNE6 并未给出合成大类因子时 的加权方式,为了不破坏各子级风格因子本身的经济含义,我们采 取的等权合成构建大类因子。而利用因子方向、因子历史 RankIC 等信息合成大类因子或是可以优化的方向之一。 2) 引入非线性因子。正如 Barra CNE7 中所描述的,可对回归残差中的 非线性因素使用机器学习的方式进行挖掘,以捕捉因子暴露与个股 收益之间的非线性关系。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至