2025年金融工程研究报告：股票多因子系列（五），Barra CNE6纯因子风险模型搭建与应用

来源：江海证券
发布时间：2025/12/17
浏览次数：254
举报

相关深度报告REPORTS

金融工程研究报告：股票多因子系列（五），Barra CNE6纯因子风险模型搭建与应用.pdf

金融工程研究报告：股票多因子系列（五），BarraCNE6纯因子风险模型搭建与应用。Barra风险模型是业界进行投资组合管理过程中，运用最为广泛的风险模型之一。本文在系列报告前两篇的基础上，进一步完善并复现了Barra多因子风险模型。具体而言，本文先详细阐释了风险模型的重要性并同时介绍了风险模型的搭建与求解方法。然后从单因子检验、纯因子模型搭建、残差因子选股能力、宽基指数风格暴露与绩效归因角度对Barra风险模型进行实践应用。风险模型的重要性。风险模型之所以重要是因为投资者可以通过其对资产收益率进行降维，进而可以方便地计算出资产之间的协方差矩阵，而后者正是投资组合优化中必不可少的输入之一。其次...

1 Barra 风险模型回顾与概述

在系列报告的前两篇中，我们分别对 Barra CNE6 中的量价大类与基本面大类因子进行了介绍，详细阐述了因子的构造逻辑与计算方式，并基于分层回测法与 IC、IR 检验对这些大类因子进行了实证检验。本文及后续报告将主要围绕纯因子模型的求解以及个股协方差矩阵的估计展开，进一步深入探讨 Barra 风险模型的理论知识与实践应用。

1.1 为什么风险模型重要

无论是在学术界还是业界，对于风险的度量与处置，始终是研究与讨论的核心热点之一。这其中，多因子模型是目前运用最广泛的风险模型，其具备可解释性较好、形式简洁灵活、扩展性较高等特点，在学术界与业界中均有着丰富的应用与研究成果。

1.2 Barra CNE6 模型介绍

2004 年，MSCI 收购了 Barra 公司并成立了 MSCI Barra，旨在为全球投资者提供专业的因子模型体系服务。2018 年，Barra CNE6（中国股票多因子模型）问世，其包含两个子模型——长期模型 CNLT 与交易模型 CNTR，前者更适用于长线投资者，而后者在前者的基础上加入了 4 个额外的风格因子以捕捉短期风险1。2025 年 1 月，MSCI 又推出了最新一代 Barra 中国股票因子模型（CNE7），旨在帮助国内投资者更好地了解驱动中国 A 股风险和回报的源头。CNE7 相较于 CNE6 来说有以下几点创新：

1) 新增风格因子：国有持股因子，旨在捕捉国有股份的占比；股票拥挤度因子，旨在评估股票和投资组合的“泡沫程度”或拥挤度；机器学习因子，旨在了解和捕捉因子暴露与个股收益之间的非线性关系；

2) 现有因子体系优化：增强动量和残余波动率等现有因子，旨在改善 IPO 对因子的影响；增强成长性和股息率因子，旨在提升其稳健性和表现；增强质量因子，旨在维持与其他模型的一致性；增强价值因子，旨在将账面市值比和盈利率合并为一个因子；基于中国本土行业分类法的行业结构；

3) 模型技术优化：自适应因子协方差，旨在帮助投资者在管理投资组合时更好地应对多个周期中不断变化的市场机制；

1.3 Barra CNE6 模型求解

本节我们介绍 Barra CNE6 的求解过程。传统的 OLS 模型假设残差变量满足独立且同方差，而实际情况下，残差变量往往存在异方差（heteroscedasticity）与自相关（autocorrelation）的特性。

2 Barra 风险模型实践与应用

2.1 模型测试细节

因子选取与合成

受限于数据的可得性，我们在计算 Barra 各级因子的时候，剔除了与分析师预期相关的因子，因此模型中一级大类因子由 9 个变为 8 个，二级因子由 20 个变为 19 个，三级因子由 46 个变为 39 个。同时，由于 Barra CNE6 并未给出各子级因子合成上一级因子的权重，因此，在合成各级因子时，我们统一采取等权合成的方式。

数据选取

我们选取除北交所外，沪深 A 股中剔除 ST 股、停牌股后的所有个股 2005-01-01 至 2025-10-10 的量价数据与基本面数据来计算各风格因子的因子暴露。得到因子暴露序列并对齐后，因子暴露序列时间区间为 2010-01-12 至 2025-10-10。

单因子分层回测

我们使用分层回测的方式对因子进行检验，具体步骤如下：在?时刻，对截面上所有股票池内的股票按照因子值大小从高到低进行排序并分为 10 组。若因子为正向因子——在该因子上的暴露越大，所获得的超额收益越多，则做多因子值最大的一组（top 组）同时做空因子值最小的一组（Bottom 组），反之亦然。除了使用单因子回归检验因子有效性外，还可以通过因子的信息系数 IC（Information Coefficient）以及信息比率 IR（Information Ratio）来检测因子的有效性。使用分组回测的年化收益率、年化波动率、夏普比率、最大回撤、单调性等对因子有效性进行评判。

2.2 大类风格因子单因子检验

综合以上回测结果，不难发现，各大类因子选股区分度较为一般，Rank IC、IR 都处于较低水平。从分层回测的显著性来看，较为显著的大类因子仅为 Growth、Momentum、Volatility 和 DividendYield，其余因子对截面个股收益率则无明显解释力度。原因在于，首先，风格因子多为风险因子而不是收益因子，它描述了某种市场风格而并不一定具备较好的选股能力；其次，在单因子回测时，无法排除其他因子对回测因子的干扰，即无法保证因子投资组合对其他因子的暴露为 0，同时也无法保证因子投资组合在回测因子上的暴露始终为 1。

2.3 大类因子纯因子模型

根据式（1.9）我们可以计算出截面上每一期各大类因子的纯因子收益率，将其累乘即可得到纯因子组合的历史净值。同时，我们还可以计算出每期截面回归后纯因子模型的 ? ?。图 19 展示了纯因子模型滚动一年的 ? ?均值，全样本回归 ? ?的均值约为 11.45%，最大值为 18.39%，最小值为 6.38%。从历史净值走势图来看，Size、Liquidity、Momentum 因子呈现出稳健的反向预测能力，年化收益分别为-2.75%、-5.90%、-5.57%；Volatility、 Value 是较为明显的正向因子，年化收益分别为 1.93%、1.38%；而 Growth、 Quality 与 DividendYield 则呈现为阶段性的正向或负向因子。

2.4 残差因子选股能力分析

根据 Barra CNE6，股票截面收益率可以为行业因子、风格因子和国家因子三部分共同因子解释，剥离这 3 部分后的残差部分，即为个股的特质收益率。上节谈到，Barra 纯因子模型 ? ?均值仅为 11.45%，因此，残差部分是否还存在显著的非线性因素导致模型整体的 ? ?偏低呢？为此，我们尝试使用回归后残差作为选股因子进行分层回测，观察其分组单调性以及选股能力。

从分层回测走势图不难看出，组合绩效中中间层（第 5、6、7 组）表现明显好于 Top 组与 Bottom 组，且 Top 组与 Bottom 组间收益差距较小，表明残差因子与个股收益率间存在非常明显的非线性关系，且残差因子的选股能力强劲，中间层第 5 组年化收益达 17.98%，夏普率为 0.68，相较于第 10 组超额年化收益为 13.58%，超额夏普率为 1.50。以上回测显示，Barra CNE6 体系对个股收益率的解释力度并不完备，若要提升模型的解释力度，可考虑引入非线性因子。

3 宽基指数风格暴露与绩效归因

3.1 宽基指数风格暴露分析

我们对上证 50、沪深 300、中证 500、中证 A500、中证 1000 以及创业板指今年以来（截止至 2025 年 10 月 10 日）的收益率进行拆分，得到其风格暴露时间序列，取均值后作为各宽基指数今年以来的风格暴露值。对比上证 50 与沪深 300 指数，可以发现两者风格暴露分布较为类似，皆在 Size、DividendYield 上有较为明显的正向暴露；在 Liquidity 与 Volatility 上呈现负暴露，两者皆具有大市值、高分红、低波低流动性的特点。两者区别在于上证 50 在 Size 与 Value 因子的正向暴露更大，而沪深 300 则更具成长性。

反观中证 500 与中证 A500 指数，风格暴露差异显著。由于编制方案不同，中证 A500 更强调行业均衡，不仅在行业分布上与中证全指保持一致（行业中性）同时更偏好细分行业龙头企业。因此，中证 A500 的 Size 风格呈现正暴露而中证 500 更偏小市值风格，除此以外，中证 A500 更突出成长性与高股息特征，而中证 500 则更具流动性与波动性。

中证 1000 与创业板指同样风格迥异，中证 1000 负向市值暴露显著，具备高波动、高流动性的风格；创业板指则更偏大市值风格，同时具备低价值、高成长、高波动、强动量的特征。两者相同的是，分红水平都较低。

3.2 宽基指数收益归因

进一步地，我们将各指数今年以来收益按照风格因子、行业因子、国家因子与残差因子进行区分和归因，探究各指数的收益来源与驱动因素。上证 50 与沪深 300 因风格暴露相似，收益归因也类似，今年以来较全市场组合（国家因子）超额收益为负。风格因子中，Size 与 Volatility 贡献了显著的负收益、Liquidity 则贡献了明显的正收益；行业因子中，银行、非银金融、食品饮料是拖累超额收益的主要原因之一，有色金属与电子则有一定的正收益；残差因子无明显收益。

中证 500 风格因子、行业因子、残差因子收益为正，因此超额收益也为正，中证 A500 受风格因子与行业因子拖累，超额收益为负。这其中，Size 与 Volatility 仍是决定风格因子收益的主要因素，中证 A500 因为更偏大市值、低波动导致风格因子收益为负，中证 500 则恰好相反。行业因子方面，中证 500 中收益贡献最多的前三行业分别是有色金属、电子、机械，中证 A500 是有色金属、电子、通信。此外，由于在食品饮料行业上暴露过大，导致了中证 A500 行业因子收益为负且弱于中证 500。中证 1000 今年以来收益与全市场组合（国家因子）几乎一致，风格因子与行业因子均取得正收益，而残差因子则为负收益。创业板指今年以来超额收益显著达 18.23%，风格因子、行业因子、残差因子收益在所统计指数中均处于最高水平，风格因子中 Volatility、Growth、Value 正收益显著，行业因子中通信、电子、电力设备及新能源正收益显著。除此之外，残差因子也贡献了 10.88%的超额收益。综上可以发现，今年以来，录得正超额的指数有中证 500（3.41%）、创业板指（18.23%），负超额的指数有中证 1000（-0.22%）、中证 A500（- 1.60%）、沪深 300（-4.30%）、上证 50（-10.27%），其中小市值、高波动、低流动性、高成长性、低股息风格较为受益，较市场组合有明显的正向超额。行业因子层面，有色金属、电子、通信、电力设备及新能源明显领跑市场。

4 总结

Barra 风险模型是业界进行投资组合管理过程中，运用最为广泛的风险模型之一。本文在系列报告前两篇的基础上，进一步完善并复现了 Barra 多因子风险模型。具体而言，本文首先详细阐释了风险模型的重要性并同时介绍了风险模型的搭建与求解方法。接着，在 Barra CNE6（CNTR）的基础上，我们等权合成了大类风格因子并基于此构建了纯因子模型，同时也检验了回归残差的选股能力。最后，我们使用纯因子模型计算常见宽基指数的风格暴露并对它们今年以来的收益进行归因。前文提到，风险模型之所以重要是因为投资者可以通过其对资产收益率进行降维，进而可以方便地计算出资产之间的协方差矩阵，而后者正是投资组合优化中必不可少的输入之一。其次，在构建风险模型的过程中，Barra CNE6 使用带约束的加权最小二乘法解决了共线性与异方差的问题，并得到了纯因子投资组合，其满足围绕某个因子所构建的投资组合仅对该因子的暴露为 1，而对其他因子的暴露为 0，从而能更好地评估因子收益率的实际大小。

实操层面，受限于数据的可得性，我们在等权合成大类因子的过程中，剔除了与分析师一致预期相关联的因子，最终生成了 8 大类因子（Size、 Volatility、Liquidity、Momentum、Quality、Value、Growth、Dividend Yield）。首先，我们对大类因子进行了单因子检验，结果发现各大类因子并无明显选股能力，且显著性与有效性都较低。在构建纯因子模型后，各大类因子显著性明显提升，其中 Size、Liquidity、Momentum 因子呈现出稳健的反向预测能力，年化收益分别为-2.75%、-5.90%、-5.57%；Volatility、Value 是较为明显的正向因子，年化收益分别为 1.93%、1.38%；而 Growth、Quality 与 DividendYield 则呈现为阶段性的正向或负向因子。纯因子模型回归 ? ?的均值约为 11.45%，表明模型对个股收益率的解释力度并不高。因此，我们对模型回归后的残差因子的选股能力进行检验，结果显示，残差因子与个股收益率间存在非常明显的非线性关系，且残差因子的选股能力强劲，中间层第 5 组年化收益达 17.98%，夏普率为 0.68，相较于第 10 组超额年化收益为 13.58%，超额夏普率为 1.50。

最后，我们利用所搭建的风险模型对常见宽基指数的风格暴露与收益分别进行计算与归因。结果发现，今年以来，录得正超额的指数有中证 500 （3.41%）、创业板指（18.23%），负超额的指数有中证 1000（-0.22%）、中证 A500（-1.60%）、沪深 300（-4.30%）、上证 50（-10.27%），其中小市值、高波动、低流动性、高成长性、低股息风格较为受益，较市场组合有明显的正向超额。行业因子层面，有色金属、电子、通信、电力设备及新能源明显领跑市场。在后续研究过程中，还可以考虑通过以下方式提升 Barra CNE6 风险模型解释力度： 1) 合成大类因子时的加权方式。Barra CNE6 并未给出合成大类因子时的加权方式，为了不破坏各子级风格因子本身的经济含义，我们采取的等权合成构建大类因子。而利用因子方向、因子历史 RankIC 等信息合成大类因子或是可以优化的方向之一。 2) 引入非线性因子。正如 Barra CNE7 中所描述的，可对回归残差中的非线性因素使用机器学习的方式进行挖掘，以捕捉因子暴露与个股收益之间的非线性关系。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）