2025年西学东渐——海外文献推荐系列之一百八十一篇

来源：兴业证券
发布时间：2025/12/30
浏览次数：30
举报

相关深度报告REPORTS

西学东渐——海外文献推荐系列之一百八十一篇.pdf

西学东渐——海外文献推荐系列之一百八十一篇。西学东渐，是指从明朝末年到近代，西方学术思想向中国传播的历史过程。至今天，西学东渐仍有其重要意义。本文作者通过大量的海外文献阅读，去粗取精，将本文作者认为最有价值的量化投资研究呈现在您面前，以供投资参考。作为西学东渐——海外文献系列报告第一百八十一篇，本文推荐了StefanoGiglio,DachengXiu和DakeZhang于2024年发表在JournalofFinance上的论文《TestAssetsandWeakFactors》。本文研究了资产定价中测试资产（TestAssets）的选择与弱因子...

一、引言

对因子风险溢价进行推断是资产定价实证工作的核心内容。在这一过程中，测试资产的选择起着至关重要的作用，然而鲜有文献对如何严格、系统地选择测试资产进行深入研究。本文展示了测试资产的选择与资产定价中长期存在的弱因子（Weak Factors）问题之间存在的重要联系——即当测试资产对因子的暴露极小或为零时，会导致风险溢价推断的失效。本文认为，因子的强弱不应被视为因子本身的固有属性，而应被视为用于估计的测试资产截面的一种属性。例如，一个流动性因子在按规模和价值等特征排序的投资组合截面中可能表现较弱，但在能很好捕捉流动性暴露的特征所排序的资产截面中可能表现强劲。

利用这一洞见，本文作者提出了一种新的风险溢价估计方法——监督主成分分析（SPCA），通过有监督的测试资产选择来解决弱因子问题。本文作者将 SPCA 设计为一个迭代算法，利用目标因子来指导测试资产的选择。同时，该算法使用 PCA 迭代地恢复相关的潜在因子，从而控制潜在的遗漏因子。这种有监督选择与 PCA 的结合产生了一种通用的方法，即使遗漏的因子是弱因子，该方法也能保持稳健。简而言之，该程序按如下方式估计目标因子??的风险溢价：第一，本文作者从大量的潜在测试资产池开始，计算每个资产收益率与??的单变量相关性。本文作者选择一小部分资产，仅保留那些相关性足够高（绝对值）的资产：这些资产对目标因子??具备较高的信息量。第二，计算这些筛选出的资产收益率序列的第一主成分，作为本轮迭代提取出的一个潜在因子，通过线性投影，从??和所有测试资产的收益率中，移除这个新提取的潜在因子所能解释的部分，得到残差。第三，在上述残差的基础上，重复步骤（即再次计算相关性、筛选资产、提取主成分）。如此循环?次次。参数?次可以基于对数据中因子数量的验验识识设定，或通过交叉验证等步骤确定为调优参数。此过程最终会得到?个潜在因子，这些因子序列包含了关于??的关键信息。与传统 PCA 在所有步骤中使用资产池中的全部资产不同，SPCA 在每一步都聚焦于与目标因子最相关的资产子集。这种做法确保其不仅能捕捉到在全部资产截面上表现强劲的因子，也能有效捕捉那些仅对部分资产有影响的弱因子。

资产定价文献中，测试资产的选择大致遵循三种主流路径：标准截面：最常见的是沿用 Fama 和 French(1993)的开创性工作，使用由少数几个关键特征（如规模、价值）排序形成的投资组合集合。大规模截面：近年来的一种趋势是大幅扩展测试资产的规模，例如使用过去几十年文献中发现的大量异象特征（成百上千个）来构建排序投资组合。针对性组合：另一种更“定向”的方法是，针对所研究的特定因子，直接根据各资产对该因子的历史暴露度（或称为敞口、贝塔）进行排序并构建投资组合，然后仅使用这些组合进行估计，期望它们能提供关于该因子的最大信息。将 SPCA 的资产选择逻辑与上述三种传统方法进行比较，能清晰揭示其优势：使用标准的截面（如市值和价值排序组合）进行估计，其弊端在于，除在该截面中显强势的因子（如规模、价值因子）外，其余多数因子往往表现为弱因子。其根本原因是此类测试资产未能提供足够的暴露，导致模型无法有效识别这些因子的风险溢价。使用大规模截面次（第二种方法）表面上乎解解决了这个问题。然而，关键在于，如果这些资产中只有少数对某个因子有暴露，而大多数没有，那么该因子在这个大截面中仍然是弱因子，从而破坏对风险溢价的推断。使用针对性组合容易受到遗漏变量问题的影响，因为它仅考虑单变量暴露（与感兴趣因子的暴露可能捕捉了对经济中其他风险的相关暴露），多因子背景下，这种方法通常会失效。

在本文中，作者在允许弱因子的设定下，推导了 SPCA 的渐近性质。本文作者分析了近期文献中提出的替代估计量(PCA、Ridge、Lasso 和 PLS)，并表明：在存在弱因子的情况下，PCA、Ridge 和 PLS 是不一致的；Lasso 虽然具有一致性，但在效率上通常不如 SPCA。此外，本文作者通过广泛的蒙特卡洛模拟发现，在应对遗漏因子、弱因子以及因子测量误差 (Measurement Error)的复杂场景下， SPCA 均表现出良好的稳健性。本文的核心分析，是在于探讨如何在因子强度因测试资产而异的环境下，通过主动选择测试资产来准确估计风险溢价。研究模型构建：由于在标准的测试资产截面中，许多因子的风险暴露?极其微弱，导致信号被特质噪声淹没，识别真实的风险溢价极具挑战。已有文献提出的 PCA、PLS 及 Ridge 回归等方法在这种“弱因子”环境下均被证明是不一致的。为此，本文提出了监督主成分分析(SPCA)模型框架。该模型不再将测试资产集合视为既定不变，而是将其视为一个可选择的变量，利用目标因子??的信息来指导潜在因子的提取。本文作者假设：因子的强弱并非绝对，而是相对于测试资产截面而言的。在均衡状态下，虽然某个因子在整个资产池中可能表现为弱因子，但总是存在一个子集?0，使得该因子在其中表现为强因子。因此，本文作者构建了一个“筛选-投影-迭代”的机制：首验筛选出与目标因子g t相关性最高的资产子集，从中提取主成分；然后将该主成分的影响从所有变量中剔除(投影)；最后对残差重复上述过程。若该假设成立，SPCA 将能够逐个恢复所有相关的潜在因子，无论其在整体截面中是强是弱。为验证此假设：本文作者首验建立了严格的渐近理论，证明了在样本量?和时间?趋于无穷时，SPCA 估计量具有统计一致性和渐近正态性。随后，本文作者通过广泛的蒙特卡罗模拟比较了 SPCA 与其他主流估计量的表现。结果表明，当存在弱因子时，传统方法(如 PCA 和两步回归)的估计偏差巨大，而 SPCA 的估计结果始终集中在真实值附近，偏差接近于零。这一结果在不同的样本量设定下均稳健，且 SPCA 在因子数量识别上也表现出优异的准确性。此外，本文作者还发现 Lasso 虽然也能提供一致估计，但其收敛速度较慢，效率不如利用因子结构的 SPCA。本文作者其次还考察了 SPCA 在因子去噪(De-noising)中的作用。本文作者将 SPCA 应用于 Fama-French 五因子模型，通过剥离因子中的测量误差(即未被测试资产共同运动解释的部分)来构建“去噪因子”。回归结果显示，相比于原始五因子模型及 Daniel et al.(2020)的去噪模型，基于 SPCA 的去噪因子模型在解释横截面收益差异时具有更低的定价误差(?)，证明了该方法在提炼有效定价信息方面的优越性。

本文的贡献主要体现在三方面：（1）提供了关于弱因子问题的新视角，指出因子的强弱取决于测试资产的选择；（2）提出了解决弱因子与遗漏因子问题的通用方法论 SPCA，并证明了其统计一致性；（3）通过丰富的实证证据，展示了 SPCA 在风险溢价估计、基金评价和因子改进方面的实际应用价值。这些发现对理解金融市场中的风险定价机制具有重要意义，尤其考虑到在因子数量激增且许多因子在标准测试资产截面中表现微弱或失效的背景下（Kan and Zhang, 1999；Harvey et al, 2016）。

二、数据来源与描述性统计

本文的实证研究基于多维度、大规模的资产定价数据集，涵盖了广泛的特征排序投资组合以及各类可交易与不可交易因子。

（一）测试资产与投资组合数据

为了全面检验 SPCA 在处理不同强度因子时的表现，本文选取了两个具有代表性的大型测试资产数据集：

1. 主数据集

采用 Chen and Zimmermann(2020)构建的开源异象投资组合(Open Source Cross-Sectional Asset Pricing)。该数据集复现了资产定价文献中大量异象因子的构建过程。本文选取了 2021 年 4 月发布的版本，时间跨度为 1976 年 3 月至 2020年 12 月。在剔除存在缺失值的序列后，共包含 901 个特征排序投资组合。此外，为了增加截面的多样性，本文还加入了来自 Ken French 网站的 49 个行业投资组合。

2. 稳健性检验数据集

采用 Hou et al.(2020)构建的数据集。该数据集包含了 1672 个无缺失值的特征排序投资组合，涵盖了动量、价值、投资、盈利、无形资产及摩擦等六大类特征。所有测试资产的数据频率均为月度。如此大规模的截面数据（N 远大于常见的 25 或 100 个组合）为检验弱因子问题提供了理想的实验环境。

（二）风险因子数据

本文考察了资产定价文献中广泛关注的两类因子，以评估 SPCA 在不同场景下的适用性：

1. 可交易因子(Tradable Factors)：包括 Fama-French 五因子（市场因子 Mkt-RF、规模因子 SMB、价值因子 HML、盈利因子 RMW、投资因子 CMA）、动量因子(MOM)，以及 AQR 发布的 “betting-against beta”因子(BAB)和“quality-minus-junk”因子(QMJ)。

2. 不可交易因子(Nontradable Factors)：涵盖了宏观经济与金融市场的重要指标，通常难以通过简单投资组合进行对冲。具体变量包括：

流动性因子：Pástor and Stambaugh(2003)构建的流动性因子，这是衡量整体市场流动性的指标。当市场流动性恶化（交易困难或成本增加）时，该因子值通常为负。

中介资本因子：He et al.(2017)的中介资本因子，该因子基于金融中介理论（如银行、券商等）构建。它反映了金融中介部门的健康程度和资本约束情况。当金融中介面临资本短缺时，它们可能会减少做市和风险资产持有，从而影响市场流动性和资产价格。

宏观经济类：工业产出增长率(IP)；Ludvigson and Ng(2010)基于 279 个宏观金融变量提取的前三个主成分；以及期限利差、信用利差、失业率、油价增长率和消费增长率。

不确定性与情绪类：Jurado et al.(2015)构建的三类不确定性指数（金融不确定性、宏观不确定性、实体经济不确定性）；以及分别来自 Huang et al.(2015)和 Baker and Wurgler(2006)的投资者情绪指数。

（三）样本划分与参数调优策略

为了严格评估模型的样本外表现(Out-of-Sample Performance)并避免过拟合，本文采取了以下样本处理策略： 1. 训练集与评估集划分：将整个样本期平均分为两段。前半段样本定义为“训练期(Training Period)”，用于估计模型参数和选择调整参数；后半段样本定义为“评估期(Evaluation Period)”，仅用于计算风险溢价的样本外? 2及其他绩效指标。 2. 交叉验证：在训练期内，采用 3 折交叉验证(3-fold Cross-Validation)的方法来确定 SPCA 的核心参数?次（即筛选步骤中保留的资产数量）。具体而言，通过最大化对冲组合在验证集上的? 2来选取最优的q值。

（四）因子结构特征分析

为了直观展示弱因子问题的普遍性，本文作者对测试资产收益率矩阵的特征值进行了深入分析。

三、模拟分析

为了验证 SPCA 在有限样本下的表现，特别是针对弱因子、遗漏因子及测量误差等复杂场景的稳健性，本文作者设计了一系列蒙特卡洛模拟实验。本文作者将 SPCA 与 PCA、PLS、rpPCA、Lasso、Ridge、Four-split（Anatolyev and Mikusheva (2021)）以及标准两步回归(Two-pass)等七种主流方法进行了全方位的对比。

（一）数据生成过程与场景设定

模拟的数据生成过程(DGP)设定为包含 4 个因子的线性模型。为了贴近真实市场环境，前三个因子被校准为 Fama-French 三因子（市场因子 Rm、Rf、规模因子 SMB、价值因子 HML），其参数与 Giglio and Xiu (2021)保持一致。第四个因子?被设定为潜在的弱因子。因子的月度夏普比率被校准为 0.25 左右，特质波动率??的设定使得时间序列? 2分布在 50%至 90%之间。为了全面考察估计量的边界适应能力，本文作者构建了六种逐步递进的测试场景：

基准情形(Benchmark)：所有 4 个因子均为强因子，且被准确观测，无测量误差。

弱因子情形(Weak Factor)：因子V对绝大多数资产的暴露极小（仅 5%的资产有显著暴露），模拟了大量异象因子在标准截面中信号微弱的现状。

测量误差情形(Measurement Error)：观测因子??中加入了高斯白噪声，模拟真实数据中的统计误差。

相关暴露情形(Correlated Exposures)：因子V的风险暴露??与 HML 的暴露?HML高度相关（相关系数接近-1），导致因子载荷矩阵近乎秩亏。

弱因子+遗漏因子情形：模型中存在弱因子?，且定价因子 HML 在估计过程中被遗漏。

综合困难情形(Correlated + Measurement Error)：这是最具挑战性的场景，同时包含因子暴露高度相关与观测因子的测量误差，旨在模拟最恶劣的实证环境。

（二）风险溢价估计的分布特征

SPCA 的稳健性：无论是在基准场景还是在存在弱因子等情况的极端场景下， SPCA 的估计分布（黄色区域）始终紧密围绕真实值（虚线），表现出优异的一致性。

1. 基准情形下的效率验证（Panel a）：在所有因子均为强因子且无测量误差的理想环境下，SPCA 的分布（黄色）与 PCA次（绿色色）及 PLS次（深色色）高度重合，且均准确地以真实值为中心。这表明，尽管 SPCA 引入了额外的“筛选”步骤，但在信号充足时，它并没有损失估计效率。相比之下，Lasso 和 Ridge（蓝色系）由于正则化带来的收缩偏差 (Shrinkage Bias)，其分布中心明显偏左（低估了风险溢价），证明了收缩类估计量在进行无偏推断时的局限性。

2. 应对“弱因子”与“相关暴露”的能力（Panel b & d）：

现象：当因子?变弱（Panel b）或与其他因子暴露高度相关（Panel d）时，PCA 和 PLS 的分布出现了剧烈的形变和偏移，不再覆盖真实值。

原因： PCA 是无监督方法，仅提取方差最大的成分。当因子V信号微弱或被强因子（如 HML）掩盖时，PCA 无法将其从噪音中分离出来。PLS 虽然利用了目标变量信息，但渐近理论证明其在弱因子下与 PCA 等价，因此同样失效。

SPCA 表现：唯有 SPCA（黄色）和 Four-split（紫色）在这两种场景下保持了稳健，分布依然覆盖真值。这是因为 SPCA 利用目标因子g t指导资产选择，能够精准定位那些对弱因子有显著暴露的“稀疏”资产子集。

3. 应对“测量误差”与“遗漏因子”的挑战（Panel c & e）：

Four-split 的崩溃：虽然 Four-split 能处理弱因子，但在 Panel c次（存在测量误差）和 Panel e次（遗漏定价因子）中，其分布变得极其发散或严重有偏。这是因为该方法缺乏类乎 PCA 的降噪机制，且对模型设定的完整性高度敏感2。

PCA/PLS 的局限：它们虽然能通过降维处理测量误差（Panel c），但在面对遗漏的弱因子（Panel e）时彻底失效。

SPCA 的全面性： SPCA 通过“投影”步骤剔除强因子影响，从而避免遗漏变量偏差；同时保留了 PCA 的降维特性，有效过滤测量误差。因此，在 Panel c 和 e 中，SPCA 是唯一保持一致性的方法。

4. 综合困难场景下的终极考验（Panel f）：这是最接近真实金融市场的场景（同时存在相关暴露+测量误差）。结果显示，绝大多数方法（PCA、PLS、Lasso、Four-split）的分布都出现了严重的偏差或坍塌。唯有 SPCA（黄色）的分布依然保持良好的形态并紧密围绕真实值。这一结果有力地证明了 SPCA 是目前唯一能够同时应对因子微弱、因子共线性以及数据噪声的通用估计方法。

（三）综合困难场景下的误差量化分析

1. 弱因子V的“信号提纯”能力对比：

SPCA 的优势：在估计真实的弱因子溢价（40.0bp）时，SPCA 的偏差仅为-5.5bp，相对误差极小。这得益于其筛选步骤有效剔除了大量无关资产的噪音干扰，从而精准锁定了稀疏的有效信号。

rpPCA 的严重失真： rpPCA 产生了高达 74.5bp 的正向偏差（估计值为 114.5bp），这意味着它严重高估了弱因子的风险补偿。这是因为 rpPCA 过度依赖均值项（Mean term）来惩罚定价误差，但在弱因子环境下，这种惩罚机制反而引入了巨大的噪声。

Lasso 的过度收缩： Lasso 产生了-32.8bp 的负向偏差，几解将真实的风险溢价“抹零”。这证实了正则化方法在处理非稀疏结构或弱信号时，往往会因过度收缩而导致估计量向下有偏。

2. 处理“伪相关”与因子分离的能力：

在该场景中，价值因子 HML 与弱因子?的风险暴露高度相关。PCA 由于是无监督学习，无法有效区分这两个相关源，导致其在 HML 上的偏差达到-15.3bp，在V上的偏差为-15.7bp。这说明 PCA 容易混淆相关的风险来源。

相比之下，SPCA 通过迭代的次“投影(Projection)”步骤，在提取一个因子后立即剔除其影响，从而有效解耦了高度相关的因子。因此，SPCA 在 HML 上的偏差仅为-4.8bp，显著优于 PCA，证明了其在处理多重共线性问题上的稳健性。

3. 偏差与方差的综合权衡(RMSE)：

在均方根误差(RMSE)指标上，SPCA 在弱因子 V 上取得了全场最低值 (20.9bp)。即使是表现看乎不错的 Two-pass 回归（偏差-1.3bp），其 RMSE 也高达 29.4bp，说明其估计结果极其不稳定（方差大）。

对于强因子（RmRf 和 SMB），SPCA 的 RMSE 与 PCA 非常接近。这表明引入“监督筛选”机制并没有以牺牲强因子的估计效率为代价， SPCA 展现出了“强弱通吃”的优异特性。

（四）统计推断的有效性与 SDF 恢复

除了点估计的准确性，统计推断的可靠性对于实证研究同样至关重要。本文作者在“综合困难情形”（场景 f）下，基于定理 2 构建了标准化 t 统计量，并考察其在有限样本下的分布特征。

对比结果显示，SPCA 的 t 统计量分布（左列）在所有因子（包括高度相关的 ?和 HML）上均完美贴合标准正态分布，这验证了本文作者的渐近推断理论在有限样本下依然有效，实证研究者可以放心地使用SPCA提供的t值进行假设检验。相反，PCA次（右列）在处理相关因子时，其分布出现了严重的偏离和非正态特征，这将导致假设检验产生错误的拒绝率，推断失效。最后，在恢复随机折现因子(SDF)的能力上，本文作者比较了各方法估计 SDF 与真实 SDF 之间的均方误差(MSE)。

1. SDF 恢复精度： SPCA 在不同样本量(? = 120,180,240)下均保持了最低的 MSE次（例如在? = 120时为 0.036），显著优于 Lasso(0.044)和 Ridge(0.050)。虽然 rpPCA 设计初衷是优化 SDF，但其 MSE 高达 0.387，再次印证了其在弱因子环境下的一致性问题。

2. 因子数量识别： SPCA 能够非常准确地估计出真实的因子数量（均值约为 4.08，非常接近真实值 4），证明了其筛选机制在剔除噪音因子方面的有效性。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）