2023年基金研究专题：特征即是协方差，风险和收益的统一模型

来源：招商证券
发布时间：2023/08/24
浏览次数：990
举报

相关深度报告REPORTS

基金研究专题：特征即是协方差，风险和收益的统一模型.pdf

基金研究专题：特征即是协方差，风险和收益的统一模型。文章提出了一种针对收益率截面数据的新建模方法。该方法主要通过工具化主成分分析（IPCA），引入了面对不可观测变量的可观测特征指标，并考虑了潜在因子及其时变性载荷。如果特征指标和预期收益之间的关系是由潜在风险因子敞口的风险补偿所驱动的，那么IPCA将确定相应的潜在因子。如果不存在这样的因子，IPCA则认为该特征指标在无风险的状况下获得了补偿，并将该补偿效应归于异常截距项。通过研究个股收益及其特征指标，作者发现包含5个因子的IPCA比现有因子模型更准确地解释了平均收益的截面数据。同时，此类IPCA模型不产生与特征指标相关且具有显著性的异常截距项。...

一、简介

过去 40 年间，资产定价领域最大的努力就是探索为何不同资产将获得不同平均收益率。均衡理论对此给出的答案很清楚，认为预期收益差反映了对不同程度风险的补偿，但实证结果表现的更为复杂，资产之间一些较大的收益差仍无法用风险来解释。

1.1 方法论

在本文中，我们使用了一种新的方法，称为工具化主成分分析（Instrumented principal components analysis）或 IPCA，通过对两种常见方法的扬长避短来估计因子及其载荷。IPCA 允许因子载荷部分地取决于可观测资产特征指标，这些特征指标将作为衡量潜在条件因子载荷的工具变量。

可观测特征指标和因子载荷之间通过 IPCA 形成映射，搭建了资产特征指标和预期收益之间的统计学桥梁。同时 IPCA 能够与均衡资产定价原则保持一致，即风险溢价完全由风险敞口决定。而且因为工具变量能够影响因子载荷，这使得 IPCA 也能够持续地估计与这些载荷相关的潜在因子。通过这种方式，因子模型在 IPCA 的协助下阐明了一个具备稳健性的实证结果，即股票特征指标为预期收益提供了可靠的条件信息。通过引入工具变量，研究人员可以利用之前他们所积累的，关于平均收益结构的经验来优化关于因子和因子载荷的估计方法，且这类方法无需先验地得到精确因子数据。

资产特征指标代表了常见风险因子载荷进而对资产平均收益产生影响，我们的 IPCA 模型认为这是有可能的。另外，如果资产特征指标和平均收益之间的关系也由潜在风险因子补偿所驱动，IPCA 也将识别出相应的潜在因子及其 beta 值。但是，如果不存在这样的潜在因子，那么资产特征指标产生的效应将归因于截距项。这自然让我们想到了一个直观的截距项检验：该检验将区分基于资产特征的收益率表征是与“beta/期望收益”模型相一致，还是在无风险敞口的情形下就得到了补偿（即所谓的“异象”）。但我们的 IPCA 检验旨在探索是否存在潜在风险因子来解释“异象”，而非关注一些先验因子是否能解释“异象”。该检验还将在控制其他工具变量的同时，对于特定工具变量群的重要程度进行检验，这类似于回归分析中的 t 检验和 F 检验。

以往的文献形成了一个标准模式：当研究人员发现了一个与资产未来收益相关的新特征指标时，他们将利用该特征指标的预测能力构建投资组合，并检验这些新投资组合相较于经典定价因子构造的组合能获取超额收益的能力。但这种模式无法令我们满意，因为它没有充分考虑历史研究得到的特征。我们的方法尝试解决这一问题，当一个新特征指标被提出时，它可以被纳入 IPCA 的范畴中，同时也包括其他一系列在过去研究中发现的特征指标。然后在控制其他特征指标后， IPCA 可以估计新提出的特征指标对模型因子载荷的边际贡献，如有需要，IPCA 还可以估计异常截距项的大小。

IPCA 的附加功能使其适用于最先进的资产定价分析。其一是它通过在模型中直接降维来以最小的运算成本来综合评估大量的预测型特征指标。资产的截面数据量和潜在预测因子的数量可能会很大，但模型直接作用于低维的因子结构会使得参数简化，这有利于处理资产特征指标高度相关、且存在众多噪声甚至出现特征指标假象的情况。降维法挑选了一些最能刻画收益率的特征指标进行线性组合，并丢弃了其余的无效高维信息。IPCA 的另一个优点是可以将传统的、先验的因子嵌套在更广泛的 IPCA 模型中，从而更容易检验潜在 IPCA 因子的增量贡献。

1.2 研究发现

我们的分析基于两个标准来评价资产定价模型。首先，一个成功的因子模型应该有效描述已实现收益的系统性变化。也就是说，它应该准确地描述系统性风险，我们使用总体? 2来衡量这一点，我们将总体? 2定义为??,?+1中能够由?̂ ?,? ′ ?̂ ?+1解释的部分，其中?̂ ?,? ′ 是估计的动态因子载荷，而?̂ ?+1是模型估计的系统性风险因子。因此，总体? 2反映了在资产和时间维度上，由同期风险因子和动态风险敞口而导致的收益率变化。

其次，一个成功的资产定价模型应该能够描述不同资产之间的平均收益差。也就是说，它应该准确地刻画风险补偿。为了评估这一点，我们将模型的预测? 2定义为??,?+1中由?̂ ?,? ′ ?̂解释的部分，这是资产 i 在给定 t 期信息情况下的条件预期收益，其中?̂是风险因子价格估计量的向量。预测? 2衡量模型隐含的条件预期收益的准确性。

我们的实证分析使用了 1962-2014 年 12,000 多只股票的收益和资产特征指标数据。例如，在包含五个因子且将股票层面的截距项限定为零的情形中，IPCA 实现的总体? 2为 18.6%。作为基准，Fama-French 五因子模型在相同样本中实现的总体? 2为 21.9%。因此，IPCA 在描述股票收益变动以及风险特征指标时极具竞争力。

更重要的是，利用 IPCA 估计的因子载荷良好刻画了股票的条件预期收益。在五因子 IPCA 模型中，因子暴露补偿的估计量(?̂ ?,? ′ ?̂)创造了 0.7%的预测? 2， Fama-French 五因子模型的预测? 2仅为 0.3%。如果我们使用标准 PCA 来进行潜在五因子估计，虽然我们能够得到 31.5%的总体? 2，但是会产生负的预测? 2，因此对平均收益差没有解释力。综上所述，IPCA 是我们最成功的分析模型，它可以同时解释收益的已实现变动（即系统风险）和平均收益差（即风险补偿）。

上面提到的模型性能统计是基于样本内的估计过程。若我们使用递归样本外估计来计算股票收益的预测? 2，我们会发现 IPCA 将持续优于其他方法。五因子 IPCA 的样本外预测? 2为每月 0.6%，该数值非常接近样本内结果，且为 Fama-French 五因子样本内? 2的两倍以上。

与包含可观测因子的模型以及标准 PCA 相比，IPCA 通过将因子载荷与可观测数据相结合，极大地降低了参数空间的维度。为了适应我们样本中超过 12,000 只股票，Fama-French 五因子模型需要估计 57,260 个载荷参数。五因子 PCA 需要估计 60,255 个参数，包括潜在因子的时间序列。五因子 IPCA 仅需要估计 3180 个，比先验可观测因子模型或 PCA 减少了约 95%的参数估计量，并且在不依赖于临时滚动估计法的情况下引入动态因子载荷。它重新定义了如何识别股票特征指标而非识别股票，因此一旦得到了特征指标，只需要很少的参数就可以将观测到的股票特征指标值映射成 beta 值。

IPCA 通过刻画因子载荷，成功地解释了股票平均收益差，但问题是，我们不知道是否存在一些 IPCA 因子无法解释但又符合股票特征指标的平均收益差异。为了在 IPCA 中引入依赖于资产特征指标的截距项，我们提供了一个检验，以确定资产特征指标是否有助于解释预期收益中无法通过因子载荷解释的部分。在单因子 IPCA 模型中加入对 alpha 收益的考量将提高其解释能力，同时假设检验拒绝了截距项为零的原假设。显然，单因子模型包含的因子丰富度不够，不足以涵盖股票特征指标中所有与收益预测相关的内容。因此，股票特征指标的超额预测能力溢出到截距项中，并且该截距项在经济上和统计上均具有显著性。

增加因子的数量可以改善模型的拟合能力。对于具有五个或更多因子的模型，截距项的估计量会变得很小并且在统计上不显著。这在经济意义上结论是，五维风险因子模型与股票特征指标中的信息相一致，这使得:（i）股票特征指标非常好地刻画了风险敞口；（ii）股票特征指标残留在因子载荷之外的收益预测作用几乎降至零，从而有效避免了异常截距项的使用。

IPCA 对平均收益的优越解释能力说明，IPCA 因子较可比模型中的因子更接近多元维度下的“均值-方差”有效。我们发现基于三因子 IPCA 模型的切线组合能够实现的事前（即样本外）夏普比率 2.5，而 Fama-French 五因子模型的夏普比率为 1.3。IPCA 还可用于构造条件因子中性的“纯 alpha 收益”投资组合。然而，我们发现这种组合获得的补偿远小于因子风险溢价所获得的补偿。

最后，IPCA 可用于检验哪些资产特征指标在控制其余特征指标的情况下与因子载荷（以及预期回报）显著相关，这类似于回归模型中用于测试解释变量显著性的 t 检验。在我们的主模型中，我们发现在样本内的 36 个特征指标中，有 10 个在 99%的置信水平下显著。这些指标包括价值类指标（如市值与账面资产之比）、即期股票趋势类指标（如动量和反转效应）、流动性变量（周转率和异常成交量）以及风险变量（如特异性标准差和市场 beta 系数）。如果使用 10 个显著自变量进行重新估计，我们会发现模型拟合效果几乎与使用全部的 36 个特征指标时相同。事实上，只有少数股票特征指标在解释已实现收益和预期收益的变动时是必要的，大多数特征指标没什么帮助。另外，我们无法通过加入更多的 IPCA 风险因子来拒绝 alpha 收益为零的原假设，由此我们得出结论，特征指标因子之所以显著，是因为它们解释了资产在系统性风险上的暴露，而不是因为它们代表了无关风险的异常补偿。

1.3 文献综述

我们的研究建立在一些文献之上，我们不会对这些文献进行全面回顾，而是选择简要地描述与我们的分析关系最为密切的三个主要流派，并强调每个流派的典型贡献。

第一个流派分析了收益率的潜在因子模型，该流派起源于 Ross (1976)开创性的套利定价理论（APT）。对于该流派具有实证贡献的研究，如 Chamberlain and Rothschild (1983)和 Connor and Korajczyk (1986, 1988)，依赖于收益的主成分分析。本文中，我们的主要创新点是将丰富的资产特征指标信息引入潜在因子模型，进而尝试通过动态因子载荷来进行潜在因子模型分析。

第二个流派将因子载荷刻画为可观测变量的函数。该流派中最典型的模型，即使用资产特征指标的函数来描述因子敞口，这至少可以追溯到 Rosenberg (1974)。与我们的成果相比，Rosenberg 的分析主要是理论性的，他假设因子是可观测的，并且没有为之提供检验框架。Ferson and Harvey(1999)为使用宏观经济变量的资产函数引入了动态 beta 值，这与我们依赖于可观测因子的分析不同，该研究关注宏观因素而非公司层面因素。Daniel and Titman (1997)直接对比了股票特征指标和因子载荷，即考察各个因子载荷解释股票平均收益差的能力。该方法在近期由 Chordia et al. (2015)进行了拓展。IPCA 在嵌套可比资产特征指标和收益率 beta 模型方面是独一无二的，它估计了能够最精确刻画资产特征指标的潜在因子，同时避免了对先验因子的依赖。

第三个流派用多种资产特征指标的函数来构造股票收益解释模型。该流派是最近才出现的，旨在反应关于预测性股票特征指标方面的研究积累，并利用了最新开发的高维预测系统。Lewellen (2015)分析了 OLS 回归中多达 15 个资产特征指标的联合预测能力。Light et al. (2017)和 Freyberger et al. (2017)考虑了比 Lewellen 更大的预测指标集合，并分别使用偏最小二乘法和 LASSO 来解决伴随统计量的问题。Gu et al. (2018)比较了一系列机器学习方法，用这些方法检测了近 1000 只个股特征指标对于收益率的预测能力。这些文献单纯地考察了收益预测方法，而没有试图开发资产定价模型或进行资产定价检验。

Kozak et al. (2018, 2019)发现来自 15 个异常投资组合的少量主成分（这些异常投资组合来自 Novy-Marx and Velikov, 2016）能够在维持 alpha 不显著的情形下对这些异常组合进行定价。而我们的结果表明，虽然该模型对特定的异常投资组合能够有效定价，但在面对其他组合时将变得无效。IPCA 通过令因子载荷随着资产特征指标的变动平稳迁移，进而调和了这种不一致性，因此 IPCA 能够成功地为个股以及异常组合定价。除此之外，相较于可比模型，我们还得到了一个完整的检验过程：（i）判断了一个资产特征指标是应该理解为系统性风险敞口的代理变量，还是异常 alpha；（ii）评估单个资产特征指标相较于一组可比特征指标的增量解释能力；（iii）对比潜在因子和先验可替代因子。这些检验的结果表明，股票特征指标最好理解为风险因子载荷，文献中提出的大多数特征指标对于收益并没有增量解释力，且我们通常研究的先验因子在均值-方差层面上是低效率的。

与目前先进的实证模型相比，IPCA 用更少的参数提供了关于截面收益率的精确刻画。但更广泛地说，IPCA 是一个简约化的统计模型，我们无法识别其底层的经济学原理。不过，我们检验了简约化模型估计量，旨在为 IPCA 因子提供部分解释。我们在第二部分描述了 IPCA 模型和我们的估计方法，第三部分中我们在 IPCA 的基础上开展资产定价和模型的比较检验。第四部分报告了我们的实证发现，第五部分进行了总结。

二、模型和估计

对于超额收益??,?+1的一般 IPCA 建模如下：

??,?+1 = ??,? + ??,???+1 + ??,?+1,

??,? = ??,? ′ ?? + ??,?,? , ??,? = ??,? ′ ?? + ??,?,?（3）

该模型由 N 项资产在 T 个时段内的数据组成。模型尝试在由潜在因子构成的 K 维向量??+1中，实现因子载荷??,?的动态化。因子载荷可能取决于 L*1 的工具向量 ??,?（其中包含一个常数）中包含的可观测资产特征指标。

关于??,?的建模是我们分析的核心，它起到两方面的作用：首先，利用可观测资产特征指标来估计潜在因子的载荷，这允许我们利用额外数据来构建关于收益率的因子模型。这不同于 PCA 等传统的潜在因子技术，传统方法仅通过收益率数据来估计因子结构，我们的方法将因子载荷锚定在可观测工具变量上，这使得我们的估计更加有效，从而提高模型性能，即便工具变量和真实因子载荷随着时间的推移是恒定的。其次，时变工具变量使得动态因子载荷的估计成为可能，这在为条件收益率建模时十分有用。

矩阵Γ?定义了从大量资产特征指标到少量风险因子暴露的映射。估计Γ?相当于寻找能最好刻画潜在因子载荷结构的备选资产特征指标线性组合。我们的模型强调对资产特征指标空间进行降维，如果存在能有效刻画股票风险敞口、但包含较多噪音的特征指标，那么将其聚合为线性组合可以将有效信号从噪音中分离出来。而在动态因子载荷内，任何与工具变量正交的变量都将被纳入??,?,?，这一项的存在使我们找到可观测特征指标无法完全覆盖的风险暴露。

矩阵Γ?还帮助我们应对了个股特征迁移的挑战。股票会随着时间的推移而变化，比如市值从小到大、从成长型到价值型、换手由高到低等等。文献中公认的观点是，股票的预期收益会随着这些特征指标的迁移而变化。但事实上，股票特性随着时间的推移而变化，这使得用简单的时间序列方法来模拟股票层面的条件预期收益变得十分困难。该问题的常规应对措施为：动态地持有使组合内部特征指标均值保持近似恒定的投资组合。但是如果需要多个特征指标才能对资产特性进行充分描述，那么由于组合数量的激增，这种构造投资组合方法将变得不再可行。 IPCA 提供了一种通用的解决方案：使用能决定股票预期收益的特征指标函数来为 beta 值建模。在该过程中，资产特性的迁移是通过其 beta 值变化来跟踪的，而 beta 值本身是由资产特征指标定义的。因此，IPCA 避免了研究人员在检验资产纳入组合的过程中，进行临时降维的需要。相反，该模型通过对特征指标进行单次降维来解决高维度问题。

我们检验了“特征指标无法代理 alpha 项”的原假设，这相当于将（3）式中的Γ? 限制为零。（3）式的无限制形式允许Γ?非零，这对应于“条件期望收益的决定模型中，存在有赖于股票特征指标的截距项”的备择假设。??,?的结构是反映??,?构造的工具变量的线性组合，IPCA 在控制特征指标在因子风险暴露中作用的前提下，通过寻找最能描述条件预期收益的特征指标线性组合（其权重由Γ?给出）来估计??,?。如果特征指标与平均股票收益的关系不同于其与因子载荷的关系，那么 IPCA 将估计出非零Γ?，从而识别到与系统性风险暴露不一致的风险补偿。

在分析中需要注意的是，我们常用的一些术语，如“风险”和“异常”，在经济意义上是不清晰的。为了尽可能避免歧义，我们现在将精确地定义这两个术语。 “风险”，特别是系统性风险，是指由公共收益因子??+1引起的资产回报的波动。值得注意的是，这些风险因子并不一定具有宏观金融变量的支撑，部分因子可能是纯粹的统计学变量。例如，它们可能来自于行为现象，包括对投资者偏好或其风险偏好的系统性冲击（Albuquerque et al, 2016）等。或者，它们可能源于投资者预期的关联性误差，并反映出集体性错误定价导致的波动（Stambaugh 和 Yuan, 2017; Barberis et al, 2015）。但无论其经济学来源如何，根据定义，我们在统计学上估计的因子捕获了收益率之间的协方差，从而刻画了非系统性波动，即便是最精明的套利者也必须承受这类波动，才能获得与因子相关的预期收益。同样，当我们使用术语“异常”时，它是指（3）式中的截距项??,?非零。

我们将关注点放在因子数量 K 较小的模型上，这意味着一个资产定价模型的目的在于它能够简约化地描述系统性风险来源。同时，我们的工具变量数量 L 可能会很大，因为以往文献中已经提出了数百种特征指标来解释平均股票收益。而且，由于任何单独的特征指标都可能代表饱含噪音的风险因子，因此使用大量的工具变量能够将特征指标平均化，该方法能够减少噪声，进而更加精确地刻画真实因子暴露。

2.1 限制性模型（?? = ?）

在本节中，我们提供了有关 IPCA 估计的概述。我们在这里介绍了两个假设，并讨论了它们在估计过程中的作用。Kelly et al. (2017)推导出了 IPCA 估计量，并证明了如果 IPCA 与识别性假设相结合，在资产数量和时间维度同时增大时，只要因子和残差满足弱规则条件，IPCA 就可以一致地估计模型参数和潜在因子。我们建议感兴趣的读者参阅该论文以了解细节。

我们首先描述了关于限制性模型的估计，其中Γ? = ??×1，这意味着特征指标不能描述异常截距项。该限制条件保证了以下观点：只有当特征指标代表了系统性风险敞口时，它们才能解释预期收益。在这种情况下，（3）式变为：

??,?+1 = ??,? ′ ????+1 + ??,?+1 ∗ （4）

其中??,?+1 ∗ = ??,?+1 + ??,?,? + ??,?,???+1为复合模型偏误。我们通过（4）式的向量形式得到估计值：

??+1 = ??????+1 + ??+1 ∗

其中??+1是个股收益的 N×1 向量，??是包含个股特征指标的 N×L 矩阵，??+1 ∗ 是残差的累加。我们的估计目标是最小化模型误差平方和：

min Γ?,? ∑ (??+1 − ??Γ???+1) ′ (??+1 − ??Γ???+1) ?−1 ?=1（5）

使得（5）式最小化的??+1和Γ?将满足一阶条件：

?̂ ?+1 = (Γ̂ ? ′?? ′??Γ̂ ?) −1Γ̂ ? ′?? ′ ??+1, ∀? （6）和 ???(Γ̂ ? ′ ) = (∑ ?? ′?? ?−1 ?=1 ⨂?̂ ?+1?̂ ?+1 ′ ) −1 (∑ [??⨂?̂ ?+1 ′ ] ′ ??+1 ?−1 ?=1 ) （7）

条件（6）表明，因子的兑现等价于??+1关于潜在因子载荷矩阵进行逐期截面回归的系数??。同样，Γ?是将收益率对与个股特异性特征指标相互作用的因子进行回归得到的系数。该一阶条件系统没有封闭解，只能求解数值解。幸运的是，即使对于高维系统，数值问题也可以通过交替最小二乘法在几秒钟内快速解决。附录 A 描述了我们的方法，并在附录 B 中讨论了一个存在精确解析解的特殊情况。

与潜在因子模型一样，IPCA 需要进一步的假设来识别估计量。Γ?和??+1是不确定的，因为对于一个非奇异 K 维旋转矩阵 R 来说，其任意一组解都可以旋转为等效解Γ?? −1和???+1。为了解决这种不确定性，我们假设Γ? ′ Γ? = Ⅱ ?，且??的无条件二阶矩矩阵为数值递减的对角矩阵，且??的均值非负。这些假设对模型没有任何经济意义上的限制，其目的仅在于确定一阶条件的唯一确定解。

2.1.1 IPCA 的管理组合解释

为了帮助我们建立对 IPCA 因子及其载荷估计量的直觉，我们将其与静态因子模型（如?? = ??? + ??）进行对比(Connor 和 Korajczyk, 1988)。静态情况下的目标函数为：

min ?,? ∑(?? − ??? ) ′ (?? − ???) ? ?=1

并且针对??的一阶条件为?? = (? ′?) −1 ? ′ ??，

将该式代入初始目标函数，我们将得到关于?的目标函数：

max ? ??(∑(? ′?) −1 ? ? ′ ???? ′?)

该目标函数旨在最大化“瑞利商”之和，这些数值具有相同的分母? ′?。在这种特殊情形下，主成分分析关于?给出的解，等于样本收益率二阶矩矩阵的前 K 个特征向量∑ ???? ′ ? 。

显然，动态 beta 使得最优化问题变得复杂。将 IPCA 的一阶条件代入初始目标函数得到：

max Γ? ??(∑ (Γ? ′?? ′??Γ?) ?−1 −1 ?=1 Γ? ′?? ′ ??+1??+1 ′ ??Γ?) （8）

这一集中化 IPCA 目标函数更具挑战性，因为在加和过程中，每个元素的瑞利商分母Γ? ′?? ′??Γ?是不同的。因此，关于Γ?没有类似的特征向量解。

然而，我们的动态问题与静态问题在结构上非常相似。当静态 PCA 估计量将奇异值分解应用于单个资产收益的面板数据??,?时，我们的求导过程表明，通过将奇异值分解应用于与工具变量相互作用的收益率而非原始收益率，可以近似地解决 IPCA 问题。考虑 L×1 向量：

??+1 = ?? ′ ??+1 ??+1 （9）

这是 t+1 时点 L 个投资组合的收益。??+1的第?个元素是股票收益的加权平均值，其权重由 t 时点每只股票的第?个特征指标值决定（通过每月末无缺失的股票观测数??+1进行正态化）。叠加时间序列观测得到 T×L 矩阵? = [?1, ?2, . . . , ?? ] ′。X 的每一列都是特征指标投资组合的收益率时间序列。

如果前三个特征指标是规模、价值和动量，那么 X 的前三列就是在上述三个特征指标的基础上搭建的投资组合的收益率时间序列。如果我们用一个常数作为瑞利商分母的近似（例如，用它们的时间序列平均值 ? −1 ∑ ?? ′ ? ??来代替每个?? ′??），那么（8）式的解将变为：令Γ?等于投资组合收益率样本二阶矩矩阵的前 K 个特征向量? ′? = ∑ ???? ′ ? 。同样，对于??+1的估计将变为投资组合面板的前 K 个主成分。只要?? ′ ??波动不算剧烈，这将是一个非常接近于精确解的近似解。更重要的是，如果我们希望找到精确解，那么这个近似为我们提供了一个很好的开端，帮助我们通过数值最优化过程快速找到精确的最优解。

当我们使用越来越多的特征指标来度量潜在因子风险时，X 中特征指标管理组合的数量就会增加。先前的实证研究表明，在异常投资组合中往往存在强烈的共同波动（Kozak 等人，2018）。IPCA 识别到这一点，并通过聚焦 X 中的共同波动来估计因子和因子载荷。它将因子估计为由 X 的列向量构造的 K 个线性组合，或“投资组合的投资组合”，这很好地解释了投资组合面板数据之间的协变。这些因子不同于 X 的主成分之处在于，被解释协变量在时间层面和资产层面进行了重新加权，旨在突出与最有效的工具变量相关的观测值。

资产定价相关文献致力于寻找哪些检验型资产最适合用来评估模型（Lewellen et al, 2010; Daniel and Titman, 2012）。IPCA 对此提供了解决方案，一方面，IPCA 检验可以理解为：应用一组最具分辨能力的检验资产——个股，同时，我们关于（8）式的讨论表明，IPCA 检验将特征指标管理组合??作为一组检验资产集，这些资产具有较低的维度，并且剔除了一定程度的非系统性风险。

单个资产收益到特征指标管理组合之间的映射，凸显了 IPCA 另一个值得注意的特点：它能够轻松处理缺失的数据。为了构建投资组合的收益率向量??+1，我们使用??和??+1之间重合且无缺失的元素来评估它们的内积。设??+1为拥有 t 期无缺失特征指标和 t+1 期收益率数据的股票列表，则有：

?? ′?? = ∑ ??,???,? ′ ?∈??+1 和 ?? ′ ??+1 = ∑?∈??+1 ??,???,?+1 （10）

通过这种方式处理缺失数据，我们在非平衡面板数据下也可以轻松进行 IPCA 分析。这是因为，估计量基本上都是在 L 维项?? ′??和?? ′ ??+1中产生的，因为模型暗示了这些 L 维项足以刻画 N 维的股票层面数据。

2.2 无限制模型（?? ≠ ?）

无限制 IPCA 模型允许截距项成为工具变量的函数，从而认为特征指标可能会通过系统性风险敞口以外的形式影响预期收益。与（4）式中的因子模型类似，无限制 IPCA 模型认为截距项由工具变量的线性组合构成，而各工具变量的权重取决于 L×1 参数向量Γ?： ??,?+1 = ??,? ′ Γ? + ??,? ′ Γ???+1 + ??,?+1 ∗ （11）

（11）式是无限制的，它认为平均收益不仅仅由因子暴露决定。估计过程与第 2.1 节类似。我们将（11）式重述为??,?+1 = ??,? ′ Γ̃?̃ ?+1 + ??,?+1 ∗ ，其中Γ̃ ≡ [Γ?, Γ?]，且?̃ ?+1 ≡ [1, ??+1 ′ ] ′。通过简单地向因子项中纳入常数，我们完成了从无限制模型到（4）式框架的映射。

Γ̃的一阶条件与（7）式相同，仅仅是用?̃ ?代替了??，??+1的一阶条件略有变化：

??+1 = (Γ? ′?? ′??Γ?) −1 Γ? ′?? ′ (??+1 − ??Γ? ), ∀? （12）

这是“超 alpha 收益”关于动态 beta 值的截面回归，该回归表明，无限制估计量能够决定如何将收益率面板数据的变化归因于因子暴露和异常截距项。

在无限制的模型中，对Γ?、Γ?和??的联合估计存在一个附加的识别性问题，该问题在有限制的模型中是不存在的。当Γ?非零时，我们需要一个假设来识别那些调控资产平均收益的参数。

为了完成计量意义上的识别，我们添加了额外的识别性假设，即Γ? ′ Γ? = ?1×?。该式在任何样本中都可以实现。通过最优化目标函数我们得到一组Γ?和Γ?的估计量，将Γ?对Γ?进行回归，并将正交残差定义为估计得到的Γ̂ ?。通过添加这一假设，我们试图令风险因子载荷尽可能多地来解释资产的平均收益率。在工具变量对于总收益率的全部预测能力中，只有未被因子载荷解释的正交残差被归因于截距项。

三、资产定价检验

在本节中，我们进行了三个假设检验，这是我们实证分析的核心。第一个假设检验事关“零 alpha”条件的成立与否，该条件区分了 2.1 节的有限制 IPCA 和 2.2 节的无限制 IPCA。第二个检验测试了在控制 IPCA 因子的情况下，可观测因子（如 Fama-French 五因子）是否显著改善了模型对资产收益率面板数据的刻画能力。第三个检验测试了在控制其余特征指标后，单一特征指标或特征指标组带来的显著性增量解释能力。

3.1 检验?? = ??×?

当特征指标与截面预期收益相匹配时，2.2 节中的无限制 IPCA 估计量决定了该如何划分它们之间的联系。问题的关键在于该特征指标是否代表了系统性风险因子暴露？如果是，IPCA 会通过?̂ ?,? = ??,? ′ Γ̂ ?将收益特征归因于 beta，从而将特征指标和预期收益之间的关系解释为承担系统性风险带来的补偿。或者，我们可以考察特征指标是否捕获了与因子敞口无关的平均收益差？在这种情况下，IPCA 将无法找到以特征指标为载荷的系统性因子，因此我们将通过?̂?,? = ??,? ′ Γ̂ ?将收益特征归因于 alpha。

在有限制的模型中，我们不允许特征指标和 alpha 之间存在关联。如果实证数据真的支持异常 alpha 存在，那么使用有限制模型将是错误的选择，此时该模型的拟合效果将弱于无限制模型。无限制 alpha 估计量与 0 之间的距离，能够间接衡量放宽 alpha 限制对模型拟合效果的改善。如果这个距离在统计意义上具有显著性，那么我们可以得出真实 alpha 非零的结论。

我们通过一个有“零 alpha”约束的假设检验来将这一逻辑实体化。模型方程：

??,?+1 = ??,? + ??,???+1 + ??,?+1

我们关注的原假设为：

?0: Γ? = ??×1

与之相对的备择假设：

?1: Γ? ≠ ??×1

只有当Γ?非零时，特征指标才能决定该模型中的 alpha。因此，原假设表示 alpha 与??,?中的特征指标无关。因为上述方程使用了公共参数进行表示，所以该假设是关于系统中所有资产的联合表述。

Γ? = ??×1并不能完全排除 alpha 的存在。在（3）式的模型中，在??,?,?非零时，我们看到??,?也有可能非零。也就是说，原假设允许存在错误定价，只要错误定价是非系统性的，且与工具向量中的特征指标无关。类似的，备择假设不在乎由非系统性??,?,?的错误定价带来的 alpha，相反它关注的是作为可观测特征指标的函数出现的、更具经济意义的错误定价。

在统计学上，Γ? ≠ ??×1是一个有约束的备择假设。举例来说，这与 Gibbons 等人(1989，GRS)研究的关于无约束备择假设?? = 0 ∀?的检验形成对比。在 GRS 中，每个??将被估计为一个时间序列回归中的截距项。因此，GRS alpha 是残差项而非模型。我们的有约束备择假设本身就是一个模型，通过一个适用于所有个股的固定映射，将股票特征指标与异常预期收益联系起来。如果我们拒绝了原假设下的 IPCA，那就是说我们认为 alpha 与特征指标之间存在联系。从这个意义上讲，我们的资产定价检验是（Barillas 和 Shanken(2018)）贝叶斯理论的频率化形式，贝叶斯理论认为，应该用一个模型来击败另一个模型。这在教学上是具有优势的，如果我们拒绝 H0 而支持 H1，那我们可以进一步确定Γ?的哪些元素（以及哪些特征指标）使得我们有理由拒绝原假设。通过分离那些“在预期股票收益和总风险因子暴露之间形成桥梁”的特征指标，我们可以尝试从经济学角度理解该桥梁是如何出现的。

我们用Γ?元素估计量的平方和来为有限制模型和无限制模型之间的距离的 Wald 统计量建模：

?? = Γ̂ ? ′ Γ̂ ?

3.1.1 关于 bootstrap 的评价

上面描述的方法是一个“残差”bootstrap。它利用模型的结构在原假设Γ? = ?下生成伪样本。特别地，它将可解释收益变动固定于原模型??Γ̂ ??̂ ?+1下的系统性因子估计量上，并通过从残差的经验分布中抽样来随机化原模型，以保留其在模拟数据中的性质。bootstrap 数据集?? ?满足Γ? = ?，因为非零的Γ̂ ?作为无限制模型的一部分，被排除在 bootstrap 数据之外。这种方法产生了?̃? ?的经验分布，旨在检验 Wald 统计量在原假设下的样本方差。用一个随机的 t 分布变量来预乘残差项，是一种被称为“野生”bootstrap 的技术。它能够提高异方差数据（如股票收益）下 bootstrap 的推理效率（Goncalves 和 Kilian, 2004）。

（8）式说明了为什么我们对管理组合的收益数据??+1而非股票原始收益??+1进行 bootstrap。我们的估计目标以管理投资组合收益为底层数据，??+1 = ?? ′ ??+1，并从其协方差矩阵中估计参数。如果我们对股票收益进行重抽样，那么我们在估计模型参数之前无论如何都需要将这些股票收益转换成管理投资组合。因此，直接对??+1重抽样更加方便。管理投资组合收益的 bootstrapping 有许多优势，与股票收益(T×N)相比，它在更低的维数(T×L)下进行重抽样，从而减少了计算成本。它还能够避免出现存在于股票面板，而不存在于投资组合面板的缺失观测值。

我们的检验享有 bootstrap 的常规优势，例如其在有限样本下的可靠性和在残差分布弱假设下的有效性。更重要的是，我们的 bootstrap 检验是可行的，因为我们为 IPCA 代入了快速交替的最小二乘估计。使用简单粗暴的数值优化过程对模型进行估计，不仅会提高在大型系统中使用 IPCA 的成本，而且会导致 bootstrapping 检验不再可行。

3.2 检验可观测因子模型与 IPCA

接下来，我们将 IPCA 框架拓展至具有先验可观测因子的常用研究模型。其中，内嵌模型为：

??,?+1 = ??,???+1 + ??,???+1 + ??,?+1 （14）

??,???+1项与其在（3）中的含义相同，新添项是由可观测因子构成的 M×1 向量??+1，可观测因子的因子载荷是与潜在 IPCA 因子载荷相同的条件信息的动态函数：

??,? = ??,? ′ Γ?,?,?

其中Γ?为从特征指标到因子载荷的 L×M 映射。对内嵌模型施加零 alpha 限制，我们能够更好地评估其可比模型基于系统性风险敞口来为资产定价的能力。

我们按照与 2.2 节相同的一般策略来估计模型，将其写作??,?+1 = ??,? ′ Γ̃?̃ ?+1 + ??,?+1 ∗ , 其中?̃ ≡ [??，??]且?̃ ?+1 ≡ [??+1 ′ ,??+1 ′ ] ′，即通过增加因子规模来涵盖可观测项 ??+1，从而将嵌套可观测因子的模型映射到（4）式的结构。?̃的一阶条件与（7）式相同，除了用?̃ ?代替了??。??+1的一阶条件略有变化：

??+1 = (Γ? ′?? ′??Γ?) −1 Γ? ′?? ′ (??+1 − ??Γ???+1 ), ∀?

这是“可观测因子暴露下的超额收益”对??的截面回归，该回归反映了这样的事实——嵌套模型决定了该如何将面板收益变动归因于潜在 IPCA 因子和可观测先验因子。

3.3 检验工具变量的显著性

我们介绍的最后一个检验是在控制了其他特征指标后，评估单个特征指标的显著性。我们关注（4）式中的模型，其中 alpha 固定为零并且无可观测因子。也就是说，我们专门研究一个给定的工具变量是否对??,?具有显著性贡献。

四、实证研究结果

4.1 数据

我们的股票收益和特征指标数据来自与 Freyberger(2017)。样本从 1962 年 7 月至 2014 年 5 月，涵盖了 12813 家公司。对于每家公司我们都记录了 36 个特征指标，分别为市场 beta(beta)、资产/市值比(a2me)、总资产(资产)、销售额/资产比(ato)、账面价值/市值比(bm)、现金/短期投资比(c)、资本周转率(cto)、资本强度(d2a)、房地产、工厂和设备变化率/总资产变化率之比(dpi2a)、收益/股价比 (e2p)、固定成本/销售比(fc2y)、现金流/账面价值比(freecf)、FF3 模型下的非系统性风险(idiovol)、投资(invest)、杠杆(lev)、市值(mktcap)、营业额(turn)、净经营资产(noa)、应计经营利润(oa)、经营杠杆(ol)、股价/成本比(pcm)、利润率(pm)、毛利率(prof)、托宾 Q (Q)、相对于 52 周高点的价格(w52h)、净经营资产收益率 (rna)、总资产收益率(roa)、净资产收益率(roe)、动量(mom)、中期动量(intmom)、短期反转(strev)、长期反转(ltrev)、销售/价格比(s2p)、销售和一般管理成本与销售的比率(sga2s)、买卖价差(bidask)和意外成交量(suv)。我们将关注点限制在所有 36 个特征指标都无缺失的 i 个股票的 t 期观测值上，最终收集到 1,403,544 个月度观测值，涉及 12,813 只股票。

我们按期对工具变量进行截面变换，我们将计算股票在每个特征指标下的排名，然后将排名除以非缺失观测值的数量并减去 0.5。这会使特征指标映射到[-0.5， +0.5]区间，该映射聚焦于股票在特征指标下的排序而非数值大小。我们使用这种标准化方式，是因为它对异常值并不敏感。并且在我们的稳健性分析中，该标准化结果在质量上持稳。

4.2 IPCA 的资产定价效果

我们在不同的 K 取值下进行 K 因子 IPCA 模型估计，并考虑每种 K 取值下的限制模型（?? = ?）和无限制模型，并分别计算两种? 2统计量以衡量模型表现。

4.3 与现有模型的比较

中的结果比较了不同类型的 IPCA 性能。现在，我们将 IPCA 与文献中的其他主要模型进行比较。第一大类现有模型涵盖了包含先验可观测因子的模型。我们考虑有 K=1,3,4,5,6 个可观测因子的模型。K=1 模型是 CAPM，K=3 时是 Fama-French (1993)的三因子模型，K=4 模型是 Carhart (1997)四因子模型，K=5 是 Fama-French (2015)在 FF3 因子中加入 RMW 和 CMA 的五因子模型。最后，我们考虑一个六因子模型，其中包括 MOM 和 FF5 因子。

我们采用了两种实现可观测因子模型的方法。第一种是传统方法，通过时间序列回归逐个估计各资产的因子载荷。在这种情况下，因子载荷是静态的，模型中没有使用特征指标工具变量。第二种方法是将可观测因子模型嵌套在 IPCA 潜在因子模型的框架内，通过参数化的方法将因子载荷作为工具变量的函数，并遵循（14）式中关于??,?的定义。

我们考虑的最后一组备择模型是用 PCA 估计的静态潜在因子模型。在这种方法下，我们分别考虑存在 1-6 个主成分因子的情形。

4.3.1 其他可观测因子

Fama-French 模型并不是唯一的可选项。接下来，我们将 IPCA 与三种为人熟知的可观测因子模型进行比较，这些模型使用的因子与 Fama-French 不同。首先是 Hou et al. (HXZ, 2015)的四因子模型，包括市场因子、规模因子、投资因子和动量因子。其次是 Stambaugh 和 Yuan (SY, 2017)的四因子模型，其中包括市场因子、规模因子和两个错误定价因子。第三种是Barillas 和Shanken (BS, 2018) 的六因子模型，其因子是从先前研究的大量因子中通过统计学方法选出的。HXZ 和 BS 因子可以使用 1967-2014 年的数据，SY 因子可以使用 1963-2016 年的数据。

一般来说，这三种模型与 IPCA 的对比方式与 Fama-French 模型大致相同。这些模型为系统性风险提供了很好的描述，其总体 ? 2在 14.4%到 23.7%之间。采用非工具化 beta 值（Panel A）的 HXZ 和 BS 在描述预期收益时的表现相对较差，其预测? 2低于 0.2%。另一方面，SY 模型在预测? 2方面优于 FFC6，但其对于收益率的预测能力仅为 IPCA 的一半。当我们使用特征指标（Panel B）来将 beta 值工具化时，所有模型的预测? 2将提高到 0.3% 以上。Panel C 和 Panel D 展示了纳入模型之外的潜在因子带来的好处。与 Panel B 相比，增加一个单一 IPCA 因子（Panel C）可以使总体? 2提高约 2%，使预测 ? 2提高约 0.2%。若增加更多的 IPCA 因子（Panel D），优化效果会更加明显。

4.3.2 讨论

IPCA 与现有的截面定价模型进行融合比较。因子模型系列可以从两个维度划分。首先，这些因子是潜在的还是可观测的？第二，因子载荷是静态数值还是动态工具变量的参数化函数？

传统的截面定价模型在两个维度上的实证表现都受到了限制。首先，它们依赖于先验可观测因子，这些因子无法以描述资产价格波动为直接目标进行最优化。其次，这些因子依赖于通过时序回归得到的静态载荷。而 IPCA 通过寻找最能刻画系统性风险来源的因子，并允许因子载荷作为可观测变量的函数而随时间变化，显著改进了模型的拟合效果。

这些维度中哪一个更为重要？Panel C 显示，动态 beta 系数，特别是那些可观测特征指标的参数化函数，对预测? 2有很大的改善。如果将因子载荷与特征指标相联系，那么因子载荷与预期收益之间的无套利关联将得到极大的增强。但同时，该举措导致了总体? 2的下滑。这也许并不令人惊讶，因为当我们对每个资产进行基于回归方程的 beta 值估计时，参数数量会大大增加。静态模型下较高的总体? 2很可能是过度参数化造成的过拟合效应。

Panel D 显示，即使 beta 是静态的，潜在因子模型也有可能成功地刻画收益率。然而，该结论的关键取决于测试性资产是个股还是管理投资组合？静态 PCA 在管理投资组合中的强劲表现与 Kozak 等人(2018)的研究结果高度一致。然而，在股票层面，使用静态 PCA 会导致模型表现不佳。这一差别表明，静态潜在因子模型存在固有偏误。

相比之下，IPCA 成功地刻画了个股和投资组合的收益率，它对于这两组资产使用了完全相同的模型参数集。简而言之，潜在因子和动态 beta 的结合是模型增强的关键，并使得 IPCA 能够在刻画收益率截面数据时取得成功。

五、结论

我们的主要结论有三点。首先，通过估计潜在因子而非先验可观测因子，我们找到了一个低维因子模型，该模型成功刻画了股票收益的风险（通过解释已实现的收益率变化）及其风险补偿（通过解释平均收益的截面差异）。我们发现，不存在与大量股票特征指标相关的显著截距项，与之相反，股票的平均收益差与其对系统性因子敞口的差异保持一致。

其次，我们的因子模型在创造较小的定价误差方面优于可观测因子模型，如 Fama-French 五因子模型。无论在样本内还是样本外都是如此。我们的因子也达到了相比其他模型更高水平的样本外均值方差有效。

第三，在我们的样本中，只有一小部分股票特征指标对 IPCA 的实证成功做出贡献。在我们样本中的特征指标内，70%的特征指标在统计意义上与收益率刻画无关。我们的假设检验得出的结论是，通过更好地识别动态潜在因子载荷，30%的特征指标对我们的模型具有显著贡献，并且没有证据表明有显著的 alpha 出现。识别一个成功的因子模型的关键，是将有关股票特征指标的信息纳入对因子载荷的估计过程中。在我们的资产定价模型中，风险因子载荷取决于可观测的资产特征指标。我们提出了一种新的方法，即工具化主成分分析（IPCA），它将特征指标作为工具变量来估计潜在因子的动态因子载荷。该估计系统与标准 PCA 一样易于使用，同时允许研究人员将信息注入对因子和 beta 值的估计中。

我们引入了一组统计性资产定价检验，为评估关于资产收益模型的假设提供了一种新的研究架构。当研究人员遇到一个新的异常特征指标时，他们应该通过 IPCA 评估其相对于此前研究发现的大量特征指标在多变量环境下的显著性。在该过程中，研究人员可以在控制大量先前提出的预测因子后，考察备选特征指标的增量解释能力。而且，如果该特征指标确实对收益率模型有显著贡献，那么研究人员就可以检验它是作为风险因子载荷还是作为异常 alpha 而作出该贡献。因此，研究人员无需再关注“我提出的特征指标/收益率联系是否为一组特定的先验因子解释”的问题，可以转而关注“是否存在一组因子能够解释可观测特征指标/收益率形成模式”。

最后，我们的模型具有令人振奋的实用效果。它允许投资者和管理人轻松地评估公司资本成本，而无需依赖于存在明显偏误的 CAPM beta 值，亦或其他可能无法用时序回归估计得到的因子载荷。相反，IPCA 制定了一套简单的资本成本算法，该算法将资本成本作为资产的可观测特征指标和模型参数估计量的函数。 IPCA 的本质是通过将资产收益视为一个关于其特征指标的不断演变的集合，以刻画资产的风险画像和相应的预期收益。IPCA 估计了一组通用参数??，该参数将特征指标映射为因子载荷，进而映射为预期收益。这些参数不依赖于时间变动或资产本身，因此，一旦从一组代表性资产中估计出这些参数，它们就可以用来推断其他资产的条件预期收益。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）