2025年量化专题报告：Deep Timing，日内信息与相似度学习驱动择时

来源：民生证券
发布时间：2025/09/17
浏览次数：276
举报

相关深度报告REPORTS

量化研究系列报告：因材施“策”，量化视角下的因子舒适区探寻与应用.pdf

量化研究系列报告：因材施“策”，量化视角下的因子舒适区探寻与应用。从因子分域到因子舒适区传统多因子模型假设因子在不同股票间具有一致性和可比性，采用全市场统一排序与加权方式，忽视了个股在基本面、流动性和市场行为上的结构性差异，在行业分化、风格多变的A股市场中表现乏力。因子分域方法通过引入行业、市值等维度进行差异建模，虽一定程度上能提升有效性，但仍依赖静态、离散的人工分组，缺乏动态适应性及多特征联合建模能力。为此，本文提出“因子舒适区”概念，旨在推动因子投资范式从“为域选因子”向“为因子找域”的转变，为...

1 基于中高频信息的股票收益率预测模型搭建

本篇报告我们基于民生金工深度学习框架进行个股择时策略研究。信号可用于个股波段择时，或并合成至指数后进行指数择时。

1.1 民生金工深度学习框架：输入、训练与输出

从之前发布的系列报告中我们已经总结出一套适合如今市场环境的深度学习股票收益率预测框架。该框架由 3 部分构成：输入端，我们利用强化学习输出风格因子以计算近期市场的风格偏好；训练端，我们采用元学习纳入最新市场数据且对样本外预测的输入与输出进行微调，动态适应市场环境；输出端，我们利用带约束的优化网络对于输出 y 进行约束，以达到特定目的，如控制输出的风格，行业暴露等。

具体的，强化学习风格因子部分来自《深度风险模型与强化风险模型的构建及组合优化》。为了更加准确地刻画市场风格，我们利用 PPO 强化学习模型预测更加具有解释度，且相比深度学习更加稳健的风险因子。将传统风格因子与近期个股量价数据输入 PPO 模型，奖励函数为稳定性惩罚后的市场收益拟合优度，预测得到强化风格因子后，取最近市场上涨幅度最高的前 10%股票，并计算这些股票最近的强化风格均值作为 AI 市场偏好。

训练端的元增量学习来自《从增量学习到元学习—深度学习训练新框架》。元增量学习首先建立在增量学习的背景之上，利用过去一段时间的增量数据来更新基模型，不断让模型纳入新的市场规律，对未来的预测产生影响。在此之上进一步用数据适应器适应增量数据并用 MAML 适应基模型，以避免增量数据与历史数据的联合分布差异过大导致的模型局部优化问题。

最后，在对模型输出的优化上，我们可以利用带约束的 LinSAT 深度神经网络在输出层中进行优化。LinSAT 层设计了一个可微且无参数的轻量级层，用于将正线性约束编码到神经网络的输出中，通过将正线性约束视为边际分布，实现了端到端的可微训练，确保了约束的严格满足。进一步地，我们可以将对于行业，风格，个股的约束条件输入到 LinSAT 网络中，对预测进行约束，从而针对约束训练出在特定条件下预测能力更加准确的模型。

1.2 基于中高频信息的收益预测与择时应用

基于上述框架，我们可以建立股票混合收益率预测模型，用于权益择时。模型包含日频输入与分钟频输入，日频输入端我们选择了民生金工因子库中 51 个技术面/情绪面日频特征+7 个日频基础量价指标+10 个强化风格因子，分钟频输入端我们采用民生金工因子库中的 52 个分钟频特征（合成至日频），基分类器我们采用 2 个 GRU 分别对日频与分钟频特征进行解码；市场信息的嵌入上，我们利用指数量价+1.1 节中提到的市场强化风格偏好生成权重进行嵌入；为了稳定预测信号以进行择时，我们将多期股票收益作为预测目标，并将多期 MSE 的均值作为损失函数，故收益预测仍然为（n，1）。

模型数据处理与其他参数细节如下表所示。训练数据从 2013 年开始，每次训练+验证集长度为 6 年，验证集为后 15%，样本外收益预测自 2019 年开始，每 20 个交易日基于元学习框架利用最新市场信息对历史基模型进行微调，历史基模型每年滚动训练一次。

模型信号分布集中于 0 轴附近。模型得到收益预测后，利用预测构建择时策略，注意这里的预测仍然是对未来一段时期内的综合收益预测(n, 1)；我们观察全历史（2019 年以来）所有股票的收益预测分布：信号呈单峰分布，略微右偏，两侧密度迅速下降，尾部极窄。此分布均值为0.55%，最小值-36.8%，25%分位数-0.32%，中位数 0.5%，75%分位数 1.37%，最大值 30.1%。

根据市场情况，我们需要对于历史预测取滚动阈值，输出买入信号。在 A 股总体市场条件下，若以 0 为阈值输出买入信号，有可能无法避免回撤的风险。除此之外，对于一个旨在做波段的择时策略，我们不希望频繁交易。故一旦输出买入信号，我们规定需要至少持有 10 个交易日，除非遇到强烈卖出信号。基于以上思路，我们以过去一年预测值的 70%分位数作为阈值，超过此阈值则输出买入信号，而卖出信号规定为低于过去一年预测值的 30%分位数。以平安银行为例，策略准确识别了 2020-2021 年的上涨与 2022 年的回撤， 5 年跑赢个股 81%，表现优秀。而这 5.5 年间共交易 111 次，平均每年换手率不到双边 20 倍，已经显著优于同类策略的选股换手率（将近翻倍）。

回测时暂不计交易费用，然而由于我们在构建模型时用到了多目标优化，故原始预测的变化不会很快，从而一定程度上降低策略换手率，按照双边千分之 3 的交易成本估算，费后可以在平安银行上取得年化 7.4%的收益，平均每年跑赢 8.8%。我们在全 A 中进行回测，对每一支股票采取相同策略后取表现平均。近 5 年多的时间中，对于等权持有每一支股票，策略获得 77%的累积超额收益，平均每年取得 27%的年化收益，跑赢个股达 11.3%（费前）。超额收益集中在市场下跌的 2022-2023 年；且在市场上涨的 2020-2021 年并没有跑输市场；故可以初步认为策略有效。

值得注意的是，策略超额收益高低与市场表现高度相关，理论上我们的基准应该对每支股票持中性观点，也就是半仓。若将基准换为持续持有每支股票的 50% 仓位，则累计超额收益可以提升至 108%，平均每年跑赢基准 20.2%。择时信号本身在选股上相比以IC 为目标函数的深度学习表现较弱。若将择时信号作为选股因子，2019 年以来因子周度平均 RankIC4.5%，双周频调仓多头组合按照双边千分之二扣费后年化收益 23.2%，相对中证 800 年化超额收益 18.3%，远不如我们之前报告中的 Meta_Master 等因子。

策略在不同市值规模的宽基成分股中表现有所区别。对于沪深 300 成分股，近五年平均胜率 74%，平均年化收益 17.2%，夏普比率 1.24 ，平均每年超额收益 11.4%，绝对收益净值最大回撤 8%。

中证 500 中平均胜率 75%，平均年化收益 18.8%，夏普比率 1.58，平均每年超额收益 9.3%，绝对收益净值最大回撤 10.3%。

中证 1000 成分股中年平均胜率 74%，平均年化收益 18.1%，夏普比率 1.24，平均每年超额收益 6.9%，绝对收益净值最大回撤 21.3%。

与选股不同，择时信号的有效性不与市值有太多关系（回撤角度大盘好于小盘），而较为有效的股票也多为高流动性与高波动的股票，这与传统学习在选股上的偏好截然相反，这也从侧面说明了选股与择时两个问题的区别。

2 SimStock 股票相似度刻画与模型提升

从提升模型效果而言，相似股票的择时信号可能共享某些规律，我们可以考虑加入相似度信息或者加权训练提升模型的泛化能力。我们参考 Yoontae Hwang 等人在 2023 年底发表的论文《SimStock : Representation Model for Stock Similarities》，利用自监督学习与时间域泛化技术，预测股票相似程度，我们将此信息加入至上一节模型中，旨在提升模型在不同种类股票之间预测的稳定性。

2.1 SimStock 模型刻画股票相似度

在深度学习中，股票属性信息往往是提升模型表现的重要因素，而刻画股票相似度有很多种方式。在我们之前的报告《深度学习如何利用公募持仓网络优化选股效果？》中，我们通过公募基金年报/半年报信息提取股票内在属性，加入到 LSTM（长短期记忆网络，Long Short-Term Memory）中取得了效果提升。在本次研究中，我们希望通过一种更加动态的方式，以预测相似度为目标，得到股票的内在属性，从而提升模型准确率。

论文提出了利用自监督学习预测股票相似度。衡量两只股票是否相似，首先需要提取股票特征，传统方法利用风格和行业表征股票属性，但缺乏对于近期量价规律的刻画。而自监督学习可以在考虑股票行业风格等属性的同时，提取过去一段时间的量价规律，从而输出一个更加全面的当期个股信息表示向量，更加动态地刻画相似度信息。所谓自监督学习，即预测目标并不从外部而来，而是通过数据本身的结构生成，作者利用数据增强技术自动构建正样本和负样本，即对于每只股票而言，较为相关的股票与不相关的股票。LSTM 生成动态注意力参数后对于正负样本分别加权，并通过 CLS 令牌吸收整个序列的信息，输出最终的个股向量表示。整个模型采用了对比学习的思想，将股票的时序信息加入相似度衡量，使得行业与风格不再是股票分类的唯一标准。首先，模型纳入股票原始输入，即个股过去 40 日时序量价，barra 风格因子以及资金流指标，数据形状为(N, 40, 20)，其中 N 为股票数量。基于原始数据与行业信息嵌入（行业哑变量经过全链接层处理）构建数据锚点 X，随后基于锚点构建正样本与负样本，即“与每只股票较为相似的模拟样本”与“与每只股票较为不相似的模拟样本“，正样本???? = ?? +(1 −?)?_????，其中? = 0.75， ?_????为 X 的一个随机特征（抽样），即很片面代表 X 的随机样本，形状为(N, 40, 1)，每一个 batch 随机抽取一个特征作为?_????。构建完样本后，利用行业信息嵌入初始化 LSTM 后输入股票原始信息，输出注意力权重，并利用 Transformer 中的 CLS 令牌聚合技术（将注意力得分聚合至股票维度）得到个股属性向量表示? ?，我们的学习目标是让? ?与正样本聚合得到的股票属性向量 ?????? ? 尽可能相似，同时让? ?与负样本聚合得到的股票属性向量?????? ? 相似度尽可能低，从而得到更能代表当期股票属性的股票向量? ?，股票相似度可以用当期个股属性向量的余弦相似度表示。

我们训练 SimStock 模型，训练集从 2013 年开始为期 5 年，验证集 1 年，测试集从 2019 年开始。由于 SimStock 是自监督学习模型，模型在训练时并不运用未来数据，故即使我们将全样本的预测输出作为结果，也不会用到未来信息。对于后续模型中使用 2013-2018 年训练集时，我们也用到了 SimStock 在同时期样本内的输出，这一点在理论上是可行的。从模型输出结果上看，SimStock 依旧偏好同行业的股票作为相关性最高的股票。我们取模型输出后的随机一天截面来观察模型的预测规律，具体地，取当天股票的属性向量后对每只股票与其他所有股票进行余弦相似度计算，我们取了 2025 年 5 月 30 日的代表性 4 只股票（表中第一行），并列出与其最相关的前 20 只股票。

从结果可以看出，与每支股票相似度最高的股票都是相同行业的股票，但是在市值上并没有明显的相似规律，且在二级行业上也没有明显规律。

2.2 基于股票属性嵌入的收益预测模型

上文中得到的股票属性信息可以加入到 GRU 股票收益预测模型中，旨在提升模型在不同股票中预测的稳定性。我们可以将第一节中用到的日频特征输入 SimStock，将 SimStock 刻画的股票属性向量? ?加入股票收益预测模型中，用? ? 初始化 GRU 的隐藏状态，即用? ?代替 GRU 模型的第 0 个隐状态，用一个已知而非随机的隐状态向量引导模型从股票属性认知开始学习，旨在提升模型在不同种类股票中表现的稳定性。改进后模型结构图如下所示，模型中其他要素与训练设定均不变。

改进后模型表现有所提升。根据上一节中的相同方式在全 A 中进行回测，对每一支股票施行相同策略后取表现平均，近 5 年多的时间中，对于等权持有每一支股票，策略获得 109%的累积超额收益，平均每只股票年化收益 30%，跑赢个股 14.8%（费前）；若基准为 50%仓位，则年化超额收益 29%，在所有股票的所有样本外回测期内，日度判断胜率为 57.4%，持仓几率为 45.7%，平均每支股票年化换手率（双边）为 26.2 倍。

继续以平安银行为例，改进后策略 5 年累计跑赢股票本身 115%，平均每年跑赢 21%，相比改进前进一步提升 12%。5 年半中共交易 147 次，平均每年双边换手率 27.5 倍，相比基准模型有所提升。按照双边千分之 3 的费率估算，平均每年收益率 16%，跑赢个股 17%，相比基准模型提升 7%。

策略在不同宽基中表现有所改善，且差距有所减小。对于沪深 300 成分股，近五年平均胜率 76.1%，平均年化收益 20.7%，夏普比率 1.88 ，平均每年超额收益 14.4%，策略绝对收益最大回撤均值为 8.5%。且 2020-2021 的超额稳定性有所提升。

中证 500 中平均胜率 75.6%，平均年化收益 23.4%，夏普比率 1.97，平均每年超额收益 13.1%，策略绝对收益最大回撤均值为 10.8%。

中证 1000 成分股中年平均胜率 75.6%，平均年化收益 22.5%，夏普比率 1.56，平均每年超额收益 10.7%策略，绝对收益最大回撤均值为 20.5%。

改进后模型在选股效果上没有提升，这可能是由于训练标签不适用导致的。改进后模型因子 2019 年以来周度平均 RankIC4.2%，双周频调仓多头组合按照双边千分之二扣费后年化收益 21.7%，相对中证 800 年化超额收益 17.2%。

3 微观至中观的宽基与行业指数择时效果

3.1 宽基指数择时

在个股择时有了一定成效后，我们尝试利用个股信号合成指数信号。对于指数择时信号的自下而上合成有 2 种方法：第一种是根据个股的买入卖出信号加总至指数信号；第二种是根据个股的原始收益预测合成至指数收益预测，再根据指数收益预测输出指数的买入卖出信号。我们选择第二种方法，因为个股收益预测至个股交易信号的计算中包含了一定误差，而进一步合成至指数后信号的误差更大，所以我们选择自下而上合成收益预测后再计算交易信号，这样只有一步误差放大。首先我们根据流通市值计算指数内合格成分股的权重，随后将每支股票的收益预测根据权重加权合成至指数收益预测。因个股合成的预测更加平滑且接近于 0，故我们取更激进的过去一年预测的 60%分位数作为信号阈值；且因为个股合成的缘故，信号变动较快，故我们规定买卖后至少保持 5 个交易日以避免频繁换手。

沪深 300 择时策略年化收益 5.1%，相对沪深 300 年化超额收益 5.6%，策略最大回撤 7.7%，若将过去一年预测值 40%分位数作为空头信号，同一仓位至少保持 5 个交易日，策略年化多空收益 10.7%，最大回撤 8.4%。

中证 500 择时多头策略年化收益 12.4%，相对中证 500 超额收益 12.2%，策略最大回撤 7.1%，若将过去一年预测值 40%分位数作为空头信号，同一仓位至少保持 5 个交易日，策略年化多空收益 24.6%，最大回撤 12.6%。

中证1000择时多头策略年化收益15.1%，相对中证1000超额收益14.9%，策略最大回撤 11.3%，若将过去一年预测值 40%分位数作为空头信号，同一仓位至少保持 5 个交易日，策略年化多空收益 30.2%，最大回撤 14.5%。

考虑到不定期择时信号操作难度较大，但若我们将策略改为固定周频，效果下降较为明显。

沪深 300 周度择时策略年化收益 1.7%，相对沪深 300 年化超额收益 2.3%，策略最大回撤 13.4%，年化多空收益 3.7%，最大回撤 19.6%。

中证 500 择时多头策略年化收益 8.3%，相对中证 500 超额收益 8%，策略最大回撤 7.8%，年化多空收益 16%，最大回撤 14.9%。

中证1000择时多头策略年化收益10.5%，相对中证1000超额收益10.3%，策略最大回撤 16.2%，年化多空收益 19.8%，最大回撤 24.2%。

3.2 行业及风格指数择时

相同的方法也可以同样对行业指数与风格指数进行择时。个股信号同样可以合成至行业信号，利用完全一致的方法论对所有行业的择时策略可以更加灵活地应用。

尽管加入了股票属性信息，择时策略仍然在不同行业中表现区别较大，在波动率高的行业中表现普遍较好。第一张图中绝对收益最高的 5 个行业分别为机械，医药，计算机，汽车与通信，相对收益最高的 5 个行业分别为医药，机械，农林牧渔，通信和建材。表现较好的行业通常都有赔率较高，且震荡规律较为明显的特点，模型大多数情况下可以识别行业下跌，持有时间大部分在上涨，故在赔率较高的行业中可以获得更高的收益。

策略在红利低波的防守型行业中效果有限。在所有行业中，银行，煤炭与纺织服装没能显著跑赢基准（一直满仓）。在波动率与弹性较低的行业中，机器学习模型较难长期稳定给出择时信号，尽管这些行业本身绝对收益表现并不差。对于大金融板块，行业出现明显上涨机会主要由政策等因素牵制，较难预测，模型在右侧买入后很难获得超额收益。

策略在电力设备及新能源中择时效果最明显。策略在行业中年化收益 36%，平均每年跑赢行业 31.1%，对于典型的高波成长行业，模型表现十分优异。

模型对于风格指数的择时效果稍微逊色一些。在中证 800 成长/价值中，择时信号也有一定效果，我们对于价值/成长的择时策略为：若价值收益预测>0 且价值收益预测大于成长收益预测，则满仓价值，反之则满仓成长，若二者都预测下跌，则保持空仓。考虑到操作的便捷性，我们继续在每周五输出信号，进行固定周频调仓。择时策略年化收益 3.3%，超额收益 4.2%（相对价值成长等权）。

4 总结与思考

本篇研究中，我们对于深度学习在股票以及指数上的择时策略进行了探索，并取得了一定成果。首先我们根据历史框架搭建基于日频与分钟频输入的股票收益预测模型，取得一定效果；随后加入自监督训练得到的股票属性，模型效果显著提升；最后我们将个股信号合成至指数，在宽基指数，行业与风格上跑赢绝大多数基准，为个股波段以及短期风格行业择时提出了新解法。根据民生金工历史研究框架搭建深度学习股票收益预测模型进行个股择时建模，效果显著。基于历史框架建立股票混合收益预测模型，模型包含日频输入与分钟频输入，利用预测值取历史滚动阈值输出交易信号，策略近 5 年在每支股票上平均获得 77%的累积超额收益。

SimStock 根据自监督学习预测股票相似度，同时考虑股票静态与动态相关性。利用 SimStock 输出的属性信息初始化基模型隐状态，预测效果进一步提升。改进后模型策略获得 109%的累积超额收益，平均每只股票年化收益 30%，跑赢个股 14.8%（费前）；日度判断胜率为 57.4%，持仓几率为 45.7%。将预测值合成至指数依然有效，高波行业中效果明显。沪深 300 择时策略年化收益 5.1%，超额收益 5.6%；中证 500 年化收益 12.4%，超额收益 12.2%；中证 1000 年化收益 15.1%，超额收益 14.9%。同样方法论在在高波板块中较好，表现最好的电力设备及新能源行业年化收益 36%，平均每年跑赢行业 31.1%，在红利低波等行业中较差；在价值和成长等风格中策略效果减弱，但仍然有效。

本篇研究中提出的方法论可以从以下几个角度出发应用至产品构建中： 1. 择时策略对于高波成长行业尤其有效，在某些个股中效果尤其出色，可以直接用于个股波段策略以博取高收益。对于某些 TMT，科技类主动型基金，可以根据择时信号对关注标的择时交易，避免回撤，从而博取更加稳定的组合表现。 2. 合成至指数后的择时信号可以用于指数增强等产品的仓位控制。比如中证 500 指数每年通过择时跑赢基准 12%，若假设现金仓位可在 90%~100%间波动，则适当的择时策略可提升组合年化收益 1%左右，且与因子策略本身无关，是值得尝试的收益增厚方式。 3. 信号可以被用于股指期货中进行交易。择时策略信号在 IC 期货中会也有一定效果，但由于多空收益最大回撤较大，建议控制仓位；此外，若能在盘中计算信号并立即建仓，准确率与收益都将进一步提升。 4. 其他 ETF 与行业，风格配置上的潜在应用。择时信号合成至行业与风格上大多可以跑赢基准，在资产配置或 ETF 交易中可以参考行业信号，进一步用类似风格轮动的方法论将行业择时改为行业轮动策略进行应用。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）