2025年金融工程专题:基于LSTM神经网络的择时融合多因子选股策略

  • 来源:华福证券
  • 发布时间:2025/11/17
  • 浏览次数:256
  • 举报
相关深度报告REPORTS

金融工程专题:基于LSTM神经网络的择时融合多因子选股策略.pdf

金融工程专题:基于LSTM神经网络的择时融合多因子选股策略。本报告提出了一种多维度指数日频择时框架,旨在通过仓位择时优化绝对收益策略和股指期货策略的绩效。框架基于多维度因子体系,包括80个分析师预期因子、134个资金流因子、43个高频聚合低频特征,以及2020年后引入的深度学习因子(涵盖日频LSTM模型和高频分时数据LSTM模型)。深度学习因子预测框架以未来一天收益为目标,利用日度和分时数据捕捉隔夜信号,并采用改进的MADL损失函数进行方向判断。通过信号融合将三类基础因子与两类深度学习因子聚合,形成最终择时信号,回测结果显示多空策略年化收益达46%(夏普比率2.37),仅多头策略年化收益23%...

策略逻辑

主要框架

仓位择时的必要性:对于追求绝对收益策略以及股指期货策略而言,仓位择时都相对比较重要。 仓位择时的可行性:日频择时胜率,多头空头均能达到54%,包含多空策略扣费后年化46%,夏普比例2.37,卡尔玛3.58。仅多头策略扣费后也 有23%稳健收益。

深度学习因子预测框架。将日度数据的预测目标明确为未来一天的收益。 利用日度以及分钟数据捕捉隔日信号,并聚合生成指数级别判断。 #应用改进的MADL损失函数而非mse,适用于指数方向判断。

基础因子:资金流+分析师预期

基础因子

我们对80个分析师预期因子来做测试。 以沪深300为基准,分别按照因子历史阈 值20%、40%、60%、80%为阈值,相关性 定方向来做测试。分析师因子在2014年 之后才开始测试。 第一组中因子FEPSYOY在80%阈值下表现 较好,年化收益14.45%、其次是预测净 资产收益同比增长率等等。

第二组中因子FNetProfitYOY在80%阈值下表现较好,年化收 益16.34%、其次是预测每股受益同比增长率等等。 第三组中因子FNPParanetComOwnersGrowRate在80%阈值 下表现较好,年化收益13.42%、其次是预测净资产收益率复 合增长率等等。 第四组中因子FGrossIncomeRatioYOY在60%阈值下表现较好, 年化收益10.24%、其次是预测毛利率等等。

我们以沪深300为基准,对资金流因子43个进 行测试。 其中总计沪深港通持股比例表现较好,年化收 益达到14.89%,但是该因子与第二天收益也是 负相关性。

高频因子聚合低频

我们需要从高频因 子中构造出合适的 特征。 针对已经提取的分 钟数据,通过聚合 日度提取出一些常 用,高效,噪声低 的高质量特征,包 括7大类共计43个细 分因子。

我们发现右边的一些特征更够直接与指 数未来一天收益形成高相关性; 成交量失衡因子:上涨min相当于下跌 min对应的成交量占比; price_vs_support:当前价格相对于支撑 位的位置;越小越高。 价量背离:日内价量趋势的一致性高低; 日内成交量:成交量与指数收益有显然 的正相关关系: price_vs_resistance:距离阻力位置越远, 收益率越高。

我们对相关性较高的信号测试了他们对未来一天open to open的预测效 果,分别按照不同阈值20%、 40% 、60%、 80%百分位测算; price_volume_divergence:日内价量趋势的一致性高低(对close和volume 进行线性拟合,并将拟合的结果相乘作为量价背离指标) 。price_vs_support:先计算日内支撑位,当前收盘价比支撑位的距离。reversal_pattern:判断日内是先低后高还是先高后低,如果日内先低后 高,指标值为-1;日内先高后低,指标值为1。

改进的madl损失函数:lstm在日度跟分钟信号上的择时

LSTM通过其内部的记忆单元和门控机制逐步处理输入序列,能够有效 捕捉时间依赖性。

我们运用lstm模型进行沪深300择时,策略总收益率高达140.81%,超额收益率为156.32%,胜率54.17%。远远高于基准,最大回撤19%。

输入数据:选取一日的分钟 bar行情作为模型输入,共包 含开盘价、最高价、最低价、 收盘价、成交量、成交额和成 交笔数7个基础特征,以及其 他技术指标44个。所有特征在 日内240分钟上做时序标准化。

多信号聚合

我们将高频数据聚合低频策略起始时间定位2010年。该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益17.98%(扣费后),最大回撤发生在2010年。 该策略胜率53.67%,包含多空信号,单边换手132倍年化,手续费按照单边万一计算。

我们将分析师预期信号策略起始时间定位2014年。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益17.80%(扣费后),最大回撤发生在2015年。 该策略胜率52.07%,包含多空信号,单边换手1.23倍年化,手续费按照单边万一计算。

我们将资金流信号策略起始时间定位2012年。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益17.93%(扣费后),最大回撤发生在2015年。 该策略胜率51.78%,包含多空信号,单边换手46.52倍年化,手续费按照单边万一计算。

我们将LSTM分钟频因子策略起始时间定位2020年。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益22.17%(扣费后),最大回撤发生在2025年。 该策略胜率54.21%,包含多空信号,单边换手121.34倍年化,手续费按照单边万一计算。

我们将LSTM日频因子策略起始时间定位2020年。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益35.49%(扣费后),最大回撤发生在2022年。 该策略胜率53.80%,包含多空信号,单边换手31.45倍年化,手续费按照单边万一计算。

三信号起始时间有差异,为了尽可能全面涵盖三信号,我们将策略起始时间定位2015年。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益35%(扣费后),最大回撤发生在2015年。 该策略胜率54%,包含多空信号,单边换手80倍年化,手续费按照单边万一计算。

五信号起始时间有差异,我们将策略起始时间定位2020年11月。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益46%(扣费后),最大回撤发生在2024年。 该策略胜率54.87%,包含多空信号,单边换手82倍年化,手续费按照单边万一计算。

三信号起始时间有差异,我们将策略起始时间定位2015年1月。 该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益18.71%(扣费后),最大回撤发生在2015年。 该策略胜率53.25%,仅包含多头信号,单边换手34倍年化,手续费按照单边万一计算。

五信号起始时间有差异,我们将策略起始时间定位2020年11月。该策略以沪深300为基准,从绝对收益角度来看效果较好,年化收益23.13%(扣费后),最大回撤发生在2024年。 该策略胜率54.63%,仅包含多头信号,单边换手41倍年化,手续费按照单边万一计算。

择时叠加选股策略

alpha158+lightGBM选股策略

Lightgbm训练方法:扩展训练12周训练一次模型 ,预测的lable是未来一期的 收益率排序rank. 。 在分组收益中,以沪深300为基准,Group5表现最佳,年化超额达到17.65%, 夏普比率70.44%。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至