2025年AI投研应用系列专题报告:基于NARX动态神经网络的指数择时策略

  • 来源:太平洋证券
  • 发布时间:2025/09/15
  • 浏览次数:211
  • 举报
相关深度报告REPORTS

神州控股研究报告:聚焦“Data+AI”场景化落地,全新范式扬帆起航.pdf

神州控股研究报告:聚焦“Data+AI”场景化落地,全新范式扬帆起航。聚焦“DataxAI”核心,持续推动产业数智化升级与商业价值重构;25H1经营与财务质量显著改善,业绩改善趋势逐步确立。神州控股于2000年成立,2001年在香港联合交易所主板上市。公司是一家以自主创新大数据融合技术赋能核心场景的高科技企业,2018年至今,公司向数字化转型之路迈进,围绕DataxAI战略方向,持续推动产业数智化升级与商业价值重构,赋能实体经济高质量发展。目前,公司聚焦“DataxAI”核心,构建多业务协同生态,形成大数据产品及方案、软件...

1. 时序神经网络概述

时序神经网络的演进与主要模型

在金融时间序列预测领域,神经网络架构经历了从简单感知向复杂时序建模的重要演进。 早期循环神经网络(RNN)首次引入隐状态记忆机制,但存在梯度消失/爆炸问题,难以捕获 长期依赖。随后长短期记忆网络(LSTM)及其变体门控循环单元(GRU)通过门控设计较好地解 决了长期依赖问题,成为多年来的主流时序建模方案。近年来,时序卷积网络(TCN)依托因果 膨胀卷积结构实现了更高效的并行计算与长期依赖建模;而源于自然语言处理的Transformer模 型,也凭借自注意力机制在长序列预测中展现出显著潜力。 在此背景下,带外部输入的非线性自回归网络(NARX)以其独特的结构设计和良好的可解释 性,为多变量金融时间序列预测提供了一个直观而有力的工具。

2. NARX神经网络模型

NARX模型原理

NARX(Nonlinear Auto-Regressive Models with Exogenous Inputs)即带外部输入变量的非 线性自回归神经网络,是一种专门为多变量时间序列预测设计的动态递归神经网络。 其核心思想直观且符合金融逻辑:未来的值不仅取决于自身过去的历史,还受到一系列外部驱动 因素的滞后影响。NARX模型将这一思想数学化,通过非线性函数来学习这种复杂的映射关系。

NARX模型结构

模型结构主要由四个层级构成: 输入层:接收外部多维信号; 时延层:通过延迟模块处理 外部输入和输出反馈信号, 生成具有特定滞后的历史数 据序列,以提供时序记忆; 隐含层:用非线性激活函数 对这些时序信号进行高阶特 征提取与复杂映射; 输出层:通过线性加权产生 预测值,该值同时反馈回时 延层,形成闭环信息流。

训练架构

NARX具有开环和闭环两种架构。在训练阶段,采用开环架构,反馈信号来自训练集的真实历史 值,避免了误差在训练过程中的累积与传播,提升训练过程的稳定性和收敛速度,使得模型能够 高效地学习到输入与输出之间的真实映射关系。在预测阶段,切换至闭环架构,模型将自身前一 步的预测值反馈回来,作为下一步预测的输入,这使得模型能够进行真正的多步预测。

NARX模型的优势

模型直观,结构可解释性强:NARX的网络结构是对经典线性ARX(Autoregressive with Exogenous inputs)模型的非线性扩展。输入层被明确划分为自回归(AR)和外生输入(X) 两部分,使模型架构本身就承载了计量经济学模型的先验知识,可解释性更强,与黑盒模型 相比融入了白盒特征。

分离式输入结构提供可控的分析框架:其结构原生区分目标序列历史值与外部驱动因子,可 以独立调控自回归部分与外生部分的滞后阶数、网络复杂度(如为其设计不同的子网络路 径),并通过权重来量化不同变量的相对重要性。这种对模型行为的可控性和可验证性,是 端到端黑盒模型所缺乏的。

训练高效且稳定:开环训练模式用真实值进行反馈,有两个优势。第一,前馈网络的输入更 准确。第二,生成的网络为纯前馈架构,可以使用静态反向传播进行训练,规避了LSTM、GRU 等模型所依赖的随时间反向传播(BPTT)及其固有的梯度问题(消失/爆炸)。这使训练过程 的内在稳定性更高,收敛曲线更平滑,对超参数调优的敏感度显著降低。

数据量需求小,效率更高:通过网络结构内置了“未来状态依赖于其自身及外生输入的历史 状态”的强归纳偏置(Inductive Bias),与大多数金融时间序列的逻辑相符。因此,相比于 参数更多、偏置更灵活(如Transformer的全局依赖性、LSTM的选择性记忆)的模型,NARX从 数据中学习未知规律的需求更小,使其在中等规模数据集上能更快收敛,展现出更优的泛化 性能且更不容易过拟合。

NARX和其他模型的对比

NARX在结构性可解释性、训练稳定性和数据效率方面具有优势,而LSTM、TCN和Transformer 则在处理更复杂的长期依赖和海量数据场景下各有优势。以

3. 基于NARX模型的指数择时策略构建

指数走势拐点预测

在指数择时模型的构建中,相比于直接预测指数价格,更具有实际意义的是可以预测出当前是否处 于阶段的顶部或底部,即识别出指数走势的拐点。 当指数形成阶段的顶点或底点时,其最近一段时间的价格、成交量、资金流等往往具有一定的特征。 指数走势在往期多种因素的共同非线性影响下形成,因此可以用神经网络对这种非线性映射关系进行 建模。 指数走势状态划分:将指数走势的模式划分为转折点和持续点两种状态。 以7日为一个基本区间,定义在该区间范围内,若当日最高价处于之前3个及之后3个交易日最高价的最高点,则该交易日为局部顶点,属于转折点;若当日最低价处于之前3个及之后3个交易日最低价的最低点,则该交易日为局部底点,属于转折点。 其余交易日则属于上涨或下跌中的持续点。

信号准确率评价

评价指标主要为以下几个:综合准确率,为预测模式和实际模式相一致的结果所占的百分比; 有效识别率,为实际模式为转折点的全部数据中,预测模式准确预测为转折点所占的百分比;识 别准确率,为预测模式为转折点的全部数据中,实际模式确实为转折点所占的百分比。

由预测结果观察可知模型对阶段顶部和底部有比较好的识别,即使有些不在拐点当天,也仅与 拐点相差一两个交易日,或者与真实最高最低点仅有微小幅度的差异,因而相比于严格计算的准 确率,实际择时效果会更好。因此可以适当放松准确率的评价方式,会更接近实际对顶底部的识 别效果。 若与实际顶底点相差仅1个交易日,且与最高最低点实际相差幅度0.05%以内,也判定识别准确。 可按此方式计算调整后的准确率。

4. 宽基指数择时测试

沪深300择时信号准确率

分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。 调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。

中证500择时信号准确率

分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。 调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。

中证1000择时信号准确率

分别按照原始准确率和调整准确率进行信号准确率统计。 原始:预测结果为顶底点当天,且为实际顶底点,判定识别准确。 调整1:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。 调整2:与实际顶底点相差不超过1个交易日,且与实际顶底点相差幅度0.1%以内,判定识别准确。 调整3:与实际顶底点相差不超过2个交易日,且与实际顶底点相差幅度0.05%以内,判定识别准确。

5. 总结与未来研究方向

本报告探讨了NARX动态神经网络在指数择时中的应用。通过价格、量能、波动性等多维度特征, 采用开环-闭环训练模式,构建了一个时序预测框架。回测结果表明,该模型对指数阶段性顶底 部具有良好的识别能力。 NARX模型的核心优势在于其“白盒”结构,通过显式分离自回归项与外生输入,既保持了神经 网络的非线性拟合能力,又具备传统计量模型的可解释性,为融入金融先验知识提供了天然框架。

未来研究可向多个方向深化:特征工程优化:引入市场情绪、宏观事件等多元另类数据。 模型结构创新:探索结合NARX与注意力机制的混合模型架构,以兼顾可解释性与长程依赖能 力。分路径差异化建模:为自回归与外生部分独立设计滞后阶数、网络深度等结构超参数,以增 强模型的领域归纳偏置。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至