2025年AI投研应用系列专题报告：基于NARX动态神经网络的指数择时策略

来源：太平洋证券
发布时间：2025/09/15
浏览次数：211
举报

相关深度报告REPORTS

神州控股研究报告：聚焦“Data+AI”场景化落地，全新范式扬帆起航.pdf

神州控股研究报告：聚焦“Data+AI”场景化落地，全新范式扬帆起航。聚焦“DataxAI”核心，持续推动产业数智化升级与商业价值重构；25H1经营与财务质量显著改善，业绩改善趋势逐步确立。神州控股于2000年成立，2001年在香港联合交易所主板上市。公司是一家以自主创新大数据融合技术赋能核心场景的高科技企业，2018年至今，公司向数字化转型之路迈进，围绕DataxAI战略方向，持续推动产业数智化升级与商业价值重构，赋能实体经济高质量发展。目前，公司聚焦“DataxAI”核心，构建多业务协同生态，形成大数据产品及方案、软件...

1. 时序神经网络概述

时序神经网络的演进与主要模型

在金融时间序列预测领域，神经网络架构经历了从简单感知向复杂时序建模的重要演进。早期循环神经网络（RNN）首次引入隐状态记忆机制，但存在梯度消失/爆炸问题，难以捕获长期依赖。随后长短期记忆网络（LSTM）及其变体门控循环单元（GRU）通过门控设计较好地解决了长期依赖问题，成为多年来的主流时序建模方案。近年来，时序卷积网络（TCN）依托因果膨胀卷积结构实现了更高效的并行计算与长期依赖建模；而源于自然语言处理的Transformer模型，也凭借自注意力机制在长序列预测中展现出显著潜力。在此背景下，带外部输入的非线性自回归网络（NARX）以其独特的结构设计和良好的可解释性，为多变量金融时间序列预测提供了一个直观而有力的工具。

2. NARX神经网络模型

NARX模型原理

NARX（Nonlinear Auto-Regressive Models with Exogenous Inputs）即带外部输入变量的非线性自回归神经网络，是一种专门为多变量时间序列预测设计的动态递归神经网络。其核心思想直观且符合金融逻辑：未来的值不仅取决于自身过去的历史，还受到一系列外部驱动因素的滞后影响。NARX模型将这一思想数学化，通过非线性函数来学习这种复杂的映射关系。

NARX模型结构

模型结构主要由四个层级构成：输入层：接收外部多维信号；时延层：通过延迟模块处理外部输入和输出反馈信号，生成具有特定滞后的历史数据序列，以提供时序记忆；隐含层：用非线性激活函数对这些时序信号进行高阶特征提取与复杂映射；输出层：通过线性加权产生预测值，该值同时反馈回时延层，形成闭环信息流。

训练架构

NARX具有开环和闭环两种架构。在训练阶段，采用开环架构，反馈信号来自训练集的真实历史值，避免了误差在训练过程中的累积与传播，提升训练过程的稳定性和收敛速度，使得模型能够高效地学习到输入与输出之间的真实映射关系。在预测阶段，切换至闭环架构，模型将自身前一步的预测值反馈回来，作为下一步预测的输入，这使得模型能够进行真正的多步预测。

NARX模型的优势

模型直观，结构可解释性强：NARX的网络结构是对经典线性ARX（Autoregressive with Exogenous inputs）模型的非线性扩展。输入层被明确划分为自回归（AR）和外生输入（X）两部分，使模型架构本身就承载了计量经济学模型的先验知识，可解释性更强，与黑盒模型相比融入了白盒特征。

分离式输入结构提供可控的分析框架：其结构原生区分目标序列历史值与外部驱动因子，可以独立调控自回归部分与外生部分的滞后阶数、网络复杂度（如为其设计不同的子网络路径），并通过权重来量化不同变量的相对重要性。这种对模型行为的可控性和可验证性，是端到端黑盒模型所缺乏的。

训练高效且稳定：开环训练模式用真实值进行反馈，有两个优势。第一，前馈网络的输入更准确。第二，生成的网络为纯前馈架构，可以使用静态反向传播进行训练，规避了LSTM、GRU 等模型所依赖的随时间反向传播（BPTT）及其固有的梯度问题（消失/爆炸）。这使训练过程的内在稳定性更高，收敛曲线更平滑，对超参数调优的敏感度显著降低。

数据量需求小，效率更高：通过网络结构内置了“未来状态依赖于其自身及外生输入的历史状态”的强归纳偏置（Inductive Bias）,与大多数金融时间序列的逻辑相符。因此，相比于参数更多、偏置更灵活（如Transformer的全局依赖性、LSTM的选择性记忆）的模型，NARX从数据中学习未知规律的需求更小，使其在中等规模数据集上能更快收敛，展现出更优的泛化性能且更不容易过拟合。

NARX和其他模型的对比

NARX在结构性可解释性、训练稳定性和数据效率方面具有优势，而LSTM、TCN和Transformer 则在处理更复杂的长期依赖和海量数据场景下各有优势。以

3. 基于NARX模型的指数择时策略构建

指数走势拐点预测

在指数择时模型的构建中，相比于直接预测指数价格，更具有实际意义的是可以预测出当前是否处于阶段的顶部或底部，即识别出指数走势的拐点。当指数形成阶段的顶点或底点时，其最近一段时间的价格、成交量、资金流等往往具有一定的特征。指数走势在往期多种因素的共同非线性影响下形成，因此可以用神经网络对这种非线性映射关系进行建模。指数走势状态划分：将指数走势的模式划分为转折点和持续点两种状态。以7日为一个基本区间，定义在该区间范围内，若当日最高价处于之前3个及之后3个交易日最高价的最高点，则该交易日为局部顶点，属于转折点；若当日最低价处于之前3个及之后3个交易日最低价的最低点，则该交易日为局部底点，属于转折点。其余交易日则属于上涨或下跌中的持续点。

信号准确率评价

评价指标主要为以下几个：综合准确率，为预测模式和实际模式相一致的结果所占的百分比；有效识别率，为实际模式为转折点的全部数据中，预测模式准确预测为转折点所占的百分比；识别准确率，为预测模式为转折点的全部数据中，实际模式确实为转折点所占的百分比。

由预测结果观察可知模型对阶段顶部和底部有比较好的识别，即使有些不在拐点当天，也仅与拐点相差一两个交易日，或者与真实最高最低点仅有微小幅度的差异，因而相比于严格计算的准确率，实际择时效果会更好。因此可以适当放松准确率的评价方式，会更接近实际对顶底部的识别效果。若与实际顶底点相差仅1个交易日，且与最高最低点实际相差幅度0.05%以内，也判定识别准确。可按此方式计算调整后的准确率。

4. 宽基指数择时测试

沪深300择时信号准确率

分别按照原始准确率和调整准确率进行信号准确率统计。原始：预测结果为顶底点当天，且为实际顶底点，判定识别准确。调整1：与实际顶底点相差不超过1个交易日，且与实际顶底点相差幅度0.05%以内，判定识别准确。调整2：与实际顶底点相差不超过1个交易日，且与实际顶底点相差幅度0.1%以内，判定识别准确。调整3：与实际顶底点相差不超过2个交易日，且与实际顶底点相差幅度0.05%以内，判定识别准确。

中证500择时信号准确率

中证1000择时信号准确率

5. 总结与未来研究方向

本报告探讨了NARX动态神经网络在指数择时中的应用。通过价格、量能、波动性等多维度特征，采用开环-闭环训练模式，构建了一个时序预测框架。回测结果表明，该模型对指数阶段性顶底部具有良好的识别能力。 NARX模型的核心优势在于其“白盒”结构，通过显式分离自回归项与外生输入，既保持了神经网络的非线性拟合能力，又具备传统计量模型的可解释性，为融入金融先验知识提供了天然框架。

未来研究可向多个方向深化：特征工程优化：引入市场情绪、宏观事件等多元另类数据。模型结构创新：探索结合NARX与注意力机制的混合模型架构，以兼顾可解释性与长程依赖能力。分路径差异化建模：为自回归与外生部分独立设计滞后阶数、网络深度等结构超参数，以增强模型的领域归纳偏置。

报告节选：

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）