2026年深度学习系列之一:在线学习增强选股模型的适应性
- 来源:天风证券
- 发布时间:2026/01/24
- 浏览次数:91
- 举报
引言
深度学习在量化选股领域中的应用,正凭借其卓越的非线性分析能力和对海量数据的高效 处理,展现出显著的优势,并逐渐成为提升投资决策效能的关键技术。然而近年来,基于 量价数据的深度学习选股模型,其回撤发生的频率较以往有所上升,这类回撤往往在市场 交易模式发生剧烈切换时出现,例如突发性的事件冲击或投资主题的快速轮动。 深度学习模型通常依赖于从历史数据中挖掘规律进行学习,然而,当市场风格在样本外发 生切换时,模型往往难以快速适应,修复的速度也可能较为迟缓。这一问题通常源于数据 中的概念漂移(Concept drift):由于金融环境的动态变化,影响资产价格的底层规律可能 随时间发生改变,导致样本外测试数据的分布不再与训练数据分布一致,从而显著影响模 型的表现。
为缓解金融数据中的概念漂移问题,提升模型的稳健性,目前研究探索了多种方向:在线 学习(Online learning)与增量更新(Incremental learning),即模型不再是一次性训练完 成,而是随着新数据的到来进行持续或周期性的增量更新,从而及时捕捉市场规律的最新 变化;集成学习(Ensemble learning),即不依赖单一模型,而是采用集成方法,动态地组 合多个具有不同偏好的基础模型,根据各模型近期表现动态调整权重,使整体模型能更灵 活地适应不同市场环境;元学习(Meta-learning)与领域自适应(Domain adaptation), 利用元学习框架,使模型具备“学会如何学习”的能力,从而在新市场环境下能基于少量 样本快速调整。此外,领域自适应技术旨在对齐不同时期的数据分布,学习更具泛化性的 特征表示。 在线学习通过持续将新到达的数据转化为训练样本,并基于新样本上的预测误差对模型参 数进行微调,相比滚动全样本重训练,显著地提升了训练效率。然而,这种学习方式也面 临两个关键挑战: (1) 灾难性遗忘:在线学习过程中,模型容易过拟合(Overfit)新到达的训练样本,导致 对历史数据中所学知识出现灾难性遗忘现象(Catastrophic Forgetting)。 (2) 信息延迟:新训练样本与测试样本之间也可能存在概念漂移。由于预测窗口的存在, 最新数据对应的标签无法即时获取,所以新训练样本并非最新,其距离测试样本至少间隔 一个预测窗口的长度。 对于灾难性遗忘问题,通常的应对方式包括关键参数冻结、小学习率更新、经验回放机制 等。一方面尽可能多的保留训练集中的关键知识,另一方面在模型微调更新时考虑历史样 本实现“温故知新”。 新训练样本与测试样本之间潜在的概念漂移可能会带来较大的负面影响。假设??表示?日对 应的特征,?日收盘后可以获取,考虑长度为?的预测窗口,??对应的标签??通常由? + 1日 与? + ? + 1日数据进行计算,即延迟?日后才可以获取。所以在线学习过程中,?日用来微 调模型的训练样本并不是? − 1日数据,而是? − ? − 1日数据(??−?−1 , ??−?−1 )。[1]中的研究 表明概念漂移很可能在新训练样本与测试样本之间的时间间隔中发生,且对模型性能的负 面影响随间隔的增大而增大,这在一定程度上限制了在线学习的有效性。传统的在线学习 考虑了训练集与新训练样本之间的概念漂移,但却忽视了新训练样本与测试样本之间的概 念漂移。

模型架构与训练方式
2.1 模型架构
模型由基础模型和适配器组成。基础模型使用一个多窗口期信息融合模型,将股票长期、 中期以及短期的量价特征分别进行标准化后融合,消除冗余信息并给出选股信号。适配器 主要作用是降低新训练样本与测试样本之间的概念漂移对模型造成的影响,将识别到的概 念漂移转化为对模型参数的缩放调整。
2.2 离线学习
在线学习之前,通常需要对模型进行预训练,即离线学习。为更好地利用历史数据并提升 稳健性,我们选择每年用扩展窗口滚动重训练的方式更新全部模型参数,这部分训练离线 进行。在年内应用在线学习的方式每日更新调整参数。 在数据输入方面,包含最高价、开盘价、最低价、收盘价、成交量与成交额的 5min 量价 序列。对数据进行多窗口期划分与标准化。窗口期长度分别选择 1、3、5、10、20、60 个 交易日,在每个时间窗口内部分别进行标准化,流程为对成交量及成交额数据对数处理后, 对全部序列进行窗口内时序 z-score 处理。然后经过 Log-signature 变换得到不同窗口对 应的特征集,涵盖短期、中期与长期特征,具有不同的侧重点。为提升训练过程的稳定性, 特征集在输入模型前做截面标准化。
训练时,每个交易日的所有股票数据作为一个 batch,标签选择为 t+1 到 t+11 日的收益率, 这里对收益率进行行业市值中性化以及截面标准化处理。从 2018 年开始逐年滚动训练模 型,为降低随机性并提升稳健性,离线训练模型时选择扩展窗口并进行 5 折交叉验证。扩 展窗口即窗口期起始日保持不变,窗口期结束日逐年移动扩展。另外在 5 折交叉验证中, 将数据集按时间顺序分为 5 部分,第一次训练时将第一部分作为验证集,其余部分作为训 练集,依此类推,需要注意的是验证集剔除了与训练集相邻的部分时间。每个验证集上设 置 20 轮早停,5 折交叉验证共得到 5 个模型,且每个模型契合的市场环境有所不同。 传统的训练过程一般将最近的时间段数据设定为验证集,但事实上,由于分布漂移,样本 外的交易模式并不一定与前一年保持一致,选择多个验证集下的模型并集成有利于模型的 样本外泛化。 离线训练的流程与标准的训练方式类似,前向传播计算输出,再反向传播优化带适配器模 型的全部参数,即离线学习时基础模型与适配器作为一个整体进行训练。训练流程的区别 在于输入包含 2 个批次的数据,包括当前批次与上一批次,主要目的是让适配器学习将批 次间的概念漂移转化为对模型的参数调整。 需要注意的是,在训练时批次之间的时间顺序是被打乱的,从而能够合成多样化的概念漂 移,以便更好地训练适配器。在线阶段可能会遇到历史数据中从未见过的新概念,但其概 念漂移可能与历史数据中学习到的有些漂移模式较为相似。由于参数调整依赖概念漂移而 非概念本身,因此,即使目标概念是全新的,适配器也有可能生成较优的参数调整。

2.3 在线学习
每年末,离线学习将得到 5 组模型的参数。在新的一年分别以离线学习得到的参数为基础 进行在线学习,过程中模型不断进行微调与预测,模型参数随新数据的到来而不断更新。 为缓解在线学习阶段的灾难性遗忘,我们一方面对基础模型中特征提取层的参数进行冻结, 另一方面选择更小的学习率进行微调。
在线学习在每个交易日持续进行。在其中一个交易日中,在线学习分为两个阶段:微调和 预测。微调阶段用当前可得的最新数据(带标签)作为训练样本,在上一次微调得到参数 的基础上进行更新。预测阶段参照前文中概念漂移估计和主动模型适应对模型参数进行暂 时性缩放调整,然后基于当前样本特征输出结果。在下一个交易日再次进行微调与预测, 以此类推。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 在线学习的未来:如何为高等教育的学生成功设计课程.pdf
- e-Learning、知识管理与虚拟学习社区.docx
- 在线学习平台标书模板(-38-).docx
- XXXX年安徽干部教育在线学习答案.docx
- e-Learning 的趋势与应用.pptx
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf
- 泛科技框架重构及选股模型初探.pdf
- 投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来.pdf
- “十五五”之六大未来产业图谱及选股框架:掘金未来.pdf
- 科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603).pdf
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf
- 金工深度研究:基于level2数据图像的选股模型.pdf
- PINN信息约束与时序截面双流网络选股模型分析.pdf
- 基于时序神经网络的选股模型初探.pdf
- 投资分析工具专题研究报告:综合财务指标选股模型.pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 中国青少年在线学习白皮书(2021)
- 2 人社部&阿里钉钉-新职业在线学习平台发展报告.pdf
- 3 NovoEd-2021年企业在线协作学习完整指南(英文)
- 4 计算机行业专题研究报告:计算机硬件市场景气度边际改善.pdf
- 5 2021年汽车人群在线学习需求洞察报告,跨越圈层,破而后立.pdf
- 6 在线教育平台用户注册及服务协议.docx
- 7 在线教育平台用户注册及服务协议(律师拟定详细版).docx
- 8 e-Learning & KM for BENQ– A Business Enabler.pptx
- 9 (能源化工行业)XXXX安徽干部在线教育测试及答案党领导文化工作的基本经验测试题及.docx
- 10 XXXX年安徽干部教育在线学习答案.docx
- 1 在线学习的未来:如何为高等教育的学生成功设计课程.pdf
- 2 高频选股因子周报:高频整体表现优异,多粒度因子维持正收益。AI增强组合超额持续回撤.pdf
- 3 因子选股系列专题报告:基于历史K线形态的因子选股研究.pdf
- 4 多因子选股系列研究报告:个股日内成交量分布特征与日内流动性弹性刻画.pdf
- 5 多因子选股系列研究之二十四:个股日内成交量周期性节奏刻画与“滴水穿石”因子构建.pdf
- 6 量化投资因子选股系列专题报告:DFQ_diversify,解决分布外泛化问题的自监督领域识别与对抗解耦模型.pdf
- 7 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf
- 8 因子选股系列专题报告:Neural ODE,时序动力系统重构下深度学习因子挖掘模型.pdf
- 9 PINN信息约束与时序截面双流网络选股模型分析.pdf
- 10 策略化选股月报:7月六大策略均录得正收益,科创板策略单月超额收益超9%.pdf
- 1 高频选股因子周报:高频整体表现优异,多粒度因子维持正收益。AI增强组合超额持续回撤.pdf
- 2 金工深度研究:基于level2数据图像的选股模型.pdf
- 3 科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603).pdf
- 4 高频和行为金融学选股因子跟踪周报:国防军工行业拥挤度较高,有限关注类因子表现较好.pdf
- 5 量化选股策略更新.pdf
- 6 量化选股策略更新.pdf
- 7 金工因子研究系列专题1:委托挂单手数蕴含的选股信息.pdf
- 8 红利选股的战略三角:进攻、防守和交易.pdf
- 9 金工深度研究:大模型概念与宏观热点选股.pdf
- 10 投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 2 在线学习行业研究
- 3 2022年在线学习行业之汽车人群研究报告21版 汽车人群洞察分析
- 4 2026年泛科技框架重构及选股模型初探
- 5 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 6 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 7 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 8 2026年量化选股策略更新
- 9 2026年金工深度研究:大模型概念与宏观热点选股
- 10 2026年量化选股策略更新
- 1 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 2 2026年泛科技框架重构及选股模型初探
- 3 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 4 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 5 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 6 2026年量化选股策略更新
- 7 2026年金工深度研究:大模型概念与宏观热点选股
- 8 2026年量化选股策略更新
- 9 2026年金工因子研究系列专题1:委托挂单手数蕴含的选股信息
- 10 2026年第4周高频和行为金融学选股因子跟踪周报:建材行业扩散指标走强,流动性类因子表现较好
- 1 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 2 2026年泛科技框架重构及选股模型初探
- 3 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 4 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 5 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 6 2026年量化选股策略更新
- 7 2026年金工深度研究:大模型概念与宏观热点选股
- 8 2026年量化选股策略更新
- 9 2026年金工因子研究系列专题1:委托挂单手数蕴含的选股信息
- 10 2026年第4周高频和行为金融学选股因子跟踪周报:建材行业扩散指标走强,流动性类因子表现较好
- 最新文档
- 最新精读
- 1 中国重汽公司深度研究:从周期到周期成长,中国重汽H的盈利中枢与全球视野下的价值重估.pdf
- 2 新城控股公司研究报告:双轮驱动战略笃行,商业竞争力与财务稳健性巩固.pdf
- 3 石油加工行业大炼化周报:炼厂保护性降负,推动能化产品价格价差上行.pdf
- 4 汽车和汽车零部件行业周报:“十五五”规划发布,战略发展智能汽车+具身智能.pdf
- 5 耐用消费产业行业周报:新型烟草多政策利好渗透率提升,拓竹发布首份消费级3D趋势报告.pdf
- 6 正泰电器公司研究报告:如何看正泰电器出口能力和空间?.pdf
- 7 策略周报:聚焦中东局势和原油走势,A股震荡分化.pdf
- 8 基础材料能源行业月报:供给持续优化下26年景气有望上行.pdf
- 9 信用债周策略:同业存款自律管理升级对短债有何影响?.pdf
- 10 机械行业周机汇0314:从特斯拉看北美光伏产业链发展.pdf
- 1 2026年商业航天行业深度:行业现状、市场规模、产业链及相关公司深度梳理
- 2 2026年国产算力行业深度:驱动因素、政策支持、产业进程、突破方向及相关公司深度梳理
- 3 2025年商品半年度报告_原油:供给逐渐过剩,油价下探仍未结束
- 4 2026年汽车行业:空间、格局及竞争优势探究—两轮车、全地形车及低速四轮车赛道对比
- 5 2026年汽车行业:关注整车预期筑底后结构性α行情,特斯拉Optimus明确今夏量产
- 6 2026年日本资本市场展望:如何看待高市时代下的日本?
- 7 2026年公募REITs春季策略展望:存量重构开新局,REITs蓝海向未来
- 8 2026年从风险识别到价值挖掘:中小银行二永债投资策略分析
- 9 2026年ROE稳定与ROE提升下的两类策略构建
- 10 2026年春季黄金投资策略展望:已凌千峰凭栏望,犹有青云万里程
