2024年基于卷积神经网络的ETF轮动策略
- 来源:广发证券
- 发布时间:2024/05/14
- 浏览次数:477
- 举报
基于卷积神经网络的ETF轮动策略.pdf
基于卷积神经网络的ETF轮动策略。研究背景:境内ETF市场规模创历史新高,指数化投资已成为境内公募基金行业发展趋势。我们团队于近期发布过《基于卷积神经网络的股价走势AI识别与分类》等深度学习研究报告,样本外跟踪至今仍旧有相对稳定的市场表现。ETF具备持仓透明、交易便利、费用低廉等特征。本报告探索将深度学习因子映射到ETF产品轮动中的效果。因子构建:通过构建标准化的价量数据图表,设计了卷积神经网络识别其中价格和交易量的走势形态,将其与未来股价进行建模,从而实现对未来股价的预测。然后基于个股因子值和权重数据计算权益指数的因子值,再进一步映射到ETF中。实证分析:周频ETF轮动模式下,ETF_fim...
一、研究背景
(一)指数化投资蓬勃发展
根据上交所的2024年度ETF行业发展报告,全球ETF市场规模于2023年首次突 破11万亿美元,全年资金净流入接近万亿美元。截至2023年底,全球挂牌交易的ETF 资产总规模达11.61万亿美元,较2022年底增长21.83%。近20年的全球ETF规模年 均复合增长率达22.16%,产品数量连续20年保持正增长。从资产类别来看,权益ETF 占主导地位。截至2023年底,全球权益ETF规模达8.62万亿美元,占比74.2%;债券 ETF规模达2.06万亿美元,占比17.7%;商品ETF规模约1794亿美元,占比1.6%;其 他类ETF规模约7506亿美元,占比6.5%。 回顾境内市场,指数化投资已成为境内公募基金行业发展趋势。根据上交所的 2024年度ETF行业发展报告,境内ETF市场规模突破2万亿元,创历史新高。截至 2023年底,境内交易所挂牌上市的ETF数量达889只,较2022年底增长18.06%;总 规模达2.05万亿元,较2022年底增长28.13%。其中权益型ETF市值达到1.73万亿元, 约占A股总市值的2%。2023年境内ETF规模增长4508.82亿元;其中新发产品贡献了 778.96亿元的规模增量,占比17.28%;存量产品规模实现了3729.86亿元的增长, 占比82.72%。
(二)机器学习因子
基于价量数据对未来股价走势进行预测作为一类重要的机器学习量化选股策略, 在过去受到了较为广泛的研究和应用。由于价量数据是跟着交易活动的进行而产生 的,其本质上是关于时间的一组序列。因此,为了建模价量数据与未来股价走势之 间的关系,大多数现有研究方法都选择了使用循环神经网络等时序模型。然而,时 序模型无法对价格和交易量的走势形态进行有效识别,其表现在一定程度上因此受 限。 我们团队于近期发布过《基于卷积神经网络的股价走势AI识别与分类》等深度 学习研究报告,为了克服时序模型对序列数据建模的不足,探究了使用卷积神经网 络对图表化的价量数据与未来股价进行建模,样本外跟踪至今仍旧有相对稳定的市 场表现。 ETF产品相比于普通基金,可以于交易时间内确认交易,具备相对更好的交易便 利性,相比于股票不用支付印花税等费用,具备费用优势。同时,ETF主要以跟踪标 的指数为投资目标,底层资产透明清晰。因此如何基于ETF进行配置也是投资者相对 关注的投资方向。 综上所述,本报告将进一步探索将深度学习因子映射到ETF产品轮动中的效果。
二、境内 ETF 市场概况
(一)ETF 总体概况
ETF产品快速发展。根据上交所的2024年度ETF行业发展报告,截至2023年末, 根据Wind,境内公募基金产品11514只,规模合计27.27万亿元,其中权益型基金规 模7万亿元,占境内公募基金总规模的26%。指数化投资已成为境内公募基金行业发 展趋势,截至2023年底,境内交易所挂牌上市的ETF数量达到889只,较2022年底 (753只)增长18.06%,年末市值总规模达到2.05万亿元,较2022年底(1.60亿元) 增长28.13%。其中权益型ETF市值达到1.73万亿元,创历史新高,约占A股总市值的 2%。

产品布局日趋完善。截至2023年末,境内ETF的投资标的涵盖了股票、债券、 货币、商品、境外股票等大类资产,产品布局较为完善。根据Wind,其中股票ETF 规模1.45万亿元,占比70.86%;跨境ETF规模2792.75亿元,占比13.66%;货币ETF 规模2067.94亿元,占比10.11%;债券ETF规模788.92亿元,占比3.86%;商品ETF 规模307.16亿元,占比1.50%。
(二)权益 ETF 概况
权益ETF的规模增量相对明显。下沉到资产类型,观察权益ETF的规模变动,根 据Wind,权益ETF的总规模由2014年的约2000亿元增长至2023年末的1.73万亿元, 在各资产类别中,规模增长相对明显。
进一步观察权益ETF中,各大类型的产品规模最新情况。规模方面,宽基类ETF 占比相对较高,根据Wind,截至2023年底,宽基ETF的规模合计为8424亿元,占比 约49%,行业主题类产品规模合计为5668亿元,占比约33%。
(三)ETF 市场格局
截至2024年4月底,境内有51家基金公司拥有上市非货币ETF产品。根据Wind, 排名前十的基金公司非货币管理规模合计为1.89万亿,占市场总规模的82%。已有7 家管理人非货币ETF管理规模突破千亿,其中华夏基金管理规模已达4884亿元。
下沉到具体产品,规模靠前的产品已突破千亿元,跟踪指数以沪深300等宽基指 数为主,其中华夏基金旗下的沪深300ETF的规模已超过2000亿元。
基于指数分类,根据Wind,截至2024年4月底,871只权益类ETF的跟踪指数合 计有369种,ETF合计规模靠前的指数同样以宽基指数为主。

三、深度学习因子逻辑
(一)标准化价量数据图表
为了能更好地使用卷积神经网络对价量数据图表与未来股价走势进行建模,本 方法对每个个股窗口期内的价量数据构建了标准化的图表。该图表包含了窗口期大 小为20日的价量数据,其由三部分组成: 1.图表的上部分由k线图和移动平均线构成,包含了开、高、低、收价格,以 及若干股价的移动平均线,如MA5、MA10等。 2.图表的中部分由当日对应的成交量构成。 3.图表的下部分由股价的MACD信息构成,其中短期和长期移动平均线的窗口 期。 由此构成了信息丰富的标准化价量数据图表。标准化图表构建完毕后,全市场 范围内从2005年至2023年期间的图表数据量达115Gb,远超于同期以序列形式表 达的价量数据,后者数据量仅为2Gb不到。
(二)价量数据图表卷积神经网络
为了对标准化图表和股价未来走势进行建模,本方法构建了卷积神经网络。输 入图片经过卷积结构后得到了512x10x10的特征图,将其摊平后得到51200维度的 特征后送入一个全连接神经网络。模型的最终输出为3个概率,分别对应个股在未 来截面日上收益率的百分位,即后1/3、中1/3、前1/3,以表示跌、平、涨。最终以 股票上涨的概率作为因子进行选股。 在模型的实现细节上,采用Xavier、 Adam化器等技术对模型进行训练;采用 训练数据外的验证集对训练中的模型进行验证,以确定最优早停(Early Stopping)时点。 通过分别训练两个不同的模型,将包含过去20日价量数据的标准化图表,与未 来5日、20日的个股收益情况进行建模。在下文中,这以I{x}R{y}来表示,其中x为 价量数据图表的窗口大小,y为预测未来y日的收益情况,换仓周期与y保持一致。 即I20R5表示使用包含过去20日价量数据的标准化图表来预测未来5个交易日的收 益情况。
(三)特征可视化
在完成卷积神经网络的训练后,标准化价量数据图表对模型进行输入,分别对 模型中的4个卷积神经网络结构的输出在特征维度随机抽取9张特征图进行可视化。 从特征可视化结果来看,卷积层1和卷积层2作为低维度特征提取器,其关注到 了整幅标准化价量数据图表中的信息,均同时涵盖了k线图、移动平均线、交易量 以及MACD信息。 而卷积层3和卷积层4作为高维度特征提取器,其对图表中代表不同信息的不同 部位的关注点开始发生分化,有的特征图重点捕捉k线图、移动平均线中的信息, 而有的特征图则重点捕捉交易量以及MACD中的信息。与此同时,也有的特征图关 注到了全局信息。 由此可见,训练后的卷积神经网络能对标准化的价量数据图表进行有效的特征 提取,识别出其中的价格以及交易量形态走势信息,从而与未来的股价走势进行建 模,实现对未来股价的预测。

四、实证分析
(一)数据说明
由个股汇总到指数,再映射ETF的逻辑,我们将选股因子应用到ETF轮动。考虑 到ETF产品的流动性,对ETF产品作规模和成交额等基本要求。另外,个股因子只涉 及境内A股市场,对跟踪海外和沪港深等指数的ETF作剔除处理。
ETF范围:境内权益ETF; 因子预处理:中位数去极值、Z-Score标准化; 回测区间:2020.01.01 – 2024.3.31; 分档方式:根据当期ETF的因子值,从小到大分为五档 ; 调仓周期:周度; 加权方式:等权; 流动性限制:换仓日滚动过去2周的日均规模超过1亿元,日均成交额超1000万 元。
(二)因子实证表现
周频ETF产品轮动模式下,因子回测结果收益相对明显。ETF_fimage因子的IC 均值为6.9%,IC胜率为62%,多空年化收益为20.4%,多空波动率为17.01%,多头年化收益为14.4%,空头年化收益为-6.1%。 分档表现方面,5分组模式下多头组超额收益相对明显。
观察ETF因子的分年度表现。回测结果显示,该因子2020年以来各年度均能实 现正的多空收益,其中截至3月底,该因子2024年初至今已实现约11%的多空收益。
进一步观察多头组的分年度表现,同时引入偏股混合型基金指数作为基准,对 比能否实现超额收益。测算结果显示,绝对收益方面,除了2023年,该因子自2020 年以来的各年度均实现了正收益,和偏股混合型基金指数的超额收益方面,该因子 的多头组均能实现超额收益。
(三)固定数量组合表现
回测结果显示,随着市场中的ETF产品发展,符合筛选要求的样本ETF产品逐渐 增多,多头组的ETF产品数量也同步增加。实际投资中,我们也关注持有如5只10只 等固定数量的ETF产品的收益状况。 因此本部分进一步测算基于因子等权配置5、10、15和20只ETF产品的回测效果。

测算结果显示,持有因子靠前的N只产品,相对偏股混合型基金指数和等权配置 样本内所有ETF均能实现超额收益。对比持有不同数量的ETF,持有相对较少的5只 ETF回测收益相对较高,2020年以来实现约16%的年化收益,年化波动率为25.6%, 相比于样本内等权配置所有ETF的超额收益为14.5%,相比于偏股混合型基金指数年 化超额收益为13.9%。
分年度表现来看,持有不同数量的ETF组合的回测收益特征基本一致。对比不同 数量持仓组合的表现,总体呈现持有较少的产品数量,收益表现更加突出的特征。
五、进一步检验
(一)剔除重复样本
上述内容的回测样本包含了跟踪同一指数的多只ETF,因此存在部分时期内回 测的多头组合里的持仓有跟踪同一指数的多只ETF的情况。 因此,我们进一步尝试换仓时,样本中跟踪同一指数的多只ETF中只保留规模最 大或流动性最好的一只。观察回测区间内符合要求的ETF样本数量,相比于剔除重复 项前数量有所下降。
剔除重复项后的,因子回测收益特征和未剔除前基本一致。ETF_fimage因子的 IC均值为6.4%,IC胜率为60%,多空年化收益为19.1%,多头年化收益为14.2%,空头年化收益为-5.1%。
对比持有不同数量的ETF,持有相对较少的5只ETF回测收益进一步增厚,相对 较高,2020年以来实现约21%的年化收益。
(二)流动性因素调整影响
流动性限制方面,前述方法是要求样本ETF换仓日滚动过去2周的日均规模超过 1亿元,日均成交额超1000万元。
我们进一步调整规模和成交额要求以对比不同流通性条件的影响。测算结果显 示,相对严格的流动性条件会降低多头组的收益表现。
(三)费用影响
费用方面,持仓5只ETF,在无交易费、双边千一和双边千二的条件下的回测年 化收益分别为19.9%、16.2%和12.5%,年化波动率为25.6%。
六、总结
研究背景:境内ETF市场规模突破2万亿元,创历史新高,指数化投资已成为境 内公募基金行业发展趋势。团队于近期发布过《基于卷积神经网络的股价走势AI识 别与分类》等深度学习研究报告,样本外跟踪至今仍旧有相对稳定的市场表现。ETF 具备持仓透明、交易便利、费用低廉等特征。本报告探索将深度学习因子映射到ETF 产品轮动中的效果。 因子构建:通过构建标准化的价量数据图表,设计了卷积神经网络识别其中价 格和交易量的走势形态,将其与未来股价进行建模,从而实现对未来股价的预测。 然后基于个股因子值和权重数据计算权益指数的因子值,再进一步映射到ETF中。
实证分析:周频ETF产品轮动模式下,ETF_fimage因子的IC均值为6.9%,IC胜率 为62%,多空年化收益为20.4%,多头年化收益为14.4%,空头年化收益为-6.1%。 因子分年度表现稳定,其中截至3月底,该因子2024年初至今已实现约11%的多空收 益。 固定持仓数量组合:等权配置5、10、15和20只ETF,持有不同数量的ETF组合 的回测收益特征基本一致,总体呈现持有较少的产品数量,收益表现更加突出的特 征。持有5只ETF回测收益相对较高,2020年以来实现约16%的年化收益,相比于样 本内等权配置所有ETF的超额收益为14.5%,相比于偏股混合型基金指数年化超额收 益为13.9%。 进一步检验:流通性条件的影响方面,相对严格的流动性条件会降低多头组的 收益表现。费用方面,持仓5只ETF,在无交易费、双边千一和双边千二的条件下的 回测年化收益分别为19.9%、16.2%和12.5%。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 行业主题轮动研究报告:基于卷积神经网络的指数轮动策略.pdf
- 鸿腾精密:智能“神经网络”平台厂商.pdf
- 银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进.pdf
- AI投研应用系列专题报告:基于NARX动态神经网络的指数择时策略.pdf
- 光通信行业研究报告:AI算力中心的神经网络.pdf
- 综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行.pdf
- 基金深度:全球配置新选择,互联互通ETF全解析.pdf
- 资金跟踪系列之三十五:两融重新净流出,ETF、北上净卖出放缓.pdf
- 两融先降后升,ETF流出可控——负债行为跟踪.pdf
- 自然资源行业资源ETF博时(510410):供需与宏观基本面共振,把握资源品大时代.pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 再探AlphaNet,结构和特征优化.pdf
- 2 2021年中国人工神经网络行业研究报告.pdf
- 3 量化投资专题报告:基于神经网络模型的利率择时.pdf
- 4 阅面科技-面向嵌入式设备的轻量级神经网络模型设计.pdf
- 5 金融工程专题:涵盖价量与基本面因子的多模型结合神经网络.pdf
- 6 “流程IT”打造企业的神经网络.pptx
- 7 光通信行业研究报告:AI算力中心的神经网络.pdf
- 8 机器、符号、神经网络学习与知识发现.pptx
- 9 基于时序神经网络的选股模型初探.pdf
- 10 无人机应用论文BP神经网络在无人机成本估算中的应用.docx
- 1 光通信行业研究报告:AI算力中心的神经网络.pdf
- 2 AI投研应用系列专题报告:基于NARX动态神经网络的指数择时策略.pdf
- 3 银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进.pdf
- 4 鸿腾精密:智能“神经网络”平台厂商.pdf
- 5 行业主题轮动研究报告:基于卷积神经网络的指数轮动策略.pdf
- 6 A股ETF市场概况与投资标的分析.pdf
- 7 金融工程行业研究:FOF破局求变,拥抱多资产和ETF.pdf
- 8 乱云飞渡仍从容:关税反击与稳市决心——“国家队”ETF持仓梳理.pdf
- 9 从投资工具到解决方案——中国机构配置手册(2025版)之ETF篇.pdf
- 10 基金投资价值分析:一键精准布局卫星全产业链——招商中证卫星产业ETF投资价值分析.pdf
- 1 银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进.pdf
- 2 鸿腾精密:智能“神经网络”平台厂商.pdf
- 3 行业主题轮动研究报告:基于卷积神经网络的指数轮动策略.pdf
- 4 基金投资价值分析:一键精准布局卫星全产业链——招商中证卫星产业ETF投资价值分析.pdf
- 5 2025年12月基金投顾投端跟踪报告:投顾组合调仓频率抬升,黄金和有色金属ETF受青睐.pdf
- 6 2026年量化和基金研究年度策略:公募新规下的ETF组合投资元年.pdf
- 7 金融产品深度报告:广发中证传媒ETF(512980.SH),政策规范护航,AI产能兑现,低估值传媒ETF走向高质量增长.pdf
- 8 A股投资策略周报(0110):2026开年产业趋势新变化和融资及ETF资金变化.pdf
- 9 基金市场与ESG产品周报:被动资金显著加仓大盘宽基ETF,国防军工主题基金表现占优.pdf
- 10 市场演进、海外镜鉴与未来趋势展望:股债恒定ETF,多资产指数投资新范式.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年行业主题轮动研究报告:基于卷积神经网络的指数轮动策略
- 2 2026年鸿腾精密公司研究报告:智能“神经网络”平台厂商
- 3 2025年银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进
- 4 2025年AI投研应用系列专题报告:基于NARX动态神经网络的指数择时策略
- 5 2025年光通信行业研究报告:AI算力中心的神经网络
- 6 2025年AI专题之NPU行业分析:专为端侧AI而生的神经网络加速器
- 7 2024年基于卷积神经网络的ETF轮动策略
- 8 2023年基于时序神经网络的选股模型初探
- 9 无人机应用论文BP神经网络在无人机成本估算中的应用
- 10 基于神经网络的模拟电路故障诊断专家系统研究
- 1 2026年行业主题轮动研究报告:基于卷积神经网络的指数轮动策略
- 2 2026年鸿腾精密公司研究报告:智能“神经网络”平台厂商
- 3 2025年银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进
- 4 2025年AI投研应用系列专题报告:基于NARX动态神经网络的指数择时策略
- 5 2025年光通信行业研究报告:AI算力中心的神经网络
- 6 2025年AI专题之NPU行业分析:专为端侧AI而生的神经网络加速器
- 7 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 8 2026年ETF基金研究·深度报告:成长价值策略SmartBeta基金产品定位及优选产品设计形式研究
- 9 2026年基金深度:全球配置新选择,互联互通ETF全解析
- 10 2026年资金跟踪系列之三十五:两融重新净流出,ETF、北上净卖出放缓
- 1 2026年行业主题轮动研究报告:基于卷积神经网络的指数轮动策略
- 2 2026年鸿腾精密公司研究报告:智能“神经网络”平台厂商
- 3 2025年银河金工可转债定价模型系列研究:条件特征神经网络对转债蒙特卡洛定价模型的改进
- 4 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 5 2026年ETF基金研究·深度报告:成长价值策略SmartBeta基金产品定位及优选产品设计形式研究
- 6 2026年基金深度:全球配置新选择,互联互通ETF全解析
- 7 2026年资金跟踪系列之三十五:两融重新净流出,ETF、北上净卖出放缓
- 8 2026年两融先降后升,ETF流出可控——负债行为跟踪
- 9 2026年自然资源行业资源ETF博时:供需与宏观基本面共振,把握资源品大时代
- 10 2026年ETF资金流向视角下的行业轮动配置
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
