“量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf

  • 上传者:J***
  • 时间:2025/05/15
  • 热度:245
  • 0人点赞
  • 举报

“量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性。前言:随着市场的发展与竞争的加剧、尤其是机器学习模型的普及,想要 挖掘现有多因子模型以外的增量信息越来越困难。本篇报告提出以下论 点:未来量价因子的研究,想要获取更多的、与现有因子低相关性的增量, “逐笔等高频数据”结合“离散化的因子构建方式”至关重要。

连续性的因子构建方式:所谓“连续性”,即基于某一段连续的数据计算因 子。以常见的“量价相关性类因子”为例,分别基于日频、分钟、逐笔数 据,采用连续性的构建方式,批量生产对应的因子簇。将各自因子簇中的 因子等权合成,得到“日频连续”、“分钟连续”、“逐笔连续”因子。考察 “分钟连续”、“逐笔连续”因子相对于“日频连续”因子的增量,发现虽 然从因子的回测效果上来看,将“分钟连续”、“逐笔连续”叠加到“日频 连续”上,因子绩效确有显著提升,但一旦落实到组合层面,“分钟连续”、 “逐笔连续”的贡献就变得非常有限。以沪深 300 指数增强组合为例,叠 加“分钟连续”、“逐笔连续”因子构建的组合,相对于仅用“日频连续” 因子构建的组合,超额年化收益只能提升 0.5%-0.6%左右。

离散化的因子构建方式:所谓“离散化”,即在过去一段时间内,基于某些 特征、抽取几个离散的时间点,只用与这些时间点相关的数据计算因子。 分别基于分钟、逐笔数据,采用离散化的方式构建因子簇,同样将因子簇 中的因子等权合成,得到“分钟离散”、“逐笔离散”因子。考察离散化因 子相对于连续性因子的增量,发现虽然将“分钟离散”、“逐笔离散”叠加 到“连续”因子上,因子的回测表现并未得到明显提升,但落实到组合层 面,离散化因子却能提供显著的增量。比如基于“连续+逐笔离散”因子 构建的沪深 300 指数增强组合,相对基准的超额年化收益为 8.15%,跟踪 误差为3.81%,信息比率为2.14,月度胜率为75.68%,最大回撤为4.27%; 相较于只用“连续”因子构建的组合,超额年化收益可以提升 1%以上。

“逐笔离散”因子的表现:在逐笔数据层面,考察放量时间点之后的量价 相关性特征,构建“逐笔离散”因子。回测时间段 2016/01/01-2025/04/30 内,以全体 A 股为研究样本,该因子的月度 IC 均值为 0.073,年化 ICIR 为 2.87,月度 RankIC 均值为 0.099,年化 RankICIR 为 3.37;10 分组多 空对冲的年化收益为 38.30%,年化波动为 11.88%,信息比率为 3.22, 月度胜率为 81.98%,最大回撤为 11.87%。剔除常用风格与行业的影响 后,因子仍然有效,年化 ICIR 为 2.84。

1页 / 共24
“量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第1页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第2页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第3页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第4页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第5页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第6页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第7页 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf第8页
  • 格式:pdf
  • 大小:2.1M
  • 页数:24
  • 价格: 5积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至