2026年高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子

  • 来源:长江证券
  • 发布时间:2026/02/27
  • 浏览次数:53
  • 举报
相关深度报告REPORTS

高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子.pdf

高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子。高频因子的计算过程可拆解成若干个数据变换和K线聚合步骤数据变换即对维度数据做函数映射,本质为交易信息的局部处理;K线聚合即对维度数据按照一定频率进行聚合计算,本质为交易信息的局部整合,以将数据从高频降至低频。量价因子的最后一步均为K线聚合,低频量价因子无数据变换和K线聚合的交叉。相比深度学习,该方法可以侧重至局部信息;相比遗传算法,该方法可以更好对应收益来源。由残差波动率的匹配逻辑可得残差成交量波动率和残差振幅波动率因子以2010年以来中证全指内选股为例,市值行业中性后的残差成交量波动率和残差振幅波动率I...

维度匹配因子构建

高频因子范式

高频因子的计算过程可拆解成若干个数据变换和 K 线聚合步骤: 数据变换即对该维度数据做函数映射,本质为交易信息的局部处理; K 线聚合即对该维度数据按照一定频率进行聚合计算,聚合计算包括求和、计数、 取极值等,本质为交易信息的局部整合,以将数据从高频降至低频。 低频量价因子相对高频量价因子的差别在于聚合计算部分,低频量价数据失去了聚合计 算和函数步骤交叉处理的可能,直接从聚合后的信息最后整合,从而失去了交易行为中 微观结构的刻画。

算子挖掘的意义

在高频因子挖掘中,有以 101Alpha 为代表的遗传算法挖掘过程,以及以监督学习为代 表的深度学习挖掘过程,以数据变换和 K 线聚合的组合过程相比以上两种挖掘因子的方 法并无效率上的提升,其意义就在算子的逻辑含义中。算子对应的逻辑含义对应了整合 信息的方向,如收益率求和对应了价格变动,成交量求和对应了成交活跃,所以变换和 聚合的过程是一种针对性的提取信息的方法,对应到选股因子层面则是可以对收益来源 给出划分。在《风格切换下的因子投资——金融工程 2026 年度投资策略》中我们指出, 当前因子整体收益在下降,但是波动在增加,收益来源的区分在控制风险、收益归因、 因子轮动层面有较大意义。 下表给出了沪深 300 和中证 1000 内,大类量价因子之间的选股超额收益相关性1,超额 收益相关性大部分在 50%以下。

相对于深度学习:深度学习是从特征到预测目标的直接拟合,符合一般机器学习的规律, 即输入数据的质量影响输出结果的质量,对数据量较为依赖,在信噪比较低的金融市场 中,如果局限特定板块或者某个维度的数据,会降低得到因子的有效性;所以一般深度 学习模型的特征较为全面,得到的因子也多为集合信息,不同网络结构的带来的结果差 异较小。即深度学习方法较难在挖掘因子上产生差异化。

相对于遗传算法:遗传算法通过算子组合的穷举,遍历信息的组合路径,从中找到有效 的选股路径,可以做到信息的差异,但整个过程均基于统计,没有辅以逻辑,会遍历较 多无效组合路径,降低挖掘效率,也容易在收益来源的区分上产生偏差。 数据变换——K 线聚合算子方法可以从已有的经典因子逻辑出发,有倾向性的挖掘某类 收益来源的因子,同时又具备一定的量产挖掘能力。

简单逻辑的扩充

本文从残差波动率这一经典价格稳定性因子出发,分别提升频率、扩充维度两个方面, 构建以下匹配逻辑的衍生因子: 高频残差波动率:30 分钟频率下个股收益率和三因子收益率的时间序列回归残差 波动率; 残差成交量波动率:个股成交占比和全市场成交占比的时间序列回归残差波动率; 残差振幅波动率:个股振幅和市场(中证全指)振幅的时间序列回归残差波动率。

成交匹配波动因子

多维度匹配

根据得到因子的最后一步是时序 K 线算子还是匹配 K 线算子,可以将数据变换——K 线聚合算子挖掘方法分为两类,以匹配 K 线算子结尾得到的因子,称为维度匹配因子。 匹配 K 线算子需要在最后一步得到两个或多个维度的数据,本文以两个维度为例,从最 简单的量价维度出发,列出基本维度的匹配表格,其中两个维度之间可以采用 R 方、残 差波动率、相关性、加权求和等算子得到因子。

成交匹配波动因子构建

本文通过遍历上述表格维度匹配的计算,构建有较为明显信息增量的成交匹配波动因子: 1. 每笔成交量:匹配变化算子——除法(成交量,成交笔数); 2. 成交量和:时序 K 线算子——求和(成交量); 3. 成交量占比:匹配变化算子——除法(成交量,成交量和); 4. 成交匹配波动:匹配 K 线算子——回归残差波动率(每笔成交量,成交量占比)。 下表分别给出了沪深 300 和全市场范围内,成交匹配波动因子和风格因子的相关性,因 子主要和波动率、换手率因子相关性较高,即属于低波收益来源,同时和规模因子呈一 定的负相关,偏小市值。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至