2026年高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子
- 来源:长江证券
- 发布时间:2026/02/27
- 浏览次数:53
- 举报
高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子.pdf
高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子。高频因子的计算过程可拆解成若干个数据变换和K线聚合步骤数据变换即对维度数据做函数映射,本质为交易信息的局部处理;K线聚合即对维度数据按照一定频率进行聚合计算,本质为交易信息的局部整合,以将数据从高频降至低频。量价因子的最后一步均为K线聚合,低频量价因子无数据变换和K线聚合的交叉。相比深度学习,该方法可以侧重至局部信息;相比遗传算法,该方法可以更好对应收益来源。由残差波动率的匹配逻辑可得残差成交量波动率和残差振幅波动率因子以2010年以来中证全指内选股为例,市值行业中性后的残差成交量波动率和残差振幅波动率I...
维度匹配因子构建
高频因子范式
高频因子的计算过程可拆解成若干个数据变换和 K 线聚合步骤: 数据变换即对该维度数据做函数映射,本质为交易信息的局部处理; K 线聚合即对该维度数据按照一定频率进行聚合计算,聚合计算包括求和、计数、 取极值等,本质为交易信息的局部整合,以将数据从高频降至低频。 低频量价因子相对高频量价因子的差别在于聚合计算部分,低频量价数据失去了聚合计 算和函数步骤交叉处理的可能,直接从聚合后的信息最后整合,从而失去了交易行为中 微观结构的刻画。

算子挖掘的意义
在高频因子挖掘中,有以 101Alpha 为代表的遗传算法挖掘过程,以及以监督学习为代 表的深度学习挖掘过程,以数据变换和 K 线聚合的组合过程相比以上两种挖掘因子的方 法并无效率上的提升,其意义就在算子的逻辑含义中。算子对应的逻辑含义对应了整合 信息的方向,如收益率求和对应了价格变动,成交量求和对应了成交活跃,所以变换和 聚合的过程是一种针对性的提取信息的方法,对应到选股因子层面则是可以对收益来源 给出划分。在《风格切换下的因子投资——金融工程 2026 年度投资策略》中我们指出, 当前因子整体收益在下降,但是波动在增加,收益来源的区分在控制风险、收益归因、 因子轮动层面有较大意义。 下表给出了沪深 300 和中证 1000 内,大类量价因子之间的选股超额收益相关性1,超额 收益相关性大部分在 50%以下。
相对于深度学习:深度学习是从特征到预测目标的直接拟合,符合一般机器学习的规律, 即输入数据的质量影响输出结果的质量,对数据量较为依赖,在信噪比较低的金融市场 中,如果局限特定板块或者某个维度的数据,会降低得到因子的有效性;所以一般深度 学习模型的特征较为全面,得到的因子也多为集合信息,不同网络结构的带来的结果差 异较小。即深度学习方法较难在挖掘因子上产生差异化。
相对于遗传算法:遗传算法通过算子组合的穷举,遍历信息的组合路径,从中找到有效 的选股路径,可以做到信息的差异,但整个过程均基于统计,没有辅以逻辑,会遍历较 多无效组合路径,降低挖掘效率,也容易在收益来源的区分上产生偏差。 数据变换——K 线聚合算子方法可以从已有的经典因子逻辑出发,有倾向性的挖掘某类 收益来源的因子,同时又具备一定的量产挖掘能力。
简单逻辑的扩充
本文从残差波动率这一经典价格稳定性因子出发,分别提升频率、扩充维度两个方面, 构建以下匹配逻辑的衍生因子: 高频残差波动率:30 分钟频率下个股收益率和三因子收益率的时间序列回归残差 波动率; 残差成交量波动率:个股成交占比和全市场成交占比的时间序列回归残差波动率; 残差振幅波动率:个股振幅和市场(中证全指)振幅的时间序列回归残差波动率。

成交匹配波动因子
多维度匹配
根据得到因子的最后一步是时序 K 线算子还是匹配 K 线算子,可以将数据变换——K 线聚合算子挖掘方法分为两类,以匹配 K 线算子结尾得到的因子,称为维度匹配因子。 匹配 K 线算子需要在最后一步得到两个或多个维度的数据,本文以两个维度为例,从最 简单的量价维度出发,列出基本维度的匹配表格,其中两个维度之间可以采用 R 方、残 差波动率、相关性、加权求和等算子得到因子。
成交匹配波动因子构建
本文通过遍历上述表格维度匹配的计算,构建有较为明显信息增量的成交匹配波动因子: 1. 每笔成交量:匹配变化算子——除法(成交量,成交笔数); 2. 成交量和:时序 K 线算子——求和(成交量); 3. 成交量占比:匹配变化算子——除法(成交量,成交量和); 4. 成交匹配波动:匹配 K 线算子——回归残差波动率(每笔成交量,成交量占比)。 下表分别给出了沪深 300 和全市场范围内,成交匹配波动因子和风格因子的相关性,因 子主要和波动率、换手率因子相关性较高,即属于低波收益来源,同时和规模因子呈一 定的负相关,偏小市值。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
-
标签
- 方法论
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 五大咨询公司IT战略规划方法论(119页).pptx
- 2 集团战略解码方法论.pptx
- 3 赛迪智库-工业互联网平台赋能重点行业数字化转型方法论白皮书.pdf
- 4 房地产行业专题研究:房地产行业的研究方法论.pdf
- 5 传统制造企业的数字化转型探索之路:华为实施数字化转型方法论与实践的业务解读.pdf
- 6 抖音电商“FACT+”全域经营方法论白皮书.pdf
- 7 2021抖音电商商家经营方法论白皮书-抖音&贝恩
- 8 “数字转型”赋能流程管理-数字化流程方法论.pdf
- 9 德勤FAST方法论:以私域为核心的全域消费者持续运营.pdf
- 10 麦肯锡工作方法论.pptx
- 全部热门
- 本年热门
- 本季热门
- 1 2026年高频因子(十八):收益来源基础的因子挖掘方法论一——维度匹配因子
- 2 2026年债券市场专题研究:宽松改进下的风险平价,从本土化到全球化——资产配置方法论系列二
- 3 2025年投资策略:成长制胜,新兴产业投资方法论
- 4 2025年投资策略报告:困境反转投资方法论
- 5 2025年科技产业投资方法论:理论基础及四阶段投资、龙头命运与N字型定价
- 6 2025年价值投资三种方法论浅析
- 7 2025年资产配置方法论系列:低利率环境下的绝对收益路径
- 8 2024年资产配置方法论系列:风险平价的理念与国内实践
- 9 2024年港股投资方法论:流动性视角看降息后的港股
- 10 2024年固定收益专题报告:转债低价券投资方法论
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
