2025年金融工程深度报告:高频流动性与波动率因子再构建

  • 来源:中信建投证券
  • 发布时间:2025/10/29
  • 浏览次数:334
  • 举报
相关深度报告REPORTS

金融工程深度报告:高频流动性与波动率因子再构建.pdf

金融工程深度报告:高频流动性与波动率因子再构建。本文对高频流动性因子与波动率因子进行了深入研究,发掘出价差类、波动率类共两类因子。其中,基于股票高频高开低收数据构建了Roll、CS、AR、DGE、EDGE等价差因子,基于高频高开低收数据构建了Parkinson、Garman-Klass等历史波动率因子,并构建了价差增强因子与波动率增强因子。基于高频流动性构建的增强因子中CS_I因子表现最好,年化多空收益35.19%,夏普比率3.69,IC均值-9.22%,年化IC_IR达到-3.80;基于高频历史波动率构建的增强因子中garman_class_vol_I因子表现最好,年化多空收益33.30%,...

一、高频选股因子介绍

1.1、高频选股因子简介

随着国内市场传统因子选股的广泛应用,对公司的基本情况、财务状况以及日间量价关系等低频数据的挖 掘已经趋于饱和,以往有效因子也逐渐失效,市场对新信息的挖掘提出了迫切的需求。高频数据中蕴含了丰富 的市场交易信息,它能带我们通过数据窥探知情交易者的隐藏信息,也让我们更近距离地感受市场交易者的情 绪,从而帮助我们更准确地拿捏市场股票价格的走势。

1.2、高频选股因子分类体系

之前总共写了八篇高频因子报告《高频量价选股因子初探》、《买卖报单流动性因子构建》、《高频订单失衡 及价差因子》、《多层次订单失衡及订单斜率因子》、《流动性因子系统解读与再增强》、《高频选股因子分类体系》、 《流动性高频因子再构建与投资者注意力因子》、《技术指标因子高频化》,并根据上述的因子构建了分类体系。

二、流动性因子介绍和投资逻辑

2.1、流动性因子研究简介

流动性在金融市场中有着重要的作用,与资产定价、企业融资和市场微观结构有密切的联系。简单来看, 流动性代表金融资产的变现能力,即金融资产以合理的价格顺利转换成现金的能力。流动性越高,则金融资产 的交易成本越低,变现能力就越强。 有效买卖价差衡量观察到的交易价格与未观察到的基本价格的距离,是金融市场交易成本的主要衡量标准. 估计价差的方法大致可分为两类:一类是使用高频交易和高频报价数据(bid-ask)估计买卖价差(见《流动性高 频因子再构建与投资者注意力因子》等报告);另一类是使用价格数据(高开低收)估计买卖价差。 本文使用第二种方法,利用分钟级价格数据,构建多种价差来衡量股票的交易成本。另外,本文使用边际 交易成本(cost-per-dollar-volumn)的衡量方式,代表交易中每单位交易额的边际交易成本,对价差因子进行增 强。

2.2、流动性因子投资逻辑

价差因子的选股逻辑主要有以下两点: 1、 流动性溢价理论:如果投资者持有流动性较差的股票,那么在变现时会面临较高的交易成本和较长的 等待时间。为了补偿变现时的潜在损失,投资者会要求一个更高的预期收益率,因此有正向的流动性溢 价。 2、 信息不对称:价差的大小反映了市场中的信息不对称程度。对于信息不透明、研究覆盖少的股票,做市 商和流动性提供者会面临更大的与知情交易风险。这种情况下,他们会设置更大的买卖价差。因此,价 差往往与信息不对称程度有正相关关系,而这同样需要更高的风险溢价来补偿。 一般情况下,使用价差因子都可以筛选出具有流动性溢价的股票,但是部分股票可能因为消息面的原因出 现短期的剧烈波动,考虑两种情况:1、在市场剧烈波动、消息面复杂(如发布财报)的时候,股票 A 交易过于 活跃,股价剧烈波动,此时股票价差与成交额均高于正常水平;2、由于股票 B 交易过于低迷,股票价差较大, 此时股票 B 成交额较低,股票交易难度较大 。 虽然股票 B 的流动性风险要高于股票 A,但是无法使用价差数据区分以上两种情况。因此本文引入边际交 易成本的逻辑,将价差除以成交额构建增强因子。增强因子可以更好区分出以上两种情况,更精准地获取流动 性溢价,增强因子的稳定性。

2.3 流动性因子定义与构建

2.3.1 ROLL 指标

Roll (1984):通过计算资产价格变动的协方差来估计市场买卖价差。 Roll 价差基于以下两个基础假设 假设 1:有效市场。 假设 2:观察到的价格变动的概率分布是平稳的。

在有效市场,股票价格围绕均衡价格波动。当且仅当市场接收到未预期的重大消息时,均衡价格才会变动, 股票价格围绕新的均衡价格波动,价格变化不存在相关性。

2.4 流动性因子绩效表现

Roll_I 因子: ????_?因子表现出优异的选股能力。因子年化多空收益 18.13%,夏普比率 2.26,IC 均值 6.99%,年化 IC _I R 达到 2.89。

????_?因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组 相对 Q10 组具有将近 18.74%的超额收益(其中 Q 1 达 18.37%的多头超额收益, Q10 为-0.37%⁡ )

CS_I 因子: ??_?因子表现出优异的选股能力。因子年化多空收益 35.19%,夏普比率 3.69,IC 均值-9.22%,年化 I C_ IR 达到-3.80。

??_?因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组相对 Q10 组具有将近 31.86%的超额收益(其中 Q1 达 19.29%的多头超额收益, Q10 为-12.57%⁡ )

AR_I 因子: ??_?因子表现出优异的选股能力。因子年化多空收益 28.47%,夏普比率 2.96,IC 均值 8.15%,年化 I C_ IR 达到 3.18。

??_?因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组相 对 Q10 组具有将近 27.00%的超额收益(其中 Q1 达 18.73%的多头超额收益, Q10 为-8.27%⁡ )

OHLC_I 因子: ???C_I 因子表现出优异的选股能力。因子年化多空收益 21.25%,夏普比率 2.55,IC 均值 7.56%,年化 IC_IR 达到 3.32。

???C_I 因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组 相对 Q10 组具有将近 21.28%的超额收益(其中 Q 1 达 18.80%的多头超额收益, Q10 为-2.48%⁡ )

OHL_I 因子: ???_I 因子表现出优异的选股能力。因子年化多空收益 21.45%,夏普比率 2.48,IC 均值 7.91%,年化 I C_ IR 达到 3.28。

???_I 因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组相 对 Q10 组具有将近 21.46%的超额收益(其中 Q1 达 18.33%的多头超额收益, Q10 为-3.13%⁡ )

CHL_I 因子: ???_I 因子表现出优异的选股能力。因子年化多空收益 21.14%,夏普比率 2.50,IC 均值 7.61%,年化 I C_ IR 达到 3.14。

???_I 因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组相 对 Q10 组具有将近 21.26%的超额收益(其中 Q1 达 18.42%的多头超额收益, Q10 为-2.84%⁡ )

CHLO_I 因子: ????_I 因子表现出优异的选股能力。因子年化多空收益 21.28%,夏普比率 2.54,IC 均值 7.46%,年化 IC_IR 达到 3.27。

????_I 因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组 相对 Q10 组具有将近 21.33%的超额收益(其中 Q 1 达 18.74%的多头超额收益, Q10 为-2.59%⁡ )

EDGE_I 因子: ????_?因子表现出优异的选股能力。因子年化多空收益 24.07%,夏普比率 2.69,IC 均值 7.74%,年化 I C_ IR 达到 3.10。

????_?因子的分层效果区分度明显。不同分组间具有单调的年化超额收益(相对中证全指),并且,Q 1 组 相对 Q10 组具有将近 23.46%的超额收益(其中 Q 1 达 17.94%的多头超额收益, Q10 为-5.52%⁡ )

三、波动率因子

波动率因子介绍及投资逻辑

波动率指标衡量了标的的波动程度,波动率越高,资产收益的不确定性就越大,风险也就越高。市场 中存在低波异象,即波动率较低的股票往往有更佳的市场表现。投资者可能对高波动的股票过度乐观,导 致价格被高估;而对低波动的股票悲观,导致价格被低估。 本文使用日内分钟级数据构建波动率相关指标,衡量日内波动的剧烈程度。 一般来说,投资者在承担波动率风险时,往往会要求一定的风险溢价,这意味着波动率高的股票往往 未来表现更好。现实中,可能存在动量效应的扰动,即股票的单边行情引发大量趋同交易,导致股票价格 高估。为了减弱动量效应的影响,本文使用波动率因子除以当天的成交额构建改进因子,用新的因子衡量 波动率风险溢价。

波动率因子绩效表现

parksinson_vol_I

parksinson_vol_I 因子表现出优异的选股能力。因子年化多空收益 31.75%,夏普比率 3.19,IC 均值 8.55%, 年化 IC_IR 达到 3.39。parksinson_vol_I 因子的分层效果区分度比较高。不同分组间具有单调的年化超额收益(相 对中证全指),并且,Q1 组相对 Q10 组具有将近 29.37%的超额收益(其中 Q1 达 18.76%的多头超额收益, Q10 为-10.61% )。

garman_class_vol_I 因子: garman_class_vol_I 因子表现出优异的选股能力。因子年化多空收益 33.30%,夏普比率 3.39,IC 均值 8.75%, 年化 IC_IR 达到 3.50。garman_class_vol_I 因子的分层效果区分度比较高。不同分组间具有单调的年化超额收益 (相对中证全指),并且,Q1 组相对 Q10 组具有将近 30.48%的超额收益(其中 Q1 达 18.87%的多头超额收益, Q10 为-11.61% )。

rogers_satchell_vol_I 因子: rogers_satchell_vol_I 因子表现出优异的选股能力。因子年化多空收益 32.85%,夏普比率 3.42,IC 均值 8.76%, 年化 IC_IR 达到 3.58。rogers_satchell_vol_I 因子的分层效果区分度比较高。不同分组间具有单调的年化超额收益 (相对中证全指),并且,Q1 组相对 Q10 组具有将近 29.98%的超额收益(其中 Q1 达 18.22%的多头超额收益, Q10 为-11.76% )。

yang_zhang_vol_I 因子: yang_zhang_vol_I 因子表现出优异的选股能力。因子年化多空收益 31.69%,夏普比率 3.23,IC 均值 8.58%, 年化 IC_IR 达到 3.36。yang_zhang_vol_I 因子的分层效果区分度比较高。不同分组间具有单调的年化超额收益(相 对中证全指),并且,Q1 组相对 Q10 组具有将近 29.42%的超额收益(其中 Q1 达 19.15%的多头超额收益, Q10 为-10.27% )。

cho_frees_vol_I 因子: cho_frees_vol_I 因子表现出优异的选股能力。因子年化多空收益 31.33%,夏普比率 3.03,IC 均值 9.05%,年 化 IC_IR 达到 3.74。cho_frees_vol_I 因子的分层效果区分度比较高。不同分组间具有单调的年化超额收益(相对 中证全指),并且,Q1 组相对 Q10 组具有将近 29.31%的超额收益(其中 Q1 达 18.69%的多头超额收益, Q10 为 -10.62% )。

四、高频流动性与波动率因子样本外跟踪表现

从 2024 年 9 月开始样本外跟踪,截至 2025 年 9 月,有 3 个因子多空收益超 30%,有 10 个因子多空收益在 20%-30%区间,其中表现最好的因子是 yang_zhang_vol_I,多空收益 31.63%,夏普比率 2.94,IC 均值 9.07%,年 化 IC_IR 达到 3.88,表现非常不错。

五、高频流动性与波动率因子在主要宽基指数样本池内的绩效表现

5.1 流动性因子在主要宽基指数样本池内的绩效表现

我们将本文流动性因子分别限制在中证 1000、中证 800、中证 500、沪深 300 成分股上,考察因子在不同 指数样本池里的绩效表现。 流动性因子在中证 1000 指数成分股上表现较好,成交额增强因子的多头超额收益均超 10%。

流动性因子在中证 800 指数成分股上表现不如中证 1000 指数,绝大部分因子多头超额超 5%。

流动性因子在中证 500 指数成分股上表现优于中证 800 指数。

流动性因子在沪深 300 指数成分股上表现一般,edge 因子多头超额超 5%。

流动性因子在中证 A500 指数成分股上表现优于沪深 300 指数成分股。

5.2 波动率因子在主要宽基指数样本池内的绩效表现

波动率因子在中证 1000 指数成分股上表现较好,成交额增强因子的多头超额均超 12%。

波动率因子在中证 800 指数成分股上表现弱于中证 1000 指数。

波动率因子在中证 500 指数成分股上表现较好。

波动率因子在沪深 300 指数成分股上表现较差。

波动率因子在中证 A500 指数成分股上表现优于沪深 300 指数成分股。

六、高频流动性与波动率因子和常规因子相关性

6.1 高频流动性因子和常规因子的相关性

流动性因子和常规因子的相关性如下: 由于流动性因子都是由价格数据构建,并且逻辑都是衡量买卖价差,因此流动性因子内部相关性较高。除 了 CS_I 因子与 LnFloatCap 因子的相关性系数较高(0.56),流动性因子与其他大类因子的相关性较低。

6.2 波动率因子和常规因子的相关性

波动率因子内部相关性较高。除了 parkinson_I、garman_class_I 和 rogers_satchell_I 因子与 LnFloatCap 因子 的相关性系数较高,波动率因子与其他大类因子的相关性较低。

七、总结和思考

本文对高频流动性因子与波动率因子进行了深入研究,发掘出价差类、波动率类共两类因子。其中, 基于股票高频高开低收数据构建了 Roll、CS、AR、DGE、EDGE 等价差因子,基于高频高开低收数据构建了 Parkinson、Garman-Klass 等历史波动率因子,并构建了价差增强因子与波动率增强因子。 本文基于股票高频高开低收数据构建了 Roll、CS、AR、DGE、EDGE 等价差因子,其中 CS_I 因子表现最 好,年化多空收益 35.19%,夏普比率 3.69,IC 均值-9.22%,年化 IC_IR 达到-3.80;基于高频高开低收数据构建 了 Parkinson、Garman-Klass 等历史波动率因子,其中 garman_class_vol_I 因子表现最好,年化多空收益 33.30%,夏普比率 3.39,IC 均值 8.75%,年化 IC_IR 达到 3.50 本文测试了高频流动性与波动率因子在不同样本池的表现,高频流动性与波动率因子在中证 1000 样 本池内表现最好。相关性分析结果表示,高频流动性与波动率因子与常规大类因子的相关性较低,具有良 好的互补性。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至