2025年金融工程专题报告:撤单视角下的算法交易识别与Alpha捕捉

  • 来源:西部证券
  • 发布时间:2025/09/16
  • 浏览次数:264
  • 举报
相关深度报告REPORTS

金融工程专题报告:撤单视角下的算法交易识别与Alpha捕捉.pdf

金融工程专题报告:撤单视角下的算法交易识别与Alpha捕捉。【报告亮点】通过下单-撤单时间差的视角,对算法交易驱动的撤单进行识别与交易逻辑分析。构建的算法交易买单撤单占比(BABR)与算法交易买卖撤单熵(ACE)因子具有较强选股效果。【主要逻辑】下单-撤单时间差分布呈现脉冲式集中,集中的时间点可能代表了算法交易驱动的撤单行为。统计这类算法交易撤单与全部撤单的比例,构建算法交易撤单数占比因子(ACCR),因子全区间RankIC达到0.052,ICIR为0.458。进一步细分撤单的买卖特征,发现买单算法交易撤单笔数/全部买单撤单笔数(BABR)全区间RankIC达到0.059,ICIR达到0.55...

一 、引言

近年来,随着算法交易的普及,机构为降低冲击成本更倾向于拆分小单。《Tracking Retail and Institutional Investors Activity in China》一文将4万元与20万元作为小中大单的划分标准,并统计每种订 单中实际交易者的占比; 2017年以来,小单中机构订单的占比逐渐攀升,大单中机构订单的占比则有所回落,传统“大单=机构”假设削弱。

受算法拆单影响,以挂单金额划分的“机构订单”已难以真实反映机构行为。2013年以来,沪深两市总成交金额整体呈现上升趋势,但平均每笔交易金额明显下滑; 目前主流金融软件和数据库仍按绝对金额划分订单,偏离真实机构交易特征。

二、算法交易撤单占比

UBS在《Identifying human versus algo trading in the China market》一文中提出,集中出现的下单-撤单时间差可能反映了由 算法交易预设的撤单规则:自然交易:撤单时间差应随机或在一些时间段内大致均匀分布。 异常特征:若撤单集中在特定时间点,且符合一定交易逻辑 → 可能为算法交易预设的行为。 以2025年7月为例,统计发生在1分钟内的撤单数量,许多时间点上确实出现了脉冲式集中。

算法交易撤单量占比(ACVR)

回测设置:2017.01-2025.08,沪深两市A股,剔除ST、*ST及上市不满一年的股票;预测未来十天(t+1至t+11的VWAP收益)。ACVR因子多空收益稳定且多头超额收益显著,但全区间RankIC仅有0.026,且ICIR较低。

算法交易撤单数占比(ACCR)

相较ACVR因子,ACCR因子依旧多空稳定,多头收益显著。因子全区间RankIC达到0.052,相比ACVR的0.026提升明显,ICIR也由0.219上升至0.458。

“秒撤”的撤单不提供额外信息增益

此前判定算法交易订单时,因考虑到20ms内的“秒撤”订单缺乏实际交易意图,故将其排除。 如果将“秒撤”订单纳入算法交易订单,全区间RankIC反而有所下降,ICIR和胜率基本不变。从交易逻辑和选股效果出发,维持原先的ACCR因子定义。

相较撤单量,笔数的统计特征更稳定,不易受极端值影响。 笔数(ACCR):捕捉稳定的行为模式。 统计特征稳定:笔数统计不易受极端值干扰,横截面稳定性更强; 信息纯度更高:撤单笔数直接反映了下单与撤单的积极性与策略意图,与市场微观结构的变化密切相关,信息含量更高。

撤单量(ACVR):噪声更大的“资金强度”。易受极端值干扰:单笔大额撤单(通常为主观决策)即可显著扭曲因子值,引入大量噪声; 信息价值有限:撤单行为本身不涉及真实成交,其“资金强度”是一个虚值信号,无法有效代表真实的行为特征,因此 预测能力较弱。对于撤单这类特殊的订单薄行为,发生“频次”比涉及“金额”更能揭示纯粹的交易意图与市场信息,因此ACCR因子的表 现显著优于ACVR。

三、算法交易买单/撤单占比

ACCR的计算只关注算法交易撤单发生的频次,不区分订单其他信息,进一步细分订单买卖方向可能带来新的信息增益。撤单里的买单(原意图为买入)和卖单(原意图为卖出)代表了交易者对资产未来价格有截然相反的预期。 两类订单市场含义不同,其撤单行为所蕴含的信号强度也可能存在差异。

综合IC和多头超额收益表现,基于买单计算的因子比基于卖单计算的因子选股效果更优:买单撤单更能反映机构吸筹,带有一定的建仓意图。 BABR因子是用全部买单撤单笔数做标准化,噪音更少,选股效果稍有提升。

BABR因子全区间RankIC达到0.059,ICIR达到0.555,IC胜率70.1%。 BABR因子多空收益稳定且多头超额收益明显,选股效果较强。

从Barra相关性出发,BABR因子偏好高Beta、高估值、成长性强且财务风险低的股票。 2020年起因子与对数市值呈现稳定的轻微负相关,但2025年的负相关性显著上升。

2025年因子表现较好,但有明显的小市值暴露。剥离市值后,2025年因子IC略有下降(原0.110),但全区间IC变化较小。进一步对所有Barra因子做中性化,全区间RankIC为0.043,ICIR和胜率有所提升,因子保留选股能力。

四、算法交易买卖撤单熵

虽然BABR因子在全区间选股表现较好,但2022-2024年持续表现较差,且ICIR较低。 因子构建仅从买单视角出发,可能存在局限。

ACE因子全区间RankIC达到0.047,ICIR为0.479。因子多空收益稳定,分五组单调性明显,但多头收益稍弱于占比类因子。 从因子定义出发,因子值较高仅代表算法撤单内部方向一致,并不区分一致性体现在买单还是卖单上,因此多头收益较弱。

五、撤单占比与撤单熵的合成

算法交易买单撤单数占比因子BABR与算法交易买卖撤单熵ACE相关性仅为-6.09%,合成可能有更好的选股表现。 根据ACE因子值的大小将选股池分为两部分作为算法撤单意见一致和混乱的划分,分别计算BABR的选股表现。 在ACE较高(算法撤单买卖意见一致)的股票内, BCBR因子的RankIC、ICIR、IC胜率显著更优。

合成因子:将ACE与BCBR分别进行横截面排序并转化为百分比排名,相加后即为合成因子。合成因子全区间RankIC达到0.069,ICIR为0.851,IC胜率达到81.5%,IC和IC稳定性相较单因子均有显著提升。 因子多空收益稳定,多头和空头表现均衡,单调性显著,呈现出较强的选股能力。

合成因子与市值因子的全区间相关性为-0.167,与流动性的全区间相关性为-0.212,明显暴露于小市值,低流动性风格:从ACE的角度考虑,小市值、低流动的股票参与者较少,更容易达成一致。 对市值和流动性做中性化后,RankIC仍有0.054,且ICIR为0.779,IC稳定性依旧较高。

根据合成因子构建组合:选取合成因子值前100的股票等权合成,每双周周一以VWAP价格调仓,费率为双边千三。 2025年,组合平均市值为108.38亿元,因此选择中证1000作为比较基准。 组合年化收益率为13.03%,超额年化收益率为13.77%,信息比率为1.44。

六、处理撤单类数据的技术细节

由于上交所和深交所接口设置的不同,在处理撤单信息时,上交所与深交所股票需要分开。 上交所:撤单信息及其对应下单信息均记录在逐笔委托。撤单:OrdType为’D’的即为撤单记录; 下单:同一笔订单的OrdNo字段保持一致,通过撤单的OrdType即可定位下单信息。 深交所:撤单信息记录在逐笔成交,下单信息记录在逐笔委托。撤单:TradeBSFlag标识为0或买卖订单号有一边为0(没有达成撮合)即为撤单记录;下单:通过撤单交易的买单订单号或卖单订单号,在逐笔委托中定位下单信息。

总结

本文聚焦下单-撤单时间差这一特殊的订单薄特征,挖掘算法交易驱动的订单带来的alpha。 下单-撤单时间差分布呈现脉冲式集中,集中的时间点可能代表了算法交易驱动的撤单行为。 统计这类算法交易撤单与全部撤单的比例,构建算法交易撤单量占比因子(ACVR)和算法交易撤单数占比因子(ACCR)。 ACCR因子表现更佳,全区间RankIC达到0.052,ICIR为0.458。 进一步细分撤单的买卖特征,发现买单算法交易撤单笔数/全部买单撤单笔数(BABR)全区间RankIC达到0.059,ICIR达到 0.555,IC胜率70.1%。与市值因子、Barra风格因子中性化后,BABR因子仍保留一定选股能力。 为更好诠释算法撤单中买卖双方的意见,引入信息熵,构建算法交易买卖撤单熵(ACE)因子,买卖意见一致性越高,因子值 越大。 RankIC达到0.047,ICIR为0.479,由于因子值高只代表一致性,不区分方向,因子多头稍弱,但单调性依旧较好。 将ACE与BCBR分别进行横截面排序并转化为百分比排名,相加后得到合成因子。合成因子全区间RankIC达到0.069,ICIR为 0.851,IC胜率达到81.5%。IC和IC稳定性相较单因子均有显著提升。选取因子值前100的股票等权组合,双周调仓,策略年化 收益率为13.03%,超额年化收益率为13.77%,信息比率为1.44。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至