2023年基于基金属性的因子选股策略研究 A股市场机构化趋势明显,量化私募机构管理规模扩大
- 来源:广发证券
- 发布时间:2023/04/03
- 浏览次数:570
- 举报
一、因子挖掘思考
(一)高频信息
近年来,A股市场机构化趋势明显,量化私募机构的管理规模也迅速扩大,产生 了一批管理规模超过百亿的量化私募机构。与此同时,传统的风格因子波动增大, 从市场获取超额收益的难度在增加。 因子拥挤是因子收益下降的原因之一。因子代表着市场某方面的非有效性、或 者是一段时期内的定价失效。当某类因子收益高的时候,会吸引更多的资金进入, 从而出现因子拥挤,降低因子的预期收益。一旦新的因子被公开,套利资金的介入 会使得错误定价收窄,因子收益也会跟着下降。因此,在多因子选股模型中,因子 的开发和更新迭代变得越来越重要。 与低频因子相比,高频数据在用于量化投资中存在一定优势。
首先,高频价量数据的体量明显大于低频数据。以分钟行情为例,用压缩效果 较好的mat格式存储2020年全市场股票的分钟行情数据(包括分钟频的开高低收价 格数据、买卖盘挂单数据等),约为12GB。如果是快照行情(目前上交所和深交所 都是3秒一笔)或者level 2行情,数据量要大很多。因此,高频数据因子挖掘对信息 处理能力和处理效率的要求较高。而且,日内数据,尤其是level 2数据,一般要额 外付费,甚至需要自行下载存储实时行情,在此基础上构建的因子拥挤度较低。
其次,高频价量数据一般是多维的时间序列数据,数据中噪声比例较高,而且 与ROE、PE这类低频指标本身就具有选股能力不同的是,原始的高频行情数据一般 不能直接用作选股因子,而要通过信号变换、时间序列分析、机器学习等方法从高 频数据中构建特征,才能作为选股因子。此类因子与低频信号的相关性较低,而且 由于因子开发流程相对复杂,不同投资者构建的因子更具有多样性。
此外,高频数据开发的因子一般调仓周期较短,意味着在检验因子有效性的时 候,同一段测试期具有更多的独立样本。例如,在一年的测试期内,只有12个独立 的样本段用于检验月频调仓的因子,与之相比,有约50个独立的时段用于检验周频 调仓因子,有超过240个独立的时段用于检验日频调仓的因子。独立样本的增多有助 于检验高频因子的有效性。 高频数据挖掘因子的难点在于数据维度大、噪声高。凭借专业投资者的经验或 者是参阅已发表的文献,可以从高频数据中提炼出一部分有选股能力的特征。此外, 机器学习方法擅长从数据中寻找规律和特征,是高频数据因子挖掘的有力工具。

(二)低频信息
以传统日频价量和更低频财务数据为基础的因子开发是一种研究途径。由于基 础因子广为人知,在此基础上进行因子挖掘的收益提升空间相对有限。而且日频数 据由于本身的数据量和信息量有限,过度挖掘会增大过拟合的风险。 对于低频信息的挖掘,从最近几年的进展上看,低频里的增量信息成果越来越 少。从数据维度上看,低频的因子建模更多是从一些另类数据或者是新的方法、理 论成果中出发构建相关的因子。如另类数据角度,从互联网中的股吧、新闻、关注 度等角度,或者是专利数据、供应链相关数据等。新的理论成果如从图网络等角度 出发构建相关的因子。 本篇专题报告基于公募基金的属性及持仓个股角度出发,研究基于公募基金持 仓的因子研究。
二、从基金到股票的思考
近年来,公募基金的总资产净值与只数一直在稳步上升,个数已经超过1000只。 从长期角度看,公募基金净值整体呈现上升趋势。随着近年来,“买基”成为越来 越多个人投资者的选择,公募基金规模不断提升,公募基金在股票市场上的影响力 越来越重大,公募基金的持仓个股影响也越来越大。
公募基金的管理者,基金经理,作为专业的投资人员,相对个人投资者来说, 往往拥有着比较有效的选股和择时能力。公募基金每个季报披露的持仓个股信息, 则在一定程度上反应了特定报告期截止点内截面基金经理的资产配置情况,公募基 金每日披露的净值数据及定期披露的持仓个股数据为跟踪、发现优秀的基金经理及 优秀的基金提供了一种可能。 如果基金经理拥有较为有效的选股及择时等能力,那么通过观察“优秀”基金 的特征表现,则为从基金数据中挖掘“优秀”个股提供了一种可能。

三、建模思路
不同基金经理管理的基金,在选股及择时能力上的表现可能也是不同的,本篇 专题报告希望利用基金在选股、择时能力的差异化构造一个选股因子。 前文已经提到,一般来说基金经理拥有相对散户而言更强的选股、择时能力, 但是不同基金经理的选股、择时能力和擅长方向是有所不同的。从上图中可以看到, 虽然公募基金业绩整体上是维持向上趋势的,但也有基金回撤较大甚至没有跑赢基 准。基金个体之间呈现出差异化。
本篇专题报告认为,更加“优秀”的基金在选股及择时等方面的表现是更强的。 以往的研究表现,基金经理的选股等方面的因子指标呈现出一定的趋势性特征,即 过去比较“优秀”的基金在未来也会相对比较“优秀”。在构建因子时,本篇专题 报告赋予“优秀”基金的持仓更高的权重,以获取“优秀”基金相对于“普通”基 金更强选股、择时能力的超额收益。
定义何为“优秀”基金,广发金工搭建了较为完整的选基因子库,本篇专题报 告基于选基因子的评价体系,根据月频维度的选基因子构建个股层面的因子。其中, 在披露的基金数据中,基金与股票之间的联系通过基金持仓联系起来。基金一年内会发布四次季报,一次半年报,一次年报。四次季报的报告日分别为3月31日,6月 30日,9月30日,12月31日,一般季报的最迟披露日在报告日后15个工作日内,披 露的持仓中只包含报告日时间截面的前十大股票持仓。半年报,年报的报告日分别 为6月30日,12月31日,半年报披露日一般需要在报告日后2个自然月内,年报公开 日需要在报告日后3个自然月内。两者都包含了报告日截止时点时间截面的所有股票 持仓。
后文构造的因子,“优秀”基金的持仓股票拥有较高权重的因子值,“普通” 基金的持仓股票拥有较低权重的因子值,形成选基因子到基金,再基金到股票的传 递。

(一)构造公式
在t时刻,j基金的第k个选基因子值为_,,,k为选基因子的序号。 在t时刻,持有i股票的第j个基金其持有i股票的持仓比例为_,,。 一个股票对应多个基金,一个基金对应若干个选基因子。对于每一个选基因子, 都可以算出一个基金属性因子。对于一个选基因子k而言,在t时刻i股票的k基金属性 因子_,,构造过程如下: 先将第k个选基因子_,,在时间截面t内标准化。
得到标准化后的 第k个选基因子__,, 将标准化后的第k个选基因子乘以对应基金的持仓比例再累和,最后再除以持仓 比例之和,得到第k个选基因子_,,。_,,=∑(_,,∗ __,,) ∑ _,, 基于广发金工跟踪的选基因子库,选出若干个选基因子,构建出对应的选基 因子相对应的基金属性因子。此时,若干个基金属性因子可以单独作为股票因子来 进行实证研究。为综合考虑基金各个属性,考虑将各个选基因子对应的基金属性因子标准化后等权合并,得到综合基金属性因子__,。
四、实证分析
(一)数据准备
基金类型:选用Wind数据库四个分类:普通股票、偏股混合、灵活配置、平衡 混合类型基金。 对股票净值占基金总净值的比例进行限制。在一个报告期内,保留权益基金持 仓占比超过40%的基金。 采用基金季报的前十大持仓。
本篇专题报告认为不同类型的选基因子衡量了基金在不同维度上的能力,在不 同“属性”上衡量了基金。因此,此因子被称为基金属性因子。 选股范围:共在四个股票池里进行回测,包括:主动权益基金重仓股股票池, 中证800,中证500,沪深300。四个股票池其对应的基准分别为沪深300指数 (000300.SH),中证800指数(000906.SH),中证500指数(000905.SH),沪 深300指数(000300.SH)。 股票预处理:剔除非上市、摘牌、ST/*ST、上市未满1年股票。 回测区间:2012年1月30日至2022年12月31日。 因子预处理:MAD去极值、Z-Score标准化、行业市值中性化。市值采用总市 值,行业采用申万一级行业分类。
将有因子值的股票从小到大分成5组,组内等权,分别计算每组的收益率。 因子值每月末更新,下月第一个交易日调仓。采用月频调仓。 超额收益率采用几何算法: 多空超额收益率 = 多头收益率 + 1 空头收益率 + 1 − 1 多头相对基准超额收益率 = 多头收益率 + 1 基准指数收益率 + 1 − 1 累积净值采用复利计算。

(二)主动权益基金重仓股票池回测结果
1. 单基金属性因子分档表现。基金因子属性:历史一年信息比、历史1年WS板块剥离 超额收益稳定型、历史1年月频创新高次数、历史1年交易信息比等因子在主动权益 基金股票池中的分档效果较为显著。2. 综合基金属性因子分档表现-未行业市值中性化。未行业市值中性化的综合基金属性因子在月度调仓频率下RANK_IC为0.032, RANK_IC胜率为62.12%,因子分成5档情况下对个股下一期收益率区分度显著。
3. 综合基金属性因子分档表现-行业市值中性化。行业市值中性化的综合基金属性因子在月度调仓频率下RANK_IC为0.025, RANK_IC胜率为65.19%,因子分成5档情况下对个股下一期收益率区分度显著。
(三)沪深300股票池回测结果
1.综合基金属性因子表现-行业市值中性化。行业市值中性化后的因子在沪深300中的效果较为显 著,因子分档净值呈现出较明显的单调性特征。在沪深300中月度调仓频率下, RANK_IC均值为0.035,RANK_IC胜率为65.91%。多头相对沪深300指数年化超额 收益率为7.97%,除了2018年没有跑赢沪深300指数外,其他年度里面都稳定跑赢沪 深300指数表现。
(四)中证500股票池回测结果
1.综合基金属性因子表现-行业市值中性化,行业市值中性化后的因子在中证500中的效果较为一 般。在中证500中月度调仓频率下,RANK_IC均值为0.015,RANK_IC胜率为59.85%。 多头相对中证500指数年化超额收益率为7.12%。

(五)中证800股票池回测结果
1.综合基金属性因子表现-行业市值中性化,行业市值中性化后的因子在中证800中的效果较为显 著,在月度调仓频率下,因子分成5档对个股下一期收益率区分度显著。在中证800 中月度调仓频率下,RANK_IC均值为0.025,RANK_IC胜率为61.36%。多头相对中 证800指数年化超额收益率为8.34%。
(六)综合基金属性因子与传统因子相关性分析
本小节将数据预处理(MAD法去极值、Z-Score标准化、行业市值中性化)后 的综合基金属性因子与广发金工因子库中的因子计算秩相关性,经过行业市值中性化处理后的因子与常见因子相关性较低, 其中与三个月股价动量因子相关性为12.88%。
可以看出经过行业市值中性化处理后的因子与常见因子的 相关性较低,与三个月、六个月、一年股价动量有15%左右相关性,考虑将三个月 股价动量因子中性化后,看因子是否依然有较为明显的选股效果。 剔除行业市值中性及三个月股价动量中性化后的综合属性 因子在基金重仓股股票池中依然有较为显著的效果效果,因子单调性依然较为显著。 在回测期内,RANK_IC均值为0.029,RANK_IC胜率为68.94%。

五、总结
本篇专题报告基于公募基金的重仓股及基金的属性因子,建立基金重仓股与基 金属性因子之间的关系,研究了基金属性因子的选股策略的有效性。 实证结果表现,基于基金属性的因子选股策略在基金重仓股、沪深300、中证500、 中证800等选股域内较为有效。在月度调仓频率下,经过行业市值中性化处理的因子 在基金重仓股股票池内,RANK_IC均值为0.025,RANK_IC胜率为65.91%,信息比 为0.80,换手率平均值为30%左右。在沪深300股票池内,经过中性化处理的因子在 沪深300股票池内分档效果显著,RANK_IC均值为0.035,RANK_IC胜率为65.91%, 信息比为1.05。
通过对数据预处理后的综合基金属性因子与传统的风格因子进行相关性分析, 可以发现,综合基金属性因子能够挖掘传统因子外的增量信息。因此,可以作为新 因子加入多因子模型中。 在剥离掉三个月股价动量因子后以及中性化后的综合基金属性因子在基金重仓 股股票池范围内依然有较为显著的选股效果。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 低利率环境下从基金配债行为寻找机会:“固收+”基金如何配纯债?.pdf
- 基金深度:全球配置新选择,互联互通ETF全解析.pdf
- 金融工程:基金窗口粉饰行为的定量识别与FOF投资应用.pdf
- “大家一起找不同”之周期主题基金经理篇.pdf
- 基金市场跟踪:国际局势动荡,资金流向防御板块周期板块基金回撤较低.pdf
- 投资者微观行为洞察手册·3月第1期:外资逆势流入A股与港股.pdf
- 基于行为金融视角的A股市场月频动量效应失效原因与修正策略-金融市场研究.pdf
- A股量化择时研究报告:AI识图关注电力、电网、公用事业.pdf
- A股七大资金主体面面观:市场在等什么?.pdf
- A股投资策略周报:美伊地缘冲突对A股的影响与投资策略展望.pdf
- 股市需求冲击与企业反应-世界银行.pdf
- A股市场2026年3月投资策略报告:市场将延续震荡行情,结构行情关注增量催化.pdf
- 央行回收维稳股市资金,债市向交易盘切换——央行报表及债券托管量观察.pdf
- 股市需求冲击与企业反应.pdf
- 股市周度回顾:科技股抛售与价值股轮动下的市场分化.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 私募股权基金的设计、运营与交易架构设计培训(95页PPT).pdf
- 2 中国私募基金募集与运营法律实务指南(2020年2月版).pdf
- 3 中国股权转让蓝皮书2019 .pdf
- 4 基金重仓十倍股专题报告:极致审美与有限收益.pdf
- 5 2019亚洲房地产投资信托基金研究报告.pdf
- 6 基金行业发展战略研究(93页).pdf
- 7 中国公募基金行业新机遇及发展战略深度解析.pdf
- 8 2019中国政府引导基金专题报告
- 9 政府及产业引导基金架构搭建、运作、投资过程中的法律、风控实务要点及案例分析.pdf
- 10 投中研究院政府引导基金专题研究报告2020.pdf
- 1 量化市场追踪周报:配置型基金仓位回落至7月末水平.pdf
- 2 全球宏观对冲基金及代表性策略简介:海外市场产品研究系列之11.pdf
- 3 FOF研究系列专题报告:捕捉趋势的力量,基金动量刻画新范式.pdf
- 4 后明星时代公募基金研究:主动权益基金应该如何选业绩比较基准?.pdf
- 5 私募基金专题研究报告:私募策略全景观.pdf
- 6 公募新规量化观察系列专题报告:基金超额收益的困境与突破.pdf
- 7 基金行业分析:公私募量化基金全解析.pdf
- 8 全球公募基金镜揽系列报告:殊途同归,全能资管科技平台共享时代.pdf
- 9 金融工程及基金研究:资产配置理论、演进及国内实践.pdf
- 10 公募基金2025Q1季报分析:黄金与成长双主线领跑,港股配置与电子持仓创历史新高.pdf
- 1 量化市场追踪周报:配置型基金仓位回落至7月末水平.pdf
- 2 基金投资价值分析:一键精准布局卫星全产业链——招商中证卫星产业ETF投资价值分析.pdf
- 3 主动权益基金基准的选择与锚定:基准之上,何以为胜.pdf
- 4 公用环保行业2026年2月投资策略:两部门发文完善发电侧容量电价机制,公用环保行业25Q4基金持仓梳理.pdf
- 5 2025年12月基金投顾投端跟踪报告:投顾组合调仓频率抬升,黄金和有色金属ETF受青睐.pdf
- 6 2026年量化和基金研究年度策略:公募新规下的ETF组合投资元年.pdf
- 7 基金市场与ESG产品周报:被动资金显著加仓大盘宽基ETF,国防军工主题基金表现占优.pdf
- 8 海外基金专题系列报告一:美国ETF投资生态全景(二),非股票型ETF产品体系梳理.pdf
- 9 2026年度资产与基金组合配置策略:多重周期嵌套下关注多主线与风格轮动再平衡.pdf
- 10 中国基金会透明度观察报告2025.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年低利率环境下从基金配债行为寻找机会:“固收+”基金如何配纯债?
- 2 2026年基金深度:全球配置新选择,互联互通ETF全解析
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年“大家一起找不同”之周期主题基金经理篇
- 5 2026年基金市场跟踪:国际局势动荡,资金流向防御板块周期板块基金回撤较低
- 6 2026年工具型基金研究专题(一):微盘风格,微盘风格基金研究框架及优选
- 7 2026年公募基金三十年:发展脉络与机构配置策略——“税费改革五部曲”系列报告之四
- 8 2026年低碳转型基金策略研究系列:碳双控背景下碳因子整合策略新径
- 9 2026年量化基金2025年回顾及2026年展望:公私募量化策略剖析、优选及配置思路
- 10 2026年3月基金配置展望:关注自由现金流指数
- 1 2026年低利率环境下从基金配债行为寻找机会:“固收+”基金如何配纯债?
- 2 2026年基金深度:全球配置新选择,互联互通ETF全解析
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年“大家一起找不同”之周期主题基金经理篇
- 5 2026年基金市场跟踪:国际局势动荡,资金流向防御板块周期板块基金回撤较低
- 6 2026年工具型基金研究专题(一):微盘风格,微盘风格基金研究框架及优选
- 7 2026年公募基金三十年:发展脉络与机构配置策略——“税费改革五部曲”系列报告之四
- 8 2026年低碳转型基金策略研究系列:碳双控背景下碳因子整合策略新径
- 9 2026年量化基金2025年回顾及2026年展望:公私募量化策略剖析、优选及配置思路
- 10 2026年3月基金配置展望:关注自由现金流指数
- 1 2026年低利率环境下从基金配债行为寻找机会:“固收+”基金如何配纯债?
- 2 2026年基金深度:全球配置新选择,互联互通ETF全解析
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年“大家一起找不同”之周期主题基金经理篇
- 5 2026年基金市场跟踪:国际局势动荡,资金流向防御板块周期板块基金回撤较低
- 6 2026年工具型基金研究专题(一):微盘风格,微盘风格基金研究框架及优选
- 7 2026年公募基金三十年:发展脉络与机构配置策略——“税费改革五部曲”系列报告之四
- 8 2026年低碳转型基金策略研究系列:碳双控背景下碳因子整合策略新径
- 9 2026年量化基金2025年回顾及2026年展望:公私募量化策略剖析、优选及配置思路
- 10 2026年3月基金配置展望:关注自由现金流指数
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
