2024年财务风险识别模型：从蛛丝马迹到全局视角

来源：广发证券
发布时间：2024/06/26
浏览次数：1264
举报

相关深度报告REPORTS

财务风险识别模型：从蛛丝马迹到全局视角.pdf

财务风险识别模型：从蛛丝马迹到全局视角。前言：为什么财务造假又一次引发市场关注？（1）经济增长信心不稳定，投资者越来越重视公司盈利能力和财务健康状况，对公司透明度和诚信度要求更高，也更加敏感和警惕，对财务造假容忍度显著降低。（2）伴随着A股产业结构的变迁，新业态、新模式不断涌现，财务造假手段演变升级，传统方式与新型手法杂糅共生。（3）新一轮退市制度改革下，财务造假“退市触点”增多，投资者更应警惕“ST风险”。本文构建了一个全新的财务造假识别模型。通过系统梳理A股历年造假案件及其特征演变，解析财务造假“流程”，定...

一、财务造假 VS 盈余管理

财务操纵包括财务舞弊（财务造假）和财务粉饰（盈余管理）两种情况。财务造假基本是公司管理层组织的，在财务报表中蓄意错报、漏报财务数据，以虚构利润为目的的系统性造假。盈余管理是在会计准则的框架之内，在不越界为财务造假的底线之上，管理层过于主观地运用或刻意迎合会计准则，以达到操纵利润的目的。盈余管理与财务造假存在本质的不同（是否违法），尽管二者在很多时候经常无限接近。可以说盈余管理是普遍存在的现象。一方面，会计准则本身是“默许”的，会计政策的可选择性和会计估计的不确定性为管理层提供了自由裁决的空间；另一方面，在会计准则范围内适度的调节，平滑会计利润和市场预期，以达到企业一些发展政策的需要（如再融资、股权激励等）。盈余管理会对财务分析带来麻烦，但并非简单的对错问题。事实上，就算没有盈余管理，公司管理层客观地选择会计方法，仍然会因为主观判断的不同而造成财务数据的不合理。而在财务造假在未曝光前，外界的认知只是会计准则“许可”范围内的盈余管理。

二、A股历年财务造假案件梳理及其特征演变

2000-2023年，因财务违规被处罚的“公司-年度”样本共3078对，涉及971家上市公司。本文的财务造假案例数据来源于CSMAR数据库的“财务违规表”，该表整理了历史上存在财务违规成分的上市公司违规事件，皆为上市公司因为财务违规受到实际处罚的事件，涉及出具警示函、警告、批评、谴责、罚款等具体的处罚措施，不包含IPO前造假事件，不包含仅接受问询的事件。据CSMAR统计，2000-2023年共有2265单处罚事件。其中，涉及虚构利润、虚列资产、虚假记载（误导性陈述）、重大遗漏、披露不实的违规事实的共有1722 条记录。此外，有372条的财务违规类型被标记为“其他”，我们发现，在这一类处罚事件中，上市公司多涉及会计处理不规范等问题，包含折旧计提不足、费用资本化等问题，在一定程度上也属于财务造假范畴。“财务违规表”中受处罚的财务违规事件都是投资过程中需要留意和规避的，因此本文将这些事件都标记为财务造假。

（一）行业维度：机械、医药、电子等行业成为造假“高发地”

从造假行业分布看，机械、化工、电子、医药生物、计算机等行业发生财务造假的数量较多。某些行业是财务造假的高危行业，例如，研发支出较多导致费用端透明度低（如TMT和医药生物）、资金流动缺乏痕迹（如农业农产品）、交易对手不规范或不透明（如线下零售）、业务环节简单或难以验证（如提供非实物类服务公司）、关联交易多（依附集团母公司等关联方），使得造假成本较低或者隐蔽性较好。

（二）时间维度：经济恢复阶段成为公司财务造假“高发期”

从造假年份分布看，2018年以前的财务造假案件呈现快速上升的趋势，尤其是2008年金融危机、2015年股灾后，财务造假案件数量的增速有明显上升。2015 年并购热潮中的业绩承诺于2017年、2018年集中到期，高溢价并购所形成的巨额商誉面临减值风险，导致财务造假高发期。2018年以后，财务造假数量逐步下降。然而，财务造假具有后验性。近几年的造假案例可能会在以后年份被暴露出来，仍需要重点关注过去发生过财务造假的公司以及模型预测造假概率高的公司。

三、造假的“重灾区”科目及定性识别

财务造假表征的分析和识别，既有财务指标，也有非财务指标。若单纯用财务指标来识别造假的可能性，难度会更大。因此，我们结合造假“流程”，讨论财务造假有哪些惯用手段，以及如何定性识别。

（一）从财务造假“流程”来理解报表的关注点

财务造假流程：创造资金流（收入）——创造资金凭证（客户和供应商）—— 资金记账（转化为资产）。财务造假的目的是虚增利润，而虚增利润的同时必然会影响到资产负债表科目，所以在利润存疑的情况下，通过分析资产负债表科目存在的异常，往往能更准确地发现财务造假的线索。对于大部分的财务造假，毛利率畸高且周转率慢，同时存在异常资产，是最见的“双击”财务造假的信号。

因此，有财务造假的“恒等式”：利润表的影响（虚增利润）== 资产负债表的影响（虚增资产、虚减负债、虚减权益）。将资产负债表和利润表结合起来的一个动态等式：资产=负债+所有者权益(不含当年新增未分配利润)+收入 -费用。企业造假通常是虚增利润（收入-费用），要保持等式平衡，一般是虚增资产或虚减负债。

（二）从造假“重灾区”科目观测异动、异常、新增

识别财务造假，可以从收入、应收账款、存货、毛利率、现金流等财务造假的 “重灾区”科目入手分析。从历年的造假案例，以及IPO审核过程中关注的财务问题看，收入、应收账款、存货、毛利率、现金流等是非常易出问题的科目。

（1）营业收入：操纵方法主要是虚增营业收入，比如以明显高于正常水平的价格卖给关联方，或提前确认收入。（2）应收账款：应收账款过大，潜在的问题在于：a.发生坏账的风险会相应增加；b.回收周期过长，会造成营运资金周转过慢，进而导致经营现金流变差。（3）存货：操纵方法比如随意改变存货的计价方法、以分期收款方式销售商品时，不按收到货款的实际比例结转销售成本等。（4）毛利率：毛利率高好还是低好，并没有定论，对于不同行业，在总体费用结构中，其营业成本和期间费用占比是不同的，研发费用、市场费用等期间费用支出越高的行业，为覆盖相关费用，其需要的毛利率水平越高。但是，若出现存货周转率逐年下降而毛利率逐年上升的现象，则隐含的财务风险较大。因为毛利率逐年上升反应的是公司产品热销、市场竞争力强，相应地，一般情况下存货周转率也应该提升，这两者若出现背离，则应警惕，需进一步分析背后的因素。（5）现金流：自由现金流可经营现金流减去资本开支现金流支出，如果这顶数值长期为正，则代表企业是创业价值的。另外，应关注经营现金流与净利润是否出现长期背离的情况。经营活动产生的净现金流与净利润严重背离，主要原因是营运资金增长幅度大于净利润增长幅度。可能来自应收账款的大幅增加（放宽信用政策或回款困难）或存货大幅增加（产品滞销或应结转但未结转成本）。

对于这些财务指标的三个观察维度：报表数据的异动（大幅波动的合理性）、异常（异于同行异于可比）、新增（新增客户、合同订单等）。

四、财务风险预测模型的构建与性能评估

基于上述的分析，我们知道单纯依靠财务数据建立一个普适性的财务造假识别模型，几乎不可能做到。一方面，造假方式多样化，且不同公司的财务指标差异很大；另一方面，财务指标需与非财务指标（如会计方法、经营指标、产供销数据等）相互印证，才能更好的体现会计的真实性，而非财务指标通常不能很好的量化。我们通过对财务造假的定性和定量分析，建立一个识别财务相对风险的评分模型，以期能够进一步在我们的财务选股模型结果中做减法，挑选真正高财务质量的公司，本质上是做大概率事件，提高模型胜率。

（一）选取识别财务造假的特征指标

我们通过梳理国内外财务造假预测模型的特征变量，并结合上文定性分析结论，筛选能够较好反应A股财务问题的指标。国外关于财务造假预测模型的研究，最具知名度的是Beneish(1999)的Mscore和Dechow(2011)的Fscore模型。Mscore 和Fscore模型利用阀值能快速判断上市公司财务造假的可能性。

尽管Mscore和Fscore模型在西方实务界已被普遍运用，但国内学者研究发现这两个模型对于预测国内造假事件的适用性较弱。因此，我们采用国内外实证较认可的财务造假预测指标，计算标准化得分（行业内部比较，更有现实意义），作为判断是否有严重盈余管理或造假的参考。

特征变量分为四个类别：资产异常、现金异常、盈利异常和非财务指标。（1）资产异常。财务造假的“恒等式”：利润表的影响（虚增利润）== 资产负债表的影响（虚增资产+虚减负债+虚减权益）。财务造假的方式是虚增利润，而虚增利润的同时必然会影响到资产负债表科目。资产的异常变化分析往往是识别财务造假的关键。比如通过虚增应收款来虚增收入是最常见的造假方式。因此，我们主要考查资产异常的变量：应收款项占比、应收变化率、存货占比、存货变化率、应付款项占比、应付变化率、软资产比例、带息负债率。（2）现金异常。比如，虚增利润的同时虚增相应的经营现金流入，对应资产负债表虚增货币资金，这时，可考虑货币资金与利息收入的匹配性。另外，若长期现销率小于1或自由现金增速小于净利润增速，也应警惕。因此，我们主要考查现金异常的变量：现金销售率、自由现金流变动率、货币现金异常。（3）盈利异常。主要看盈利的构成是否健康、是否有内在矛盾性、是否融资目的下的操纵行为等。主要考查盈利异常的：交变量联交易占比、交联交易变化率、毛利率异常、前一年是否亏损、前一年扣非ROE。（4）非财务指标。主要有指标：是否再融资、股权集中度、机构持股比例、董事会规模、是否更换事务所、审计意见。

在特征变量的设计上，考虑到逻辑推理的合理性，主要有以下几个特点： ①采用指标的行业分位值。考虑到行业特性不同，多项指标转化为行业分位值（申万二级行业），进行百分比排位，取值0-100%。若采用加入行业虚拟变量的做法，则会损失大量的自由度。 ②采用指标的变化率。考查特征指标的突变情况，即引入指标的环比变化率作为解释变量。由此，通过指标的异常变化，判断是否有财务风险的嫌疑。 ③控制样本采用全样本，即全市场非造假公司。这样可避免样本选择的偏差，与学术界一般的做法（选择1：1的配对样本）有别。

（二）搭建财务风险预测模型及其应用分析

（1）模型选择

本文参考国内外关于财务风险预测模型的研究成果，建立了适用于A股市场，且更有实际应用价值的财务风险预测模型。在模型层面，本文采用了XGBoost机器学习模型对财务风险进行识别。XGBoost是一种特殊的梯度提升树模型（Gradient Boost Decision Trees）。梯度提升树模型的核心思想是：将损失函数看作拟合值的函数，计算损失函数对拟合值的负梯度，用决策树拟合负梯度并最终加到原拟合值上，让损失函数不断沿着梯度方向减小，使得拟合值不断逼近真实值。

本文选择XGBoost模型对上市公司财务风险进行识别，取得了不错的效果。 XGBoost模型优点在于： ①允许特征中存在一定数量的缺失值，避免因特征缺失值删失数据而导致偏误。XGBoost在处理缺失值时有其独特的机制。与其他机器学习算法不同， XGBoost在构建树模型时可以自动处理缺失值，而无需预先进行缺失值填补或删除。该模型先利用特征下无缺失值的数据选择决策树的节点，以信息增益最大化为目标，把缺失值统一归类到左叶子节点或右叶子节点。这样，存在缺失值的数据也可以通过决策树进行预测。 ②对特征异常值的敏感性较小。XGBoost模型由若干决策树组成，而决策树天然对异常值较为鲁棒。这是因为决策树通过决策节点对特征进行分割，每次分割取一个靠中间的值对单个特征进行简单的二分类，将样本归入左叶子节点和右叶子节点，单个特征的极端值对模型的影响有限。而对于传统线性回归模型而言，极端值会对最小二乘法产生影响，且极端程度越大影响越大。 ③有独特的特征选择机制。XGBoost模型由若干决策树组成，在决策树节点的生成过程中，模型自动根据信息增益最大化对特征进行筛选，排除不相关的特征，因此XGBoost模型对特征质量具有一定的鲁棒性，少量相关性较差的特征的加入对模型性能的影响有限。 ④对特征的多重共线性不敏感。决策树天然不受多重共线性影响，XGBoost无需处理多重共线性问题。 ⑤能够捕捉特征之间的非线性关系，适用于复杂的数据集。财务风险与上市公司特征间并非简单的线性关系，使用线性模型进行财务风险识别容易欠拟合。在没有过拟合的情况下，类似XGBoost的非线性模型会更有效、准确。

（2）模型设定

①模型参数设定。在模型拟合的过程中，我们发现，XGBoost模型的稳健性较高，模型的表现对参数的选取不敏感。因此，本文仅通过简单的网格搜索适当优化模型参数，确定了一组较优的参数。

②样本不平衡处理。在以财务风险识别、信贷风险识别这类异常检测任务中，存在严重的样本不平衡问题，如果不做处理，模型预测结果会偏向于样本数量更多的类别，以获得更高的准确率（Accuracy）。样本不平衡的解决方法有过采样、欠采样等方法，但这类方法会使训练集数据发生改变。本文的解决方案是调整阈值，使用有财务风险的先验概率为阈值，将预测有财务风险的概率大于先验概率的公司标记为有财务风险的公司，反之标记为正常公司。 ③模型评价指标。模型选用AUC值作为损失函数。ROC曲线的横坐标是伪阳性率（也叫假正类率，False Positive Rate），纵坐标是真阳性率（真正类率， True Positive Rate）。简而言之，在财务风险预测任务中，ROC曲线的横坐标是将正常公司预测为有财务风险的公司的比例，纵坐标是将有财务风险的公司预测为有财务风险的公司的比例。随着判断阈值从宽松到严格，阳性判定率会不断增加，伪阳性率和真阳性率都会提升，最终都收敛至100%，构成下图的橙色曲线。AUC 值是橙色曲线下方的面积，面积越大，在伪阳性率相同的情况下，真阳性率整体更高，模型性能越好，理想模型的AUC值是1，随机模型的AUC值是0.5。

（3）模型拟合

本文基于2000-2023年的65802个“上市公司-年份”样本数据，随机选取80%的数据作为训练集，剩余20%的数据作为验证集，进行模型拟合。可见，模型在验证集上的auc值起初为65%，模型的预测近乎随机，经历200轮迭代后，模型性能快速提高并趋于收敛，最终模型在验证集上的auc值达到80%，模型效果较好。经历 500轮迭代，模型性能没有发生反弹，无严重过拟合现象。

（4）模型结果表现

为解决样本不平衡问题，本文使用有财务风险的先验概率作为判定阈值，先验概率=样本中有财务风险的数量/总样本数量=0.0468。若上市公司的有财务风险的概率估计值大于0.0468，将其判定为有财务风险的公司，否则判定为正常公司。

由于样本不平衡问题的存在，将所有公司公司都判定为正常公司，模型准确度就可以达到90%以上，因此，模型准确度具有迷惑性。本文使用混淆矩阵评估模型性能，结果显示，使用先验概率作为判定阈值，有财务风险的公司的识别率达到 70.94%，正常公司被错判为有财务风险的比例仅25.56%，模型表现较好。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）