2025年银河金工可转债定价模型系列研究：条件特征神经网络对转债蒙特卡洛定价模型的改进

来源：中国银河证券
发布时间：2026/01/08
浏览次数：156
举报

相关深度报告REPORTS

银河金工可转债定价模型系列研究：条件特征神经网络对转债蒙特卡洛定价模型的改进.pdf

银河金工可转债定价模型系列研究：条件特征神经网络对转债蒙特卡洛定价模型的改进。蒙特卡洛转债定价模型存在耗时长、不可微等问题：前篇报告中我们构建了蒙特卡洛转债定价模型，从模型假设、模拟方法、参数设置、代码实现等多方面对传统转债定价模型进行了改进，相比传统模型有效提高了定价精度、充分体现了赎回下修等附加条款对转债定价的影响，但仍存在耗时长、方差大、不可微等问题，无法满足高频交易或大规模资产负债管理对转债定价“实时、可微、批量”的要求，因此我们引入深度学习模型对转债定价做进一步改进。构建条件MLP转债定价模型，“中心样本+局部扰动”数据增强策略扩充样本...

转债蒙特卡洛定价模型回顾

可转债作为一种兼具债权安全性与股权进攻性的混合资本工具，其价格形成机制受到正股价格波动、信用风险溢价、以及赎回、回售、下修等复杂内嵌条款的多维驱动。这种复合结构使得可转债天然呈现出高度的路径依赖性与状态依赖性，即当前的理论价格不仅取决于当前的市场状态变量（如 S，K，σ，r），更深刻地受制于历史价格路径对条款触发状态的累积影响。传统的 Black-Scholes 封闭式解法在面对这种含有离散、非线性条款的衍生品时往往失效，而二叉树或有限差分方法在处理多因子高维问题时又面临维数灾难。蒙特卡洛（Monte Carlo Simulation）能够完整模拟未来股价路径与条款触发过程，是处理该类复杂问题的标准数值方法，但其计算开销与精度之间存在难以调和的矛盾。为了将标准差控制在可接受范围内，往往需要模拟成千上万条路径，这导致单只转债的定价耗时较长，无法满足全市场数百只标的的实时高频估值需求。更为关键的是，蒙特卡洛模拟过程本质上是离散的采样统计，其输出结果不可微，这使得计算 Delta、Gamma 等风险敏感度指标时需要进行重复的差分计算，进一步加剧了算力负担，难以嵌入现代化的实时风控与投资组合优化系统。

（一）银河金工转债蒙特卡洛定价模型

在报告《转债蒙特卡洛定价的改进及应用：测度变换与张量计算》中，我们以蒙特卡洛模型为基础构建了转债定价模型，正股价格在真实测度下假设为几何布朗运动（GBM），通过测度变换至到期收益率测度（YTM Measure），以反映可转债现金流的信用特征；在该测度下对模拟的 N 条路径上的现金流进行贴现与估值，N 条路径下转债价值的均值即为转债定价结果。该模型在模型假设、模拟方法、参数设置、代码实现等多方面对传统转债定价模型进行了改进，主要包含以下四点：

到期收益率测度与重要性抽样：我们通过数学推导证明了风险中性测度并不适合转债定价，我们应当使用转债的到期收益率进行贴现以反映转债现金流的信用风险，我们将其定义为 “到期收益率测度”。而在模拟过程中，由于我们需要判断正股价格是否触发赎回/下修条件，正股价格应当在真实测度下模拟，再转换至到期收益率测度进行贴现。为实现测度变换，我们采用了重要性抽样的方法，该方法同时可达到缩小方差、提高估计精度的效果。

最小二乘蒙特卡洛模拟：可转债具有美式期权的特征，进入转股期后随时可以转股。但单纯的蒙特卡洛模拟无法识别期权最优停时点，难以解决持有者在转股期可能提前转股的问题，因此我们引入最小二乘蒙特卡洛模拟，从最后一期开始反向回溯、通过回归拟合存续价值，与内在价值进行比较，以判断当日是否应当转股，从而处理提前转股的最优停时。

赎回下修相关参数：目前市场上绝大多数转债均附有赎回、下修、回售等条款，为使模型尽可能贴近现实情况，我们设置了下修概率、下修限制期长度、赎回概率、赎回限制期长度等系数，并通过爬虫爬取所有转债赎回、下修相关公告，优先以该转债对应公告中提取到的数据为参数赋值。

Tensor 数据结构：前一版本的定价程序采用的数据结构是 ndarray 数组，不支持自助求导功能，导致计算 Delta、Gamma 等指标时方法繁琐、结果偏差较大。我们将数据结构改用 Tensor（张量），支持 GPU 计算与自动求导，提高了运行效率，便于研究各模型参数对定价的影响。

（二）转债蒙特卡洛定价模型：计算瓶颈与问题界定

尽管我们已经对转债蒙特卡洛模型进行了大量修正与改进，但该模型仍存在以下问题有待进一步解决：

条款判定成本高：尽管我们对蒙特卡洛模型进行了诸多数学与工程上的优化，但可转债特有的赎回与下修条款依然构成了巨大的计算负担。这些条款通常包含路径依赖的计数规则（如“过去 30 个交易日中至少 15 个交易日股价高于转股价的 130%”），这要求模型必须在每一条模拟路径的每一个时间步长上实时更新计数器状态。这种高频的非线性逻辑判断不仅消耗了大量算力，而且导致定价函数在条款触发边界附近呈现出高度的非平滑性，使得传统数值方法在边界区域的收敛速度显著变慢。

时间复杂度：根据上一篇报告中的统计，单只转债需要至少模拟 2500 及以上条路径，才能使得估计值标准差处于较为稳定的范围内。在实际应用中，往往需要对全市场约 500 只转债进行高频实时监控，并计算其对标的股价、波动率、利率等因素的敏感度（Greeks）。蒙特卡洛模型单次定价耗时通常在毫秒至秒级，若要计算完整的 Greeks 矩阵，计算量将呈指数级增长。

估计值噪声与不可微困境：蒙特卡洛输出的本质是统计均值，一方面，均值估计的一阶矩噪声较大，即使我们通过采用重要性抽样法一定程度上缩小了方差，估计值的噪声仍然无法忽略；另一方面，估计值的随机噪声会导致差分法计算的 Greeks 极不稳定。此外，因此，无论如何优化，基于采样的蒙特卡洛方法在物理机制上无法满足高频交易或大规模资产负债管理对“实时、可微、批量”的严苛要求，这正是引入深度学习模型的根本动力。

MLP 转债定价模型

为实现可转债定价“实时、可微、批量”跟踪计算的需求，本报告构建了一套“教师-学生”蒸馏框架，以解决上述定价效率瓶颈。我们首先以改进后的蒙特卡洛模型作为“教师模型”（Teacher），通过引入测度变换、重要性抽样、最小二乘蒙特卡洛模拟等技术确保理论定价的无偏性与精确性；随后，利用多层感知器（MLP）的通用逼近能力构建“学生”模型（Student），学习教师模型在多维状态空间下的定价函数。该方法的核心目标是在保留蒙特卡洛模型对复杂条款敏感性的前提下，将定价速度提升数个数量级，并提供解析形式的可微性，并在条款复杂度不降低的前提下保留对赎回/下修的敏感性，为大规模转债投资策略与风险管理提供高效的计算基础。

（一）多层感知机（MLP）模型介绍

多层感知机（Multi-Layer Perceptron, MLP）是一类以全连接神经网络为基础的函数逼近模型，通过多层线性变换与非线性激活的组合来学习输入变量与目标输出之间的复杂映射关系。MLP 不依赖显式定价公式，而是以数据驱动方式捕捉高维特征之间的非线性交互，因此适合用于模拟可转债定价中包含赎回、下修等多条款约束的高度非线性定价函数。 MLP 是最经典的前馈神经网络结构，由输入层、若干隐藏层与输出层组成。每一层包含若干神经元，通过线性变换与非线性激活函数将原始特征映射到更高维的隐空间，使模型能够表达复杂的非线性结构。根据通用逼近定理（Universal Approximation Theorem），只要隐藏层规模足够， MLP 理论上能够逼近任意连续函数，因此在金融工程中常用于构建高维、不可解析定价函数的替代模型。MLP 的训练过程通过最小化损失函数，使其在参数空间内找到最接近真实定价函数的映射，从而实现对复杂金融产品的快速近似定价。

在可转债定价中，由于赎回触发、下修触发、提前转股等条款均依赖状态变量和路径结构，真实定价函数高度非线性且不具备封闭形式。MLP 能够在无需显式建模条款逻辑的情况下，直接从输入变量（S/K、波动率、票息结构、条款参数等）中学习到蒙特卡洛定价函数的隐式映射。通过多层非线性组合，MLP 得以捕捉不同条款之间的交互效应与状态依赖性，从而用近乎瞬时的运行速度复现高精度的蒙特卡洛价格，这使其成为可转债复杂条款场景下最适合的深度学习架构之一。

（二）训练数据构建

为了确保 MLP 模型有足量的数据能够学习到稳健的定价逻辑，我们并未直接使用全量历史数据，因为 MLP 转债定价模型是一个非线性的回归模型，包含 20+个参数，需要上万条训练数据才能保证模型结果稳定有效；同时，为了尽可能学习到市场最新转债定价逻辑，采用过早的历史数据也不适宜，因此仅采用历史数据训练模型是不够的。为了获取到足量的训练数据，我们认为蒙特卡洛定价在多数情况下是较精确的参考，并进行以下操作构建训练数据：

1.有效样本筛选

筛选定价误差较小的样本作为“有效样本”。计算真实市场价格与 MC 模拟价格的相对误差，筛出误差较小的样本，作为“MC 有效样本”，以确保教师信号可靠。我们采用的数据是 2025 年 1 月 24 日至 2025 年 9 月 30 日每个月末各只转债的数据，总共 4145 条，计算它们的蒙特卡洛模拟价格，并与真实价格进行比较，筛选出误差小于 5%的样本总共 2046 条。我们认为这些样本通过蒙特卡洛模拟之后计算出来的价格是比较合理的，因此进一步对这些数据进行随机扰动得到的模拟数据，再用蒙特卡洛模拟来计算的话，得到价格是接近真实值的。

2.基于局部邻域的扰动增强

针对筛选出的样本，我们实施了基于“中心样本+局部扰动 ”的数据增强策略。对于每一条真实有效样本，保持其条款参数（如转股价 K、剩余期限 T、赎回/下修触发阈值）不变，在正股价格 S、波动率σ、无风险利率 r 等核心状态变量的局部邻域内施加随机扰动。这种方法在不破坏合约结构的前提下，大幅扩充了训练集在状态空间中的覆盖密度，使模型能够充分学习定价函数对市场变量的偏导数特征。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）