高收益债券量化投资的实践
来源: 发布时间:  2023-03-03

摘要

2014年超日债违约,打破债券刚兑开启了高收益债券投资新纪元。经过几年的发展,高收益债券已经成为一种相对独立的大类资产,高收益在量化投资方法和技术在债券投资领域不断深入的情况下,量化方法在高收益债券投资应用也成为趋势。因此,我们构建了国内信用债的短期信用风险模型,在此基础上构建了量化指数。结果表明,采用量化方法进行高收益债券投资具有初步的可行性。


关键词

高收益债券 信用模型预警模型 债券量化

1、 引言        

股票的量化投资主要体现在交易的自动化,而债券的量化投资,尤其是国内的债券投资,受限于国内债券市场的实际情况,自动交易往往处于次要位置。相对于传统的债券投资,量化投资的价值体现在债券选择,组合构建等方面具有不可比拟的优势。  

信用债一直是我国债券市场的重要组成部分,但自2014年超日债违约起,刚兑被打破,传统的投资逻辑受到前所未有的挑战,同时,高收益债券市场不断发展,逐渐形成一个初具规模的市场。据鼎诺投资统计,截至2022年9月底,全国高收益债券市场规模达182511.63亿元,二级市场总成交规模也接近万亿规模。

同时,在国内市场,高收益债券并不是高风险的代名词,许多企业在违约前,交易并不活跃,据鼎诺投资的统计,高收益债券和违约债的重合度在50%左右,而近几年著名私募基金和公募基金的爆雷,说明对高收益债券的投资需要全新的完整逻辑。

作为一家投资机构,我们在高收益债券领域进行了量化投资的一些探索。我们认为,信用风险是投资高收益债的核心风险,基于这一认识,我们开发了信用风险模型,辅以短期风险预警模型,构建了高收益短债量化指数,初步证明了高收益债券量化投资的可行性。



二、信用风险模型构建

信用风险一直是信用债投资的重要方面,也曾经是学术研究的主要课题之一。这些研究概括起来有几个特点:一是引进国外已经成熟的方法引入信用风险分析领域,进行实证研究[3,4,5];采用人工智能与大数据技术的信用风险模型研究[2];以及考虑信披因素对信用风险的影响、信用风险传染等问题进行研究[1,6] 。这些研究往往集中在信用风险的一个方面,或者集中在一个债券品种,不能直接用于投资实践。债券投资的实务要求要有足够市场容量,最好能针对整个信用债市场有合适的信主模型进行信用风险分析。因此,我们在信用风险模型的目标是对全市场所有发行信用债券的主体进行一致的信用风险评价和排序,以适应投资的需求。

(1)  在信用风险分析模型的构成上,我们区分了普通的产业债和具有政府信用属性的城投债,分别构建了不同的模型,使模型更具有针对性。

(2)在每个子模型的构建上,同时采用了不同的模型构建方法,最后把各个模型结果的平均值作为最终的结果。
(3)模型负面样本的选择上,同时考虑了公开市场违约与非标违约的两种场景,将二者不进行区分逻辑回归模型以及区分二者的序数回归两种方法进行计算。
(4)模型结果输出上,我们没有采取逻辑回归那样,将模型计算出的违约概率作为结果,而是采取了模型输出数值进行排序后的分位数作为输出结果。这样处理的目的,一是便于各模型结果的合成,二是
(5)在指标的处理上,也普遍采用了分位数作为指标值,规避了不同数值范围的标准化处理,同时指标值也体现了在整个市场或行业中的地位,信息量更加丰富。



(一)模型说明与数据准备

1. 指标选取

以财务指标为主选取指标,考虑因素财务状况,可质押资产、未来经营状况与现金流与债务的匹配情况等影响企业信用状况的核心要素,共选取了63个加工过的候选财务指标。这些指标是分析师选出的、有一定业务含义的指标。指标多为无量纲的比例指标(刻意回避了传统信用评级中对于收入、净资产等规模指标的过分依赖);大多数入选的合并报表财务指标都同时有母公司报表的相应指标入选(为了避免如合并报表中归集的现金无法使用,子公司资产无法出售等问题);加入了部分指标的行业内排序(避免由于行业差异产生偏差)。同时,在一些容易财务粉饰或造假影响的指标,进行了修正,如可用现金等。

对于城投企业,除以上财务指标外,还加入了28个地方财政的相关数据。

2. 数据选取

产业主体选取公开市场2014-2021年间有存续债的发债主体作为建模的对象,城投主体选取公开市场2016-2021年间有存续债的发债主体作为建模的对象(产业主体从2014年开始有公开债的违约数据,城投主体从2016年开始有非标债务的违约记录)。

财务取年报数据,主要方法是通过前一年年报数据预测下一年5月1日之后1年内主体是否违约(4月30日是每年年报发布截止日期,由于新冠疫情,2020年报发布截止日期是6月30日)。把每个主体每一年的表现作为一个样本,而且需要该主体在年报发布后的1年内有债券到期。因为公开市场债券的偿还方式多为逐年付息,到期还本。偿付利息的压力较小,极少有企业付息时违约,需要偿还本金时才真正考验其偿还能力。企业付息或本金违约、技术性违约、债券展期等都统一算违约。产业主体建模一共7715个样本,城投主体建模一共3436个样本。产业一共108个非标违约样本,98个公开债务违约样本,165个非标加公开(公开和非标有重叠)。城投有18个违约样本。

产业模型把公开债务违约和非标债务违约的记录都包括了进来,城投模型只包括了非标债务违约的记录(全部城投主体还没有过公开债务的违约记录)。

3. 数据预处理

指标处理没有采用标准的变量分箱、计算信息值(IV)、再计算证据权重(WOE)的方式,而是直接采用单指标的全市场排序分位数作为输入。这样做可以简化流程,减少变量分箱标准的不确定性,增加模型的稳定性和通用性。模型最终给出的也是主体模型得分的全市场分位数

产业债样本中违约样本比例仅为2.1%,城投债违约样本比例0.5%,好坏样本不均衡。我们采用两种方法来解决这个问题。第一步,先简单复制坏样本,相当于人为增加了坏样本的重要性。产业坏样本多复制了3倍,城投坏样本多复制了5倍。第二步,再采用Bootstrap方法有放回的抽取样本子集来拟合,增加模型的稳定性,避免过拟合。


(二)模型设计

1. 逻辑回归模型

产业模型,分别就公开债务违约记录和非标违约记录作为负面样本,进行逻辑回归。城投模型,将非标违约记录作为负面样本进行逻辑回归。两者都使用逐步回归的方式来尽可能的消除指标间的共线性影响。

例如,利用公开违约记录构建的产业模型结果:(标注母的指标为母公司报表)


每个主体的模型结果,是用表中的系数乘以相应的指标得分相加后得到多项式分,再进行全市场排序,得到一个0-1之间的数。观察可见,表中一些指标的作用是反常识的,比如收入在行业内的排名,通常认为越大越好,但模型给出了相反的意见。逻辑回归给出的结果不能完全拆成单个指标去逐个分析,指标之间还会有相互作用,所有的指标是一个整体。

2. 序数回归模型

相对于非标债务违约,公开市场的债务违约让公司主体的压力更大,所以我们尝试给主体状态设置不同的值进行序数回归。未违约:0;非标违约:1;公开违约:2;

由于目前城投企业未在公开市场违约,城投模型只使用非标违约记录逐步逻辑回归模型。


(三)模型结果验证

根据我们开发模型的目标,对单个子模型的结果与总模型分别进行了计算,并进行了对比。

1. 模型结果的计算

与大多数回归模型计算出违约概率不同,我们把回归值从小到大排序后,计算其分位数作为结果。并把建模时使用样本作为母体样本,评估新进主体时,把回归值在母体样本中的分位数作为模型结果。

2. 结果验证

(1)ADP结果

根据穆迪公司首先使用的评级有效性指标ADP来评价,产业模型的ADP达到了0.84,城投模型的ADP达到了0.88。国际评级公司各时期内的ADP基本都在0.85左右。产业模型和城投模型的有效性还是很不错的。

(2)ROC曲线

ROC曲线及通过其计算的基尼系数也是评级有效性的评价方法(曲线凸性越大越好),产业模型与城投模型的ROC曲线如下:


(3)公司模型打分与其国内评级与国际评级的对比

我们选取同时有国内和国际信用等级的公司,计算相同等级公司的模型打分均值,观察变化趋势。可见随着信用等级的降低模型的打分均值也有不断降低的趋势,但是有波动,暗示了量化模型与国际评级的结果并不完全一致。




三、预警模型

信用风险模型主要以财务指标为依据,指标更新频率较低,同时信息披露及时性也不够好,不能充分反映市场情况和信用情况的变化,在实际应用中,在信用风险模型基础上,提供相应的辅助决策机制。基于此,我们加入可以获取的另类数据组成预警模型,用于反映企业近期的信用风险。

(一)模型构建

另类数据分布较为稀疏,不适合放入信用风险之中,用于风险预警可以作为信用风险模型的补充。诸如司法、行政处罚和招聘等数据对信用风险的发现和预警有很大的作用[7]。为此,我们挑选了年报披露及时性、司法诉讼、监管处罚、近期行情收益率波动性、过高的收益率(年化收益30%以上)、失信被执行人等10个指标,对3个月内企业的信用状况进行预测。

1. 指标有效性分析

在以上的10个指标中,判断各指标对企业违约的有效性,剔除区分度不明显的指标,剩余5个指标,如下表所示。


2. 模型计算

利用以上5个指标,计算以上5个指标的数值,进行数值加总,以其数值作为近期违约可能性的度量结果(其中,司法诉讼为当前比例与第1步确定的阈值之比),比较不同阈值下的预测效果,选择合适的阈值作为是否排除主体的决策依据。


(二)模型结果

1. 预警模型结果分析

将3个月是否违约作为正面/负面样本,对比了不同阈值下的结果。如下表,单元格中的值表示该分值下包括的违约和未违约企业。0分及以上包含了所有的企业,1分及以上包括了94.5%的违约企业和70.7%的非违约企业。

上表可以看出,这些指标对企业是否违约具有良好的区分度。从效果上看,选取2或3作为阈值较为合适,可以排除70%以上的违约主体。


2.   与信用模型结合

将预警模型和信用模型结合,可以达到更佳的效果,如下表所示。

上表可知,将阈值定为4分,可以排除99%以上的违约主体,同时可以将ADP提高至接近0.9,效果较单一模型均有所提升。



四、高收益债量化指数

建立上述量化信用模型并初步验证其效果后,可以将其用于信用债的筛选,从违约风险较小的债券中挑选收益率较高的债券,从而在风险相对可控的前提下,实现理想的投资收益。为此,我们尝试把它运用到高收益债的宽基指数中,从市场上的高收益短债(到期/行权期限1年以内,收益率8%以上)中选出模型认为相对安全的标的,组成一个新的指数,这相当于用信用因子构建了一个高收益债聪明贝塔指数。

(一)高收益债短债指数

1. 鼎诺中国高收益债短债指数(以下简称宽基指数)

由1年内到期或行权,且到期或行权的收益率超过6%的非金融公募信用债组成,每月初调仓;单个发债主体的市值权重不超过5%;只纳入近两个月有实际成交的债券;债券违约后,该主体的其他债券强制按违约处理退出指数;回收率按中国市场5年期历史回收率均值计算(当前为33.3%)。受限于数据获取限制,在指数构建时,未采用中证或中债的债券估值,而是根据最近各市场的成交均价来确定,由于以上估值较市场成交价格更为平滑,这增大了指数的波动性,但更能反应市场的真实情况。

2. 鼎诺中国高收益债短债量化指数(以下简称量化指数)

在鼎诺中国高收益债短债指数成分券的基础上,通过量化信用模型排除全市场信用排序后15%的主体后,剩下的债券组成指数;每月初调仓,为降低行业周期对整体投资组合的影响,加入行业占比不超过20%的条件;

设计此量化指数的初衷是想摸索建立相应的指数基金,希望能规避掉大部分的违约主体,保持组合高收益的同时尽量避免违约损失,期望能从收益率和夏普比率上超越短债宽基指数。它本质上是利用信用因子获取超额收益,是一种聪明贝塔(smart beta)类的策略指数。

(二)指数运行结果

(1)下图是宽基指数和量化指数的模拟走势。


(2)两个指数运行的主要指标如表所示:

表中计算夏普比率时假设无风险利率为3%,计算信息比率时基准为宽基指数。

量化指数的年化收益率和夏普比率都要好于宽基指数,信息比率也大于1,量化信用模型在验证的时间区间内起到了获取超额收益的作用。



五、结论

量化投  资和传统投资的最大区别是人工处理和自动处理的程度不同,量化投资需要数据和平台的支持,具有更强的系统性,绩效的可预测性和稳定性,具有不可比拟的优势。  量化债券投资代表了时代的必然趋势。  

2014年超日债违约,打破债券刚兑开启了高收益债券投资新纪元。经过几年的发展,高收益债券已经成为一种相对独立的大类资产,高收益在量化投资方法和技术在债券投资领域不断深入的情况下,量化方法在高收益债券投资应用也成为趋势。因此,我们构建了国内信用债的短期信用风险模型,在此基础上构建了量化指数。结果表明,采用量化方法进行高收益债券投资具有初步的可行性。



参考文献

1  吴建华,张颖,王新军.信息披露扭曲下企业债券违约风险量化研究[J].数理统计与管理, 2017, 36(01): 175-190.DOI:10.13860/j.cnki.sltj.20160515-011.

2  基于大数据的证券公司信用风险评级与预警体系研究[C]//.创新与发展:中国证券业2018年论文集(上册).,2019:257-270.

3  何慧凌,张代军. 地方政府债务信用风险与安全举债规模研究——基于KMV模型的实证分析[C]//.21世纪数量经济学(第15卷).,2014:207-221.

4  张目,陈华丰. 信用风险度量的结构化模型国外研究综述[C]//.Proceedings of 2017 3rd ICCE International Conference on    Social Science (ICCE-ICSS 2017).,2017:161-166.

5  韦茜,李立平,董哲.基于KMV模型的公司债券信用风险研究[J].财会通讯,2016(35):89-92+129. DOI:10.16144/j.cnki.issn1002-8072.2016.35.023.

6  郭超.债券市场信用风险传染模型研究[J].投资研究,2016,35(06):120-129.

7  崔玉征. 人工智能在信用债投资领域的应用:Python语言实践[M]. 清华大学出版社, 2019.




声明

本报告版权归北京鼎诺投资管理有限公司所有。

本文仅供北京鼎诺投资管理有限公司(以下简称“鼎诺投资”)客户使用,接收人不会因为收到文章而被视为鼎诺投资客户。                
本文信息均来源于公开资料,鼎诺投资对这些信息的准确性和完整性不作任何保证。本文所载的资料、意见及推测仅反映发布文章当日的判断。在不同时期,可能发出与本文所载资料、意见及推测不一致的文章。
文中的内容和意见仅供参考,并不构成对所述证券买卖的出价或询价,也不构成对所涉及证券的投资建议,且未考虑到个别客户特殊的投资目标、财务状况或需求。客户应考虑本文中的任何意见或建议是否符合其特定状况。本文中提及的投资价格和价值以及这些投资带来的预期收入可能会波动。在任何情况下,本公司不对任何人使用本报告中的任何内容所引致的任何损失承担任何责任。
如欲引用或转载本文内容,务必联络鼎诺投资并获得许可,并需注明出处为鼎诺投资,且不得对本文进行有悖原意的引用和删改。



益扬资本旗下北京鼎诺投资管理有限公司是专业的债券市场机构投资者(私募基金管理人编号:P1069999),主要投资方向为高收益债券。团队成员主要来自于评级机构核心岗位,对债券市场与信用风险有深刻的洞察和理解。公司创始人、执行董事张志军先生曾任联合信用评级有限公司总经理、信评委主任等职;副总经理苏春霞女士曾任北方信托风控部负责人、中诚信国际高级分析师和德勤会计师事务所高级审计师等职,具有丰富的审计、信评和风控经验;副总经理吴天舒先生有近二十年债券投资经验,曾在银河证券债券投资部任职,管理最大自营单账户规模超过80亿元,收益良好;固收研究总监王鹏女士曾任毕马威华振会计师事务所高级审计师、中诚信国际高级副总监、中诚信数字科技总监;固收研究副总监晏逸鸣先生曾任中诚信国际高级分析师负责城投、煤炭行业信用评级,对城投行业有深刻理解和认知。
“言九鼎,诺千金”,鼎诺投资将依法合规经营,专业、专注于高收益债券投资领域,与投资人财富共成长!