基于文本分析和机器学习的企业风险识别研究

陈友余, 赵金晶, 王欣, 刘纯霞

计量经济学报 ›› 2024, Vol. 4 ›› Issue (6) : 1671-1690.

PDF(1010 KB)
PDF(1010 KB)
计量经济学报 ›› 2024, Vol. 4 ›› Issue (6) : 1671-1690. DOI: 10.12012/CJoE2023-0163
论文

基于文本分析和机器学习的企业风险识别研究

    陈友余(), 赵金晶, 王欣, 刘纯霞()
作者信息 +

Enterprise Risk Identification Based on Text Analysis and Machine Learning

    Youyu CHEN(), Jinjing ZHAO, Xin WANG, Chunxia LIU()
Author information +
文章历史 +

摘要

在传统财务指标基础上, 基于过去、未来和情感视角, 应用文本分析方法和自然语义处理方法, 重构企业风险识别指标体系, 然后引入机器学习方法, 以上市公司财务数据及管理层讨论与分析文本信息为数据来源, 构建企业风险识别模型, 进行企业风险识别. 研究结论如下: 1)通过提供增量信息, 完善风险度量尺度, 构建兼具时态敏感性和情感洞察力的三维风险识别体系, 以更全面、更准确地对企业风险进行测度和识别; 2)引入机器学习算法, 对AdaBoost模型、Hist Gradient Boosting模型、Random Forest模型和Bagging模型进行精度比较, 发现AdaBoost模型最优, 稳健性最好, 可用于企业风险识别; 3)应用机器学习方法和SHAP方法, 进行企业风险特征重要度排序和企业风险识别机理分析, 识别出企业风险关键影响因素, 观察各项风险特征对企业风险识别模型的影响. 本研究能为企业风险识别指标体系设计和风险识别模型优化提供经验证据和决策支持, 并助推企业高质量发展和供应链安全稳定.

Abstract

Based on the traditional financial indicators, this paper applies text analysis and natural semantic processing methods to reconstruct the enterprise risk identification index system based on past and future perspectives. Then, it introduces machine learning methods to construct an enterprise risk identification model based on the financial data of listed companies and the textual information of management discussion and analysis as the data source for enterprise risk identification and prediction. The conclusions of the study are as follows: 1) By providing additional information, the risk measurement scale can be improved, and a three-dimensional risk identification system that combines temporal sensitivity and emotional insight can more comprehensively and accurately measure and identify business risks. 2) Introduces machine learning algorithms to compare the predictive accuracy of the AdaBoost model, Hist Gradient Boosting model, Random Forest model and Bagging model, and finds that the AdaBoost model is optimal, has the best robustness, and can be used for enterprise risk identification and prediction. 3) By applying machine learning and SHAP methods to rank the importance of enterprise risk characteristics and analyze the mechanism of enterprise risk identification, the key influencing factors of enterprise risk can be identified, and the impact mechanism of various risk characteristics on the enterprise risk identification model can be observed. This study can provide empirical evidence and decision support for the design of enterprise risk identification index system and optimization of risk identification model, as well as promote the high-quality development of enterprises and supply chain security and stability.

关键词

文本分析 / 机器学习 / 外部风险 / 供应链风险 / 未来风险

Key words

text analytics / machine learning / external risk / supply chain risk / future risk

引用本文

导出引用
陈友余 , 赵金晶 , 王欣 , 刘纯霞. 基于文本分析和机器学习的企业风险识别研究. 计量经济学报, 2024, 4(6): 1671-1690 https://doi.org/10.12012/CJoE2023-0163
Youyu CHEN , Jinjing ZHAO , Xin WANG , Chunxia LIU. Enterprise Risk Identification Based on Text Analysis and Machine Learning. China Journal of Econometrics, 2024, 4(6): 1671-1690 https://doi.org/10.12012/CJoE2023-0163

1 引言

中国企业发展, 面临百年未有之大变局、严峻复杂的国际形势和接踵而至的巨大风险挑战. 习近平总书记在党的二十大上指出, 要不断完善风险监测预警体系和国家应急管理体系, 要着力提升产业链供应链韧性和安全水平.
然2018年以来, 美国不断升级贸易摩擦, 先后对中国中兴、华为等企业实施"精准打击", 使我国企业陷入供应中断、技术中断、合作中断等多重风险保卫战. 世纪疫情不仅直接冲击了我国企业的正常运营, 还使全球供应链遭受中断风险危机. 俄乌冲突更是加剧了国际政治经济的不稳定性, 给全球供应链、中国产业链和我国企业带来前所未有的不确定性. 以上事件的相互作用和影响, 使得企业面临的风险变得更加复杂和难以识别. 在"牛鞭效应"下, 企业风险可能沿着生产链、销售链和价值链传导, 并被不断放大, 最终导致全球供应链萎缩甚至断裂.
习近平总书记指出: "我们既要有防范风险的先手, 也要有应对和化解风险挑战的高招; 既要打好防范和抵御风险的有准备之战, 也要打好化险为夷、转危为机的战略主动战". 这不仅是对当前严峻形势的深刻认识, 也彰显出政府对风险管理的重视. 对企业风险进行准确识别是提升企业风险防范意识和风险预判能力的关键, 是企业风险预警和风险管控的先决条件, 同时也是从经济和政治意义上解决新时期中国企业安全稳定与可持续发展的关键. 而企业风险的识别, 面临"风险识别指标体系重构"和"风险识别方法改进"两大攻坚难题. 此时, 根据动态情景不断更新企业风险识别类型, 构建与时俱进的风险识别指标体系, 并探寻具备智能决策的风险识别模型, 对"巨大风险挑战下企业风险识别"现实问题解决具有重要的实践意义, 也是当前学术界亟待解决的关键问题.
本文的主要增量贡献如下: 一是在现有研究基础上, 结合风险管理指导性标准, 进行企业风险指标选取辨识, 构建多维动态风险识别指标体系; 二是引入机器学习算法, 利用新技术提高风险识别的精准度, 即设计企业风险识别模型选取依据, 并应用有监督学习法, 进行风险识别指标赋值和调参, 对机器学习算法精度进行比较, 构建企业风险识别模型; 三是应用SHAP方法, 应对机器学习模型"黑箱", 探寻企业风险识别机理.

2 文献回顾

相关研究主要聚焦于以下两方面: 一是引入新型风险探讨企业风险识别指标体系的构建, 从而更全面科学地进行风险分类与识别; 二是通过优化识别模型提升企业风险识别精度.

2.1 企业风险分类与识别

企业风险主要包含外部风险、供应链风险和企业内部风险三类. 以下主要就这三类风险进行阐述. 外部环境对企业决策和行为产生直接影响, 已成为财务和会计学术研究领域的热点. 学者们尝试应用市场风险反映外部宏观环境影响, 并用贝塔指数度量(Fama and French, 2015; Campbell et al., 2014). 申慧慧等(2010)尝试引入环境不确定性指数, 即采用过去五年剔除正常增长部分并经行业调整之后销售收入的标准差, 用于分析外部环境对企业的影响. 姬强等(2022)从微观企业视角分析了气候风险感知对我国上市公司股票收益影响, 发现上市公司股票收益受气候风险感知冲击, 具有明显的非对称性. 宫晓莉等(2024)发现外部媒体情绪抑制企业风险承担水平。经济政策不确定性指的是经济主体无法确切预知政府是否、何时以及如何改变现行经济政策(Gulen and Ion, 2016). 学者们常应用经济政策不确定性指数(EPU指数)进行度量(Baker et al., 2016; 彭涛等, 2021), 但用EPU指数刻画中国经济政策不确定性具有一定的片面性(宋科等, 2022), 因其仅能从国家层面进行测度, 未能区分企业层面的不确定性感知差异. 何超等(2022)以上市企业年报中披露的管理层讨论与分析(MD & A)为对象, 构建了企业层面的经济政策不确定性感知指标.
作为企业关键的利益相关者, 供应商和客户分别位于企业供应链的上游和下游, 对企业的生产、运营及销售等环节产生重要影响, 是企业须关注的重要风险. 高客户集中度往往会带来较大的风险效应(沈红波等, 2021; 修宗峰等, 2021), 高供应商集中也会加剧公司风险(陈正林, 2016), 并可能增加企业股价崩盘风险(高震男等, 2023). 学者们主要采用客户集中度和供应商集中度对供应链风险进行度量(陈正林, 2016; 毕晓方等, 2020; 高震男等, 2023). 何捷和陆正飞(2020)指出企业业绩可能与未来供应链风险有关, 并构造了供应链未来风险指标体系, 通过定性的未来信息反映更多维度的供应链风险. 据此, 供应链风险度量从基于过去定量视角向关注未来定性视角转变.
财务风险、经营风险、现金流风险、融资约束、管理风险和信息风险能较好地描绘企业内部风险轮廓, 学者们对此进行了大量研究. 财务风险是企业未来无力承担或覆盖必要的财务义务的潜在可能性(Gilson, 1989), 将导致企业获利能力、偿债能力、周转能力和成长能力下降. 史金艳等(2021)采用阿尔曼Z值来衡量经营风险, 该值越大, 表明企业面临的经营风险越小. 现金流风险是企业风险管理的先导信号, 能反映企业资金的安全性、完整性与盈利性(陈志斌等, 2015). 董盈厚等(2021)应用波动性指标来度量现金流风险, 即通过现金流标准差关注其波动情况, 刻画历年现金流风险. 融资约束是困扰实体企业转型升级和发展的关键问题之一(高敬忠等, 2021), 学者们常用KZ指数和SA指数进行度量(毕晓方等, 2020; 高敬忠等, 2021). KZ指数越大, 表示融资约束程度越大. 为避免内生性干扰, SA指数是在考虑企业资产规模和企业运营年数两类强外生性变量基础上计算得出. SA指数一般为负值, 其绝对值越大, 表明企业融资约束程度越高, 内部风险越大. 管理风险是指管理运作过程中因信息不对称、管理不善、判断失误等可能影响企业管理水平. 管理层可以通过管理层语调(陈艺云, 2019)和文本可读性(徐巍等, 2021)误导信息解读. 信息风险是指会计信息质量和信息披露较差的可能性(Francis et al., 2005). 因KV指数能全面反映企业信息披露质量和信息不对称程度(彭俞超等, 2018), 常用KV指数度量信息风险. KV指数越高, 表明信息披露程度越低, 信息风险越大.

2.2 机器学习方法在企业风险识别中的应用

企业风险识别研究方法主要可划分为以下两大类: 一类是基于统计模型的研究方法, 以线性判别分析、Probit回归、Logistic回归为主要研究方法; 一类是近几年尝试引入的机器学习方法. 机器学习方法具有以下独特优势: 一是决策响应速度快, 能在处理复杂数据时实时更新数据, 大大提升企业风险响应速度(孔繁辉等, 2018); 二是风险识别的效率与准确性高, 主要是通过消除众多决策因子之间的重叠信息, 将复杂问题决策简单化实现的(彭岩, 2009); 三是具有自动完善与迭进机制, 能不断提高识别模型的准确性和应对的高质量(姬颜丽等, 2020). 杨莲和石宝峰(2022)通过多方法对比分析发现, 机器学习方法的预测结果优于Logit回归模型, 尤其是随着样本数量的增加, 机器学习算法能显著提升预测准确性.
由于机器学习方法能实现客观、精准的分级分类管理, 现已被尝试应用于风险分类和风险识别. 李成刚等(2023)应用Logistic模型、决策树模型、支持向量机和神经网络模型四种方法构建上市公司信用风险预警模型, 为提高信用风险预警的预测准确性提供了方法和经验证据. 姬颜丽等(2020)选取随机森林算法, 对虚开增值税发票风险建立识别模型, 发现该模型稳健可靠, 预测准确性高. 杨鸿雁和田英杰(2022)基于不均衡数据解决思路, 构建了基于机器学习的组合算法模型, 以提升食品安全风险预警效果. 杨子晖等(2022)采用Logit回归模型以及随机森林模型、梯度提升模型等前沿机器学习方法, 考察系统性风险指标对我国企业财务危机的预测能力. 田婧倩和刘晓星(2023)设计了基于智能优化算法的风险感知监控体系, 为真实情况下的社交网络金融安全风险感知提供实时有效防控. 这些研究为将机器学习方法引入企业风险识别奠定了坚实的理论与方法基础.
综上可知: 现有企业风险识别指标体系是零散分裂的, 对企业内部风险关注较多, 对外部风险和供应链风险关注不够, 对过去信息关注较多, 对未来信息关注不够, 无法反映企业风险的综合特征和动态变化属性; 现有研究主要是基于企业财务数据进行分析, 较少依赖定性信息, 较少应用文本分析法和自然语言处理方法将定性信息进行定量转化; 在统计模型基础上, 利用新技术提高风险识别的精准度还远远不够, 将机器学习算法在企业风险识别模型中的应用有待进一步展开.

3 企业风险指标的选取要求与辨识

基于《风险管理指南》 《中央企业全面风险管理指引》和《企业风险管理框架》等风险管理指导性标准, 进行企业风险界定和企业风险指标选取. 在此基础上, 以中国上市公司为研究对象, 进行风险文本分析, 识别企业重要风险.

3.1 基于风险管理指导性标准的企业风险指标选取要求

《风险管理指南》将企业风险界定为"不确定性对目标的影响". 该指南主要包含风险管理原则、框架和流程三部分, 能为企业管理各种类型的风险提供通用方法. 指南指出: 随着组织内部和外部环境的变化, 风险可能会出现、变化或消失, 故风险管理必须考虑企业的内外环境; 风险管理的输入是基于历史、当前的信息和未来的预测, 必须明确考虑和反映这些信息.
《中央企业全面风险管理指引》将企业风险界定为"未来的不确定性对企业实现其经营目标的影响", 并强调企业风险管理是一项十分重要的工作, 关系到企业持续、健康、稳定发展; 企业风险一般可分为战略风险、财务风险、市场风险、运营风险、法律风险等风险类型; 在实施全面风险管理进程中, 企业应广泛、持续不断地收集与该企业风险和风险管理相关的内部、外部初始信息, 包括历史数据和未来预测; 企业对收集的初始信息应进行必要的筛选、提炼、对比、分类、组合, 以便进行风险评估; 企业应对风险管理信息实行动态管理, 定期或不定期实施风险辨识、分析、评价, 以便对新的风险和原有风险的变化重新评估.
美国反虚假财务报告委员会(COSO)发布的《企业风险管理-整合框架》, 将风险定义为"事项发生并影响战略和商业目标实现的可能性", 包括5大构成元素和20条原则. 该整合框架指出: 在建立业务目标的同时必须考虑风险, 对追求战略和业务目标所面临的风险要建立起组合观念; 要建立风险的组合观, 即管理层需要从组织整体角度考虑风险, 将组织风险作为一个整体去和实现绩效目标所需要承受的风险进行对比, 而不是将其视为一个个单独的、分散的风险.
根据三大风险管理指导性标准, 企业风险识别指标的选取应遵循以下要求: 1)风险组合要求, 即企业管理层不能将各类风险视为一个个单独的、分散的风险, 而是需将各类风险融为一个整体去和实现绩效目标所需承受风险进行对比; 2)动态风险管理要求, 即企业须定期或不定期实施风险辨识, 对新风险和原有风险的变化进行重新评估, 动态调整并进行定制化管理; 3)最佳可用信息要求, 即风险管理的输入是基于历史、当前的信息和未来的预测, 企业应广泛、持续不断地收集与企业风险和风险管理相关的内部、外部信息.

3.2 企业风险指标辨识

本文拟运用Python爬取2013–2020年A股上市公司年报, 以我国上市公司年报中"可能面对的风险"为主要分析文本, 进行格式转换、段落清洗、定位及误差处理, 去除停用词, 再运用Jieba分词, 对文本信息进行分词, 并统计上市公司风险类别词频, 利用WordCloud制作企业风险类别词云图, 如图 1所示. 通过所绘制的企业风险类别词云图, 辨识企业面临的重要风险, 并以此作为企业风险识别指标体系构建的依据之一1.
1本文所使用的数据和代码请参见科学数据银行(ScienceDB)期刊社区, DOI: 10.57760/sciencedb.j00214.00002和CSTR: 31253.11.sciencedb.j00214.00002. 若使用文中数据信息, 请注明引文和数据出处.
图1 基于未来定性视角的企业风险类别词云图

Full size|PPT slide

图 1可知, 上市公司主要面临市场风险、财务风险、经营风险、管理风险、政策风险和竞争风险等风险类型. 其中, 市场风险、财务风险及经营风险一直是企业关注的重要风险.管理层可能通过管理层语调和文本可读性误导信息解读, 是管理风险的重要来源. 由于受地缘政治对抗和内向型发展政策影响, 政策风险可能进一步加大经济下行压力, 进一步加大短期和长期风险, 外部风险除了要高度关注市场风险外, 还应将政策风险列为新型风险类型进行重点管控. 竞争伴随的优胜劣汰是促进资源配置效率提升的有效机制, 竞争风险通常表现为同行业的竞争风险和供应链上下游的竞合风险, 一般通过现金流风险、投融资风险和信息风险进行传导.

4 企业风险识别指标体系构建

在企业风险分类与识别文献回顾的基础上, 参照《风险管理指南》 《中央企业全面风险管理指引》和《企业风险管理框架》等三大风险管理指导性标准, 以中国上市公司为研究对象, 基于过去定量视角和未来定性视角, 应用文本分析方法和自然语义处理方法, 构建兼具时态与情感的企业风险识别指标体系.

4.1 基于过去定量视角的企业风险指标选取与度量

基于过去定量视角, 现主要从外部环境风险、企业内部风险和供应链风险三方面进行企业风险选取与度量. 借鉴相关研究成果(Fama and French, 2015), 应用Beta指数度量市场风险, 不妨用Beta表示. 环境不确定性指数的度量主要是借鉴申慧慧等(2010)的处理方法, 先计算未经行业调整的环境不确定性指数, 再计算行业环境不确定性, 最后用未经行业调整的环境不确定性除以行业环境不确定性, 即为环境不确定性指数, 不妨用EU表示.
财务风险主要源自企业营运能力、盈利能力和偿债能力, 故从这三方面进行度量. 用总资产周转率的标准差(TAT)度量营运风险, 用总资产净利润率的标准差(ROA)度量盈利风险, 用资产负债率的标准差(AIR)度量企业偿债风险. 借鉴史金艳等(2021)的研究成果, 选取阿尔曼Z值度量经营风险, 用于衡量公司资产的利用效率. 借鉴董盈厚等(2021)研究成果, 用全部资产现金回收率的标准差(TCR)度量现金流风险. 借鉴毕晓方等(2020)高敬忠等(2021)的研究成果, 应用KZ指数和SA指数进行融资约束度量. 借鉴徐寿福等(2015)彭俞超等(2018)的研究成果, 用KV指数度量信息风险.
借鉴高震男等(2023)陈正林(2016)毕晓方等(2020)的研究成果, 用供应风险、需求风险和依赖风险表示企业面临的供应链风险. 其中, 供应风险和需求风险分别用前5大客户销售额占年度销售总额的比例的标准差(SC)和前5名供应商采购额占年度采购总额的比例的标准差(RC)度量, 依赖风险用第一大供应商销售额占比的标准差(LSC)和第一大客户销售额占比的标准差(LRC)来度量.

4.2 基于未来定性视角的企业风险指标选取与度量

基于未来视角, 借鉴已有研究成果, 应用文本挖掘方法, 将定性的风险披露信息进行定量转化. 具体步骤如下: 1)借鉴词表法测度文本风险披露信息, 即对文本风险披露内容进行分类(Loughran and McDonald, 2011), 并结合企业风险类别词云图, 将需要查找的风险披露信息分为行业风险、宏观风险、经营风险、供应商风险、客户风险等五类, 编制关键词词集; 2) 使用wingo中文财经文本数据库中深度学习相似词工具, 选出关键词相似词, 对词集进行补充和拓展, 确定五类风险披露指数的关键词词表, 如表 1所示.
表1 关键词表
风险披露指标类型 具体关键词
行业风险披露指数(IR) 行业、领域、产业、市场
宏观风险披露指数(MR) 宏观政策、宏观经济、宏观经济环境、宏观经济形势、宏观调控、经济形势、市场环境
经营风险披露指数(OR) 经营、运营、营运、运作、管理、生产
供应商风险披露指数(SR) 供应商、卖方、上游、供方、供应方、采购商
客户风险披露指数(CR) 客户、用户、服务、专用性、买方、下游、顾客、经销商、消费者、买家
关键词表确定后, 将定性文本的非结构化数据转化为定量指标. 数据收集步骤如下: 首先, 提取年报中MD&A中"未来展望" (即公司对未来发展的展望)及"未来风险" (即重大风险提示及可能面对的风险) 两部分文本信息; 然后, 对文本进行筛选、清洗和分词, 计算风险披露文本"未来展望"的总字数(ALL-WORDS); 最后, 遍历并统计"未来风险"文本中不同类别风险关键词出现的频次(KEY-WORDS). 风险信息披露指标计算公式如下:
IR(MR,OR,SR,CR)=KEYWORDSALLWORDS.
(1)
经济政策风险的度量, 主要是借鉴何超等(2022)的处理方法, 从上市公司年报文本中应用文本挖掘方法获取, 不妨用FEPU表示.

4.3 基于自然语言处理的企业风险指标选取与度量

管理层可能通过管理层语调和文本可读性等自然语言处理方式误导信息解读, 是管理风险的重要来源. 借鉴Loughran and McDonald (2011)设计的情感词典, 再结合中文语境进行扩充和完善. 采用正负面词汇计算净正面语调, 据此度量管理层语调(TONE). 管理层语调计算公式为:
TONE=(PositiveNegativePositive+Negative).
(2)
文本可读性是指MD&A文本中信息的可读性. 该指标以MD&A文本长度为基础, 先剔除该文本中字母、数字及表格等非汉字数据信息, 再以MD&A文本信息中每句话中平均文字数量计算得出, 不妨用READ表示. 其中, Characters表示MD&A文本信息字数, Sentences表示文本信息中句子数量. READ的值越大, 表明文本可读性越差, 信息披露质量越差, 企业管理风险越高, 计算公式如下:
READ=CharactersSentences.
(3)
基于时态和情感双视角的企业风险识别指标体系构建完成, 具体指标体系如表 2所示.
表2 企业风险识别指标体系
一级风险 二级风险 特征 指标名称
外部风险 环境风险 未来 行业风险披露指数(IR)
未来 宏观风险披露指数(MR)
过去 环境不确定性指数(EU)
市场风险 过去 Beta指数(Beta)
经济政策风险 过去 经济政策不确定性指数(FEPU)
企业内部风险 融资约束 过去 KZ指数(KZ)
过去 SA指数(SA)
财务风险 过去 营运能力的标准差(TAT)
过去 盈利能力的标准差(ROA)
过去 偿债能力的标准差(AIR)
现金流风险 过去 全部现金回收率的标准差(TCR)
经营风险 过去 阿尔曼Z值(Z-score)
未来 经营风险披露指数(OR)
管理风险 自然语言 管理层语调(TONE)
自然语言 文本可读性(READ)
信息风险 过去 KV指数(KV)
供应链风险 供应风险 过去 前五大供应商占采购额比的标准差(SC)
未来 供应商风险披露指数(SR)
需求风险 过去 前五大客户占营业收入比的标准差(RC)
未来 客户风险披露指数(CR)
依赖风险 过去 第一大供应商采购额占比的标准差(LSC)
过去 第一大客户销售额占比的标准差(LRC)

5 研究设计

5.1 样本选择与数据来源

本文以2013–2020年我国A股上市公司为初始样本, 进行如下筛选: 1)剔除金融保险类上市公司; 2)剔除数据异常的ST公司; 3)剔除数据缺失超过50%的上市公司. 最终, 共收集到1087家上市公司数据, 每家上市公司的样本观测值为8696个, 共获取217425个样本观测值. 其中, 财务定量数据主要来自CSMAR数据库及CNRDS数据库; 宏观风险披露指数、行业风险披露指数、经营风险披露指数、供应商风险披露、客户风险披露及企业经济政策不确定性指数是应用文本分析方法将定性信息转化为定量数据, 管理层语调及文本可读性是应用自然语言处理方法转化, 详见第4部分内容.

5.2 描述性统计分析与相关性分析

由于变量中存在异常值, 对所有变量进行前后1%的缩尾处理, 描述性统计如表 3所示.
表3 描述性统计分析
变量名称 样本量 平均值 标准差 最大值 最小值 中位数
LRC 8696 4.04 5.57 55.65 0.00 2.15
LSC 8696 4.78 5.57 62.21 0.00 2.89
RC 8696 5.66 6.52 57.35 0.00 3.61
SC 8696 6.96 6.66 62.69 0.00 4.91
SR 8696 0.00 0.00 0.03 0.00 0.00
CR 8696 0.00 0.00 0.16 0.00 0.00
Z-score 8696 5.30 14.16 419.82 522.75 3.00
AIR 8696 0.08 1.05 94.83 0.00 0.04
KV 8696 0.50 0.19 1.98 0.00 0.48
TCR 8696 0.05 0.05 1.86 0.00 0.03
ROA 8696 0.05 0.37 17.61 0.00 0.02
TONE 8696 0.36 0.13 0.74 0.99 0.38
TAT 8696 0.11 0.17 4.21 0.00 0.07
KZ 8696 1.05 2.26 11.38 11.34 1.16
OR 8696 0.01 0.01 1.26 0.00 0.00
Read 8696 167.52 52.86 1447.79 70.16 165.24
Beta 8696 1.13 0.28 5.16 0.04 1.13
EU 8696 1.41 1.27 9.99 0.11 1.08
IR 8696 0.01 0.01 1.19 0.00 0.00
MR 8696 0.00 0.00 0.06 0.00 0.00
FEPU 8696 0.00 0.00 0.01 0.00 0.00
SA 8696 3.84 0.25 5.28 2.63 3.84
kendal系数能用于反映分类变量的相关性. 通过计算kendall相关系数, 绘制热力图呈现指标间的相关关系, 如图 2所示. 通过图 2可知, 企业风险指标之间的相关性较低, 指标数据集之间不存在明显耦合关系.
图2 企业风险指标相关性热力图

Full size|PPT slide

5.3 基于机器学习算法的企业风险识别模型构建

5.3.1 企业风险识别模型选取

本文企业风险识别模型的选取, 主要基于以下三方面:
首先, 将数据代入多类风险识别模型, 进行初步风险识别, 发现自适应提升(AdaBoost)、基于直方图的梯度提升(Hist Gradient Boosting)、随机森林(Random Forest)、引导聚集(Bagging)等四类集成算法的准确度显著高于其他算法, 模型准确率均超过8%. 该结果表明集成算法对风险识别具有良好的鲁棒性, 能够适用于绝大多数企业风险识别场景, 故本文拟选取这四类机器学习算法进行后续分析.
其次, 基于算法选择, 建立与研究问题的具体特征映射, 发现上述四类算法在解决企业风险识别问题上具有以下优势: 在企业风险识别中, 由于风险因素的多样性和复杂性, 数据分布往往不平衡, AdaBoost算法能通过迭代训练弱分类器, 进行自适应调整, 有效处理不平衡数据, 提高风险识别的准确性; Hist Gradient Boosting算法通过直方图近似和梯度提升策略, 在处理大量的历史数据和复杂的风险因素时, 能显著降低计算复杂度和内存消耗, 并提升风险识别效率; Random Forest算法通过构建多个决策树并进行集成, 在处理风险指标之间复杂的非线性关系时, 能较好地捕捉并处理好这些关系, 有效避免过拟合, 并能提高模型的稳定性和泛化能力; Bagging算法通过自助采样法构建多个基分类器并进行集成, 在处理风险数据的不确定性和复杂性时, 能较好地降低单一分类器的方差, 提高模型的稳定性.
最后, 拟尝试应用AdaBoost算法、Hist Gradient Boosting算法、Random Forest算法及Bagging算法构建企业风险识别模型. 并在此基础上, 引入传统分类模型和其他常见的机器学习模型, 进行比较分析, 通过实证分析检验所选模型的可行性.

5.3.2 基于机器学习算法的企业风险识别模型构建流程

本部分拟基于AdaBoost算法、Hist Gradient Boosting算法、Random Forest算法及Bagging算法, 构建企业风险识别模型, 并将样本集随机划分为训练集和测试集, 其比例为4:1.
本文拟采用有监督学习法, 借鉴郑国坚等(2013)的研究成果, 就所构建的企业风险识别指标体系, 对1087家上市公司样本进行风险分类, 赋予标签值, 具体做法如下:
1)确定每类风险指标类型, 即确定是正向影响指标或是负向影响指标, 经分析发现, 共有17类正向影响指标和5类负向影响指标;
2)对每类风险指标进行赋值, 其中正向影响指标数值由高到低依次取值为5、4、3、2和1, 反向影响指标数值则由低到高依次取值为5、4、3、2和1;
3)将所有样本的风险指标赋值进行加总, 并按总分排序, 均分成五组, 将赋值最高组界定为高风险企业, 赋值为1, 其余四组样本界定为无风险或低风险企业, 赋值为0.
在风险分类和赋值基础上, 将22项企业风险识别指标为输入特征, 以这些指标对应的定量数据、未来定性数据及企业文本数据为输入数据, 以低风险(0)和高风险(1)两类风险状态为输出结果. 基于训练集样本, 构建四类机器学习模型, 调整至最佳参数后, 将测试集样本代入机器学习识别模型进行识别结果评价.

5.4 企业风险识别预测结果评价

5.4.1 评价标准

企业风险识别结果评价指标主要包含Accuracy分类精度、Precision精确度、Recall召回率及F1分数等四类. Accuracy分类精度是指, 对于给定的测试数据集, 分类器正确分类的样本与总样本数之比, 即识别正确的概率. Precision精确度主要是针对识别结果而言的, 是指识别模型反馈为无风险样本占总无风险企业的概率. Recall召回率主要是针对数据样本而言的, 是指无风险样本中识别正确的概率. 考虑到Precision和Recall是一对矛盾的度量, 学术界既希望提高Precision精确度和Recall召回率, 又希望两者之间的差异尽可能小, 于是设计了F1分数, 是两者的加权平均值, 其最大值为1, 最小值为0. 其中, TP为无风险样本正确判定为无风险的个数, FN为无风险样本误判为有风险的个数, TN为有风险样本正确判定为有风险的个数, FP为有风险样本误判为无风险的个数. 计算公式如下:
{Accuracy=TP+TN(TP+FP+FN+TN),Precision=TP(TP+FP),Recall=TP(TP+FN),F1=2(PrecisionRecall)(Precision+Recall).
(4)

5.4.2 Accuracy分类精度判定

参数设计能在模型过拟合和收敛性能方面进行权衡, 能应用损失函数优化模型, 调整分类器性能, 达到提高模型性能和训练速度目的. 本部分拟将训练集样本数据代入AdaBoost模型、Hist Gradient Boosting模型、Random Forest模型及Bagging模型, 通过范围区间测试、五重交叉验证折数及三百种随机寻参组合等方式进行参数优化设计. 具体参数设计系数和性能如表 4~7所示.
表4 Adaboost参数设计
Parameter name Parameter range Optimal parameters
n_estimators 0500 124
loss ('linear', 'exponential', 'log') linear
Learning_rate (0.01, 0.05, 0.1, 0.5 and 1.0) 1.0
Base_estimator parameters Decision Tree Classifier (max_depth= n), n(1, 10) n=3
algorithm (SAMME and SAMME.R) SAMME.R
表5 Hist Gradient Boosting参数设计
Parameter name Parameter range Optimal parameters
max_iter 0350 300
learning_rate (0.01, 0.05, 0.1, 0.5 and 1.0) 0.1
max_leaf_nodes 010 8
min_samples_leaf 15 1
L2_regularization (0.0, 0.1, 0.3, 0.5) 0.1
表6 Random Forest参数设计
Parameter name Parameter range Optimal parameters
n_estimators 0300 140
criterion (gini, entropy) entropy
max_depth 010 0
Min_samples_split 010 5
max_features (auto, sqrt, log2) Log2
min_samples_leaf 05 1
表7 Bagging参数设计
Parameter name Parameter range Optimal parameters
n_estimators 0500 56
base_estimator Decision Tree Classifier (max_depth= n), n(1, 10) 10
max_samples 01 0.5
max_features 01 1.0
bootstrap (True and False) True
将每家上市公司测试集样本数据代入调参后的模型, 识别分类精度如表 8所示. 由表 8可知, AdaBoost模型的分类精度最高, 表明正确识别的样本占所有样本的比重最高, 该模型的风险识别能力最强.
表8 调参前后模型分类精度对比
模型名称 调参前Accuracy (%) 调参后Accuracy (%)
Adaboost 95.11 96.09
Hist Gradient Boosting 93.62 94.94
Random Forest 88.92 89.36
Bagging 87.52 87.70

5.4.3 Precision精确度、Recall召回率及F1分数判定

将每家上市公司测试集样本数据代入调参后的四类机器学习模型中, Precision精确度、Recall召回率及F1分数的三类识别精度计算结果如表 9所示.
表9 识别精度比较
AdaBoost Hist Gradient Boosting
预测值 样本量 Precision (%) Recall (%) F1 (%) Precision (%) Recall (%) F1 (%)
0 1426 97.88 97.20 97.54 97.21 97.83 97.52
1 314 87.65 90.45 89.03 89.84 87.26 88.53
宏平均 1740 92.77 93.82 93.28 93.52 92.54 93.02
微平均 1740 96.04 95.98 96.00 95.88 95.92 95.90
Bagging Random Forest
预测值 样本量 Precision (%) Recall (%) F1 (%) Precision (%) Recall (%) F1 (%)
0 1426 91.73 97.20 94.38 90.56 98.25 94.25
1 314 82.53 60.19 69.61 87.05 53.50 66.27
宏平均 1740 87.13 78.69 82.00 88.80 75.88 80.26
微平均 1740 90.07 90.52 89.91 89.93 90.17 89.20
注: 宏平均(maro avg)和微平均(weighted avg)为模型评估指标, 宏平均是指每类样本预测精度的简单算术平均值, 微平均是以每一类别样本数量在所有类别样本总数的占比为权重计算每类样本预测精度的加权算术平均值. 以AdaBoost模型F1为例, 其宏平均= (97.54+89.03)/2= 93.2 8, 其微平均=97.54*1426/1740+89.03*314/1740=96.00.
将AdaBoost模型、Hist Gradient Boosting模型、Random Forest模型和Bagging模型进行对比分析, 发现: 1)就Precision精确度而言, AdaBoost模型和Hist Gradient Boosting的识别精度较高, 要明显优于Bagging模型和Random Forest模型; 2)就Recall召回率而言, AdaBoost模型的识别精度最高, Hist Gradient Boosting模型的识别精度较高, Bagging模型的识别精度较低, Random Forest模型的识别精度最低; 3)就F1分数而言, AdaBoost模型的识别精度均高于其他三类模型. 可见, AdaBoost模型最优, 稳健性最好, 可用于企业风险识别.

5.4.4 方法比较

为验证本文所选模型的科学性和有效性, 本部分拟将相应数据分别代入其他常用机器学习模型与统计模型中, 共对15类分类模型进行识别准确度对比. 由于四类机器学习算法调参后的性能有所提升, 为确保对比的公平性, 此处选取调参前的识别结果进行比较, 模型对应的识别准确率排序如表 10所示. 由表 10可知, AdaBoost模型、Hist Gradient Boosting模型、Random Forest模型和Bagging模型对应的企业风险识别准确率远高于其他模型, 且排在前四位.
表10 调参前企业风险识别模型分类精度排序表
排序 模型 Accuracy (%) 排序 模型 Accuracy (%)
1 AdaBoost 95 9 Logistic Regression 83
2 Hist Gradien Boosting 93 10 Bernoulli NB 80
3 Random Forest 88 11 Gaussian NB 80
4 Bagging 87 12 K-Nearest Neighbor 80
5 LASSO Logistic Regrexssion 85 13 Passive Aggressive 80
6 MLP 85 14 Support Vector 80
7 Linear Discriminant Analysis 84 15 Extra Tree 77
8 Ridge Logistic Regression 84
进一步地, 本文还引入了套索回归(LASSO Logistic Regression)、线性判别分析(Linear Discriminant Analysis)、岭回归(Ridge Logistic Regression)、逻辑回归(Logistic Regression)等4种经典统计模型, 企业风险识别结果如表 11所示. 通过识别性能对比分析发现, 四类统计模型的Precision精确度、Recall召回率、F1分数、Accuracy分类精度均低于本文所选取的四类机器学习模型, 据此验证了本文所选方法的有效性.
表11 四种统计模型预测结果评价表
模型 Recall (%) Precision (%) F1 (%) Accuracy (%)
LASSO Logistic Regression 71.50 81.26 74.69 85.86
Linear Discriminant Analysis 70.24 80.48 73.42 84.36
Ridge Logistic Regression 67.72 79.44 70.91 84.13
Logistic Regression 65.69 77.59 68.62 83.04

5.5 企业风险识别结果影响分析

本部分拟从两方面分析企业风险识别机理: 一是基于机器学习算法, 进行企业风险特征重要度排序, 以观察模型识别性能; 二是应用SHAP方法进行特征重要度排序, 以理解各个特征对模型输出的影响程度, 进行企业风险识别模型解释.

5.5.1 基于机器学习模型的企业风险识别因子重要度排序

特征重要度可以进一步解释哪些输入特征对识别结果贡献更大.本部分拟应用AdaBoosting模型, 进行特征重要度排序, 如图 3所示.
图3 企业风险识别因子重要度排序图

Full size|PPT slide

图 3可知: RC (供应链需求风险)和Z-score (经营风险)风险因子与企业风险的相关性最高, 其特征重要性分别达到7.5%和7.1%; LRC (客户依赖风险)、SC (供应风险)、IR (环境风险)、CR (需求风险)及LSC (供应商依赖风险)等5项指标的特征重要度也超过了5%; 前14个指标的特征重要性合计约为75.4%, 能在很大程度上解释企业风险识别结果, 识别出的这14个指标是企业风险的重要影响因素.
图 3还可知: 以定性指标为主的供应链风险、以定量数据为主的经营风险仍是识别企业风险的主要依据; 通过文本分析构建的外部环境、经济政策风险指标也已成为影响企业风险识别的主要因素之一.

5.5.2 基于SHAP方法的企业风险识别模型解释与分析

为刻画各类企业风险特征对识别模型的影响规律, 应用SHAP方法绘制特征密度散点图, 如图 4所示. 图 4中, 按影响程度从上到下进行排列, 色点由白至黑颜色逐渐加深, 每一个点代表一个样本的SHAP值, 该值代表了每类输入特征的贡献, 根据色点的分布可以观察到各项特征对企业风险识别模型的影响机制.
图4 企业风险识别SHAP概要图

Full size|PPT slide

图 4图 3进行对比分析发现: 1) SHAP模型中RC与Z-score排名相同, 依然属于企业风险识别主要因素; 但由色点位置可知, RC特征下浅色点(小值点)聚集在横轴左侧, 表明供应链需求风险与企业风险呈正相关关系, 即供应商集中度越高, 供应链风险越高; Z-score特征下浅色点聚集在横轴右侧, 表示与企业内部经营风险与企业风险呈现负相关, 即阿尔曼Z值越低, 企业破产可能性越高; 2)呈现显著正相关关系的特征指标还包括IR、EU、LRC及SC, 即此类特征项的分值越高, 企业风险也越高; 呈现显著负相关关系的特征还包括KV、TAT等. 各指标与企业风险正负相关性均与指标本身所表示经济含义情况相符, 这也进一步验证本文构建的企业风险识别体系的可解释性与稳定性.

6 结论及建议

本文首先重构企业风险识别指标体系, 然后引入机器学习方法, 优化企业风险识别模型, 并以上市公司财务数据及MD&A文本信息为数据来源, 进行企业风险识别. 研究结论如下:
1)通过提供增量信息, 完善风险度量尺度, 构建兼具时态敏感性和情感洞察力的三维风险识别体系, 为企业提供更全面、深入、动态的风险管理视角, 以更全面、更准确地对企业风险进行测度和识别;
2)引入机器学习算法, 将选取出的AdaBoost模型、Hist Gradient Boosting模型、Random Forest模型和Bagging模型进行Accuracy分类精度、Precision精确度、Recall召回率及F1分数比较, 发现AdaBoost模型最优, 稳健性最好, 可用于企业风险识别;
3)应用机器学习方法和SHAP方法, 进行企业风险特征重要度排序和企业风险识别机理分析, 识别企业风险关键影响因素, 探寻各项风险因子对企业风险识别结果的影响大小和影响方向.
本文研究具有重要的实践意义, 相关建议如下:
1)披露供应链风险信息和外部风险信息, 有利于改善公司信息环境, 培育良好的风险管控体系. 监管部门应高度关注供应链产业链及外部环境对企业行为的影响, 鼓励上市公司及时、准确、客观地披露更多更全面的风险信息, 进一步规范上市公司年报风险信息披露的内容和形式, 进一步改进风险文本信息披露范式, 充分揭示新旧风险, 强化风险监控体系建设;
2)在当前不确定风险加剧环境下, 企业应主动考虑内外风险因素, 尤其是要全面分析客户风险和供应商风险, 进行供应链尽职调查, 防范供应链链条上的重大突发风险, 主动降低供应链风险传染效应, 发挥供应链风险共担效应, 提高供应链信息传递效率;
3)企业应将各类风险融为一个整体, 进行风险组合管理, 并定期或不定期地实施风险辨识, 构建具备时态特征和情感特征的企业风险识别体系, 打造全方位风险管控体系, 使动态风险信息能真正发挥出决策支持功能.

参考文献

毕晓方, 邢晓辉, 姜宝强, 客户型文化促进了企业创新吗?——来自中国制造业上市公司的经验证据[J]. 会计研究, 2020, 41 (2): 166- 178.
Bi X F , Xing X H , Jiang B Q , Does the Customer Culture Promote Enterprise Innovation? — Evidence from Chinese Manufacturing Listed Companies[J]. Accounting Research, 2020, 41 (2): 166- 178.
陈艺云, 基于信息披露文本的上市公司财务困境预测: 以中文年报管理层讨论与分析为样本的研究[J]. 中国管理科学, 2019, 27 (7): 23- 34.
Chen Y Y , Forecasting Financial Distress of Listed Companies with Textual Content of the Information Disclosure: A Study based MD&A in Chinese Annual Reports[J]. Chinese Journal of Management Science, 2019, 27 (7): 23- 34.
陈正林, 客户集中、政府干预与公司风险[J]. 会计研究, 2016, 37 (11): 23- 29.
Chen Z L , Customer Concentration, Government Intervention and Corporate Risk[J]. Accounting Research, 2016, 37 (11): 23- 29.
陈志斌, 王诗雨, 产品市场竞争对企业现金流风险影响研究——基于行业竞争程度和企业竞争地位的双重考量[J]. 中国工业经济, 2015, 32 (3): 96- 108.
Chen Z B , Wang S Y , Impact of Product Market ompetition on Corporate Cash Flow Risk — Analysis Based on the Competition Degree of Industry and the Competitive Position of Enterprises[J]. China Industrial Economics, 2015, 32 (3): 96- 108.
董盈厚, 马亚民, 董馨格, 韩亮亮, 金融资产配置与盈余价值相关性——"有效市场"抑或"功能锁定"[J]. 会计研究, 2021, 42 (9): 95- 105.
Dong Y H , Ma Y M , Dong X G , Han L L , Financial Asset Allocation and Value Relevance of Earnings: "Efficient Market" or "Functional Fixation"[J]. Accounting Research, 2021, 42 (9): 95- 105.
高敬忠, 杨朝, 彭正银, 网络平台互动能够缓解企业融资约束吗——来自交易所互动平台问答的证据[J]. 会计研究, 2021, 42 (6): 59- 75.
Gao J Z , Yang C , Peng Z Y , Can Online Platform Interaction Alleviate Corporate Financing Constraints? — Evidence from Interactive Q&A on Exchange Interactive Platform[J]. Accounting Research, 2021, 42 (6): 59- 75.
高震男, 魏旭, 张学勇, 供应商集中度与股价崩盘风险: 理论分析与中国实证[J]. 经济学(季刊), 2023, 23 (5): 1991- 2008.
Gao Z N , Wei X , Zhang X Y , Supplier Concentration and Stock Price Crash Risk: A Theoretical Model and Empirical Evidence from China[J]. China Economic Quarterly, 2023, 23 (5): 1991- 2008.
宫晓莉, 徐小惠, 熊熊, 媒体情绪与企业风险承担——基于机器学习和文本分析的证据[J]. 系统工程理论与实践, 2024, 44 (6): 1869- 1895.
Gong X L , Xu X H , Xiong X , Media Sentiment and Enterprise Risk Taking — Evidence Based on Machine Learning and Text Analysis[J]. Systems Engineering Theory & Practice, 2024, 44 (6): 1869- 1895.
韩宝山, 李夏, 税收减免提高企业创新活力了吗?——基于融资约束视角的检验[J]. 经济学动态, 2022, 63 (3): 88- 107.
Han B S , Li X , Does Tax Reduction Stimulate Corporate Innovation? — Empirical Evidence from the Perspective of Financial Constraints[J]. Economic Perspectives, 2022, 63 (3): 88- 107.
何超, 李延喜, 李翘楚, 丁晨晨, 不确定性感知视角下企业跨国投资决策研究: 基于企业年报文本的分析[J]. 世界经济研究, 2022, 41 (7): 59- 75.
He C , Li Y X , Li Q C , Ding C C , Research on Corporate Multinational Investment Decisions from the Perspective of Uncertainty Perception: An Textual Analysis Based on Listed Firms' Annual Reports[J]. World Economy Studies, 2022, 41 (7): 59- 75.
何捷, 陆正飞, 定性的未来供应链风险披露与分析师关注行为研究[J]. 会计研究, 2020, 41 (6): 36- 48.
He J , Lu Z F , Supply Chain Risk Disclosure and Analyst Coverage[J]. Accounting Research, 2020, 41 (6): 36- 48.
姬强, 赵万里, 张大永, 郭琨, 气候风险感知对金融市场的影响——基于中国企业层面的微观证据[J]. 计量经济学报, 2022, 2 (3): 666- 680.
Ji Q , Zhao W L , Zhang D Y , Guo K , Climate Risk Perception and Its Impacts on Financial Markets: Micro-evidence from Listed Firms in China[J]. China Journal of Econometrics, 2022, 2 (3): 666- 680.
姬颜丽, 王文清, 大数据背景下税收风险识别精准度存量研究——基于机器学习的视角[J]. 财政研究, 2020, 41 (9): 119- 129.
Ji Y L , Wang W Q , The Stock of Research on Accurate Identification of Tax Risk Under the Background of Big Data Technology — Based on Machine Learning[J]. Public Finance Research, 2020, 41 (9): 119- 129.
孔繁辉, 李健, 供应中断风险下OEM供应链弹性运作与提升策略[J]. 中国管理科学, 2018, 26 (2): 152- 159.
Kong F H , Li J , Resilient Operation and Promotion Strategy of OEM Supply Chain under Supply Disruption Risk[J]. Chinese Journal of Management Science, 2018, 26 (2): 152- 159.
李成刚, 贾鸿业, 赵光辉, 付红, 基于信息披露文本的上市公司信用风险预警——来自中文年报管理层讨论与分析的经验证据[J]. 中国管理科学, 2023, 31 (2): 18- 29.
Li C G , Jia H Y , Zhao G H , Fu H , Credit Risk Early Warning of Listed Companies Based on Information Disclosure Text: Empirical Evidence from Management Discussion and Analysis of the Chinese Annual Report[J]. Chinese Journal of Management Science, 2023, 31 (2): 18- 29.
彭涛, 黄福广, 孙凌霞, 经济政策不确定性与风险承担: 基于风险投资的证据[J]. 管理科学学报, 2021, 24 (3): 98- 114.
Peng T , Huang F G , Sun L X , Economic Policy Uncertainty and Risk-taking: Evidence from Venture Capital[J]. Journal of Management Sciences in China, 2021, 24 (3): 98- 114.
彭岩, 王万森, 王旭仁, 涂序彦, 基于机器学习的风险预测方法研究[J]. 计算机科学, 2009, 36 (4): 205- 207.
Peng Y , Wang W S , Wang X R , Tu X Y , Research of Machine Learning — Based Risk Prediction[J]. Computer Science, 2009, 36 (4): 205- 207.
彭俞超, 倪骁然, 沈吉, 企业"脱实向虚"与金融市场稳定——基于股价崩盘风险的视角[J]. 经济研究, 2018, 53 (10): 50- 66.
Peng Y C , Ni X R , Shen J , The Effect of Transforming the Economy from Substantial to Fictitious on Financial Market Stability: An Analysis on Stock Price Crash Risk[J]. Economic Research Journal, 2018, 53 (10): 50- 66.
申慧慧, 吴联生, 肖泽忠, 环境不确定性与审计意见: 基于股权结构的考察[J]. 会计研究, 2010, 31 (12): 57- 64.
Shen H H , Wu L S , Xiao Z Z , Environmental Uncertainty and Audit Opinions: An Examination Based on Shareholding Structure[J]. Accounting Research, 2010, 31 (12): 57- 64.
沈红波, 刘智博, 洪康隆, 债券信用评级能否反映大客户风险?[J]. 财务研究, 2021, 42 (6): 35- 47.
Shen H B , Liu Z B , Hong K L , Can Credit Rating Reflect the Customer Concentration Risk?[J]. Finance Research, 2021, 42 (6): 35- 47.
史金艳, 杨健亨, 李延喜, 张启望, 牵一发而动全身: 供应网络位置、经营风险与公司绩效[J]. 中国工业经济, 2019, 36 (9): 136- 154.
Shi J Y , Yang J H , Li Y X , Zhang Q W , A Slight Move in One Part May Affect the Situation as a Whole: Supply Network Location, Operational Risk and Corporate Performance[J]. China Industrial Economics, 2019, 36 (9): 136- 154.
宋科, 徐蕾, 李振, 王芳, ESG投资能够促进银行创造流动性吗?——兼论经济政策不确定性的调节效应[J]. 金融研究, 2022, 65 (2): 61- 79.
Song K , Xu L , Li Z , Wang F , ESG Investment and Bank Liquidity Creation: The Moderating Effect of Economic Policy Uncertainty[J]. Journal of Financial Research, 2022, 65 (2): 61- 79.
田婧倩, 刘晓星, 智能优化算法下的金融安全风险感知监控研究——基于COVID-19期间中国社交网络区域数据[J]. 计量经济学报, 2023, 3 (2): 570- 588.
Tian J Q , Liu X X , Research on Financial Security Risk Perception Monitoring under Intelligent Optimization Algorithm: Based on Regional Data of China's Social Network During COVID-19[J]. China Journal of Econometrics, 2023, 3 (2): 570- 588.
修宗峰, 刘然, 殷敬伟, 财务舞弊、供应链集中度与企业商业信用融资[J]. 会计研究, 2021, 42 (1): 82- 99.
Xiu Z F , Liu R , Yin J W , Financial Fraud, Supply Chain Concentration, and Corporate Trade Credit Financing[J]. Accounting Research, 2021, 42 (1): 82- 99.
徐寿福, 徐龙炳, 信息披露质量与资本市场估值偏误[J]. 会计研究, 2015, 36 (1): 40- 47.
Xu S F , Xu L B , Information Disclosure Quality and Misvaluation in Capital Market[J]. Accounting Research, 2015, 36 (1): 40- 47.
徐巍, 姚振晔, 陈冬华, 中文年报可读性: 衡量与检验[J]. 会计研究, 2021, 42 (3): 28- 44.
Xu W , Yao Z Y , Chen D H , Readability of Chinese Annual Reports: A Measure and Test[J]. Accounting Research, 2021, 42 (3): 28- 44.
杨鸿雁, 田英杰, 机器学习在食品安全风险预警及抽检方案制订中的应用研究[J]. 管理评论, 2022, 34 (11): 315- 323.
Yang H Y , Tian Y J , Application Research of Machine Learning in Food Safety Risk Early Warning and Sampling Inspection Program[J]. Management Review, 2022, 34 (11): 315- 323.
杨莲, 石宝峰, 基于Focal Loss修正交叉熵损失函数的信用风险评价模型及实证[J]. 中国管理科学, 2022, 30 (5): 65- 75.
Yang L , Shi B F , Credit Risk Evaluation Model and Empirical Research Based on Focal Loss Modified Cross-entropy Loss Function[J]. Chinese Journal of Management Science, 2022, 30 (5): 65- 75.
杨子晖, 张平淼, 林师涵, 系统性风险与企业财务危机预警——基于前沿机器学习的新视角[J]. 金融研究, 2022, 65 (8): 152- 170.
Yang Z H , Zhang P M , Lin S H , Systemic Risk and Corporate Financial Distress Forecasting from the New Perspective of Machine Learning[J]. Journal of Financial Research, 2022, 65 (8): 152- 170.
郑国坚, 林东杰, 张飞达, 大股东财务困境、掏空与公司治理的有效性——来自大股东财务数据的证据[J]. 管理世界, 2013, 29 (5): 157- 168.
Zheng G J , Lin D J , Zhang F D , Large Shareholder Financial Distress, Hollowing Out, and Corporate Governance Effectiveness — Evidence from Large Shareholder Financial Data[J]. Management World, 2013, 29 (5): 157- 168.
Baker S R , Bloom N , Davis S J , Measuring Economic Policy Uncertainty[J]. The Quarterly Journal of Economics, 2016, 4 (131): 1593- 1636.
Campbell J L , Chen H , Dhaliwal D S , Lu H M , Steel L B , The Information Content of Mandatory Risk Factor Disclosures in Corporate Filings[J]. Review of Accounting Studies, 2014, 19 (1): 396- 455.
Fama E F , French K R , A Five-factor Asset Pricing Model[J]. Journal of Financial Economics, 2015, 116 (1): 1- 22.
Francis J , Lafond R , Olsson P , Schipper K , The Market Pricing of Accruals Quality[J]. Journal of Accounting and Economics, 2005, 39 (2): 295- 327.
Gilson S C , Management Turnover and Financial Distress[J]. Journal of Financial Economics, 1989, 25 (2): 241- 262.
Gulen H , Ion M , Policy Uncertainty and Corporate Investment[J]. The Review of Financial Studies, 2016, 29 (3): 523- 564.
Loughran T , McDonald B , When is a Liability Not a Liability? Textual Analysis, Dictionaries, and 10-Ks[J]. The Journal of Finance, 2011, 66 (1): 35- 65.

基金

长沙市自然科学基金(kq2208004)
2022年全国大学生创新创业训练计划项目(202211532005)
2022年全国大学生创新创业训练计划项目(202211532008)
湖南省重点实验室开放研究基金(2019TP1009)

版权

版权所有,未经授权。
PDF(1010 KB)

759

Accesses

0

Citation

Detail

段落导航
相关文章

/