❤️ ×
各类单机,绅士游戏不断更新:https://www.acghua.com/
网站地址

基于样本加权SVM的科技型企业融资风险预警研究

(南京航空航天大学经济与管理学院,南京 211106)

引 言

在科技水平和产业革命快速发展、经济结构迅速转型的环境下,科技创新对经济发展的驱动作用越来越明显。2016年我国出台 《国家创新驱动发展战略纲要》,提出 “三步走”战略,在2020年进入创新型国家行列,创新驱动发展上升为国家战略。在经济环境与政策的双重导向下,科技型企业将成为产业结构向高质量转型的冲锋军,并可能成为新经济增长点。

但是作为技术创新成果转化的力量,科技型企业具有前期投入高、创新投资转化时间长、投资回报高的特点,并且创新能力及创新成果转化也存在诸多不确定性[1]。前期投入高、回报时间长的特征使金融机构在降低自身风险的前提下,会提高科技型企业的融资门槛,带来融资渠道少、融资成本高的问题。创新成果转化的不确定性可能直接导致企业无法及时偿付债务资本,较低的偿债能力进一步导致融资难度增加,资金循环进入不良状态[2]。因此,及时识别和预警融资风险,对科技型企业资金内部流动的良性循环起到重要作用。

近年来,国内外学者对科技型企业融资问题的关注越来越多。国外学者主要从融资结构理论和融资需求理论方面展开研究[3]。国内学者主要关注于科技型企业融资难融资贵的问题,并以此为背景,针对融资现状与特点、融资渠道、融资风险、融资效率的测度等多方面进行研究。

针对科技型企业融资风险,学者们主要从风险的识别、度量和预警三方面进行研究。束兰根从生命周期的角度,研究科技型企业在种子期、初创期、成长期、成熟期和衰退期所面临的融资风险[4],刘玉敏等从融资方式的角度,研究债务融资、股权融资及内源融资3种方式对企业融资风险的影响[5]。耿成轩等引入生态经济学的思想,从融资内生态和融资外生态的角度,对企业融资问题展开研究[6]。王玉冬等在生态学的基础上,基于资金在企业内部的循环,从资金来源、使用、偿还和分配4个维度,构建了创新资金配置风险的评价体系[7]。

针对融资风险预警指标的选取,谭超将文化类企业融资风险的影响因素总结为以下8个方面:管理风险、融资结构、融资规模、融资成本、无形资产比率、营运风险、信用风险和投资风险[8]。方先明和苏晓珺对科技型企业融资风险进行分类,分为市场风险、环境风险、生产经营风险以及财务风险,综合考虑了企业内外部环境的影响[9]。

针对风险预警模型的研究,主要分为两大类:(1)传统的统计学方法,包括单一财务比率法、多元判别模型以及Logistic回归模型; (2)基于数据驱动及机器学习的思想,将人工智能的方法运用到风险预警中,包括神经网络、遗传算法、决策树、以及支持向量机等。上世纪60年代,Beaver[10]提出利用单一财务比率来预测企业财务风险的方法,随后,美国学者Altman[11]提出了多元判别分析模型 (MDA),该模型利用企业的各项财务指标,分别设置权重构建判别函数。Martin[12]利用Logistic回归模型预测银行破产的概率。Logistic回归模型假设因变量与自变量之间不存在非线性函数关系,且各自变量之间无多重共线性,当样本数据不满足这些假设时,预测结果将受到影响。 Rick和Sharda[13]最早将神经网络 (ANN)运用到企业财务困境中,以等量的破产公司和财务健康公司为样本,选取Altman的5项财务指标为预测变量,通过神经网络模型分析企业破产前1年的数据,神经网络的预测准确率达到79.5%。支持向量机 (SVM)适合处理小样本、非线性及高维数据,目前,该方法主要应用于模式识别、分类对比以及回归估计等方面[14]。徐国祥和杨振建利用主成分分析法降低指标间的相关性,通过遗传算法完成对惩罚系数C和核函数参数的动态寻优,构建了PCA-GA-SVM模型对沪深300指数进行预测[15]。吴冲等利用模糊C均值聚类 (FCM)与神经网络相结合的方法预测企业财务风险,使用优化后的FCM对样本进行选择,解决了神经网络平滑参数的确定问题[16]。 杨海军和太雷[17]运用模糊C均值算法,为样本点赋予不同权重以确定每个样本的隶属度,实证证明增加了样本隶属度后的支持向量机解决了传统SVM过拟合以及经验风险升高的问题。

综上,我国对科技型企业融资风险的研究切入角度较多,对比企业不同生命周期、分析不同融资方式、分别考虑内外部环境对融资风险的影响,从时间空间、纵向横向都有全面研究。融资预警指标主要集中于企业财务指标,部分研究会增加融资结构、融资成本以及公司治理指标。学者们对预警模型的改进和创新较多,往往使用多个模型的组合方式,克服单一模型的不足。但是,以上研究大多从静态的角度分析融资风险的影响因素,而资金通常以资金流这一动态形式存在于企业内部,对于科技型企业,其融资成本及结构会影响企业的创新能力和经营成果,创新能力及成果转化水平会进一步影响企业债务资金的偿还能力,良好的偿债能力和盈利能力又会拓宽企业的融资渠道,降低融资成本,当资金在企业内部实现良性循环时,融资风险就会保持在安全水平。在支持向量机预警模型优化方面,更多研究是针对惩罚系数与核函数参数的优化,很少考虑隶属度的优化问题,即认为每个数据点都具有相同的重要性,但是实际上,对位于类中心和偏离较大的样本,这两类样本数据的重要程度是存在差异的。

因此,本文以资金流在企业内部循环过程作为切入点,从资金筹集风险、资金使用风险以及资金偿还风险3个维度出发,构建科技型企业融资风险预警指标体系,在预警模型方面,对传统支持向量机模型加以改进,利用模糊C均值聚类产生类中心,计算各样本点到类中心的距离,实现对样本的赋权,构建样本加权支持向量机模型,同时将改进后的模型推广至多分类问题,最后将其应用于融资风险预警的实证分析中,以验证优化改进后的多分类样本加权支持向量机具有更优的预测能力。与以往文献相比,本文具有三方面可能的创新点:(1)对企业融资风险预警不仅仅局限于一个时段,而是从动态的角度进行全局全面预警,相应地,在预警指标选取上,基于企业内资金循环的过程,构建出动态化的融资风险预警指标体系;(2)在预警模型优化方面,不仅对惩罚系数和核函数参数进行优化,而且也对样本隶属度进行优化,为不同样本点赋予不同权重,以区分位于类中心和偏离中心的点;(3)在以往二分类的基础上实现三分类,在高风险与安全状态之间增加低风险这一过渡期,能够在企业未达到高风险状态时及时识别,使预测更加及时有效。本文的技术路线图如下。

图1 技术路线图

1 融资风险预警指标体系设计

学者们普遍认为融资风险是资金在筹集和偿还过程中,由于信息不对称以及对自身认识不足,导致筹措资金或偿还本息面临不确定性。本文在此基础上,从动态的角度对企业资金流动全局全面预警,考虑了资金在企业内部流动的过程,即资金循环形成的资金链。企业的生产运营需要获得充足的资金支持,尤其是前期投入较大的科技型企业,资金筹集过程中的融资结构和融资成本直接对生产经营产生影响,经营活动中资金的配置和使用效率的不确定性会使企业面临资金使用风险,当资金在企业内部完成循环,最终以偿还债务或者利润分配的形式流出企业,由于股权融资不具有强制偿还性,此时,企业更多地面临债务资金偿还风险。同时,资金循环的3个阶段具有动态联动性,流入链、运营链和偿还链可以相互影响、相互促进,形成良性的循环过程,而任何一环节风险过高,都会导致整条资金链断裂。因此,本文基于动态资金流的视角,认为科技型企业融资风险主要是指难以适度成本筹集足够资金、债务资本到期无法及时偿还以及资金在创新成果转化过程中存在的不确定性。

1.1 科技型企业融资风险的影响因素及预警指标

构建融资风险预警指标是准确预警的重要基础,根据上述分析,本文从企业资金筹集过程、资金使用过程以及资金偿还过程3个阶段分析科技型企业融资风险的影响因素。

(1)资金筹集风险

资金筹集风险是指企业在筹资活动中由于资本结构不合理或融资成本过高而导致的不确定性。根据动态资本结构权衡理论,企业存在一个区间式的最优资本结构,且该最优资本结构与企业价值存在一定关联。科技型企业的蓬勃发展离不开资金支持,当企业增长速度高于其可持续增长率时,需要外部融资额作为补充,融资规模不足会制约企业发展,被迫放缓其成长速度,而过剩的资金会提高企业的融资成本。不同融资方式下的融资成本不同,通常股权融资成本高于债务融资,本文利用资本资产定价模型求得加权平均资本成本作为衡量指标。投资者在考虑未来投资回报的同时也要进行风险控制,项目风险越高,投资者要求的报酬率越高,企业将付出更高的成本,因此,采用企业风险系数β值作为风险水平的测度。

(2)资金使用风险

资金使用风险是指资金在企业内部流通中由于配置不合理导致经营成果在规模和质量上未达到目标值。科技型企业集人才密集型和技术密集型为一体,研发人员的数量和质量是创新的基础,研发费用占销售额的比重也是衡量创新投入的指标,该比率达到2%,企业才可生存,达到5%,在行业中才具有竞争力[18],先进的设备投入为创新提供硬件支持,因此,本文从人力资源、财力资源和设备资源三方面的投入和配置衡量创新投入水平。科技型企业的创新成果直接表现为无形资产和专利技术,这两项指标是过去创新能力的产物,而管理水平决定了企业能否从战略层面计划和组织创新活动,是企业未来创新水平的体现,因此,本文用无形资产比率、人均专利技术和发明以及管理水平衡量创新实现水平。企业经营成果最终表现形式是收益水平,较高的利润水平使企业在债务资金偿还方面以及股权融资吸引力方面具有优势,因此,选取净资产收益率和营业利润率反映盈利水平。

(3)资金偿还风险

资金偿还风险是指由于偿债能力不足或者资金供应不足导致债务资本到期无法及时偿还而使企业在经营中面临的不确定性。企业偿还能力直接关系到能否持续经营,若无法偿还债务,可能面临诉讼风险,甚至被迫破产,也会对企业的信用评级以及企业声誉产生负面影响,导致企业再融资的难度增加,良性循环链被打破。除了具备良好的偿债能力,企业的现金支付能力决定着偿债的可行性,变现水平较差同样会导致资金链在偿还环节断裂。因此,在指标选取上,考虑了企业的长期和短期偿债能力、应收账款的变现水平以及现金流量相关指标。

基于以上对融资风险影响因素的分析,本文从资金筹集风险、资金使用风险以及资金偿还风险三方面构建如表1所示预警指标。

表1 科技型企业融资风险预警指标

其中,技术密集度采用固定资产原值与年均职工人数的比值确定。

1.2 融资风险等级的确定

在企业财务危机预警的相关研究中,通常以企业是否被ST为划分依据,将企业分为财务困境和财务健康两类,但这种划分方式忽略了企业财务状况从健康转到危机的过程,因此,本文将风险等级分为3类:高风险状态、低风险状态以及安全状态。

确定融资风险等级常用的方法包括:层次分析法、专家评价法以及熵权法。熵权法相比于层次分析法和专家评价法,可以对指标量化处理,且赋权过程中克服了主观随意性[19],因此本文采用熵权法,具体步骤如下:

对n个样本,m个指标,其数据集为R={xij},xij为第i个样本, 第j个指标, 其中i=1,2,3,…,n;j=1,2,3,…,m。

由于各指标单位不统一,在指标间运算时,先进行归一化。

对于极大型指标:

对于极小型指标:

计算第i个样本的第j个指标的权重:

不过,与其他城市相比,一线城市居民即便房租涨幅最大,他们也不太愿意降低母婴消费品的档次,愿意降低的占比虽有41%,但远低于新一线城市的57%、三线城市的66%。

计算第j个指标的信息熵ej,dj为指标的信息效用值,该指标越大,说明指标重要性越高:

计算第j个指标的熵权Wj以及各样本的综合得分F。

根据综合得分F,将样本三等分,分别代表安全状态、低风险状态以及高风险状态。

2 基于样本加权支持向量机的融资风险预警模型

企业融资风险受多项指标影响,具有特征维度高的特点,支持向量机适合解决小样本、高维度及非线性识别问题,且具有良好的泛化能力,因此,本文主要采用支持向量机的方法构建预警模型。

2.1 SVM模型

支持向量机 (SVM)是通过建立一个分类超平面,将样本分为正负两类。不同于传统机器学习经验风险最小化的目标,SVM的目标是最大化分类边界,在保证经验风险最小化的基础上最小化置信范围,达到结构风险最小化的目标。

支持向量机的目标函数如下:

为了求解w,将原问题转为以W为目标函数的对偶问题,并引入拉格朗日乘子αi:

对于任意样本点xi,SVM的分类判别模型为:

其中,αi为拉格朗日乘子。

在支持向量机中,C为确定的常数,这就使得不同样本被赋予相同的惩罚度。但是企业融资风险会受非定性指标的影响,或者短期受到突发性事件的影响,这些难以衡量的因素仅存在于少数公司中,使得数据中存在具有特殊性的样本,为了尽量减少此类样本的干扰,根据每个样本点相对于这一类别的重要程度,对每一样本赋予不同的权重,以排除野点或噪声的影响,提高分类的准确性。

本文采用样本加权支持向量机,其原理是通过给不同样本赋予不同权重,从而弱化不重要样本点对分类结果的影响,在最大化分类间隔的同时,最小化分类误差,其二次规划形式如下:其中,ti代表每一样本重要程度的权重,权重ti越大,意味着第i个样本点对模型分类的影响越大。

支持向量机最初用于二分类问题,通过超平面将样本分为 “正例”和 “负例”两类,将SVM从二分类推广到多分类,可以通过构造多个分类器来实现,常用的方法有一对一的方法 (1-v-1)、一对多的方法 (1-v-r)以及二叉树分类法(SVMDT)。本文将融资风险等级设为3级,采用1-v-1的模式构建三分类支持向量机。首先,分别在类1和类2、类2和类3、类1和类3之间构建3个分类器;接着,用以上3个分类器对测试数据进行预测,对于任意一个样本点均有3个分类器对其投票,最终被划分为哪一类,取决于哪一类的票数最多。

2.2 传统样本权重的确定

针对支持向量机存在的如何区分样本数据重要性的问题,Lin和Wang[20]提出了模糊支持向量机的方法 (FSVM),主要思想是为各样本点相对于簇中心的不同位置赋予不同权重,对于靠近簇中心的点赋予较高权重,反之赋予较低权重。对加权方式,常见的是基于距离的权重确定方式,其隶属度定义为:

其中,opon分别为GpGn的类中心。

2.3 FCM聚类确定样本权重

本文使用模糊C均值聚类确定样本权重。模糊C均值聚类是在给定分类数的情况下,寻找到对样本最佳分类的方法。相比于其他硬聚类方法,FCM算法引入模糊思想,通过最小化各样本点到各聚类中心的欧式距离及模糊隶属度的加权和,不断迭代产生新的聚类中心和隶属度矩阵,直到小于设定的阈值[21]。该聚类方法属于无监督式的机器学习理论,不需要主观确定分类边界,有效避免了人为确定导致的主观性。

设数据集中含有k个样本,基于每个样本的特征属性,将各样本划分为m个集合,由于每个样本不都是完全属于某一集合,因此,会产生隶属度矩阵wij来表示样本xi属于第j类的程度。FCM最优聚类即其目标函数Jm:

其中,U为隶属度矩阵,c为聚类中心,cj为第j个聚类中心,dist(xi,cj)为样本xi到聚类中心的距离,p为加权指数。

FCM算法先随机确定初始聚类中心,随后通过迭代不断修正聚类中心cj,同时,产生每一个样本点的隶属度矩阵wij。聚类中心cj的形式如下:

隶属度wij表示样本点i对于聚类中心j的隶属度,其具体形式如下:

通过多次迭代,调整聚类中心和样本隶属度的值,使得目标函数小于一定阈值ε,此时完成对样本的聚类,同时可以得到最优的聚类中心和样本隶属度矩阵。

为描述各样本点到每一类中心的接近程度,构建样本权重ti:

2.4 样本加权支持向量机模型构建

设样本集S={xi},xi∈RN, 其中包含了高风险状态、低风险状态以及安全状态3类共i个样本,则构造样本加权支持向量机模型的步骤如下:

第一步,根据资金动态循环过程,构建科技型企业融资风险预警指标体系。

第二步,对样本数据预处理。采用归一化处理,消除数据量纲对模型结果的影响,将原始数据中的数值缩至[0,1]内。采用主元分析法 (PCA)对初始指标体系提取关键特征,用更少的指标代替整个指标体系的信息,设置累计贡献率为80%,得到最终预警指标体系。

第三步,利用FCM算法对3类样本聚类,得到3个聚类中心c1、c2、c3以及每一样本对各聚类中心的隶属度矩阵wij。

第四步,计算样本权重,根据式 (20)计算样本点到每一类中心的接近程度,以此确定样本权重ti。

第五步,通过交叉检验的方式寻找到最优惩罚系数C(C为常数)以及核函数参数。

第六步,构造式 (12) 的决策函数f(x),利用该决策函数对样本进行分类得到y′i,将分类结果与实际的y相比较,即可确定分类的准确率。

样本加权支持向量机模型构建的核心步骤是确定每个样本的权重。由于不同样本对最终预测的贡献程度不同,本文利用FCM算法确定类中心,并计算样本点到类中心的接近程度。该模型能够降低样本中因偶然因素导致的噪声或野点的干扰,进而提高融资风险预测准确率。

3 实证研究3.1 样本选取及数据来源

科技型企业是指以科技人员为主体,研制、开发、生产、销售高新技术产品或大规模运用高新技术的企业,其以市场为导向,创新能力强,具有自主知识产权[22]。根据科技部的 《科技型中小企业技术创新基金若干重点项目指南》,基金支持对象的具体领域包括电子信息、新材料、节能环保、新能源、高技术服务业等行业。本文以上述五大行业为研究对象,选取行业中2018年具有高新技术认定的企业,除去数据不完整的部分企业,共筛选出264家企业,其中180家企业数据作为训练集,84家企业数据作为测试集。以上述企业2018年数据为研究对象,数据来源为Wind数据库。

图2 基于样本加权支持向量机的科技型企业融资风险预警模型

利用熵权法对264家企业指标赋权,根据式(7)求出各企业的综合评分,并按三等分法,将企业的状态划分为安全状态、低风险状态以及高风险状态。3种状态企业的综合评分区间依次为[0.068551,0.102606]、 [0.102677,0.119831]和[0.120074,0.43691],高风险状态区间宽度最宽,说明被划分入高风险状态的企业分布更加分散,低风险状态的区间宽度最窄,说明该状态企业具有更高的相似度。

3.2 数据预处理及参数优化

由于多个财务指标在数量级方面存在差异,且这些指标不服从正态分布,因此,采用无量纲化中区间缩放的方法,消除数据量纲对模型结果的影响。数学表达式为式 (1)及式 (2),通过区间缩放,将原始数据中的数值缩至[0,1]内。

本文采用主元分析法 (PCA)提取特征值,设置累计贡献率为80%,通过部分指标代替全部指标信息,从而压缩原指标的维度。

有大量学者和研究证明,高斯径向基核函数相比于其他核函数具有更强的学习能力,本文选择 RBF核函数, 其表达式为:,其中,σ是待确定的参数。采用交叉验证法寻优,确定模型最优惩罚系数C为16,最优核函数参数g为0.0625。

3.3 模型结果及分析

将上述处理过的数据代入构建的样本加权支持向量机中,模型的预测结果如表2所示。

表2 样本加权支持向量机预测结果

图3 样本加权支持向量机预测结果

从表2可以看出,样本加权支持向量机模型对融资安全状态、低风险状态以及高风险状态企业的预测准确率分别为96.43%、92.86%以及78.57%。

为检验样本加权支持向量机的预测结果,用相同的样本数据,选择目前运用范围较广的基于距离的加权SVM模型、未经样本加权的SVM模型以及Logistic回归模型分别与样本加权支持向量机模型作对比,测试结果如表3所示。

表3 3种模型预测结果对比 单位:%

可以看出,样本加权SVM模型的预测准确率最高,尤其对于高风险状态的预测,准确率较基于距离加权模型高近7%,较未加权SVM模型高14%。根据熵权法综合得分将企业划分为安全、中风险以及高风险状态,为了获得3类平衡样本,区间设置分别为[0.068551,0.102606]、 [0.102677,0.119831]和[0.120074,0.43691], 可以看出, 高风险状态的区间范围最大,说明该类型的数据更加零散,即样本加权SVM模型对于分布零散的数据有更好的预测效果。此处的高风险状态是指该企业对样本企业的相对高风险,当企业融资处于相对于行业的高风险状态时,管理者应及时关注并采取适当措施,因此对于高风险状态的预测最为重要,样本加权SVM模型能够对处于高风险状态的企业有效监控,具有一定的现实意义。

4 结 论

2020年是我国建成创新型国家的关键之年,资金的筹集和使用是决定科技型企业发展的重要因素,确保科技型企业稳步发展最关键的是实现资金在企业内的良性循环。本文引入资金动态循环思想,构建科技型企业融资风险评价体系。根据样本相对于类中心的接近程度确定样本权重,构建样本加权支持向量机模型。最后,通过2018年科技型企业的融资数据,对比基于距离加权的SVM模型以及未加权模型,证明了样本加权支持向量机模型在融资风险预警方面具有更高的准确性。具体结论如下:

(1)融资风险的预警是一个动态循坏的过程,恰当的指标评价体系是准确预警的前提。本文基于动态循环的思想,从资金筹集过程、资金使用过程以及资金偿还过程3个维度,并针对科技型企业创新性强的特征,构建了科技型企业融资风险指标评价体系。

(2)提高支持向量机预测的准确性,可以从参数寻优以及样本数据处理两个角度入手。在参数寻优方面,本文利用交叉验证的方式对参数寻优;在样本数据处理方面,基于样本数据在高风险状态分布零散的特征,为不同样本确定权重,提高了模型的预测性能。

(3)实证分析的结果表明,样本加权支持向量机模型能够高效、及时地对企业融资风险进行监测,有利于企业及时采取应对措施,对于监管机构及投资者,有利于完善企业融资信用评价体系,加强风险监督及风险管理。

随着互联网金融的迅速发展,科技型企业在提高核心竞争力和创造力的同时,也要利用好政策优势,主动寻找新型融资渠道。政府及金融机构也应加快金融创新,开拓以知识产权、无形资产等抵押或质押贷款等特色融资渠道。

相关阅读