风险建模及预警方法理论介绍
风险建模及预警方法理论介绍
1、蒙特卡罗方法 ...................................................................................... 1
2、决策树法 .............................................................................................. 2
3、检查表法 .............................................................................................. 4
4、财务报表分析法 .................................................................................. 5
5、层次分析法 .......................................................................................... 6
6、模糊综合评价法 .................................................................................. 8
7、五变量Z-Score模型 ........................................................................ 11
8、多元逻辑回归(Logit)模型 ...........................................................13
9、人工神经网络(ANN)模型 .................................................................15
10、支持向量机(SVM)模型 .............................................................17
1、 蒙特卡罗方法
蒙特卡罗方法(Monte Carlo simulation)又称随机抽样或统计实验方法,是在20世纪40年代中叶为研制核武器中的计算问题而由该计划的主持人之一、数学家冯·诺依曼用驰名世界的赌城-摩纳哥的蒙特卡罗来命名并加以运用的。
蒙特卡罗方法的基本思想很早以前就被人们所发现和利用。早在17世纪,人们就知道用事件发生的“频率”来决定事件的“概率”。19世纪人们用投针试验的方法来决定圆周率π。二十世纪计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。
用民意测验来做一个不严格的比喻。民意测验的人不是征询每一个登记选民的意见,而是通过对选民进行小规模的抽样调查来确定可能的优胜者。其基本思想是一样的。而科技计算中的问题比这要复杂得多,比如金融衍生产品(期权、期货、掉期等)的定价及交易风险估算,问题的维数(即变量的个数)可能高达数百甚至数千。对这类问题,难度随维数的增加呈指数增长,这就是所谓的“维数的灾难”(Course Dimensionality),传统的数值方法难以对付(即使使用速度最快的计算机)。蒙特卡罗方法能很好地用来对付维数的灾难,因为该方法的计算复杂性不再依赖于维数。以前那些本来是无法计算的问题现在也能够计算量。
蒙特卡罗方法以概率论和数理统计为基础,依据大数定律(样本均值代替总体均值),利用计算机数字模拟技术在计算机上进行大量的随机模拟试验,解决一些很难直接用数学运算求解或其他方法不能
解决的复杂问题的近似计算法,是一种多元素变化方法。在该方法中所有的元素都同时受到风险不确定性的影响,由此克服了敏感性分析受一维元素变化的局限性。简而言之,蒙特卡罗模拟创造了一种假设的未来,通过产生数以千计甚至成千上万的样本结果并分析他们的共性实现的。
在实践中,蒙特卡罗模拟法用于风险分析、风险鉴定、敏感性分析和预测。从二十世纪五十年代起,蒙特卡罗模拟就用在美国Los Alamos国家实验室发展氢弹的早期工作中,并流行于物理学和运筹学研究领域。兰德公司和美国空军是这个时期主要的负责资助和传播蒙特卡罗方法在的组织。如今,其广泛的被应用于金融工程学,宏观经济学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域。
2、决策树法
决策树法是指将决策的问题以树状图形表示,并通过对树状图的计算分析选择决策行动方案的方法。它利用了概率论的原理,并且利用一种树形图作为分析工具。
决策树一般由方块结点(称为决策点)、圆形结点(称为状态点)、方案枝和概率枝等组成,由左向右、由简到繁展开,形成一个树状网络图。其基本原理是用决策结点代表决策问题,用方案枝代表可供选择的方案,用概率枝代表方案可能出现的各种结果,经过对各种方案在各种结果条件下损益值的计算比较,为决策者提供决策依据。
决策树分析法可以比较直观地起到类似于框图在编写计算机程
序中的作用,在错综复杂的决策环境中找出一条最优的决策线路,是常用的风险分析决策方法。其决策是以期望值为标准的。人们对未来可能会遇到好几种不同的情况。每种情况均有出现的可能,人们目前无法确知,但是可以根据以前的资料来推断各种自然状态出现的概率。在这样的条件下,人们计算的各种方案在未来的经济效果只能是考虑到各种自然状态出现的概率的期望值,与未来的实际收益不会完全相等。它适合于商业银行面对多个自然状态、多种决策方案等较为复杂的离散型风险决策。
3、检查表法
检查表法是将项目可能发生的潜在风险列于一个表上,供识别人员进行核对,用来判断是否存在表中所列或类似的风险。对于同类已完工项目的环境与实施过程进行归纳总结后,一般根据项目环境、产品或技术资料、团队成员的技能或缺陷等风险要素,建立该类项目的基本风险结构体系,以表格形式按照风险来源形成风险识别核对表。
安全检查表是20世纪30年代工业迅速发展时期的产物。当时,由于安全系统工程尚未出现,安全工作者为了解决生产中遇到的日益增多的事故,运用系统工程的手段编制了一种检验系统安全与否的表格。系统工程广泛应用以后,安全系统工程开始萌芽时期,安全检查表的编制逐步走向理论阶段,使得安全检查表的编制越来越科学、全面和完善。安全检查表分析既可用于简单的快速分析,也可用于更深成绩单分析。是进行安全检查、发现潜在风险的一种有效而简单可行的方法。常用于安全生产管理。
优点方面,安全检查表能够事先编制,可以做到系统化、科学化,不漏掉任何可能导致事故的因素,为事故树的绘制和分析做好准备。安全检查表是定性分析的结果,是建立在原有的安全检查基础和安全系统工程之上的,简单易学,容易掌握,符合我国现阶段的实际情况,为安全预测和决策提供坚实的基础。
缺点方面,安全检查表只能做定性的评价,不能定量,而且只能对已经存在的对象评价,并且要有事先编制的各类检查表,有赋分、评级标准。
4、财务报表分析法
财务报表分析法(financial statement method)是由克里德尔
(A.H.Criddle)于1962年提出的。根据企业的资产负债表、损益表、资产记录等资料,以每一会计科目为单位,对企业的固定资产、流动资产之分布进行风险分析,以发现潜在损失的风险识别方法。它通过一定的分析方法分析企业的资产负债表、利润表、现金流量表等相关的支持性财务指标,以分析企业的财务状况,以此来识别投资活动的潜在风险。利用财务报表分析法识别风险主要有三种方法:
(1)趋势分析法。趋势分析法是根据风险管理单位连续两期或连续期的财务报表,将报表中的相同指标进行对比分析,确定指标的增减变动方向、数额和幅度,以反映风险管理单位的财务状况和经营成果的变动趋势,并对发展前景进行判断。
(2)比率分析法。比率分析法是将财务报表中相关项目的金额进行对比,计算出相应的财务比率,通过比率之间的比较说明风险管理单位的发展情况、计划完成情况或者与同行业平均水平的差距。比率分析可分为偿债能力分析、资本结构分析(或长期偿债能力分析)、经营效率分析、盈利能力分析、投资收益分析、现金保障能力分析、利润构成分析等。
(3)因素分析法。因素分析法是依据分析指标和影响因素之间的关系,从数量上确定各因素对指标的影响程度,主要包括差额分析法、指标分解法、连环替代法和定基替代法。
比如在商业银行的经营管理中,最直接最方便的风险识别工具就是银行的财务报表,如资产负债表、损益表、留存收益表、财务状况变动表等。对银行自身的财务报表进行分析是商业银行实行风险管理的重要内容。首先,通过财务报表可以获得各种风险指标,如流动性风险比率、利率风险比率、信用风险比率以及资本风险比率等。其次,通过对财务报表的静态分析(如比率分析、比例分析等)和动态分折(如时期比较分析、趋势分析等),可以估计银行过去的绩效,衡量银行目前的财务和经营状况,预测银行未来的发展趋势,找出可能影响银行未来经营的风险因素。
优点方面,财务报表分析法一是因为任何企业的经营活动最终涉及到不是现金就是财产,所以对这些项目进行研究会非常可靠和客观。二是财务报表容易得到,不像现场调查法等方法需要花费大量的时间实地采集资料和绘制特别图表。三是因为财务报表中包含了投资风险的信息,因此也可以用来识别企业的金融风险。
缺点方面,首先是财务信息要具有真实全面性,这是其识别投资风险的基础,如果财务报表不真实和全面,就无法识别投资的潜在风险;其次是其专业性较强,如果缺乏财务管理的专业知识,就无法识别投资风险。
5、层次分析法
层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由美国运筹学家托马斯·塞蒂(T.L.Saaty)正式
提出。运用层次分析法解决问题的思维方式是:把复杂的问题分解成各个组成要素,把各要素按支配关系分组形成有序的递阶层次结构,通过两两比较的方式确定层次中因素的相对重要性,然后综合人的判断以决定各因素相对重要性中的顺序。其特点是在对复杂的决策问题的本质、影响因素及其内在关系等进行深入分析的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法。尤其适合于对决策结果难于直接准确计量的场合。层次分析法的基本步骤为:建立层次结构模型——构造成对比较阵——计算权向量并做一致性检验——计算组合权向量并做组合一致性检验。
例如,某人选购一台电冰箱,他对市场上的6种不同类型的电冰箱进行了解后,在决定买那一款式时,往往不是直接拿电冰箱整体进行比较,因为存在许多不可比的因素,而是选取一些中间指标进行考察。例如电冰箱的容量、制冷级别、价格、型号、耗电量、外界信誉、售后服务等。然后再考虑各种型号冰箱在上述各中间标准下的优劣排序。借助这种排序,最终进行选购决策。在决策时,由于6种电冰箱对于每个中间标准的优劣排序一般是不一致的,因此,决策者首先要对这7个标准的重要度作一个估计,给出一种排序,然后把6种冰箱分别对每一个标准的排序权重找出来,最后把这些信息数据综合,得到针对总目标即购买电冰箱的排序权重。有了这个权重向量,决策就很容易了。在这个被称为决策系统中,很多因素之间的比较往往无法
用定量的方式描述,此时需要将半定性、半定量的问题转化为定量计算问题。层次分析法是解决这类问题的行之有效的方法。
由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范围得到重视。它的应用已遍及经济计划和管理、能源政策和分配、军事指挥、运输、农业、教育、人才、医疗和环境等领域。在预警系统中可以用来对警兆指标进行排序、筛选和权重分配,在工程项目投标阶段使用其评价工程风险,可以使风险管理者能在投标前就对拟建项目的风险情况有全面认识,决定是否投标。
优点方面,层次分析法一是具备系统性,它将研究对象作为一个系统,按照分解、比较判断、综合的思维方式进行决策。二是简洁实用,其既不单纯追求高深数学,又不片面注重行为、逻辑和推理,二是把定性与定量方法有机地结合起来,能将人们的思维过程数学化、系统化,便于人们接受。三是所需定量数据信息较少。
缺点方面,一是不能为决策提供新方案,只能从备选方案中选择。二是定量数据较少,定性数据较多,具有一定主观性。三是特征值和特征向量的精确求法比较复杂。
6、模糊综合评价法
运用多个指标对多个参评单位进行评价的方法,称为多变量综合评价方法,或简称综合评价方法。其基本思想是将多个指标转化为一个能够反映综合情况的指标来进行评价。如不同国家经济实力,不同地区社会发展水平,小康生活水平达标进程,企业经济效益评价等,
都可以应用这种方法。现代综合评价方法包括主成分分析法、数据包络分析法、模糊评价法等。其中,(1)主成分分析法是将其分量相关的原随机向量,借助于一个正交变换,转化成其分量不相关的新随机向量,并以方差作为信息量的测度,对新随机向量进行降维处理。再通过构造适当的价值函数,进一步做系统转化。(2)数据包络分析法是创建人以其名字命名的DEA模型——CR模型。DEA法不仅可对同一类型各决策单元的相对有效性做出评价与排序,而且还可进一步分析各决策单元非DE有效的原因及其改进方向,从而为决策者提供重要的管理决策信息。(3)模糊评价法。模糊评价法奠基于模糊数学。它不仅可对评价对象按综合分值的大小进行评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象的等级。
模糊集合理论的概念于1965 年由美国自动控制专家查德(L.A.Zadeh)教授提出,用以表达事物的不确定性,是一种基于模糊数学的综合评标方法。该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。
模糊综合评价法进行风险评价的思路是:综合考虑所有风险因素的影响程度,并设置权重以区别各因素的重要性,通过构建数学模型,推算出风险的各种可能性程度,其中可能性程度高者为风险水平的最终确定值。其一级模型的评价步骤如下:
(1)确定评价对象的因素集:如服装的U=舒适性、耐磨性、美观性和价格;
(2)建立评价集:专家利用经验知识作出评价结果,如V=很好、好、一般、不好;
(3)建立模糊关系矩阵:建立从U到V的模糊关系R;
(4)确定权重集:即确定因素集U中的不同重要程度;
(5)模糊综合评判:根据模糊综合评价数学模型进行模糊合成,得出综合评价结果,如计算结果服装隶属很好、好、一般、不好的程度分别为25%,33%,17%和25%,根据最大隶属度原则,综合评价为好。当从不同角度进行风险评价,每个角度包含不同评价因素时,可进行多级评价,将因素集分为若干子集,对每个子集利用一级模型进行模糊综合评价,然后进行多级模糊综合评价,计算综合隶属度。
其优点是可以利用模糊数学的知识进行风险衡量和评价,把边界不清楚的模糊概念用量化的方法表示,为决策提供支撑,具有结果清晰,系统性强的特点,能较好地解决模糊的、难以量化的问题,适合各种非确定性问题的解决。其缺点在于评价要素及其权重的确定具有主观性。(下图为BOT项目的风险评价指标体系示例)
7、五变量Z-Score模型
1968年,纽约大学斯特恩商学院教授爱德华·奥特曼(Edward Altman)在研究美国破产和非破产生产企业时,采用了22个财务比率,经过数理统计筛选建立了著名的五变量Z-score模型。期初的Z-score模型是以多变量的统计方法为基础,以破产企业为样本,通过大量的实验,对企业的运行状况、破产与否进行分析、判别的系统。 Z—Score模型在实证考察和分析研究基础上,从上市公司财务报告中计算出一组反映公司财务危机程度的财务比率,然后根据这些比率对财务危机警示作用的大小给予不同的权重,最后进行加权计算得到一个公司的综合风险分,即z值.将其与临界值对比就可知公司财务危机的严重程度。Z—Score模型判别函数为:
Z = 0.012X1 + 0.014X2 + 0.033X3 + 0.006X4 + 0.999X5
其中,X1=营运资金/资产总额,它反映公司资产的变现能力和规模特征。一个公司营运资本如果持续减少,往往预示着公司资金周转不灵或出现短期偿债危机。X2=留存收益/资产总额,反映了公司的累积获利能力。对于上市公司,留存收益是指净利润减去全部股利的余额。留存收益越多,表明公司支付股利的剩余能力越强。X3=税前利润/资产总额,可称为总资产税前利润率,可以衡量上市公司运用全部资产获利的能力。X4=股东权益的市场价值总额/负债总额,测定的是财务结构,分母为流动负债和长期负债的账面价值之和,分子以股东权益的市场价值取代了账面价值,使分子能客观地反映公司价值的大。X5=销售收入/资产总额,即总资产周转率,企业总资产的营运能力集中反映在总资产的经营水平上。如果企业总资产周转率高,说明企业利用全部资产进行经营的成果好。反之,如果总资产周转率低,则说明企业利用全部资产进行经营活动的成果差.最终将影响企业的获利能力。
Z-Score模型从企业的资产规模、变现能力、获利能力、财务结构、偿债能力、资产利用效率等方面综合反映了企业财务状况,推动了财务预警系统的发展。奥特曼通过对Z—Score模型的研究分析得出Z值与公司发生财务危机的可能性成反比:Z值越小,公司发生财务危机的可能行就越大;Z值越大,公司发生财务危机的可能性就越小。当Z2.675时,公司财务状况良好,破产可能性极小。
优点方面,Z值模型克服了单变量预警模型的缺陷,几乎包括了所有预测能力较强的财务指标。它不仅可预测本企业的财务发展状况,还可以分析企业的竞争对手、供应商、客户及利益相关企业的情况,且具备较高的准确性。曾有研究人员通过对中国沪、深证券交易所2007年~2009年暂停上市或终止上市的32家公司进行了Z值分析,结论是用Z—Score模型预测企业风险是有一定效果的。
缺点方面,一是其仅考虑了极端情况,而对于负债重整、或是虽然发生违约但是回收率很高的情况就没有做另外较详细的分类。二是其权数是四十年前根据美国当时的市场环境推导而出的,如需针对特定行业或国家必须改进,且应根据市场的变化进行即时调整,才能保证其灵敏度。三是并未考虑宏观景气循环效应因子的影响。
8、多元逻辑回归(Logit)模型
多元逻辑回归模型(Logit model,也译作“评定模型”,“分类评定模型”,又译作Logistic regression,“逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是最早的离散选择模型,也是目前应用最广的模型。Logit模型是Luce(1959)根据IIA特性首次导出的,此后Logit模型在心理学、社会学、经济学、市场营销及交通领域得到了广泛的应用,并衍生发展出了其他离散选择模型,形成了完整的离散选择模型体系,如Probit模型、NL模型(Nest Logit model)、Mixed Logit模型等。
20世纪70年代以来,许多关于财务危机的研究采用了该模型。
Logistic财务预警模型以多元线性回归方程为基础模型,以影响财务风险的各项财务指标为自变量,建立财务预警模型,采用了一系列的财务比率来预测财务危机发生的概率,然后根据银行、投资者等的风险偏好程度设定风险警戒线,以此对分析对象进行风险定位和决策。
该模型的逻辑分布(Logistic distribution)公式为:P(Y=1│X=x)=exp(x'β)/1+exp(x'β),其中参数β常用极大似然估计。
优点方面,一是Logit模型具有IIA特性(即Independent and irrelevant alternatives假设,也称作“IIA效应”),指Logit模型中的各个可选项是独立的不相关的,模型中选择枝的减少或者增加不影响其他各选择之间被选概率比值的大小,因此,可以直接将需要去掉的选择枝从模型中去掉,也可将新加入的选择枝添加到模型中直接用于预测。二是其概率表达式具有显性的特点,模型的求解速度快,应用方便。当模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。
缺点方面,一是样本的数量要求较多(如在财务危机预警中需要200个样本),否则在参数估计上存在一定偏差性;二是模型的有效性有待于提高;三是该模型对中间区域的判别敏感性较强,可能导致判别结果的不稳定。
9、人工神经网络(ANN)模型
人工神经网络(Artificial Neural Networks,简写为ANN)是一种应用类似于大脑神经联接结构进行信息处理的数学模型。1943年,心理学家W.S.Mc Culloch和数理逻辑学家W.Pitts建立了神经网络和数学模型,称为MP模型。开创了人工神经网络研究的时代。其中多层非线性ANN中的“误差反向传播算法”(即BP算法)突破了当成神经网络不能进行复杂分类的限制。
人的思维有逻辑性和直观性两种不同的基本方式。逻辑性的思维是指根据逻辑规则进行推理的过程:先将信息化成概念,并用符号表示,然后进行逻辑推理。然而,直观性的思维是将存储的信息综合起来,忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于信息是通过神经元上的兴奋模式分布在网络上以及信息处理是通过神经元之间同时相互作用的动态过程来完成的。人工神经网络就是模拟人思维的第二种方式,是一个非线性动力学系统,同时其通过一个基于数学统计学类型的学习方法得以优化,所以也是数学统计学方法的一种实际应用。
神经网络由大量的节点(或称“神经元”,或“单元”)和之间相互联接构成,每个节点代表一种特定的输出函数,称为激励函数
(activation function),每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(weight),这相当于人工神经网络的记忆。网络的输出则按照网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。它的构筑理念是受到生物(人或其
他动物)神经网络功能的运作启发而产生的,具有自学习和自适应的能力。
在BP网络中,BP网络分为输入成、隐含层和输出层,隐含层可以有一层或多层。BP算法的学习过程由正向传播和反向传播两部分组成。在正向传播过程中,输入模式从输入层经过隐藏层神经元的处理后,转向输出层,每一层的神经元的状态只影响下一层神经元转台。如果在输出层得不到期望的输出,则转入反向传播,此时误差信号从输出层向输入层传播并沿途调整各层间连接权重值和阀值,以使误差不断减小,直至达到精确的要求。该算法实际上是求误差函数的极小值,它通过多个样本的反复训练,并采用最快下降法师的权重值沿着误差函数负梯度方向改变,并收敛于最小点。
人工神经网络的特征:1)非线性。大脑的智慧就是一种非线性现象。2)非局限性。多个神经元广泛连接而成,一个系统的整体行为不仅取决于单个神经元的特征,而且可能主要由单元之间的相互作用、相互连接所决定。3)非常定性。人工神经网络具有自适应、自组织、自学习能力。
优点方面: 一是人工神经网络具有自学习功能。例如实现图像识别时,只要把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。预期未来的人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其应用前途是很远大的。二是具有联想存储功能。三是具有高速寻找优化解的能力。利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可能很快找到优化解。
缺点方面:一是没有能力解释其推理过程和依据,缺乏统一的数学理论。二是神经网络不能向用户提出必要的询问,而且当数据不充分的时候,神经网络就无法进行工作。三是把一切问题的特征都变为数字,把一切推理都变为数值计算,结果却很有可能丢失信息。
人工神经网络图例如下:
10、支持向量机(SVM)模型
支持向量机(Support Vector Machine,SVM)是由Vapnik领导的AT&T Bell实验室研究小组在1963年提出的一种基于统计学习理论的模式识别方法。希冀借助最优化方法解决机器学习问题,与神经网络类似,都是学习型的机制,但与神经网络不同的是SVM使用的是数学方法和优化技术。当时的研究尚不十分完善,数学上比较艰涩,研究一直没有得到充分的重视。直到90年代,统计学习理论 (Statistical Learning Theory,SLT)的实现和由于神经网络等较新兴的机器学习方法的研究遇到一些重要的困难,比如如何确定网络结构的问题等,使得SVM迅速发展和完善起来。
支持向量机以统计学习理论中的VC 维理论和结构风险最小原理为基础,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度) 和学习能力(即无错误地识别任意样本的能力) 之间寻求最佳折衷,以提供最佳的学习性能,其网络结构类似于神经网络,其输出是若干中间层结点的线性组合,而每一个中间层结点对应于输入样本与一个支持向量的内积,因此也被称为支持向量网络。该模型在机器学习与数据挖掘中已被确立为一种标准工具,被认为是“机器学习领域非常流行的方法和成功的例子”。在文本分类、手写识别、图像分类、生物信息学等领域中获得了较好的应用。
应用在预警领域,SVM 模型就是将 SVM 作为有关专家的模拟,代替有关专家对原始数据进行分析处理,产生评价结果。其具体工作机理是: 将根据评价准则体系收集上来的原始数据作为 SVM 的输入向量,将综合评价的结果作为 SVM 的输出,然后利用模糊综合评价法分析专家的评价原则,形成一系列样本,用足够多的样本训练 SVM,使它能够达到一定的误差要求。训练成功后,SVM 就具备了专家的经验和知识,这时再将现有的实际数据(需要评价的数据)输入 SVM,SVM 的输出即是预测的结果,根据预测结果就可以确定有警还是无警。
优点方面,SVM一是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;二是该算法最终将转化成为一个二次型寻优点问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问
题。
缺点方面,一是 SVM算法对大规模训练样本难以实施。由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算(m为样本的个数),当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。二是用SVM解决多分类问题存在困难。经典的SVM算法只给出了二类分类的算法,而在数据挖掘的实际应用中,一般要解决多类的分类问题。只有通过多个二类SVM
的组合来解决。
11、数据包络分析法
数据包络线(DEA)
企业管理者如何评估一所快餐分销店、银行支行、健康诊所或初等学校的生产力?衡量生产力有三重困难:第一,什么是系统适当的投入(如劳动力时间、材料金额)及其度量方法?第二,什么是系统
适当的产出(如现金支票、存款凭证)及其度量方法?第三,正确衡量这些投入产出之间关系的方法是什么?
1. 衡量服务生产力
从工程学角度看,衡量组织的生产力和衡量系统的效率相似。它可以表述为产出和投入的比率。例如,在评估一个银行支行的运营效率时,可以用一个会计比率,如每笔出纳交易的成本。相对于其他支行,一个支行的比率较高,则可以认为其效率较低,但是较高的比率可能是源于一个更复杂的交易组合。运用简单比率的问题就在于产出组合没有明确。关于投入组合,也能作出同样的评论。广泛基础上的指标,如赢利性和投资回报,和全面绩效评估高度相关。但它们不足以评估一个服务单位的运营效率。比如,你不能得到以下的结论:一个赢利的支行必定在雇员和其他投入的使用上是有效的。赢利性业务的比率高于平均水平比资源运用的成本效率更能解释其赢利性。
2. DEA模型
目前,开发出一种技术,通过明确地考虑多种投入(即资源)的运用和多种产出(即服务)的产生,它能够用来比较提供相似服务的多个服务单位之间的效率,这项技术被称为数据包络线分析(DEA)。它避开了计算每项服务的标准成本,因为它可以把多种投入和多种产出转化为效率比率的分子和分母,而不需要转换成相同的货币单位。因此,用DEA衡量效率可以清晰地说明投入和产出的组合,从而,它比一套经营比率或利润指标更具有综合性并且更值得信赖。
DEA是一个线形规划模型,表示为产出对投入的比率。通过对
一个特定单位的效率和一组提供相同服务的类似单位的绩效的比较,它试图使服务单位的效率最大化。在这个过程中,获得100%效率的一些单位被称为相对有效率单位,而另外的效率评分低于100%的单位称为无效率单位。
这样,企业管理者就能运用DEA来比较一组服务单位,识别相对无效率单位,衡量无效率的严重性,并通过对无效率和有效率单位的比较,发现降低无效率的方法。
DEA线形规划模型建立如下:
1) 定义变量
设Ek(k=1,2,……, K)为第k个单位的效率比率,这里K代表评估单位的总数。
设uj(j=1,2,……, M)为第j种产出的系数,这里M代表所考虑的产出种类的总数。变量uj用来衡量产出价值降低一个单位所带来的相对的效率下降。
设vI(I=1,2,……,N)为第I种投入的系数,这里N代表所考虑的投入种类的综合素。变量vI用来衡量投入价值降低一个单位带来的相对的效率下降。
设Ojk为一定时期内由第k个服务单位所创造的第j种产出的观察到的单位的数量。
设Iik为一定时期内由第k个服务单位所使用的第i种投入的实际的单位的数量。
2) 目标函数
目标是找出一组伴随每种产出的系数u和一组伴随每种投入的系数ν,从而给被评估的服务单位最高的可能效率。
(*) 式中,e是被评估单位的代码。 这个函数满足这样一个约束条件,当同一组投入和产出的系数(uj和vi)用于所有其他对比服务单位时,没有一个服务单位将超过100%的效率或超过1.0的比率。
3) 约束条件
(**)
k=1,2,……,K
式中所有系数值都是正的且非零。
为了用标准线性规划软件求解这个有分数的线性规划,需要进行变形。要注意,目标函数和所有约束条件都是比率而不是线性函数。通过把所评估单位的投入人为地调整为总和1.0,这样等式(*)的目标函数可以重新表述为:
满足以下约束条件:
对于个服务单位,等式(**)的约束条件可类似转化为:
k=1,2,…,K
式中 uj≥0 j=1,2,…,M vi≥0 i=1,2,…,N
关于服务单位的样本数量问题是由在分析种中比较所挑选的投入和产出变量的数量所决定的。下列关系式把分析中所使用的服务单位数量K和所考虑的投入种类数N与产出种类数M联系出来,它是基于实证发现和DEA实践的经验。
数据包络分析包括成本指标和效益指标
目前从国内外研究现状来看,财务预警分析主要分为两类:单变量预警和多变量预警分析。
1.单变量预警模型。单变量预警模型主要利用个别单一的财务比率来预测企业的财务风险。此类模型简单易懂,便于操作,但其本身存在的缺点巨大。首先,单个财务比率无法反映企业的整体财务状况。其次,管理层对财务数据的操纵会使单个财务比率作出的预警信息失去可靠性。再次,对同一家公司选取的财务比率不同可能得出的预测结果不同。
2.多变量预警模型。多变量预警模型是指运用多种财务比率加权汇总而构成线性函数公式来预测财务危机的一种模型。应用最为广泛的是美国纽约大学教授 Altman 的Z-Score 五变量计分模型。它克服了单变量预警模型的缺陷,基本涵盖了所有预测能力很强的指标,但局限性在于:它没有考虑到较为客观的现金流量指标,造成企业现实财务质量失真的存在。
3.模型的研究存在的问题。从国内外研究成果中可以看出,当前的预警模型基本运用会计数据和财务比率,而存在的问题在于:(1)机械性的将财务数据引入已有模型, 忽视模型适用经济环境和企业实际的不同,造成检验结果的失真。(2)进行实证分析时刻意寻求统一的参数去解决所有企业的问题,缺乏对参数选择的应变能力。(3)选取的预警模型的侧重点不同,使得财务指标不够全面,降低预警模型的解释能力。
(一)研究背景国外对财务预警的研究开展得较早,常见的方法有:一元判定模型(Univariate);多元判定模型(Multiple Discriminant Analysis ,MDA);多元逻辑(Logit)回归模型;多元概率比(Probit)回归模型;人工网络模型;联合预测模型;时间序列模型。
国内对财务风险及预警模型的研究开始于20世纪80年代中期。我国学者周首华、杨济华和王平在Z分数模型的基础,考虑了现金流量变动指标,建立了F分数模型。吴世农和卢贤义选取了70家ST公司和70 家非ST 公司,应用Fisher 线性判定分析、多元线性回归分析和Logistic 回归分析,分别建立三种预测财务风险的模型。最终研究结果表明,三种模型预测效果均较好,其中Logistic预测模型的误判率最低。
国内外大多学者以数理理论、多元统计方法为基础对预警系统的特征以及风险识别技术进行了深入研究,如 Edward Altman (1972) 的 Zeta 模型、Deakin模型(1972)、Blum 模型(1974)、Taffler 模型(1974)、Diamand 模型(1976)、Logistic 模型(1977)、Marais模型 (1979)、Casey 模型 (1985)、周首华(1996)F 分数模型、杨保安(2001)BP 神经网络预警系统等,这些多变量风险预警模型大多采用截面数据进行静态预警。