聚类分析方法调研报告
中原工学院理学院本科毕业论文
调研报告
一、调查目的和手段:
调研目的:随着我国经济的进一步发展,信用经济正在也占据着越来越重要的地位,上市公司信用等级也日益受到投资人的重视,由此,信用评价环节也逐渐成为信用关系建立前的必要环节,准确有效的信用调查是上市公司从股民手中获取资金的基本保障,也是整个社会资金链的重要一步。建立一个良好的、有效的上市公司信用评价制度业对于投资人根据企业的盈利状况进行合理选择,以及上市公司的公平竞争,甚至整个市场经济的发展大局,都起着十分重要的作用,它可以使投资人在对企业融资的过程中,尽量减少因信息不对称造成的风险,促进证券市场资本的合理配置,实现企业与投资人的双赢。本次调研旨在利用图书文献资料,了解聚类分析的使用方法及其在企业信用方向的应用信息,为接下来的论文写作打下基础。
调研方法:利用知网等相关网站收集聚类分析方法应用于企业信用等级评价的相关论文与书籍资料,对聚类分析中的系统聚类、模糊聚类等方法进行深入掌握。
二、调研内容简述:
调研内容:首先收集若干家上市公司财务报表中净利润、净利润增长率、加权净资产收益率等数据信息,并找出这些数据与企业信用分类评价的联系。 首先,信用评级是根据科学的指标体系对被评级公司履行经济责任的能力及其可信任程度进行客观公正评价的过程。信用评级可分为外部信用评级和内部信用评级两种模式。外部信用评级主要由专门的评级机构做出,并给出相
应的信用统计信息。内部信用评级则是由银行或者企业根据内部模型给出,其中建立内部模型是新巴塞尔资本协议的核心内容之一,该协议正式允许金融机构使用其内部模型管理风险。从国际著名银行的风险管理方式来看,内部信用评级在信用风险管理中的作用日益增强。早期建立的内部信用评级方法是多元判别分析法。1968年,Altman率先将判别分析法应用于财务危机、公司破产及违约风险的分析,建立了著名的Z-score模型和改进的ZETA模型。1977年,Martin放松判别分析法中的正态分布假设,建立了Logistic回归模型,改善了公司财务数据在不满足正态分布的情况下判别方法的正确率。此外,还有几种常见的用于信用风险分析的统计方法:k―邻近法、主成份分析法、聚类分析法和分类树法等。进入20世纪90年代,神经网络引入了银行业,用于信用风险识别和预测。2000年,West建立五种不同的神经网络模型:多层感知器、专家混合系统、径向基函数、学习向量量子化和模糊自适应共振,用来研究商业银行信用评价的准确性。
国内对内部信用评级体系的研究方面起步较晚,目前主要是采用财务数据建立内部信用评级体系,取得了一定的成果。张玲(2004)利用Z值模型对我国上市公司进行信用评级,并分析了我国上市公司资信品质的一些特点。本文从最为常用的财务指标出发,采用上市公司的年报数据建立样本集合,并利用因子分析达到降维目的,把多个指标变量进行综合,以得出若干个能充分反映中国企业信用风险特征的主因子,然后把这些主因子作为聚类分析的变量,对样品进行聚类分析,最后通过分析微观因子的经济意义并结合S&P评级体系确定最后的企业的评级结果。
聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类
分析在统计分析应用领域已经得到了极为广泛的应用。聚类分析将分类对象置于一个多维空间中,按照它们空间关系的相似性(亲疏程度)进行分类,即聚类分析是一种建立分类的多元统计方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度进行自动分类,产生多个分类结果。类内部的个体在特征上具有相似性,不同类之间个体的差异性较大聚类分析中个体之间的“亲疏程度”是极为重要的,它将直接影响最终的聚类结果。对“亲疏程度”的测度一般有两个角度:
第一,个体间的相似程度;
第二,个体间的差异程度,通常是观察不同类的个体是否明显区别于其他类的个体。
通过众多资料用聚类分析方法对企业信用分类评价的研究,说明基于聚类分析方法可以作为企业信用评级的一种手段。由于目前中国上市公司的财务数据的质量并不是很高,收集数据十分有限,所以进行的评级只能是一个比较粗略的结果,对企业的信用的评级还有待于财务数据的完整和准确。 阅读的主要参考文献及资料名称:
[1] 奚胜田,詹原瑞,韩著钊.因子分析与聚类分析在企业信用评级中的应用
[J].北京:中国农机化,2009(01).
[2] 吴海建.多元统计的聚类分析方法及应用[J].郑州:河南省情与统计期刊,2003,3:34-35.
[3]王庆健.聚类分析在上市公司财务数据中的应用研究[N]. 安徽电子信息职业技术学院学报,2007,2(6):88-89.
[4]苗杰,银建华.聚类分析在上市公司绩效评价中的应用[N].昌吉学院学报,
2009,4:94-96.
[5]何晓群.多元统计分析[M].北京:中国人民大学出版社,2011.
[6]冯伟.聚类分析在金融数据分析中的研究[D].沈阳:辽宁师范大学应用数学系,2009.
[7]Pang-Ning Tan,Michael Steinbach,Vipin Kumar,et al.Introduction to Date Mining[M](范明,范宏建等译),北京:人民邮电出版社,2011,305-402.
[8]曹小奇,郭焦锋等. 我国民营企业信用调研报告[R].北京:国务院发展研究中心,2005(05).
三、调研总结:
通过对论文课题内容的深入挖掘及对聚类分析方法的掌握,这次调研我掌握到了很多有用的信息。
第一,翻阅的资料中对聚类分析的讲解十分透彻,在掌握了系统聚类、模聚类的方法后,我可以对接下来的论文写作做到有的放矢。
第二,在上市公司的金融数据上,聚类结果可以指导我们对企业有一个较准确的认识,可以给投资者以建议。一方面,分析各类股票的业绩指标可以判断出绩优的类和绩差的类,高成长的类和低成长的类,由此投资者可在某一类或几类中确定投资范围,提高了投资决策的效率和准确性;另一方面,从聚类的结果中得出类的均衡价格水平,预测股票的价格趋势。低于这一价格水平的,其当期市价与均衡价格的差距就是该股票价格可能的上涨空间,投资者若把握时机对这类股票进行长期投资则承担的风险较小,获利的可能性较大。
第三,通过对企业信用分类评价相关资料的查阅,我了解到建立信用评价模
型需要对企业的股票数据进行综合分析,不能片面纠结于其中一点,才能得出最准确的信用评价结果。另外运用民生证券钱龙金典版进行数据收集时,需要选取不同行业的企业,避免选取企业的重复性。
第四,在对何晓群《多元统计分析》的阅读中,SPSS软件的重要性值得重视,聚类分析需要借助SPSS软件对数据进行处理,在熟练掌握软件操作后,可以很方便的将各种聚类方法应用到信用分类评价中去。