金融时间序列聚类分析方法比较研究
龙源期刊网 http://www.qikan.com.cn
金融时间序列聚类分析方法比较研究
作者:赵冲
来源:《时代金融》2013年第17期
【摘要】本文研究目的是通过使用金融时间序列聚类方法验证收益率序列相似的公司是否属于同一个行业。由于金融时间序列数据不服从正态分布,不能用线性相关系数来进行相似性度量,因此文中选用几种非线性相关系数来对金融序列相似度进行度量,然后运用PAM 、agnes 、diana 三种聚类方法分别对金融时间序列进行聚类。研究发现:最终聚类结果和初始的行业分类比较吻合,表明同一个行业中的股票收益率相似度很大。
【关键词】非线性相关系数 相异度度量 聚类方法 验证统计量
引言
时间序列聚类在很多领域有重要的作用,如金融和经济,工程学和生命科学等等。时间序列聚类有多种方法,聚类时通常要构建两个时间序列之间的相异度度量。如Piccolo (1990)
[14]和Maharaj (1996)[12]提出的基于扩展的自相关系数的距离,Galeano (2000)[7]提出基于自相关的距离,Tong 和Dabas (1990)[15]提出基于残差拟合的距离,Bohte (1980)[3]提出基于交叉相关系数距离,Caiado (2006)[5]提出基于周期图的距离,Maharaj 和D’Urso(2010)[13]提出基于谱的相异度度量,Berndt 和Clifford (1996)[2]提出动态时间扭曲距离,De Gregorio(2008)[6]提出马尔科夫算子距离,等等。
时间序列聚类分析在金融领域显得尤为重要,因为金融从业人员对金融资产之间的相似性很感兴趣,通过研究资产之间的相似度,对资产进行聚类,来进行投资和风险管理。因此,金融研究者提出了很多统计方法来分析资产价格序列的相似结构。例如,Mantegna 和Bonanno (2001)[4]使用Pearson 相关系数来度量两个股票收益率序列之间的相似度。考虑到金融时间序列的波动性,Caiado 和Crato (2006)[5]提出了一种描述两个股票收益率数据之间动态特征的的类Mahalanobis 距离度量方式,并且提出了一种聚类程序来对DJIA 指数进行聚类。
本文中,通过Hoeffding’D,Kendall’sτ和Spearman’sρs三种相关系数分别来定义金融时间序列的相似度,然后运用PAM 、agnes 、diana 三种聚类方法对相异度度量矩阵进行聚类,从而对不同的相似度度量方法和聚类方法进行比较。这对实际中进行金融时间序列分析有借鉴作用。
文章结构分为四个部分,第一部分介绍几种了相关系数和相异度度量方法;第二部分介绍了几种聚类方法和聚类评价标准;第三部分运用股票收益率数据进行了实证分析;第四部分做出总结并提出相关建议。
一、相关系数和相异度度量