中国证券市场股票价格预测模型综述
第25卷 第7期Vo.l25
四川教育学院学报
JOURNALOFSICHUANCOLLEGEOFEDUCATION
2009年7月
Ju.l2009
中国证券市场股票价格预测模型综述
王 浩
(洛阳理工学院工程管理系,洛阳 471023)*
摘 要:中国金融市场的证券价格存在着可预测成分。现有的各种统计预测方法基本都可以归纳为时间关系模型和因果关系模型两大类,详细分析了各种模型的实现方法并总结了其特点。
关键词:预测;股票价格;统计模型;综述do:i10.3969/j.issn.1000-5757.2009.07.058
中图分类号:F830191 文献标志码:A 文章编号:1000-5757(2009)07-0058-03
一、证券市场可预测性
有效市场理论指出,证券价格呈现随机游走特征,因此技术分析和掷骰子选出的股票,最终表现相差无几。大量分析却发现中国股票价格波动具有长期记忆性,拒绝了随机游走假设,即股市涨跌存在自身的规律,无论长期和短期都存在着可预测的成分,因而技术分析是有用的,通过采用
[1]
相应策略,投资者可以获得超常利润。中国证券市场呈
GARCH(广义自回归条件异方差)模型,从而认为对股票价格这样波动频繁的时间序列,从非线性系统角度建模略胜于
[2]
从非平稳时间序列角度建模。由于传统算法收敛速度慢且
全局寻优能力差,更多研究将精力放在对神经网络结构和参数的改进上。丁雪梅等发现改进后BP算法的预测结果比
[3]回归预测、指数平滑预测和灰色预测都要好。
神经网络预测方法的应用有两个明显特点。一方面,统计模式识别和数字信号处理等领域的特征选择和提取方法,如小波包最优分解方法、混沌吸引子理论、Kalman滤波算法、主成分分析、灰色系统理论,广泛用于神经网络输入参数的甄别。另一方面,新的网络模型不断被应用于证券预测实践以提高映射效率,如模糊神经网络和小波神经网络。预测结果明显优于普通神经网络模型。
神经网络的缺陷在于,网络结构只能事先指定或应用启发式算法在训练过程中寻找,需要在充分了解待解决问题的基础上,主要依靠个人经验来确定,没有统一的规范,往往需要通过反复改进和试验,最终才能选出一个相对较好的设计方案,并且网络训练过程易陷入局部极小点。不过,神经网络最致命缺点在于,无法表达和分析预测系统的输入输出之间的关系,难以解释系统输出结果。
2.灰色系统和随机过程模型
灰色预测普遍采用灰色系统模型,经由累加过程削弱原始数据的随机干扰,突出系统所蕴涵的内在规律,然后建立动态预测模型。马尔可夫过程是无后效性的随机过程,是一种应用极为广泛的传统方法。灰色系统GM(1,1)模型的解为指数型曲线,几何图形较为平滑,比较适用于具有增长趋势的问题,而对随机性波动较大的数据进行预测,会
现弱有效性的原因可能在于,作为一个新兴市场,法制、监管等因素造成市场信息传递效率低下,投资者在博弈中存在严重的信息和资金实力不对称,而且这种不对称状态并不能在市场中迅速消除,因此Fama所描述的概率上的/瞬时性0还无法达到,而这种市场结构的特点,使得某些/技术分析0成为信息挖掘的成本。
由于股票指数序列呈现高度的非线性,经典计量经济模型和时间序列模型的有效性受到了挑战。现代预测理论和统计学、信息技术、优化算法紧密结合,向复杂化和智能化方向发展。至少目前在我国,各种预测技术方兴未艾,投资者按照自己的经验采用各不相同的指标作为决策依据,在市场上低买高卖,获得了成功,也经历过失败。
二、主要预测模型1.神经网络模型
神经网络是一种大规模并行处理系统,具有良好的自学习能力、抗干扰能力和强大的非线性映射能力,能够从大量历史数据中进行聚类和学习,自动提取样本隐含的特征和规则,进而找到某些行为变化规律,可以实现任何复杂的因果关系。BP(反向传播)和RBF(径向基函数)神经网络是最常见的股市预测模型。崔建福等发现BP模型普遍显著优于
*
收稿日期:2009-02-23
作者简介:王浩(1973)),男,河南西峡人,副教授,硕士,研究方向:区域经济发展理论与数量分析。
第25卷(总第196期) 王 浩:中国证券市场股票价格预测模型综述影响预测精度。马尔可夫模型通常只能用于对数据波动区间的估计,不能进行具体数值的精细预测。因此,实际应用中两种方法常常结合在一起。王露璐等证实灰色马尔可夫
[4]
模型可以显著改善预测效果。
[9]
和泛化能力。
三、预测模型简要评价
各种预测方法虽然手段各异,但基本都可以归纳为时间关系模型和因果关系模型两大类。时间关系模型中,预测对象的演变过程与时间相联系,如混沌时序模型、灰色模型、随机过程模型等。因果关系模型认为被预测事物与其影响因素之间,在一定时间内保持着某种固定关系,如神经网络模型以及聚类模型等。时间模型直接从价格自身历史运动轨迹中寻找规律;因果模型则寻找影响价格变动的可能原因,试图在原因和结果之间建立某种有效和稳定的联系。不难发现,本文提及的众多模型具有许多共同的特点。
1.重大盘综合指数预测轻个股预测
大部分预测方法都是以上证或深证综合指数作为预测对象,而不是选择个股。大盘指数综合反映股市整体的涨跌变化情况,和个股相比,因不易受人为因素控制而更加稳定,波动幅度明显要小得多。夏景明等认为大盘指数的预测相对容易,方法如果在个股中推广中则有一定的难
[10]
度。个股中大量存在假突破、振荡洗盘、短期飙升和暴跌[11]等现象,导致预测的正确率较低。个股预测困难的实质
3.分形和混沌模型
金融市场公认具有典型的分形和混沌特性。分形方法使我们能分层次地了解复杂体系的内部精细结构和所富含的信息,有望找到多重分形参数和金融数据中大幅涨落间的关联性,从而以一定的概率反映和预测金融市场的剧烈动荡。周孝华等对金融资产价格持续大幅波动的开始及结
[5][6]
束做出预测。彭继兵等提出一种实时跟踪预测算法。
混沌指由非线性系统所产生的复杂不规则行为。到目前为止,对于混沌尚未有统一明确的定义,通常由系统的初值敏感性、非周期性、存在奇怪吸引子、确定性的随机现象、长期行为的不可预测性等特征来加以确定。分形和混沌方法运用于金融时间序列的研究具有巨大的优势和潜力。不仅如此,分形和混沌作为一种极其有效的非线性分析工具,广泛用于时序特征的提取,为神经网络输入变量选择提供
[7]依据。龙建成等对行情的高低点进行了较准确的预测。
人们常称中国股市是/政策市0和/消息市0,这的确反映了国内市场的某些特征。宏观上看,进出资金流量确实对整个市场的运动起到决定性作用,政策变化势必会改变资金流向,从而形成某一阶段的/趋势0,影响人们对价格的未来预期,进而改变投资者的投资选择,这种能量在价格系统里的释放往往服从一定的规律,这就是非线性预测模型兴起的原因。对非线性动力系统进行背景分析和研究,将神经网络、混沌理论、遗传算法、系统理论等最新理论与方法应用于金融领域,已成为一大热点。
4.统计模式识别模型
证券市场是一个呈现高度复杂性的非线性系统,直接预测价格波动的具体数值难度很大。如果将价格波动的方向按照一定的标准划分为不同的类别,如大幅上涨类、轻微下跌类等,这样就将价格预测问题转化为类别判断问题,就可以运用统计模式识别方法。首先分析影响证券价格波动的因素,根据识别对象的特征运用聚类或分类算法将其划分为不同类别,然后对于需要预测的未知样本,利用某种判别规则将其归入已知的类别中去,从而实现预测。王浩等
[8]应用改进的近邻算法进行了中长期预测。
在于,由于价格波动剧烈,可能导致不同时间段各自包含不同的数据结构,从而割裂历史和未来之间的联系。
2.重历史数据拟合轻未知数据预测
通常对模型性能的检验包括历史数据拟合能力和未知数据预测能力两方面。只要网络节点和隐层足够多,神经网络能以任意小的误差逼近任何函数。遗传程序设计方法同样能以极小的误差逼近任何非线性函数。其实,即便是最简单的高阶多项式也能够以零误差拟合任何离散数据。不过,模型的预测能力往往和拟合能力背道而驰,如神经网络。个股交易数据如果波动剧烈或包含太多的噪声,直接作为神经网络输入,一些特异样本会对网络参数产生显著影响,从而降低其预测性能。于是,时序分析中常常不得不采用变换和滤波方法。
3.变量选择对模型成败具有至关重要的影响
股价波动是诸多因素的综合反映,由于人们对非线性系统的内部运行机制缺乏深刻认识,很难判断哪些变量对预测目标有较大的影响。因此,有效地选取输入变量成为决定模型预测准确性的关键因素。常用的变量选择方法可划分为技术分析和基本分析两大类。小波分析、K-L变换、分支定界算法、粗集约简理论、因子分析等方法,广泛用于特征的选择和提取。
4.没有提供关于预测结果的风险估计
所有模型都没有区分不同预测结果的风险。看涨和看跌预测对投资者的现实影响是不相同的,其根本原因在于中国股市的现有交易制度,只有做多机制而没有做空机制,从而限制了可能的获利空间。并且,仅仅预测一个价格数
聚类方法的优越性体现在模型输入变量的选择极为自由,既可以从价格时序中提取特征,又可以选择影响价格变动的原因变量。金融市场特有的高度复杂性,使得传统聚类分析方法遇到强有力的挑战,如对高维空间稀疏数据以及不规则分布数据的分析。新兴的SVM(支持向量机)理论,能将很多现有方法纳入其中,为解决有限样本学习问题提供了一个统一的框架,具有比神经网络更好的拟合精度
四川教育学院学报 2009年7月值是远远不够的,还必须同时提供该预测结果的可信度指标,也即该预测准确的概率。
5.预测方法的长期有效性没有得到完全检验
大部分预测方法都是对10个交易日以内的价格进行预测,这本无可厚非。随着预测时间的延长,误差从总体上是上升的。其不妥之处在于,仅给出了对于极少数预测结果的验证,而没有在更大的范围或更长的时间段内进一步实证。通常认为,既然模型已经对历史数据进行了准确的拟合,并且短期预测成功的可能性很大,似乎随着时间的推移,不断将新数据纳入模型中,不就可以实现滚动预测了吗?其实只要看一下证券的历史走势就能发现,不同时期的波动特点差异甚大,此时需要改变的就不仅仅是模型参数,甚至还有模型结构本身。短期预测的成功往往包含太多的偶然因素,只有滚动预测结果才能够对模型的普适性提供更严格的检验。
6.重常规模式预测轻异动模式捕捉
证券预测的目的显然不是为了求得误差率的降低,而是据以发现能够以很大概率成功的获利模式,这意味着真正有意义的预测应该是异动点捕捉,也就是说发现股票价格出现异动(如大幅飙升)时的数量特征。熟悉中国股市的人都知道,的确有为数不多的情况出现了买入和卖出信号,相应地,这些信号可以带来极高的收益。真正的获利机会恰恰隐藏在波动剧烈的非平稳个股中间,而这却正是大多数预测方法无能为力的情况。对此,模式识别和智能化方法可能具有良好的效果。
四、预测方法未来发展方向
混沌和分形,作为主要的非线性科学分支,正处于快速发展阶段,新的研究成果不断被应用到金融领域,为证券预测提供了大量的方法。小波变换等优秀的时频分析工具,以及卡尔曼滤波等时序处理方法,广泛用于特征的选择和提取,并与神经网络方法相结合,遗传算法、蚁群算法、粒子群算法、多智能体系统以及模糊逻辑等现代智能方法成功地用于模型优化。一个明显的发展趋势是,各种方法的组合和综合模型层出不穷,预测效果逐步提高。组合方法的一个常用模式是,首先对变量集合进行预处理提取特征,得
到比原始数据更能准确反应预测对象特征的变量,作为非线性预测模型的输入,而模型的结构和参数则通过智能算法进行优化。参考文献:
[1] 苏治,方明,李志刚.STAR与ANN模型:证券价格非
线性动态特征及可预测性研究[J].中国管理科学,2008,(5):9-16.
[2] 崔建福,李兴绪.股票价格预测:GARCH模型与BP
神经网络模型的比较[J].统计与决策,2004,(6):21-22.
[3] 丁雪梅,伦立军,高为.基于BP算法的股票均价预测
技术研究[J].哈尔滨商业大学学报:自然科学版,2003,(6):638-640.
[4] 王露璐,邓丽,刘先涛.股票投资价值灰色马尔可夫
预测[J].商业研究,2004,(1):137-139.
[5] 周孝华,宋坤.高频金融时间序列的异象特征分析及
应用)))基于多重分形谱及其参数的研究[J].财经研究,2005,(7):123-132.
[6] 彭继兵,唐春艳.基于变维分形理论的卡尔曼滤波实
时跟踪预测模型在股票价格预测中的应用[J].计算机工程与应用,2005,(13):218-220.
[7] 龙建成,李小平.基于神经网络的股票市场趋势预测
[J].西安电子科技大学学报,2005,(3):460-463.[8] 王浩,刘荣利,黄登仕.重复剪辑近邻算法预测股票
价格波动趋势[J].管理科学文摘,2005,(9):54-55.
[9] 冯一宁,邵元海,陈静,等.基于层次聚类的大样本加
权支持向量机[J].计算机工程与设计,2009,(1):175-178.
[10] 夏景明,肖冬荣,夏景虹,等.灰色神经网络模型应
用于证券短期预测研究[J].工业技术经济,2004,(6):109-111.
[11] 辛治运,顾明.基于最小二乘支持向量机的复杂金
融时间序列预测[J].清华大学学报:自然科学版,2008,(7):1147-1149.
TheReviewonModelsofStockPriceForecastingintheDomesticSecuritiesMarket
WANGHao
(EngineeringManagementDepartment,LuoyangInstituteofScienceandTechnology,LuoyangHenan471023,China)
Abstract:Byempiricallytesting,manyresearcherspointoutthepredictabilityofstockpriceindomesticsecuritiesmarket.Almostallofthepresentforecastingmethodscanbeclassifiedintotwoparticularcategories:timerelationmodels,causeandeffectrelationmod-els.Thispapercomparesthemeansofrealizationsandanalyzesthecommoncharacteristicsofthesemodels.
Keywords:forecasting;stockprice;statisticmodels;review
(责任编辑:李 舒 责任校对:林 子)