非线性最小二乘法-跟踪误差最小化
非线性最小二乘法—跟踪误差最小化
2010-09-28 | 16:31分类:matlab |
在研究分析中,我们常常使用非线性最小二乘法的方法对数据进行回归或归因分析。数据拟合可以发现数据数据自身逻辑关系、确定回归模型参数或根据已知数据进行预测分析。数据的非线性最小二乘法是用连续曲线近似的刻画或比拟平面或空间中离散点所表示的坐标之间函数关系的一种数据处理方法,是用解析表达式逼近离散数据的一种方法。
非线性最小二乘法具体分为两个步骤:1.确定拟合模型类型,2确定拟合模型参数。拟合模型类型有线性方程、指数方程、微分方程、多项式方程、混合方程等等。拟合方程的选择是一个复杂的问题。若拟合方程未知,通常使用反复测试的方法,即给定几种备选拟合模型,进行多次拟合,选择拟合效果最好的模型进行拟合。
指数基金(Index Fund),是以指数成份股为投资对象的基金,即通过购买一部分或全部的某指数所包含的股票,来构建指数基金的投资组合,目的就是使这个投资组合的变动趋势与该指数相一致,以取得与指数大致相同的收益率。1976年美国先锋基金管理公司(Vanguard Fund Co.)推出了世界上第一只真正意义上的指数基金—追踪标准普尔500指数的Vanguard 500指数基金,从此指数化投资开始正式登上金融舞台。复制指数的方法就有两大类:即完全复制(full replicate)和优化复制(optimized replicate)。完全复制就是购买标的指数中的所有成份证券,并且按照每种成份证券在标的指数中的权重确定购买的比例以构建指数组合从而达到复制指数的目的。以标准普尔500 指数为例,按市值比重购入全部500种成分股就可以完全复制指数。当然,实际情况要复杂的多,因为指数是一个“纸面上的组合”(paper portfolio),每种成份证券在标的指数中的权重时时刻刻在发生变化,以某一时刻的相对权重值来确定组合的结构显然不能保证组合的走势与指数完全一致,因此实务中即便是完全复制也要根据追踪误差的偏离状况对组合进行动态调整。不过,相对于其他复制方法来讲,这种方法的思想还是比较简单明了,而且构建的指数组合与标的指数之间保持高度的一致,较好地继承了标的指数所具有的代表性和投资的分散性,较容易获得比较小的追踪误差(tracking error)。然而这种方法有其优势,但也有很多不足,比如完全复制指数,特别是成分股较多的指数,比如威尔希尔5000全市场指数(Wilshire 5000 Total Market Index)等,所需资金量巨大,一般的投资者根本无此实力来完全复制指数,而且完全复制指数的指数组合通常规模巨大,如果市场容量较小,市场深度不足,短时间内买入或抛出整个指数组合必然会对市场造成很大的冲击,使得构建指数组合以及随后的组合调整所承受的冲击成本(impact cost)较高。此外完全复制指数还可能面临很大的流动性风险,以及可能导致较高的调整频率和追踪成本。
因此,考虑在最少的追踪误差范围内如何用少量的成分证券(少量资产)来实现对整个标的指数的优化复制(optimized replication)问题就显得尤为重要。所谓的优化复制指的是根据预先设定的标准选择部分成分证券并对其在组合中的相对权重进行优化再配置,从而使得构建出来的指数组合的追踪成本及其与标的指数之间的追踪误差控制在可以接受的范围之内。优化复制的方法又可以进一步细分为分层抽样(stratified sampling)和优化抽样(optimized sampling)两种。前者是两阶段优化法,即第一阶段是抽样,第二阶段则是权重的优化再配置,使得组合的表现与标的指数相一致,同时保证较小的调整频率和追踪成本。与之不同,优化抽样属于单阶段优化法,即把抽样和权重优化再配置同时进行。不过无论是哪种方法都要用到最优化算法模型来进行求解,这是进行权重优化再配置的必经步骤。目前国外所用的最优化算法模型包括二次规划(quadric
programming)、线性规划(lineal programming)、鲁棒回归(robust regression)、蒙特卡洛模拟(Monte Carlo simulation)、遗传算法(genetic algorithm)、启发式算法(heuristic algorithm)等多种方法对指数组合进行优化求解。此外,研究者还尝试使用其他一些更复杂的方法来进行建模和求解,如随机控制(stochastic control)和随机规划(stochastic programming)等方法进行求解,这些最优化方法的应用使得指数追踪的效果得到了更好的改进。