相关分析及其原理(全)
相关原理
一、两个随机变量的相关系数
通常,两个变量之间若存在一一对应的确定关系,则称两者存在着函数关系。当两个随机变量之间具有某种关系时,随着某一变量数值的确定,另一却可能取许多不同的值,但取值有一定的概率统计规律,这时称两个随机变量存在着相关关系。
下图表示由两个随机变量x和y组成的数据点的分布情况。
左图中个点分布很散,可以说变量x和变量y之间是无关的。
右图中x和y虽无确定关系,但从统计结果、从总体看,大体上具有某种程度上的线性关系,因此说他们之间有着相关关系。
变量x和y之间的相关程度常用相关系数ρxy表示
ρxy=E[(x−μx)(y−μy)]
ςxςy式中 E-------数学期望;
μx-------随机变量x的均值,μx=E[x];
μy-------随机变量y的均值,μx=E[y];
ςxςy-------随机变量x、y的标准差
ςx2=E[(x−μx)2]
ςy2=E[(y−μy)2]
利用柯西-许瓦兹不定式
故知|ρxy|≤1。当数据点分布愈接近于一条直线时,ρxy的绝对值愈接近1,x,y的线性关系度愈好,ρxy的正负号则是表示一变量随另一变量的增加而增或减。当ρxy接近于零,则可认为x,y两变量之间完全无关,但仍可能存在着某种非线性的相关关系甚至函数关系。
E[(x−μx)( y−μy)]2≤E[(x−μx)2] E[(y−μy)2]
二、信号的自相关函数
假如x(t)是某各态历经随机过程的一个样本记录,x(t+τ)是x(t)时移τ后的样本,在任何t=ti时刻,从两个样本上分别得到两个值x(ti)和x(ti+τ),而且x(t)和x(t+τ)具有相同的均值和标准差。例如把ρx(t)x(t+τ)简写成ρx(τ),那么有,
ρx(τ)=
将分子展开并注意到
limT→∞ x t −μx [x t+τ −μx]dtlimT→∞ 0ςx1T T x t dt=μx T011T limT→∞ x t+τ dt=μx T0
从而得
ρx(τ)=limT→∞ x t x t+τ dt−μx20ςx1T1T 对各态历经随机信号及功率信号可定义自相关函数RX(τ)为 RX(τ)= limT→∞
则
ρx(τ)=
RX τ
ςxRX τ −μx2ςx2 x t x t+τ dt T0显然ρx(τ)和RX(τ)均随τ而变化,而两者成线性关系。如果该随机过程的均值μx=0,则 ρx(τ)=
可得RX(τ)= ρx(τ) ςx2+μx2 自相关函数具有下列性质: 1)由ρx(τ)=RX τ −μx2
ςx 又因为|ρxy|≤1,所以μx2−ςx2≤RX τ ≤μx2+ςx2
2)自相关函数在τ=0时为最大值,并等于该随机信号的均方值φx2
RX(0)= limT→∞2 xtxtdt=φ xT01T
证明:任何正函数的数学期望恒为非负值,即
E{[X t ±X t+τ ]2}≥0
E{X2 t ±2X t X t+τ +X2 t+τ }≥0
而E[X2 t ]= E[X2 t+τ ]= RX(0)
带入前式可得2RX(0) ±2RX(τ) ≥0
于是 RX(0) ≥|RX(τ)|
需要注意的是
因为RX(0) ≥|RX(τ)|,所以并不排除在其他τ≠0的地方RX(τ)也有可能出现同样的最大值。
例如:随机相位正弦函数x(t)=x0sin(ω0t+φ)的自相关函数
RX(τ)=
在τ=2nπ
ω0x022cosω0τ x022,n=0,±1, ±2,⋯⋯时,均出现最大值。
取随机相位正弦波为x(t)=4sin(t+θ) 2π其中θ是在(0,2π)上均匀分布的的随机变量。
求自相关函数:
RX(t1t2)=E[X t1 X t2 ]=E[4sin(2t1+θ)∗4sin(2t2+θ)]
=16E[sin(2t1+θ)∗sin(2t2+θ)]
=16 0sin(2t1+θ)sin(2t2+θ)2πdθ
= [cos2(t1−t2)−cos(2(t1+t2)+2θ)] π042π2πππππππ1ππ=8 cos2(t1−t2)
syms t1 t2 k y1=4*sin((pi/2)*t1+k); y2=4*sin((pi/2)*t2+k); y=y1*y2; R=1/(2*pi)*int(y,k,0,2*pi); ezmeshc(R)
π
3)当τ足够大或τ→∞ 时,随机变量x(t)和x t+τ 之间不存在内在联系,彼此无关,故
ρ τ →0 ρX τ →R2 XXτ→∞τ→∞
4)自相关函数为偶函数,即
RX(τ)= RX(−τ)
证明: RX(τ)=E[X t X t+τ ]= E[X t+τ X t ] = RX(−τ)
5)周期函数的自相关函数仍为同频率的周期函数,其幅值与原周期信号的幅值有关,而丢失了原信号的相位信息。