06对数量化与自适应量化
对数量化
语音信号是非平稳的,例如在一秒钟内短时(32 ms语音分段)方差的动态范围可超过40dB 。短时方差随着不同的讲话人还会有20dB 的动态范围。
对数量化最大信噪比虽然没有最佳量化器的高,但动态范围大,可直接用于语音信号的量化。8比特/样值的对数量化可以达到12比特/样值的线性量化的效果。 ❒ 理想对数量化压缩特性为:
C (x ) =
1B
1
, ln x , 与输入信号概率分布无关, C ' (x ) =
Bx
❒ 量化噪声方差为:
σ
2
q
≈
V
2
22
3L
⎰
2
V
-V
p x (x ) [C ' (x ) ]
V
-2
dx
= ≈
V B 3L
22
⎰
2
-V
x p x (x ) dx
B V 3
2
2
2
,与输入信号方差成正比,这时:
⋅2
-2R
B V 3L
2
σ=
2x
σ
2x
❒ SNR
SNR =
σσ
2x 2q
=
3L
2
22
B V
=
3B V
2
2
⋅2
2R
, 与输入信号的方差无关。
❒ 对数量化的方法已经应用于ITU-T (CCITT) G.711 64 kb/s PCM中。
理想对数压缩无法实现,x →0时C (x ) →-∞,将对数量化特性在x →0的小信号区域进行修正。G .711采用A 律和μ律两种压缩特性: ◆A 律(Cattermole ,1969)压缩:
1⎧Ax
0≤x ≤⎪⎪1+ln A A
C (x ) =⎨
⎪1+ln Ax 1
是使压缩特性在原点附近为线性的,而对于大的输入语音样点值具有对数压缩特性。
式中若A =87.56(欧洲PCM 标准),SNR 增加24.08dB 。A 律压缩的量阶比为:max {∆}=A 。
min {∆}
◆μ律(Holzwarth 1949, Panter and Dite 1951, Smith 1957)压缩:
C (x ) =
ln(1+μx ) ln(1+μ)
是准对数压缩。对小信号是线性的,而对于大信号具有对数压缩特性。 式中若μ=255(北美PCM 标准),SNR 增加33.25dB 。
μ律压缩的量阶比为 max {∆}
=1+μ
min {∆}
=256
❒ 实际实现时压缩曲线分别用13段折线 (A律) ,和15段折线(μ律) 近似。
自适应量化
若输入信号是非平稳的,可以采用自适应量化算法。尤其在语音信号的低比特率编码,粗量化的情
况下,量化误差明显减少。采用自适应量化算法付出的代价之一是引入了编码延时。
❒ 自适应量化:自适应量化根据输入信号短时方差,对量阶大小进行调整,使量阶的大小化与输入信号电
平匹配,进一步改善量化效果。 ❒ 自适应量化分类:
◆ 前向自适应量化 Forward Adaptive Quantiser(AQF ), ◆ 后向自适应量化 Backward Adaptive Quantiser(AQB )。 图1是这两种自适应量化器的原理示意图。
前向自适应量化器
后向自适应量化器
图1自适应量化器原理示意图。
❒ 特点:
◆ AQF:信号的短时方差从输入信号X(n) 中估算。估值不受量化噪声影响,但是延时大,要传边信息。
◆ AQB:后向估值器由量化器输出的最近的过去值来提取量阶信息∆(n ),所以避免了估值延迟与电平传输问题;但是估值受量化噪声影响,降低了电平跟踪性能。
◆ 采用自适应量化明显提高分段信噪比。 (1)输入信号方差或电平的估值
◆ 量阶自适应按如下关系,能够跟随输入方差的变化:
AQF
ˆx (n ) ∆(n )=K (R )⋅σ
2
(1)
⎡1
ˆx (n ) =⎢σ
⎣M
M -1
∑
i =0
⎤2
x (n +i ) ⎥
⎦
(2)
这里R 表示量化比特数,K (R )=∆opt x ,表示规一化最佳均匀量化器的量阶。查表1可得到具有不同概率密度函数的K (R )。 AQB
ˆx (n ) ∆(n )=K (R )⋅σ
(3)
⎡1
ˆx (n ) =⎢σ
⎣M
M -1
1
∑
i =0
⎤
y (n -i ) ⎥
⎦
2
(4)
表1 规一化最佳均匀量化器的量阶和最大信噪比
U :均匀或者矩形分布, G :高斯或者正态分布, L :拉普拉斯或者双边指数分布,
Γ:伽玛分布。
为简化算法,在自适应量化中,对输入信号电平的估值也可采用如下两种方法:
◆ 短时最大幅值绝对值
AQF:
∆(n )=K 1(R )⋅x x
max
(5) (6)
max
=max x (n +i ) , i =0, 1, M -1
AQB:
∆(n )=K 1(R )⋅y
max
(7) (8)
y max =max {y (n -i ) }, i =0, 1, M -1
◆ 短时幅度绝对值平均
AQF:
⎡1
∆(n )=K 2(R )⎢
⎣M
M -1
∑
i =0
⎤
x (n +i ) ⎥, i =0,1, , M -1
⎦
(9)
AQB:
⎡1
∆(n )=K 2(R )⎢
⎣M
M -1
∑
i =0
⎤
y (n -i ) ⎥, i =0,1, , M -1
⎦
(10)
❒ 在对AQB 短时方差进行估值时,常在计算中加指数窗,这时:
∞
ˆ(n ) =(1-α) ∑ασ
i =1
2x
i -1
y (n -i ) ,
2
(11)
0
(1-α) : 使加权系数总和为1的归一化项
α
ˆx (n ) 愈少受过去y (⋅) 值的影响 愈小,σ
α→1,接近于不加窗
❒ 改写为递归形式:
ˆx (n ) =ασˆx (n -1) +(1-α) y (n -1) , σ 0
2
2
2
(12)
系统传输函数 H (z )= 是低通滤波器
1-αz -α
系统冲激响应 h (n ) =(1-α)αn -1u (n -1)
相当于y 2(n ) 经过低通滤波器得到σˆx 2(n ) ,α决定了σˆx (n ) 随输入信号变化的速率。
2
◆ 定义h (n ) 衰减到e
-1
所用的时间为衰减时间常数,则有:
N
h (N ) =α=e
-1
-1
(13) (14)
N =(lnα)
-1
◆ 衰减时间常数为:
τ=NT S =(lnα
-1
) T S ≈
-1
T S 1-α
(15)
当采用频率为8KHZ 时α取63/64~127/128比较合适,τ为8~16ms ,同语音音节变化速度相匹配。
(2)乘子法自适应量化 由指数窗方差估值公式,有:
⎡(1-α) y (n -1) ⎤=⎢α+⎥2
ˆx (n -1) ⎣ˆx σσ(n -1) ⎦ˆx (n ) σ
2
2
(16)
由于:
ˆx (n ) ∆(n )=K (R )⋅σ
ˆx (n -1) ∆(n -1)=K (R )⋅σ
对于均匀量化器,量化电平y (⋅) 与量阶∆(⋅)的关系为:
y (n -1) =∆(n -1) H (n -1) /2
(17)
式中H 是幅度标号,H (n -1) 对于中升型量化器定义为:
±H (n -1) =1, 3, 5, , (L -1)
n -1时刻的信号量化电平y (⋅) 可由n -1时刻的H (⋅) 值确定,式(16)可写成:
∆(n ) ∆(n -1) =[α+(1-α) H (n -1) K
2
2
(R )
4]
(18)
❒ 定义量阶乘子:
M (n -1) =[α+(1-α) H (n -1) K
2
2
(R )
4]
1
(19) (20)
则有
∆(n ) =M (n -1) ∆(n -1)
n 时刻量阶∆(n ) 值等于(n -1) 时刻的量阶乘以
M (n -1)
因子,
M (n -1) 因子只取决于(n -1) 时刻采样值落于量化器的那一个量化电平上, 在每一量化电平上都有其对应的乘子M i ,它由式 (19) 确定,不受∆(.)影响。
当前的量阶∆(n ) 只与前一时刻的量阶∆(n -1) 和乘因子M (n -1) 有关,而M (n -1) 只和前一时刻的。乘子{M i }可以由式19求H (n -1) 有关,即只取决于前一时刻信号被量化到哪个电平层上(一比特记忆)
出,也可以用计算机模拟,根据最小均方误差准则,用实验的方确定。表2列出 R 为2或3比特时,高斯均匀自适应量化器的量阶乘因子理论值及实验值,其中α=1/2。
表2 R 为2或3比特高斯均匀自适应量化器的量阶乘因子
{M i }:理论值, {M i }exp :实验值。
从表2可以看到,量化电平的前一半(内层)量阶乘因子M i 总是小于1,而另一半(外层)M i
总是大于1,从内层到外层M i 逐渐增大。可以这样从物理意义上来理解:(n-1)时刻如果信号落入最内层量化间隔,说明量阶偏大,在n 时刻需要将量阶调小;反之,若(n-1)时刻信号落入外层量化间隔,说明量阶过小,甚至可能过载,在n 时刻需要将量阶调大。
自适应均匀量化器瞬时特性
在实际通信系统中还要考虑:
❒ 编码器、解码器量阶乘子一致问题。
由于∆(n ) =M (n -1) ∆(n -1) 会引起编码器、解码器量阶不一致的问题,要限制最大最小量阶。当不
讲话时,输入信号近似为零,编、解码器都趋向最小量阶∆min ,从而处于相同的初始状态。∆max ∆min 将决定量化器动态范围,一般取值100~1000,量化器动态范围可达到40~60dB以上。
❒ 增强抗误码性能
传输过程中的误码会引起编码器、解码器量阶乘子不一致的问题。
在收端,由于∆(n ) =M (n -1) ∆(n -1) ,会有误差积累,直至讲话停顿。为了缓解这种误差蔓延,可以
用加衰减因子的方法。
∆(n ) =M (n -1) ∆(n -1), 0
β
(21)
设n -1时刻发生一个误码,使编码器M i 与解码器M r 不一致,以后 l 个时刻都没有误码,则有:
⎛M i ⎫
⎪= ∆r (n +l ) ⎝M r ⎪⎭∆i (n +l )
β
l
(22)
称编码解码器量阶失调比,希望它随l 增大而趋向零。衰减常数按β
l
=e
-1
计算:
τ=lT S =(lnβ
-1
) T S ≈
-1
T S 1-β
(23)
采用β后 ,会使最大量阶变小,最小量阶变大,从而减小量化器动态范围。为此需重新调整量阶乘因子的值。