语音编码技术:CELP与低比特率编码解析
1. CELP编码中的感知加权与后置滤波
语音编码的目标是在维持一定感知质量的前提下降低比特率,因此误差最小化并非最佳准则。感知加权滤波器旨在塑造噪声,使其被语音信号掩盖,通常大部分量化噪声能量会集中在语音信号能量较高的频谱区域。
常见的方法是用线性滤波器近似这种感知加权:
[W(z)=\frac{A(z/\gamma)}{A(z/\beta)}]
其中,(A(z))是预测多项式:
[A(z)=1 - \sum_{i = 1}^{p}a_{i}z^{-i}]
选择(0 < \gamma < \beta \leq 1),会使(A(z/\gamma))和(A(z/\beta))的根比(A(z))的根更靠近单位圆原点,从而产生更宽共振的频率响应。该感知滤波器会弱化共振峰附近量化误差的影响。常用参数选择为(\gamma = 0.8)和(\beta = 1.0),这简化了实现过程。此滤波器可轻松纳入矩阵(H),包含感知加权的CELP编码器如图所示。
尽管有感知加权滤波器,重建信号仍存在可听噪声。后置滤波器可在不降低语音信号质量的情况下,减少感知上无关频率区域的噪声。后置滤波器通常由强调共振峰结构的短期后置滤波器和增强信号周期性的长期后置滤波器组成。一种可能的实现是使用上述公式,取值(\gamma = 0.5)和(\beta = 0.75)。
2. 参数量化
为实现低比特率,所有系数都需量化。由于矢量量化的编码效率高,它是量化预测器系数的首选压缩技术。LPC系数不能直接量化,因为量化过程中的小误差可能导致频谱大幅变化,甚至使滤波器不稳定。因此,会使用保证稳
超级会员免费看
订阅专栏 解锁全文

2059

被折叠的 条评论
为什么被折叠?



