欢迎订阅《FPGA学习入门100例教程》、《MATLAB学习入门100例教程》
本课程学习成果预览:

目录
1.软件版本
MATLAB2021a
2.MFCC理论概述
在语音识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale FrequencyCepstral Coefficients,简称MFCC)。梅尔倒谱系数是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性,它与频率的关系可用下式近似表示:
Mel(f)=2595∗lg(1+f/700)Mel(f)=2595∗lg(1+f/700)
Mel频率倒谱系数是语音信号的短时功率谱的表示,Mel频率倒谱系数是通过对数计算的DCT变换在频率的非线性Mel尺度上计算的。MFCC通常用作语音识别算法中的特征参数。在MFCC理论中,临界频带是解决分频问题的一个非常重要的概念,也是Mel频率的重要指标。引入临界带宽概念的目的是描述掩蔽效应。在相同的临界带宽下,如果噪声声压恒定,则噪声的响度恒定。但一旦噪声带宽超过临界带宽,响度将明显改变。
临界带宽(临界频带)将随着频率的变化而变
本文是MATLAB语音处理教程,介绍了MFCC理论和实现步骤。通过MATLAB仿真,利用mel滤波器组和DCT进行语音信号的MFCC特征提取,适用于语音识别等应用。
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



