kaldi在线识别

最新推荐文章于 2025-11-10 22:41:03 发布

原创

最新推荐文章于 2025-11-10 22:41:03 发布 · 3.8k 阅读

·

0

·

博客上搜到的都是清华大学的中文数据集thchs30，其实中文和英文的在线识别操作是一样的，我这里用英文librispeech数据集进行测试（kaldi官网上可以下载到数据集和训练好的模型）。

1、创建相关文件

从voxforge把online_demo拷贝到librispeech下，和s5同级。online_demo下建online-data和work两个文件夹，online-data下建audio和models两个文件夹，audio放要识别的wav，models放训练好的模型。

测试tri1模型

在models建tri1文件夹，将librispeech/s5/exp/tri1下的final.mdl和35.mdl拷贝到刚刚新建的tri1文件夹下，将librispeech/s5/exp/tri1/graph_tgpr下的words.txt和HCLG.fst也拷贝到刚刚新建的tri1文件夹下。

2、修改脚本

修改online_demo下的run.sh

2.1 将下面这段注释掉

if [ ! -s ${data_file}.tar.bz2 ];then

echo "Downloading test models and data ..."

wget -T 10 -t 3 $data_url;

if [ ! -s ${data_file}.tar.bz2 ]; then

echo "Download of $data_file hasfailed!"

exit 1

fi

fi

if [ ! -d $ac_model ]; then

echo "Extracting the models and data ..."

tar xf ${data_file}.tar.bz2

fi

2.2 修改模型类型

ac_model_type=tri2b_mmi改成ac_model_type=tri1

2.3 修改在线识别方式

有两种识别方式

online-wav-gmm-decode-faster读取wav文件列表中的语音，并将识别结果以指定格式输出

online-gmm-decode-faster从麦克风中读取语

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。