python silk codec binding 支持微信语音编解码
pilk
python silk codec binding 支持微信语音编解码
pilk: python + silk
安装

pip install pilk
介绍与说明
SILK 是一种语音编码格式,由 Skype
公司研发,网上可找到的最新版本是 2012 发布的。
SILK 原始代码已上传到 v0.0.1 release , 包含规范文档
Tencent 系语音支持来自 silk-v3-decoder
v0.0.1 release
中也包含 silk-v3-decoder 重编译的 x64-win 版本
SILK 编码格式 和 Tencent 系语音的关系:
此处 Tencent 系语音,仅以微信语音为例
- 标准 SILK 文件以
b'#!SILK_V3'开始,以b'\xFF\xFF'结束,中间为语音数据 - 微信语音文件在标准 SILK 文件的开头插入了
b'\x02',去除了结尾的b'\xFF\xFF',中间不变
已下统称为语音文件
语音数据
语音数据分为很多个独立 frame,每个 frame 开头两字节存储剩余 frame 数据的大小,每个 frame 默认存储 20ms 的音频数据
据此可写出获取 语音文件 持续时间(duration) 的函数(此函数 pilk 中已包含)
def get_duration(silk_path: str, frame_ms: int = 20) -> int:
"""获取 silk 文件持续时间,单位:ms"""
with open

本文介绍了Python库pilk用于微信语音的SILK编解码,包括安装、SILK格式解析及快速入门示例。pilk支持标准SILK文件与Tencent系语音文件的转换,并提供了获取语音文件持续时间的函数。同时,文章还提到了音频文件与PCM数据之间的转换,以及如何利用ffmpeg进行转换。

1577

被折叠的 条评论
为什么被折叠?



