阿里方面称,对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快,识别准确率更高。
目前主流的语音识别引擎解决方案都基本支持了MRCP协议,unimrcp也完成了和Kaldi的集成,所以DFSMN模型的使用对开源MRCP更是如虎添翼。

以下是Pull Requtests:

使用方式:
- 应用修补程序
- 该补丁是基于带有提交“04b1f7d6658bc035df93d53cb424edc127fab819”的Kaldi语音识别工具包构建的。
- ##看看补丁中的变化
- git apply --stat Alibaba_MIT_Speech_DFSMN.patch
- ##在实际应用之前测试补丁
- git apply --check Alibaba_MIT_Speech_DFSMN.patch
- ##如果你没有得到任何错误,补丁可以被干净地应用。
- git am --signoff
提交者信息:

通过开源组织的互相合作,共同分享,笔者相信Kaldi会越来越完善,完全可能成为目前商业语音识别引擎公司的强大的竞争对手。


unimrcp-MRCP协议学习分享,QQ群号:208136295
关注微信公众号:asterisk-cn,获得有价值的行业分享
freepbx 技术论坛:www.ippbx.org.cn
Asterisk, freepbx技术文档: www.freepbx.org.cn
欧米(Omni)智能客服解决方案
融合通信商业解决方案,协同解决方案首选产品:www.hiastar.com