编者按:在对比智能语音机器人的使用效果时,我们一般会关注机器人的反应速度和机器人声音的自然性和流畅度。关于机器人声音效果影响因素的介绍可参考:《影响语音机器人声音效果的因素有哪些》。本文,企业服务汇主要为您介绍影响电话机器人反应速度的因素有哪些,以及常用的智能语音机器人语音识别技术有哪些,核心评测指标有哪些,如何提升机器人的语音识别率和语音识别效率。

 

➤  语音识别率影响因素

▌语音识别模型:语音识别的本质是将音频序列转化为文字序列转化,即将给定语音输入信号对应到匹配度最高的文字序列。实现流程可简单理解为:系统基于声学模型,将语音源与声学符号相匹配;再基于语言模型将声音序列输出为文字序列。语音识别系统的核心就在与声学模型和语言模型的构建。主流的声学模型有高斯混合模型(GMM)、深度神经网络(DNN)以及循环神经网络(RNN/卷积神经网络(CNN)模型,实际的应用中,语音识别技术厂商往往会采用混合模型的方式,综合各个模型的优势来提高语音识别的准确率。

▌抗噪音和远场技术:语音识别模型的搭建主要用于提升安静环境下的语音识别的准确性。那么在环境较为复杂,比如高噪声、多人说话、强口音、远场环境下时,如何保障语音识别的准确率呢?常用的技术方案有语音增强与分离以及语音模型自适应。语音增强与分离指的是在户外、车内等复杂环境下,系统通过对不同输入信号进行分离处理,再通过对人声信号增强来提高语音识别率; 语音模型自适应指的是在语音模型训练中加入正则项,以及使用非常少的参数来表征说话者特征等方式来训练系统对人声的识别能力。

 

➤  语音识别效率影响因素

语音识别效率会直接影响智能语音机器人会话的实时性,低实时性、高延时的系统无疑会导致客户体验差。语音识别效率提升的思路主要有三个方面:一是通过优化算法来降低运算时间成本;二是通过识别阶段硬件的运算能力来减少语音识别时间,但语音识别芯片的研发依赖于硬件厂商,语音机器人厂商可操作性不大,在采购电话机器人时可忽略这个方面;此外就是话语/语音识别和同步处理技术,即在语音识别的过程中,实时同步区分说话人,以提高系统效率。

 

➤  小结

以上,我们主要从技术层面为您介绍了影响智能语音机器人语义识别率和语音识别效率提升的主要因素。但其实企业在实际的选购过程中,很难去了解各家产品底层算法,而且国内目前绝大多数的智能语音机器人厂商都是采用了第三方的语音识别技术,以科大讯飞、百度、腾讯、阿里云、捷通华声、微软、IBM等为主,在此基础上开发自己的产品应用系统。因此,企业在选择电话机器人时,一方面可关注系统在业务逻辑方面的功能支持;另一方面可实际测试,对比各家机器人产品的语音识别效果。

立即注册查看完整版评测报告
马上注册         立即登录