编者按:智能语音识别系统目前已经实现商业化应用,广泛应用于客服行业,包括智能语音客服和智能客服呼叫中心。那么智能语音识别系统如何识别客户意图,如何判断智能客服系统的语音识别能力呢?本文我们将结合语音识别技术原理为大家回答以上问题。

 

➤  模式识别原理

智能语音识别系统是计算机技术和人工智能发展的产物,其对语音的识别处理依赖于计算机的运行计算,但是计算机只认识二进制编码,如何通过语音的形式让计算机了解客户的意图?目前大部分智能语音识别系统采用的是模式识别的系统方式,即系统包含特征提取、模式匹配、参考模式库三个基本单元,企业需要先建立和业务相关的语音模型,组成系统的参考模式库,在和客户进行语音沟通时,语音先经过设备转换成电信号输入智能语音识别系统,系统抽取电信号中的语言特征,与系统参考模式库中语言模型的特征进行比对,根据一定的搜索匹配策略,找出与输入语音匹配的模板,这样,智能语音识别系统就实现了对客户语音的“理解”。

显然最优结果与特征的抽取、语音模型的好坏、参考模式库是否全面都直接关联。但是智能语音识别系统怎么实现语音电信号的特征抽取和参考模式库的建立?

 

➤  语音识别技术(ASR)

人的自然语音可以用发音单元、字词、语句三个元素来表征,通过语音识别技术(ASR)在智能语音识别系统建立声学模型、词典和语言模型,就可以实现参考模式库的建立。

建立参考模式库时,首先是对语音信号处理,语音信号具有短时平稳性特点,可以先对语音信号进行分帧,将每帧信号都变换成系统更容易理解的特征;通过triphone等技术确定发音单元,构建声学模型,让系统理解声音和发音单元之间的关系;词典通过输入规定每个字的读音实现;语言模型则需要使用大量语音数据,通过Ngram或其他语言模型进行训练学习,让系统建立A问题出现后紧接着出现B问题的概率认知。

在实际沟通中,系统对语音信号进行处理,获取发音单元、字词、语句等特征,与建立的参考模式库进行匹配,理解用户意图。

 

➤  小结

智能语音识别系统本质上是一个模式匹配的系统,智能语音识别系统要识别用户意图,首先需要通过发音单元、字词、语句三个基本元素建立参考模式库,在与客户的语音沟通过程中,将语音转换成电信号抽取特征,再将其与模式库进行匹配比对而理解用户意图。在实际应用中,企业需要大量的语音数据对系统进行训练,才能建立并提高智能语音识别系统的语音识别能力。

立即注册查看完整版评测报告
马上注册         立即登录
* 新注册会员还能免费获得企业服务汇专家团队提供的定制报告
分享到: