编者按:网易七鱼机器人除了系统自带的通用词库外,还面向企业提供了可自定义的词库。自定义词库可由企业自主编辑,主要服务于企业自有的业务场景。七鱼可自主配置的词库有专有名词、相似词库和停止词词库。关于七鱼知识库词库中各类词的的作用及配置方式介绍如下。

 

➤  自定义词库作用

▌相似词库:相似词库主要针对一些和企业自身业务相关的专有名词。这些词由于是企业业务相关专有名词,正常的自然语言语义理解中并不能知晓两者间的联系。比如“七鱼”和“七鱼云客服”指代同一实体,但由于这两个词为企业特有的词汇,不在汉语基本词库内,系统不知道两者可以等同;企业通过自主添加这类业务特有词汇的相似词,能够实现机器人的自定义配置,使机器人能够更加适应企业的服务场景,从而提高机器人自动回复的匹配率和解决率。

这里需要说明的是相似词库中仅需添加企业业务相关的专有名词的相似词,对于类似“高兴”、“开心”、“愉快”这类通用词,虽然其语义也是类似的,但机器人内置的词库里包含此类词汇,能够对此类词汇进行自行判断,无需重复添加。

▌停止词:停止词也叫干扰词、或噪音,指的是在一句话中无实际含义的字或词,比如,“为什么我的扣费凭证不显示呢”这句话中“为什么、呢”等均为停止词,添加停止词有助于训练机器人过滤干扰词语的能力,从而提高机器人的语义理解能力。

企业自定义的停止词库与相似词库类似,都不需要关注通用语料中包含的词语,只需添加行业或业务的专有词即可。就停止词而言,比如客户在查询特定型号手机的相关信息时,输入的型号中可能包含一些无实义的符号,如“&”“#”等,企业可将这类词添加为停止词,作为机器人停止词库的补充信息。

▌专有名词:专有名词指的是和客户业务高度相关的词语,比如,电商行业场景“请问这个海蓝之谜有折扣吗?”中的“海蓝之谜”;“麻烦帮我查下托运单的单号”中的“托运单”等。这类名词不在通用语料库中,企业自主添加后可以训练机器人准确识别这类词的业务含义,从而提高机器人自动回复的解决率。

 

➤  自定义词库设置

七鱼知识库中词库的配置方式较为简单,其中停止词和专有名词均支持批量导入添加或删除,词条内容也比较简单,管理员在特定词库内添加具体词即可。相似词的添加不支持批量操作,只能逐一添加。相似词词条的构成包括了标准词和相似词,一个标准词下面最多可添加3个相似词。

 

➤  小结

网易七鱼智能客服机器人要具备语义识别和语音理解能力,本身就具备相当量的词库,这类词库属于通用词库,是基于大量的会话数据整理形成的,其中包含了通用类的“停止词”和“相似词”。在此基础上,七鱼将机器人词库开放给企业,由企业结合实际的业务场景对词库进行补充添加。七鱼可自主配置的词库有专有名词、相似词库和停止词词库,以上我们对各类词的作用及配置和编辑维护方式做了详细的说明。七鱼自定义词库功能能够与企业业务相结合,能够显著优化机器人语义理解能力,从而提高自动回复的匹配率和准确率。

立即注册查看完整版评测报告
马上注册         立即登录

>>  相关阅读

网易七鱼工单系统:工单受理

网易七鱼工单系统:工单流转功能

网易七鱼知识库构成:寒暄库

网易七鱼知识库构成:知识点