编者按:对于想要引入聊天客服机器人的企业来说,聊天机器人方案类型是一个关键问题。现在很多企业都不清楚有哪几种具体的聊天机器人方案,今天企业服务汇就为您介绍聊天机器人的两种不同的技术方案:1、基于检索的模型;2、生成式模型,来帮助您更加好地了解聊天机器人。

目前在技术上聊天机器人方案可以分为两种:1、基于检索的模型;2、生成式模型。接下来企业服务汇就为您分别作一下详细介绍:

(一)基于检索的聊天机器人方案

所谓基于检索的模型,其表现形式类似于大家常见的搜索引擎:首先由人工事先定义好了知识库内容(包含问题库和答案库,以及两者之间的关联关系),另外在自然语言处理技术(NLP)的帮助下对用户提出的问题进行拆解分析,通过提取核心关键词、索引等方法与后台的知识库里的知识条目进行匹配,并将匹配度最高的答案返回到用户那边。

从上面的描述可以看出检索式聊天机器人的性能极依赖于其知识库的内容丰富度和内容质量,而搭建一个符合上述条件的知识库又是一个漫长浩大的工程——目前除了少数非常重视客服工作的大企业和一些AI服务商外,绝大多数的企业连最基础的客服知识库都没有,只能使用一些公开的第三方行业知识库。但是这些资源也存在着更新不及时、匹配度低等等诸多问题。

虽然有这个障碍,但是相比于生成模型,检索模型的开发非常简单。模型会提供更多可能的预测结果。即使检索模型无法获得100%的准确性回复,模型也会返回一个可能性最高的回复,同时能够确保没有不当或者语法的错误。总的来说现阶段基于检索的模型更为实用,唯一需要的重视的是企业自身专属知识库的搭建,这是目前阻碍聊天机器人在很多企业内部推广使用的最大的障碍。

(二)生成式模型下的聊天机器人方案

与基于检索的聊天机器人方案不同,生成式模型一般不用依赖于人工预设的知识库,而是可以依据从大量语料中习得的对话能力来与对象进行自然的聊天。从一般意义上来讲这一对话处理过程也更加接近于人类真实的思考和产生语言的过程。

但是使用生成式模型的聊天机器人是非常难建立和训练的:通常需要用上百万个具体的谈话案例来对机器人训练,让其能够进行质量较高的对话。另外生成式模型的聊天机器人有一个很大的缺点就是你不能完全确定模型会产生什么回应,它的回答是开放式的(与此相反,基于检索的聊天机器人反馈的回答完全来自于知识库内部的条目,回答不会脱离此界限)。微软研发的聊天机器人“Tay”就是应用了生成式模型的一个典型代表。因此目前生成式模型很少应用到商业聊天机器人上,而一般只用于娱乐、科研等少数用途上。

但随着深度学习技术的不断进步,其标志性的“Sequence-to-Sequence”方式可以很好的实现生成模型的框架,在可预见的将来让聊天机器人变得真正的“智能”起来。

 

➤  小结

基于检索的聊天机器人能够更好地回答那些指向明确、范围清晰的问题,并且能够避免犯各种低级的语法错误。但其不足之处在于回答很难跳出预定的答案库,并且需要人工花费很多时间和精力来对知识库和匹配规则进行维护与更新。

而生成式模型下的聊天机器人可以直接通过不断的对话资料来训练自己,从而显著降低知识库的维护成本,并且生成模型的回答没有明确界限,能回答的问题范围更加宽泛。但是好的生成式模型往往需要大量的训练语料,并且还需要克服“上下文分析”以及“意图识别”等障碍。

立即注册查看完整版评测报告
马上注册         立即登录

>>  相关阅读

如何挑选智能聊天机器人?

客服聊天机器人的演进

智能对话系统的多轮对话与单轮对话

聊天机器人如何识别用户意图

聊天机器人哪个好