以上内容来自于《自然语言处理实践,聊天机器人的技术原理与应用》
问答系统是信息检索系统的一种高级形式,它通过 Web 搜索或链接知识库等方式,检索到用户问题的答案,并用准确、简洁的自然语言回答用户。问答系统更接近信息检索中的语义搜索,针对用户用自然语言提出的问题,通过一系列的方法生成问题的答案,但与信息检索系统的不同在于,问答系统根据用户的问题直接给出精准的答案,而不是给出一系列包含候选答案的页面。系统生成答案的过程虽然也涉及简单的上下文处理,但通常是通过指代消解和内容补全完成处理操作的。问答系统主要针对特定领域的知识进行一问一答,侧重于知识结构的构建、知识的融合与知识的推理。
问答系统在任务上与很多相关领域的任务有共同点。例如,问答系统与信息检索均需要根据用户提出的问题在 Web 上进行答案信息的检索,问答系统与数据库查询(Database Query)均需要在数据库或知识库上进行答案信息的查询。问答系统与信息检索、数据库查询又有所不同,下面是三者各自的特点及各自适用的场景。
三者特点的对比如下。
1.信息检索
(1)以关键字作为输入,以文档或结构化的数据作为输出
(2)用户需要让搜索引擎「明白」搜索意图。
(3)想要获得令人满意的信息可能要依赖多种检索操作。
(4)信息检索是一个回复驱动的信息获取过程。
2.数据库查询
(1)以结构化的查询语句为输入,以数据记录(data record)或数据聚合(aggregation)等为输出。
(2)用户需要预先理解数据库的模式和数据库查询语言的语法。
(3)令人满意的查询结果可能依赖于多次查询操作。
3.问答系统
(1)以自然语言问题为输入,以准确的答案为输出。
(2)让机器承担更多数据解释的工作。
(3)问答系统是一个问题驱动的信息获取过程(Query-driven Information Access)。
三者适用场景的对比如下。
1.信息检索适用于简单信息的获取,问题可以用简单的关键字概括,并且网络上有大量相关的文档可供参考。
2.数据库查询适用于问题规模小而集中,仅存在少量语义异构信息的场景,这类场景对精确率和召回率的数值要求较高。
3.问答


5万+

被折叠的 条评论
为什么被折叠?



