CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名任务型对话系统中对话管理方法研究
作者王唯康
答辩日期2020-05-28
文献子类博士
授予单位中国科学院大学
授予地点中科院自动化所
导师宗成庆
关键词自然语言处理 任务型对话系统 对话管理 强化学习 对话策略
学位专业模式识别与智能系统
英文摘要

任务型对话系统指通过对话交互的方式辅助用户完成特定任务(订餐、订机 票等)的人机交互系统。一般而言,任务型对话系统由语言理解、对话管理和语 言生成模块组成。其中,对话管理模块负责记录用户的对话状态,并按照某一对 话策略选择系统行为,是整个任务型对话系统的核心。近年来,对话管理技术取 得了较为丰硕的成果。然而,已有的工作主要关注封闭领域下的对话管理方法。 当遇到新的用户行为时,系统往往会给出不合理的回复。此外,已有的对话管理 方法无法根据客观知识灵活地制定交互策略,只适用于处理简单的槽填充任务。 缺乏知识建模能力极大地限制了任务型对话系统的应用范围。针对上述不足,本 文围绕提升对话管理模块的可维护性、在线学习能力和知识建模能力展开。 

论文的主要贡献和创新归纳如下: 

(1)提出了一种基于教师-学生框架的对话管理维护方法 

针对基于强化学习的对话管理模块难以维护的问题,论文提出了一种基于 教师-学生框架的对话管理维护方法。其中,“教师”指现有的对话资源。它包 括原始对话管理模块、人机交互日志和用于处理新的用户行为的对话规则。“学 生”指新本体结构下的对话管理模块。论文提出的方法通过定义“学生”的学习 约束,直接把“教师”的对话知识迁移到“学生”中,从而避免了从零开始训练 新对话管理模块。实验表明,使用该方法扩展后的模型取得了和利用强化学习重 新训练得到的模型可比的性能,但是本文提出的方法的训练开销远低于后者。 

(2)提出了一种基于增量学习框架的任务型对话系统设计方法 

针对现有对话系统缺乏在线学习能力的问题,论文以客服场景为例提出了 一种基于增量学习框架的任务型对话系统设计方法。该方法可以通过不确定性 评估模块估计系统给出正确回复的置信度。在置信度较高时,系统会回复用户的 提问。否则,人工客服将接管对话。当人工客服回答结束后,系统会通过在线学 习模块更新模型参数。实验表明,使用该方法设计的系统对新的用户行为更为鲁 棒,且能够在线地累积对话知识。更重要的是,不确定性估计模块能够引导人类 标注最有价值的对话数据。因此,对话系统能够以更少的数据标注代价取得更好 的效果。

(3)提出了一种用于身份欺诈检测的任务型对话系统设计方法 

针对现有对话管理不具备知识建模能力的问题,论文以贷款申请中的身份 欺诈检测任务为例探讨了对话管理中的知识建模技术。具体而言,论文为每个贷 款申请者构建了一个和其身份信息相关的知识图谱。基于该知识图谱,论文提出 了结构化的对话管理模块。该对话管理模块由基于知识图谱的对话状态追踪器 和层次对话策略模块组成。对每个申请者而言,基于知识图谱的对话状态追踪器 会把知识图谱中和申请者身份信息相关节点的表征视为对话状态。然后,层次对 话策略模块将基于层次强化学习探索反欺诈策略。实验表明,具备结构化对话管 理模块的系统能够在更短的交互轮次内更准确地识别出身份欺诈者。

语种中文
页码110
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39122]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
王唯康. 任务型对话系统中对话管理方法研究[D]. 中科院自动化所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace