任务型对话系统中对话管理方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 博士学位论文

题名	任务型对话系统中对话管理方法研究
作者	王唯康
答辩日期	2020-05-28
文献子类	博士
授予单位	中国科学院大学
授予地点	中科院自动化所
导师	宗成庆
关键词	自然语言处理任务型对话系统对话管理强化学习对话策略
学位专业	模式识别与智能系统
英文摘要	任务型对话系统指通过对话交互的方式辅助用户完成特定任务（订餐、订机票等）的人机交互系统。一般而言，任务型对话系统由语言理解、对话管理和语言生成模块组成。其中，对话管理模块负责记录用户的对话状态，并按照某一对话策略选择系统行为，是整个任务型对话系统的核心。近年来，对话管理技术取得了较为丰硕的成果。然而，已有的工作主要关注封闭领域下的对话管理方法。当遇到新的用户行为时，系统往往会给出不合理的回复。此外，已有的对话管理方法无法根据客观知识灵活地制定交互策略，只适用于处理简单的槽填充任务。缺乏知识建模能力极大地限制了任务型对话系统的应用范围。针对上述不足，本文围绕提升对话管理模块的可维护性、在线学习能力和知识建模能力展开。论文的主要贡献和创新归纳如下：（1）提出了一种基于教师-学生框架的对话管理维护方法针对基于强化学习的对话管理模块难以维护的问题，论文提出了一种基于教师-学生框架的对话管理维护方法。其中，“教师”指现有的对话资源。它包括原始对话管理模块、人机交互日志和用于处理新的用户行为的对话规则。“学生”指新本体结构下的对话管理模块。论文提出的方法通过定义“学生”的学习约束，直接把“教师”的对话知识迁移到“学生”中，从而避免了从零开始训练新对话管理模块。实验表明，使用该方法扩展后的模型取得了和利用强化学习重新训练得到的模型可比的性能，但是本文提出的方法的训练开销远低于后者。（2）提出了一种基于增量学习框架的任务型对话系统设计方法针对现有对话系统缺乏在线学习能力的问题，论文以客服场景为例提出了一种基于增量学习框架的任务型对话系统设计方法。该方法可以通过不确定性评估模块估计系统给出正确回复的置信度。在置信度较高时，系统会回复用户的提问。否则，人工客服将接管对话。当人工客服回答结束后，系统会通过在线学习模块更新模型参数。实验表明，使用该方法设计的系统对新的用户行为更为鲁棒，且能够在线地累积对话知识。更重要的是，不确定性估计模块能够引导人类标注最有价值的对话数据。因此，对话系统能够以更少的数据标注代价取得更好的效果。（3）提出了一种用于身份欺诈检测的任务型对话系统设计方法针对现有对话管理不具备知识建模能力的问题，论文以贷款申请中的身份欺诈检测任务为例探讨了对话管理中的知识建模技术。具体而言，论文为每个贷款申请者构建了一个和其身份信息相关的知识图谱。基于该知识图谱，论文提出了结构化的对话管理模块。该对话管理模块由基于知识图谱的对话状态追踪器和层次对话策略模块组成。对每个申请者而言，基于知识图谱的对话状态追踪器会把知识图谱中和申请者身份信息相关节点的表征视为对话状态。然后，层次对话策略模块将基于层次强化学习探索反欺诈策略。实验表明，具备结构化对话管理模块的系统能够在更短的交互轮次内更准确地识别出身份欺诈者。
语种	中文
页码	110
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/39122]
专题	毕业生_博士学位论文
推荐引用方式 GB/T 7714	王唯康. 任务型对话系统中对话管理方法研究[D]. 中科院自动化所. 中国科学院大学. 2020.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们