题名 | 智能对话系统中的知识表示、激活与利用研究 |
作者 | 陈修意 |
答辩日期 | 2022-05-18 |
文献子类 | 博士 |
授予单位 | casia |
授予地点 | 中国科学院自动化研究所 |
导师 | 徐波 |
关键词 | 对话系统,知识表示,知识对话生成 |
学位名称 | 工学博士 |
学位专业 | 模式识别与智能系统 |
英文摘要 | 人们在对话交流过程中通过话语的字面意义来传递其真实意图,话语的字面意义是意图的载体,但意图并不完全是话语字面的意义。因此,在人机交互时,智能对话系统不仅需要词法、句法等基本的语言知识来解读话语的字面意义,还需要背景知识、百科知识、领域知识和常识等知识来理解用户的真实意图。此外,作为新一代人机交互界面,智能对话系统需要具备与外部知识库交互的能力,来满足用户的信息获取需求,为用户提供更好的信息服务。自然语言处理中常见的知识形式有结构化知识库和非结构化知识库以及预训练的模型参数,因此,本文以结构化、非结构化和预训练模型参数等典型形式的知识为研究对象,研究对话系统中的知识建模问题,并重点关注其中的三个子问题:面向对话的知识表示问题、对话过程中的知识激活问题以及对话回复时的知识利用问题。
1. 基于工作记忆模型的任务型对话生成研究 任务型对话系统依赖于背景知识库信息来帮助用户完成特定任务,现有端到端模型通常采用记忆网络来建模知识库信息。但是这些记忆增强的模型通常混淆对话文本和知识库信息,将其同等对待并存储在一个记忆中。受到心理学工作记忆研究的启发,本文提出一个用于对话回复生成的工作记忆模型。首先,本文采用基于记忆网络的语义记忆与情景记忆来分别编码与存储知识库实体与对话上下文;其次,本文提出的工作记忆模块与两个记忆模块进行迭代式交互,从中激活词汇分布、对话上下文的拷贝分布以及知识库实体的拷贝分布;最后,本文提出基于哨兵思想的词汇选择策略,该策略从三个分布进行词汇选择,将知识库实体恰当地拷贝到对话回复中。此外,本文还提出上下文感知的记忆编码来缓解对话中的未登录词问题。实验结果表明,本文所提方法能够较为准确地激活记忆中的情景词与语义实体,并在对话生成过程中利用这些激活的实体,提升了任务型对话系统的准确性与信息量。 2. 基于后验信息增强的对话知识管理研究 知识对话的前提是知识获取与激活,为此本文研究知识对话系统中的知识选择与对话生成联合建模问题。这是两个相辅相成的子任务:对于相同的对话上下文,不同的人可能会选择不同的知识文本来产生不同的对话回复,以及如果人们预先知道对话回复就能反过来推断知识选择策略。现有主流方法采用基于隐变量模型的知识管理,本文首先分析隐变量模型在先后验知识选择利用上的差异,然后提出基于后验信息增强的对话知识管理器。本方法首先采用键-值记忆网络将文本知识编码为文本级和单词级表示;然后采用后验信息预测模块来增强文本级的知识选择;最后使用基于知识蒸馏的训练策略来消除知识选择的暴露偏差。实验结果表明,该方法能够弥合隐变量模型在先后验知识选择利用上的差异,提升了知识选择的准确率与对话生成的信息量。 3. 基于预训练语言模型的知识对话系统研究 在对话交流过程中,人们会依据外部世界感知的信息以及从记忆中抽取的信息来理解话语,其中记忆分为外显记忆和内隐记忆。近期,预训练语言模型以自监督训练的方式学习大规模文本里的知识,大幅提升了下游任务的性能,分析性实验表明预训练语言模型能够将知识隐式地存储在模型参数中。因此,本文首先在对话生成任务上分析了多领域预训练微调机制的有效性,然后在生成式与检索式两类对话系统中探索如何将预训练模型的隐性知识与显式的结构化知识融合。在生成式对话系统中,本文提出两种知识图谱线性化方式将外部知识融入生成式预训练模型中;在检索式对话系统中,本文使用基于预训练模型的单流编码器将对话文本和知识图谱进行深层交互以选择候选回复。实验结果表明,该方法能够有效地利用显性和隐性知识,提升多领域知识驱动的对话系统的性能。 |
语种 | 中文 |
学科主题 | 自然语言处理 |
页码 | 132 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/48666] |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 陈修意. 智能对话系统中的知识表示、激活与利用研究[D]. 中国科学院自动化研究所. casia. 2022. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论