CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名事件图谱构建与自主演化关键技术研究
作者曹鹏飞
答辩日期2023-05-17
文献子类博士
关键词事件图谱构建 事件抽取 事件事实性判别 事件关系抽取 事件模式归纳
英文摘要

       知识图谱作为人类对客观世界认知的一种表现形式,以结构化形式存储人类知识,是实现从感知智能到认知智能跨越的重要组成部分。现有的大多数知识图谱都是以实体为核心,缺乏事件知识。然而,事件作为人类认知的重要单元,能够刻画动态变化的客观世界,表达更丰富的语义信息。通过构建事件图谱可以更好地推动认知智能的发展,并且支撑自然语言处理众多的下游任务。
       尽管近年来现有事件知识抽取方法在公开评测的数据集上取得了不错的效果,但是由于事件知识的结构复杂性和动态变化性的特点,在真实应用场景中构建事件图谱面临标注数据匮乏、篇章信息理解、背景知识依赖和新型事件涌现等难点问题。针对上述问题,本文对事件抽取、事件事实性判别、事件关系抽取和事件模式归纳等事件图谱构建所涉及的关键技术展开深入研究,以支持事件图谱的持续构建。具体来说,本文的主要工作和创新点总结如下:
       1. 基于提示学习的零样本事件抽取
       现有的事件抽取方法过分依赖大规模高质量的标注数据,但是在真实应用场景中事件结构复杂,标注成本高,不可能人工为每个事件类型标注充足的训练数据。针对标注数据严重匮乏的问题,本文提出一种基于提示学习的零样本事件抽取方法,该方法基于序列到序列的多语言预训练语言模型,通过设计语言无关的事件模板,实现跨语言的任务相关的知识迁移,从而缓解事件抽取任务中标注数据匮乏的问题。具体地,通过构造待填充的事件模板,把事件抽取任务建模成模板约束条件下的文本生成问题,从而可以有效地捕获事件元素之间的依赖关系,并利用语言通用的依存结构计算提示信息,实现填充模板的优化,以提升跨语言可移植性和事件抽取系统的性能。实验结果表明,该方法能够有效缓解标注数据匮乏的问题,显著提升了事件抽取的性能。
       2. 基于篇章信息建模的事件事实性判别
       现有的事件事实性判别方法局限于单句文本,但是真实应用场景中事件往往是由整个篇章或者段落描述的。针对篇章级事件事实性判别问题,本文提出一种基于篇章信息建模的事件事实性判别方法。不同于之前方法将局部信息编码成单个向量,该方法将局部信息建模为高斯分布,分别利用均值和方差表示局部信息的特征和重要程度,实现对局部信息语义的深度理解。在此基础上,根据局部信息之间的位置关系和语义关系构造篇章的图结构,利用非确定的图卷积神经网络对局部信息进行聚合和推理,从而突破单句文本限制,实现篇章级事件事实性判别。实验结果表明,相较于以往方法,该方法显著提升了篇章级事件事实性判别的性能。
       3. 基于外部知识注入的事件因果关系识别
       现有的事件关系抽取方法仅利用文本信息,但是真实应用场景中事件关系的表达形式非常多样化,往往需要利用文本信息和背景知识联合推断。针对背景知识利用不足的问题,本文提出一种基于外部知识注入的事件因果关系识别方法,该方法利用描述图归纳模块从知识图谱和预训练语言模型中获取事件的描述性知识,并使用图卷积神经网络进行编码;同时,利用关联图归纳模块学习事件之间的关联图结构,并使用稠密连接的图卷积神经网络对关联性知识进行编码。在此基础上,联合使用上述两种多粒度知识进行事件因果推断。实验结果表明,该方法通过利用外部的背景知识,实现了事件因果关系的准确识别。
       4. 基于类型演化与增量学习的事件图谱持续构建
       现有的事件抽取方法通常假设有预先定义好的封闭事件类型集合,但是真实应用场景中新的事件类型是不断出现的。针对新类型事件不断涌现的问题,本文提出一种基于类型演化与增量学习的事件图谱持续构建方法,该方法设计了邻域对比学习算法和动态边际损失函数使得模型能够自动发现新事件类型,并利用自顶向下的贪心扩展算法将其链接到现有的事件类别体系上,实现事件类别体系的自主演化。在此基础上,使用增量学习实现事件知识抽取模型对新类型事件的持续学习,不断提升事件知识抽取模型的覆盖范围,从而实现事件图谱的持续构建。实验结果表明,该方法能够有效地扩充事件类别体系,以及提升事件抽取模型对新类型事件的抽取能力。

语种中文
页码150
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/52136]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
曹鹏飞. 事件图谱构建与自主演化关键技术研究[D]. 2023.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace