题名基于信息融合的知识图谱推理算法研究
作者王子康
答辩日期2021-05-22
文献子类博士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师曾大军 ; 李林静
关键词知识图谱 知识表示 知识推理 自然语言处理
学位专业计算机应用技术
英文摘要

      知识图谱是存储知识的大规模图数据库,可以为各种人工智能任务提供外部知识支持,在知识搜索、智能问答、推荐系统等多个应用中具有重要的作用。但是,各类应用中使用的知识图谱大都具有稀疏和不完整的缺点,如何推理出缺失知识,丰富和扩展已有的知识图谱,是本领域重要的研究问题。

      现有的知识图谱推理模型大多利用神经网络直接进行推理,忽略了大量有价值且易于获取的信息,如何挖掘和利用这些信息来提升推理模型的性能,是当前研究面临的一大挑战。本论文针对基于表示学习的知识图谱推理、面向事实核查任务的知识图谱推理及面向问答任务的知识图谱推理三大场景,分别提出融合外部信息(包括多模态信息和时间信息)、结构信息(包括路径结构信息和图结构信息)与先验信息的知识推理模型,以编码更丰富的信息,提升推理的效果。

      本论文的主要研究贡献包括:
      (1) 对基于表示学习的知识图谱推理,针对外部信息未得到有效利用这一问题,本论文提出了两个融合外部信息的模型,分别实现对多模态信息和时间信息的融合。融合多模态信息的知识图谱推理模型,引入实体的文本描述和图像描述两种外部信息,通过结合多模态自编码器和TransE模型来学习同时编码多模态信息和三元组信息的实体和关系的表示。融合时间信息的知识图谱推理模型,给三元组引入时序信息,将时间对实体和关系表示的影响划分为三种类型,并提出了对应的处理模型。实验表明所提出的模型可以有效捕捉实体和关系的时序信息。

      (2) 对面向事实核查任务的知识图谱推理,针对知识图谱结构信息未得到有效利用的问题,本论文提出了两个融合结构信息的模型,分别实现对路径结构信息和图结构信息的融合。融合路径结构信息的知识图谱推理模型,通过将注意力机制与路径表示相结合,相比于现有模型能更好地结合各条路径的语义信息,并能实现噪声过滤。融合图结构信息的知识图谱推理模型,将头实体与尾实体之间的图看作一个子图序列,利用图神经网络在头实体和尾实体之间逐步传递子图信息,实现头实体与尾实体之间关系表示的学习。实验表明,图结构信息不仅可以提升推理效果,还可以提高推理效率。

      (3) 对面向问答任务的知识图谱推理,针对知识图谱自身信息未得到充分挖掘和利用的问题,本论文提出了一种融合先验信息的模型。首先,模型根据知识图谱中已有的知识,构建反事实样本,并根据反事实样本来抽取先验知识;进一步,模型将抽取到的先验知识引入到基于强化学习的推理模型中,实现基于先验知识和神经网络的共同推理。在多个数据集上的实验和分析发现,先验知识不仅可以提升知识推理模型的效果,同时还能在一定程度上改善现有模型效果受推理路径长度限制的问题。

      (4) 展示并验证了本论文提出的知识图谱推理方法在自然语言处理应用中的效果。以自然语言推理任务为例,应用本论文第四章中提出的面向事实核查任务的推理方法,给传统自然语言推理模型引入基于知识图谱的关系学习模块,实现了为传统自然语言推理任务引入外部知识的效果,给模型效果带来了提升。

语种中文
页码132
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44750]  
专题自动化研究所_复杂系统管理与控制国家重点实验室_互联网大数据与安全信息学研究中心
推荐引用方式
GB/T 7714
王子康. 基于信息融合的知识图谱推理算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace