CORC  > 兰州理工大学  > 兰州理工大学
题名基于本体的语义检索方法研究
作者尉醒醒
答辩日期2016
导师王旭阳
关键词本体 语义检索 语义相似度 查询扩展 局部共现
学位名称硕士
英文摘要随着近几年科学技术的快速发展,互联网已成为人们获取信息资源的主要途径,在具有海量信息的互联网中,如何快速准确的获得所需要的资源成为了迫切需要解决的问题。传统的检索系统或搜索引擎主要是通过机械式的匹配关键词进行检索,对查询请求及信息资源缺乏语义层面上的理解与分析,导致实际检索结果与用户的查询需求不匹配。本体作为一种很好的概念建模工具,不仅能够在语义和知识层次上描述信息,反映概念之间的关系,而且支持逻辑推理操作,所以将本体引入到传统的信息检索系统中,利用本体的优势,实现查询的语义化,从而提高查全率和查准率。本文在分析和探讨了目前语义检索的常用方法后,进行了如下三方面的研究:(1)在深刻理解基于距离、基于内容和基于特征的相似度计算方法的基础上,提出了一种综合的加权语义相似度计算方法,综合考虑了两概念之间的语义距离、语义重合度和属性重合度。其中,在语义距离相似度的衡量过程中,分析了深度、细化程度和类型对有向边权重的影响;在语义重合度的计算上,加入了两概念之间的深度差因素,改进了不能够区分共同上层节点相同且深度和相等的概念对的语义重合度问题;属性重合度的计算方面,考虑到部分概念节点在继承上一层概念属性的基础上又定义了新的属性,给出了直接属性重合度和间接属性重合度的计算。实验结果表明,改进后的算法能更准确的衡量概念之间的相似度。(2)针对基于本体的查询扩展方法脱离待检索语料集的问题,本文将基于本体的语义查询扩展和基于局部文档的统计查询扩展相结合,提出了基于本体和局部共现共现的查询扩展方法。在本体中,由概念之间的相似度得到与初始概念相关度较大的概念作为语义候选扩展概念;同样在局部文档中,由共现性分析得到概念的统计候选扩展概念,再利用局部文档和本体分别对语义候选扩展概念和统计候选扩展概念进行筛选,筛选后的两部分扩展词作为最终的扩展概念。该扩展算法得到的新查询能更好地反映用户的查询请求。(3)研究基于本体的查询扩展过分依赖构建的领域本体的问题,提出基于概念相似度和相关度的查询扩展方法,即由概念在本体中的语义相似度和在局部文档中的相关度构成概念之间的关联度,使得概念之间关联度的衡量不再仅仅依靠本体,并根据概念与整个初始查询的相关度选取扩展词,此外还改进了扩展词权重的计算方法,由初始概念在局部文档中权重、在本体中的相似度和局部文档中的相关度共同决定。在设计的检索系统中,改进的算法有效的提高了检索性能。
语种中文
页码66
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/91641]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
尉醒醒. 基于本体的语义检索方法研究[D]. 2016.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace