题名 | 基于Lucene 的全文检索引擎在SSRF-PDM系统的研究与实现 |
作者 | 李志明 |
学位类别 | 硕士 |
答辩日期 | 2010-05 |
授予单位 | 中国科学院研究生院 |
授予地点 | 北京 |
导师 | 邓辉宇 |
学位专业 | 信号与信息处理 |
中文摘要 | 众所周知,在大科学工程的管理中,项目的管理及档案信息的检索占据了重要的地位。上海光源(Shanghai Synchrotron Radiation Facility, SSRF)作为一项大科学装置和大科学平台,它采用UGS 公司开发的基于Teamcenter 平台的产品数据管理系统(Product Data Management,PDM)来完成对海量数据的管理,同时将研发流程电子化,并通过流程控制任务进行和数据发放。在实际使用中,发现PDM 系统原有的全文检索引擎效果不甚理想。为了提高了从大量纷繁的数据中查找特定信息的效率,经过调查研究,我们决定采用Lucene 全文检索引擎工具包对SSRF-PDM 系统搜索引擎进行重构。 本文在分析原有搜索引擎的工作原理和Lucene 全文检索原理的基础上,在SSRF-PDM 系统上搭建并实现了基于Lucene 的B/S 模式全文检索引擎,并着重研究了增量优化、中文分词算法和相关度排序算法,通过对算法的改进,全文检索的查全率和查准率有很大提高。重构的全文检索系统,搜索结果不仅能按相关度排序,而且能高亮显示关键词在文中的位置。实验和使用表明,新的全文检索系统是对SSRF-PDM 全文检索系统很好的重构;而且整个全文检索引擎接口简单,独立性强,便于与整个系统的融合,也可以单独提供服务。 |
公开日期 | 2012-04-13 |
分类号 | TP31 |
内容类型 | 学位论文 |
源URL | [http://ir.sinap.ac.cn/handle/331007/7458] ![]() |
专题 | 上海应用物理研究所_中科院上海应用物理研究所2004-2010年 |
推荐引用方式 GB/T 7714 | 李志明. 基于Lucene 的全文检索引擎在SSRF-PDM系统的研究与实现[D]. 北京. 中国科学院研究生院. 2010. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论