CORC  > 兰州理工大学  > 兰州理工大学
题名家庭常用药品垂直搜索引擎的研究与设计
作者刘磊
答辩日期2016
导师王燕
关键词常用药品 垂直搜索引擎 中文分词 Lucene PageRank Heritrix
学位名称硕士
英文摘要健康的身体是人之根本,随着个人及家庭对于常见病的预防和早期治疗的不断关注,越来越多的家庭更加注重家庭常用药品的选择和使用。根据最新调查,目前我国人口已超过13亿,家庭总数已超过3亿3千多万个。目前,Web中存在这大量的与家庭常用药品相关的网站,但是,通过在食药监局的查询,很多药品信息来源并不是从国家卫计委批准的网站中而来,因此,通过使用综合搜索引擎所查询到的药品信息并不能保证人们的用药安全性,也不能更加方便、快速的使人们查找到相关药品的信息。通过设计专业化的搜索引擎,从而解决这一庞大群体对于家庭常用药品的选择和查询具有重要的意义。本文通过对家庭常用药品需求情况的研究分析,通过利用垂直搜索引擎技术,对互联网上的由国家卫计委批准的的家庭常用药品信息内容进行采集和分析,通过使用Lucene开源搜索引擎和Heritrix爬虫,从而实现家庭常用药品垂直搜索引擎的设计,主要研究工作如下:(1)详细分析了Heritrix开源爬虫的系统结构,并根据本系统的需求,对开源的Heritrix爬虫进行扩展与改进,设计出只针对家庭常用药品信息进行抓取的网络爬虫。(2)通过对Lucene的系统结构的深入分析,以及对Lucene自身排序算法的研究,发现在使用中存在对网页重要性的反应不足。因此,通过引入PageRank算法,对Lucene自身的排序算法进行了改进,已达到系统对于排序结果的最佳要求。(3)面对家庭常用药品垂直搜索引擎的设计和研究。通过针对家庭常用药品垂直搜索引擎关键技术的研究和分析,主要包括信息抓取、主体化定制、建立家庭常用药品词库、设计家庭常用药品用户检索接口、索引库、系统总体框架以及各部分模块,并通过使用Eclipse开发平台,利用Java语言实现了本系统设计的预期功能。通过测试分析,本文所设计的家庭常用药品垂直搜索引擎的方案是符合预期设计目的,能够达到用户需求。与综合搜索引擎相比,极大的提升了搜索效率和查准率,满足众多家庭对于常用药品的个性化、专业化检索的需求。
语种中文
页码59
URL标识查看原文
内容类型学位论文
源URL[http://ir.lut.edu.cn/handle/2XXMBERH/91915]  
专题兰州理工大学
作者单位兰州理工大学
推荐引用方式
GB/T 7714
刘磊. 家庭常用药品垂直搜索引擎的研究与设计[D]. 2016.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace