CORC  > 软件研究所  > 软件所图书馆  > 早期
题名一种基于向量空间模型的个性化搜索引擎的研究与设计
作者文振威
学位类别硕士
答辩日期2008-06-04
授予单位中国科学院研究生院
授予地点中国科学院软件研究所
导师秦晓
关键词个性化 向量空间模型 隐式反馈 搜索引擎
其他题名A study and design of personalized search engine based on vector space model
学位专业计算机应用技术
中文摘要传统的搜索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求,实现针对不同用户进行相应信息筛选的目的。个性化服务技术能够充分提高搜索引擎的服务质量和访问效率,吸引更多的访问者。个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎。本文在对第二代搜索引擎分析的基础上,运用“隐式反馈技术”和“向量空间模型”,设计并实现了一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎。本文的主要工作有:第一,对目前的搜索引擎技术和个性化信息检索技术进行了较为全面深入的探讨和综述。对于目前已经有的和正在探索中的各种个性化信息检索与提取技术进行介绍和分析。第二,在用户兴趣提取中,采用了基于隐式反馈技术的多级信息提取方法,提取用户点击历史中的信息。在其中采用了提取即时隐式反馈信息的多级信息沉淀的方法,能对用户短期的兴趣信息进行提取,以适应用户短期的异常行为,同时也可以通过这些信息描述用户兴趣的转移。第三,在文档的相似度比较方面,采用了向量空间模型,并结合了布尔模型的优点进行了维度复杂性计算方面的改进。对于即时的隐式反馈信息,采用了一种挖掘关键词相互关系的算法来进行用户兴趣种类的判别并根据用户行为的上下文信息做出相应评价。第四,对每一次搜索,记录用户的点击历史并进行相应的分析,评价用户对于搜索结果的满意度,并动态得对搜索结果进行调整。本文所设计的搜索引擎能获得对于用户具有较高相关度的搜索结果,减少用户的检索负担,使用户能从大量繁杂的信息中迅速提取到对自己有用的信息,对于提高网络信息的利用效率和用户的工作效率具有十分重要的现实意义。
索取号暂无
英文摘要The traditional search engines indeed meet people's need in some degree, but they still can not satisfy the queries of different background, different target or different period, so the personalized service is present for this requirement. It can provide specific services for different needs, and supply different users with relevant information of them. So it can enhance the quality and the efficiency of the search engine's service, and attract more and more users. Personalized Search Engine is a new intelligentized search engine that automatically learns user’s interests and filters the information with these interests. In this paper, we designed a personalized search engine that can learn user's interests and make dynamic adjust for specific context using the "implicit feedback technology" and the "vector space model". The main work includes: 1. Discuss and summarize the technology of search engine and personalized information retrieval. 2. Use Multi-level information extracting technology based on implicit feedback to extract information from users’ hit history. It can extract the immediate information to adapt the immediate abnormal action of users and also depict the transfer of users’ interest. 3. Use vector space model to assess the similarity degree of documents and make improvement with Boolean models on dimension complexity. Use a new method to mine the relationship between keywords in the immediate implicit feedback information from users’ action context. 4. Use a dynamic method to get the evaluation from users and make relevant adjust to the search results. The system designed in this paper can supply users with high relevant results hence reduce the work of users when searching the results. It can enhance the usage of internet information and the efficiency of users work.
公开日期2011-03-17
分类号暂无
内容类型学位论文
源URL[http://124.16.136.157/handle/311060/6630]  
专题软件研究所_软件所图书馆_早期
推荐引用方式
GB/T 7714
文振威. 一种基于向量空间模型的个性化搜索引擎的研究与设计[D]. 中国科学院软件研究所. 中国科学院研究生院. 2008.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace