题名 | Blog挖掘和推荐系统的设计和实现 |
作者 | 康楠 |
学位类别 | 博士 |
答辩日期 | 2007-06-04 |
授予单位 | 中国科学院软件研究所 |
授予地点 | 软件研究所 |
关键词 | Blog搜索 Blog挖掘 文本分类 特征选择 |
其他题名 | Design and Implementation of a Mining and Recommendation System for Blog |
中文摘要 | 随着Web2.0技术的成熟,Blog作为Web2.0的重要应用,以其个性化的信息发布平台、多元化的内容载体等特点,吸引着越来越多的网络用户参与其中。撰写和浏览Blog已经成为网络文化新的流行热点,并直接推动了Blog搜索服务的发展。目前的Blog搜索服务大都是基于对查询关键字的匹配来实现的,缺乏自动提取用户兴趣并进行推荐的能力。本文设计和实现了一个面向Blog的挖掘和推荐系统Blog-digger,该系统采用Blog挖掘技术,能自动识别用户的兴趣,并主动推荐主题相关的Blog。 本文首先对Web2.0技术进行了概要性的介绍,然后,对文本分类技术进行了细致的探讨,并对该技术中所涉及的各种方法的特点及其性能进行了分析,选出更适合针对Blog进行挖掘的方法。本文还对Blog排名问题进行了较为深入的研究:介绍了基于链接的网页排序算法以及它们在Blog排名上的不适用性,又对现有的两种Blog排名算法进行了分析,指出了其存在的局限性。本文提出了一种基于Blog内容特征的新排序方法。该方法利用机器学习领域中的RankBoost算法,得到一个可以量化Blog热门程度的表达式。在nDCG标准测试中,新算法的排序结果比现有的Blog排名算法提高了14.5%。本文详细描述了Blog-digger系统的设计和实现,包括体系结构、服务器组件和客户组件,介绍了系统的工作流程以及实际系统的工作情况。 |
语种 | 中文 |
公开日期 | 2011-03-17 |
页码 | 77 |
内容类型 | 学位论文 |
源URL | [http://ir.iscas.ac.cn/handle/311060/7588] ![]() |
专题 | 软件研究所_中科院软件所_中科院软件所 |
推荐引用方式 GB/T 7714 | 康楠. Blog挖掘和推荐系统的设计和实现[D]. 软件研究所. 中国科学院软件研究所. 2007. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论