CORC  > 清华大学
S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)
蔡元哲 ; 李佩 ; 刘红岩 ; 何军 ; 杜小勇 ; CAI Yuanzhe ; LI Pei ; LIU Hongyan ; HE Jun ; DU Xiaoyong
2010-06-07 ; 2010-06-07
关键词连接分析 相似度计算 文本分析 linkage mining similarity calculation text mining TP391.1
其他题名S-SimRank:Combining Content and Link Information to Cluster Papers Effectively and Efficiently
中文摘要文档的内容分析和连接分析是计算文档相似度的两种方法。连接分析能够发现文档之间的隐含关系,但是,由于文档之间的噪声的存在,这种方法很难得到精确的结果。为了解决这个问题,提出了一个新的算法—S-SimRank(Star-SimRank),有效地将文档的内容信息和连接信息结合在一起从而提高了文档相似度计算的准确性。S-Simrank算法在ACM数据集上无论是准确性和效率都比其他算法有了很大地提高。最后,给出了S-SimRank的收敛性的数学证明。; Content analysis and link analysis among documents are two common methods in recommending system.Compared with content analysis,link analysis can discover more implicit relationship between documents.At the same time,because of the noise,these methods can't gain precise result.To solve this problem,a new algorithm,S-SimRank(Star-SimRank),is proposed to effectively combine content analysis and link analysis to improve the accuracy of similarity calculation.The experimental results for the ACM data set show that S-SimRank outperforms other algorithms.In the end,the mathematic prove for the convergence of S-SimRank is given.; The National Natural Science Foundation of China under Grant No.70871068,70621061,70890083,60873017,60573092~~
语种英语 ; 英语
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/40351]  
专题清华大学
推荐引用方式
GB/T 7714
蔡元哲,李佩,刘红岩,等. S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)[J],2010, 2010.
APA 蔡元哲.,李佩.,刘红岩.,何军.,杜小勇.,...&DU Xiaoyong.(2010).S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)..
MLA 蔡元哲,et al."S-SimRank:结合内容和链接信息的文档相似度计算方法(英文)".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace