CORC  > 清华大学
一种大规模数据的快速潜在语义索引
卫威 ; 王建民 ; WEI Wei ; WANG Jian-min
2010-06-09 ; 2010-06-09
关键词潜在语义索引 降维 特征选择 特征提取 Latent Semantic Indexing(LSI) dimension reduction feature selection feature extraction TP391.3
其他题名Fast Latent Semantic Indexing on Large-scale Dataset
中文摘要潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一个特征选择问题。利用该技术在最大程度保持LSI降维效果的同时,简化LSI的计算,使其能够应用于大规模数据。; Latent Semantic Indexing(LSI) has been successfully applied to various fields in modern information retrieval.However,the high computational complexity of Singular Value Decomposition(SVD) makes it improbable on the application of large-scale dataset.This paper proposes a fast LSI approach to solve this problem.It gives a unified framework of dimension reduction problem.As a feature extraction method,LSI can be transformed into a feature selection method within this framework.This new strategy can simplify significantly the computation of LSI.
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/55190]  
专题清华大学
推荐引用方式
GB/T 7714
卫威,王建民,WEI Wei,等. 一种大规模数据的快速潜在语义索引[J],2010, 2010.
APA 卫威,王建民,WEI Wei,&WANG Jian-min.(2010).一种大规模数据的快速潜在语义索引..
MLA 卫威,et al."一种大规模数据的快速潜在语义索引".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace