面向Top-k快速查询的层次化LSH索引方法 | |
罗雄才 ; 高军 | |
刊名 | 计算机研究与发展
![]() |
2015 | |
关键词 | 层次化局部敏感哈希 Top-k查询 相似度图 三角不等式 Minhash |
英文摘要 | 局部敏感哈希(locality sensitive hashing,LSH)用于在海量高维数据中检索相似的数据项,它能高效地返回相似度大于用户给定阈值的数据对.但是,由于需要设置固定阈值,LSH无法直接处理Top-k相似查询.传统LSH索引算法需要设置一系列阈值,分别建立索引,时间和空间代价较大.提出了一种层次化的LSH索引算法,通过动态构建层次化相似度图,充分利用三角不等式,减少不必要的索引构建代价.具体来讲,首先通过高阈值构建相似度图,将高度相似的数据点抽象成"超点",再在"超点"上构建低阈值的相似度图.查询时,首先查询高阈值相似度图;数量不足时再查询低阈值相似度图.实验表明,相比传统LS...; 中文核心期刊要目总览(PKU); 中国科技核心期刊(ISTIC); S1; 56-63 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.pku.edu.cn/handle/20.500.11897/455459] ![]() |
专题 | 信息科学技术学院 |
推荐引用方式 GB/T 7714 | 罗雄才,高军. 面向Top-k快速查询的层次化LSH索引方法[J]. 计算机研究与发展,2015. |
APA | 罗雄才,&高军.(2015).面向Top-k快速查询的层次化LSH索引方法.计算机研究与发展. |
MLA | 罗雄才,et al."面向Top-k快速查询的层次化LSH索引方法".计算机研究与发展 (2015). |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论