CORC  > 厦门大学  > 信息技术-学位论文
题名高维小样本数据的特征选择研究及其稳定性分析; Research on Feature Selection and Stability Analysis for High Dimensionality Small Sample Size Data
作者宁永鹏
答辩日期2014 ; 2014
导师周绮凤
关键词高维小样本 特征选择 稳定性 随机森林 high dimensionality small sample size Feature selection Stability Random Forests
英文摘要随着生物信息学、图像处理、文本挖掘等大规模数据挖掘问题的不断涌现,数据挖掘的研究对象越来越复杂,对象的特征维数也越来越高。在现实生活及科学研究中产生了大量的高维小样本数据,如果直接利用这些高维小样本数据进行数据挖掘,容易出现维数灾难问题。通过特征选择,可以删除高维小样本数据中的冗余特征和噪声特征,从而降低学习算法的时间和空间复杂度,避免维数灾难。 已有的特征选择方法主要侧重于特征选择结果的高分类性能或者聚类性能,而忽略了特征选择结果的稳定性。特征选择的稳定性问题对于高维小样本数据的数据挖掘与机器学习过程是非常重要的,不稳定的特征选择结果将带来很多歧义,难以获取可以理解的真实特征。本文以高维小...; With the rapidly development of bioinformatics, image processing, text mining and other large-scale data mining problems, the study of data mining is more complex. In real life and scientific research, a lot of high dimensionality small sample size data were generated, if we use these high dimensionality small sample size data for data mining directly, it will prone to the curse of dimensionality....; 学位:工学硕士; 院系专业:信息科学与技术学院_模式识别与智能系统; 学号:23220111153241
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=46214
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/84355]  
专题信息技术-学位论文
推荐引用方式
GB/T 7714
宁永鹏. 高维小样本数据的特征选择研究及其稳定性分析, Research on Feature Selection and Stability Analysis for High Dimensionality Small Sample Size Data[D]. 2014, 2014.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace