多谢指导,我看下。作者: zouy1216 时间: 2012-9-12 09:15
你好,可以用weka的PCA,对降维的结果进行处理的方法可以参考这两篇论文
Maria C. Uyarra, Isabelle M. C & Ocirc. Island-specific preferences of tourists for environmental features: implications of climate change for tourism-dependent states. Environmental Conservation, Volume 32, Issue 01, March 2005, pp 11 – 19.
William R. Dillon, Narendra Mulani, Donald G. Frederick. On the use of component scores in the presence of group structure. Journal of Consumer Research, Vol. 16, No. 1 (Jun., 1989), pp. 106-112.
不过处理的过程不侧重属性的排名而是对特征意义的归类和分析,比较适用于维数较少的数据。希望对你有帮助:)作者: tangzk 时间: 2012-9-13 09:05
上个实验室的网站还要翻墙,唉!
关于特征重要性的度量,有两种方法:
1、查看残差的增量:通过移除一个变量后,查看前后残差的增量来衡量,可用公式如下,
F_j = (RSS_j - RSS_0) / (RSS_0 / (n-p))
RSS_j为去除变量j后的残差,RSS_0为原始残差,这样分子就是前后残差的增量,n为样本数,p为特征总数,分母就是噪声的方差
这种方法也可适用于一组变量的重要性衡量,还可以应用于online learning
2、利用统计中的假设检验方法,定义第j个变量的z-score服从t(n-p)分布,然后利用p-value来解释结果。
我认为PCA方法,可以保留原始特征中的主要因子,变换其线性空间降维处理,即会形成原始特征的线性组合,这是常说的特征提取,其选取后的特征并非是原始特征的子集,后者是指特征选择。使用PCA方法,得到结果之后,可以考虑把线性组合后的结果反向解释原始变量重要性。作者: endual 时间: 2012-9-23 20:19
多谢各位的帮助作者: Ibelieve 时间: 2012-9-25 12:38
如果只是想排序的话推荐可以用mRMR的方法,详见:http://penglab.janelia.org/proj/mRMR/#matlab作者: xmubingo 时间: 2012-9-25 15:14