机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
12
返回列表 发新帖
楼主: AmBeta
打印 上一主题 下一主题

基因表达数据分类聚类相关资料(持续更新)

[复制链接]
11#
发表于 2013-6-3 14:07:31 | 只看该作者
回复 支持 反对

使用道具 举报

12#
发表于 2013-6-3 22:27:25 | 只看该作者
http://bib.oxfordjournals.org/content/14/3/279.full.pdf+html
biclustering综述
Briefings in Bioinformatics 2013最新论文
回复 支持 反对

使用道具 举报

13#
发表于 2013-11-12 18:42:16 | 只看该作者
声明:本帖只是对mRNA特征选择程序的使用进行介绍,没有对原理方法深究。
出处链接: http://penglab.janelia.org/proj/mRMR/
1、输入文件格式要求:
        程序的输入文件格式必须是CSV文件。
2、输入内容的格式要求:
        CSV文件的内容形式是第一行是以类别特征开始的特征变量名,特征变量名之间用 “,” 隔开,不能有其它的字符。下面每一行都是对应特征变量名的特征值一样用逗号隔开。
        !!!注意的是,特征变量的第一个必须是类别(就是你的分类的标号),这跟我们平常arff文件的习惯不一样。
         例子: http://penglab.janelia.org/proj/mRMR/test_lung_s3.csv
3、该特征选择方法提供在线版本,但是有所限制,文件大小不能超过2M,特征变量的个数不能超过10000,选择的特征不能超过200。如果受限的话自己下作者源程序使用。
4、这里介绍作者提供的C++版本的程序的使用。
     命令是:./mrmr -i input.csv -t thresholds -n fea_num -m method -s max_example -v max_variables
     解释:input.csv是出入的文件。           
               thresholds默认是9999,这个变量的作用是类似定义一个区间,在该区间里面的例子得分是一样的。
               fea_num是要选择特征的个数,作者的程序设置为最多是500。要注意如果没有改作者的程序的话如果运行程序的fea_num大于500全部设置为500。如果需要增加特征个数,要改mrmr.cpp文件,将文件中874和875行注释掉,然后将951行的poolFeaIndMax改为nfea,这样重新编译之后,就可以随意设置选择要选择的特征个数。(编译方法见下面)
               method的值只有两种"MID"和“MIQ”。
               max_example是文件例子的最大值,默认是1000。
               max_variables是特征变量的最大个数,默认是10000.
5、如果有自己改程序,就要重新编译。确定自己机器有C++编译器后,用下面的命令:
      make -f  mrmr.makefile clean
      make -f mrmr.makefile
      然后就可以用命令(见4) ./mrmr ......运行了

     如果有什么不对或者不足的地方,欢迎各位补充和指正。谢谢。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-26 17:54 , Processed in 0.067951 second(s), 17 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表