机器学习和生物信息学实验室联盟

标题: 参数设置低于0.4下的CD-HIT [打印本页]

作者: shixiang    时间: 2017-7-17 12:04
标题: 参数设置低于0.4下的CD-HIT
CD-HIT自今年上半年的更新起,已支持阈值参数设置低于0.4。参数低于0.4情况下要用psi-cd-hit.pl命令,这个命令通过blast+来代替它原来的k-mer比对序列,摆脱限制。因此,要使用这条命令,需要提前安装blast并将安装路径加入PATH变量。

1. 安装blast+并将其加入PATH变量:http://bbs.malab.cn/forum.php?mo ... amp;highlight=blast

2. 将psi-cd-hit.pl所在路径加入PATH变量,这一步不是必须的,但是这样做能够在任意路径使用CD-HIT。

3. 执行命令:

psi-cd-hit.pl -i noClass.txt -o noClass_0.3.txt -c 0.3 -para 2

-i: 输入文件;
-o: 输出文件;
-c: 阈值参数;
-para: 并行核心数量。
-prog: 选择blast的命令,默认为blastp,用于蛋白质序列,如果输入为核酸序列,要使用blastn。


目前99服务器、131服务器上都已配置好psi-cd-hit,直接敲psi-cd-hit.pl就有所有能够使用的参数说明,如果没有响应,敲命令“source /etc/profile”使环境变量更新生效。

作者: zouquan    时间: 2017-7-17 12:34
非常好




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2