机器学习和生物信息学实验室联盟
标题:
参数设置低于0.4下的CD-HIT
[打印本页]
作者:
shixiang
时间:
2017-7-17 12:04
标题:
参数设置低于0.4下的CD-HIT
CD-HIT自今年上半年的更新起,已支持阈值参数设置低于0.4。参数低于0.4情况下要用psi-cd-hit.pl命令,这个命令通过blast+来代替它原来的k-mer比对序列,摆脱限制。因此,要使用这条命令,需要提前安装blast并将安装路径加入PATH变量。
1. 安装blast+并将其加入PATH变量:
http://bbs.malab.cn/forum.php?mo ... amp;highlight=blast
2. 将psi-cd-hit.pl所在路径加入PATH变量,这一步不是必须的,但是这样做能够在任意路径使用CD-HIT。
3. 执行命令:
psi-cd-hit.pl -i noClass.txt -o noClass_0.3.txt -c 0.3 -para 2
-i: 输入文件;
-o: 输出文件;
-c: 阈值参数;
-para: 并行核心数量。
-prog: 选择blast的命令,默认为blastp,用于蛋白质序列,如果输入为核酸序列,要使用blastn。
目前99服务器、131服务器上都已配置好psi-cd-hit,直接敲psi-cd-hit.pl就有所有能够使用的参数说明,如果没有响应,敲命令“source /etc/profile”使环境变量更新生效。
作者:
zouquan
时间:
2017-7-17 12:34
非常好
欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/)
Powered by Discuz! X3.2