机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2701|回复: 1
打印 上一主题 下一主题

参数设置低于0.4下的CD-HIT

[复制链接]
跳转到指定楼层
楼主
发表于 2017-7-17 12:04:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
CD-HIT自今年上半年的更新起,已支持阈值参数设置低于0.4。参数低于0.4情况下要用psi-cd-hit.pl命令,这个命令通过blast+来代替它原来的k-mer比对序列,摆脱限制。因此,要使用这条命令,需要提前安装blast并将安装路径加入PATH变量。

1. 安装blast+并将其加入PATH变量:http://bbs.malab.cn/forum.php?mo ... amp;highlight=blast

2. 将psi-cd-hit.pl所在路径加入PATH变量,这一步不是必须的,但是这样做能够在任意路径使用CD-HIT。

3. 执行命令:

psi-cd-hit.pl -i noClass.txt -o noClass_0.3.txt -c 0.3 -para 2

-i: 输入文件;
-o: 输出文件;
-c: 阈值参数;
-para: 并行核心数量。
-prog: 选择blast的命令,默认为blastp,用于蛋白质序列,如果输入为核酸序列,要使用blastn。


目前99服务器、131服务器上都已配置好psi-cd-hit,直接敲psi-cd-hit.pl就有所有能够使用的参数说明,如果没有响应,敲命令“source /etc/profile”使环境变量更新生效。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-2 03:32 , Processed in 0.066966 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表