机器学习和生物信息学实验室联盟

标题: miRNA注释 [打印本页]

作者: hllysx    时间: 2013-12-10 16:05
标题: miRNA注释
本帖最后由 hllysx 于 2013-12-10 16:05 编辑

下载解压mirnaDetect
输入:fasta格式的基因序列文件(如testData中的test.txt)
输出:miRNA注释结果,gff3格式结果
首先使用乐义师兄写的软件mirnaDetect对序列注释(windows系统下),运行如下:
1,将test.txt文件拷贝到blast目录下,在doc中进入blast目录:
  (1)formatdb.exe -i test.txt -p F -o T
  (2)blastall.exe -p blastn -i mature.fa -d test.txt -o test_blastout.txt -e 0.005

  注意:“test_blastout.txt”是BLAST结果文件;“-e 0.005”用来调整一个匹配的alignment质量。
2,把test.txt和test_blastout.txt文件拷贝到mirnaDetect目录下,在doc中进入mirnaDetect目录:
  java -jar mirnaDetect.jar test.txt test_blastout.txt 0.5 4
  注意“0.5”代表libSVM的分类阀值(从0到1),阀值越高,注释到的pre-miRNA越少,但是置信度越高;outlast.txt为结果文件。
  (嘿嘿,前两步师兄软件里有英文使用说明,偶翻译了一下)
3,如果需要生成gff3文件,在上面两步后,doc中进入mirnaDetect目录:
  java -jar createGff3.jar outlast_info.txt outlast_simple.txt gff3_out.txt
  注意:“gff3_out.txt”即为gff3格式结果文件。

[attach]1794[/attach]




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2