机器学习和生物信息学实验室联盟
标题:
根据蛋白名搜索序列的方法(批量编程)
[打印本页]
作者:
zouquan
时间:
2011-4-24 18:06
标题:
根据蛋白名搜索序列的方法(批量编程)
去Uniprot;
比如要Q28298
用java读下面的URL即可
http://www.uniprot.org/uniprot/Q28298.fasta
代码如下:
try{
String id = "
Q28298
";
String site = "
http://www.uniprot.org/uniprot/
" +id + ".fasta";
URL url = new URL(site);
InputStreamReader isr = new InputStreamReader(
url.openStream(), "UTF-8");
Thread.currentThread().sleep(500);//如果网速不好的话,这句很必要!
BufferedReader in = new BufferedReader(isr);
BufferedWriter bw = new BufferedWriter(new FileWriter(id+".txt"));
while (in.ready()) {
bw.write(in.readLine());
bw.newLine();
bw.flush();
}
bw.close();
in.close();
}
catch(Exception ex){
System.out.println(ex.getMessage());
System.exit(0);
}
--------------------------------------------------------------------------
好像biojava中有现成的接口,回头有时间谁尝试一下
欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/)
Powered by Discuz! X3.2