机器学习和生物信息学实验室联盟

标题: 根据蛋白名搜索序列的方法(批量编程) [打印本页]

作者: zouquan    时间: 2011-4-24 18:06
标题: 根据蛋白名搜索序列的方法(批量编程)
去Uniprot;

比如要Q28298

用java读下面的URL即可

http://www.uniprot.org/uniprot/Q28298.fasta

代码如下:
try{
                            String id = "Q28298";
                            String site = "http://www.uniprot.org/uniprot/" +id + ".fasta";
                            URL url = new URL(site);
                            InputStreamReader isr = new InputStreamReader(
                                    url.openStream(), "UTF-8");
                            Thread.currentThread().sleep(500);//如果网速不好的话,这句很必要!
                            BufferedReader in = new BufferedReader(isr);
                           BufferedWriter bw = new BufferedWriter(new FileWriter(id+".txt"));
                            while (in.ready()) {
                                bw.write(in.readLine());
                                bw.newLine();
                                bw.flush();
                            }
                            bw.close();
                            in.close();
}
        catch(Exception ex){
            System.out.println(ex.getMessage());
            System.exit(0);
        }
--------------------------------------------------------------------------
好像biojava中有现成的接口,回头有时间谁尝试一下






欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2