机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 5987|回复: 6
打印 上一主题 下一主题

生物信息学工具Biojava使用介绍以及部分功能代码展示

[复制链接]
跳转到指定楼层
楼主
发表于 2012-4-17 17:54:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 hsc 于 2012-4-17 18:03 编辑

前一段时间看了一下Biojava,本意是想研究他的Blast技巧,没想到他是调用ncbi进行blast的,我看到的是这样,不知道还有没有没看到的部分功能。然后再搜资料的过程中,发现了一个比较好的地方,上边有很详细的介绍Biojava,并给出了一部分功能的代码,但是我看了一下,很多不完全并且大部分都有错误,鉴于他上面讲到的对于生物信息学都很有帮助,因此我把他那边的代码给修正和完善了一下,然后写了一个使用文档,希望会对大家有所帮助。

那个网站网址是:lhttp://www.cbi.pku.edu.cn/chinese/documents/PUMA/biojava/index-cn.html

Biojava的API网址是:http://www.biojava.org/docs/api1.8.2/

还有一个:http://www.biojava.org/docs/api/index.html

主要是参考第一个,第二个模式的版本我到现在不知道干嘛,还没用到,大部分功能都在第一个版本里边。

下边是文档和文档中牵涉到功能的详细代码,代码中大部分都是能够运行的,除了有几个我没看懂,没办法完善,我都有标注的,凡是待测试的,是我基本没有完善的。其他的都是可运行的。




上边的是没有介绍他的blast,尽管他是调用ncbi的,我试了,能够提交给ncbi,但是在返回结果的时候会出异常,还在研究中。

另外,以上这些只是一部分而以,欢迎大家提出改进意见以及更多的功能使用方法。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
 楼主| 发表于 2012-4-17 18:13:45 | 只看该作者
本帖最后由 hsc 于 2012-4-17 18:18 编辑

鉴于好多人不知道Biojava是干嘛的,我这里把文档中提供的功能列一下。


如何得到DNA,RNA或蛋白质的成分表?       

如何用自定义的标记建立自定义的成分表?

如何建立杂交产物成分表(cross product alphabet),例如密码字成分表(codon alphabet)?

如何从杂交产物成分表(cross product alphabet)中分解出他们的组成标记(component symbol)?       

如何判别两个成分表或两个标记是否相同?

如何建立一个多义标记(ambiguous symbol),例如Y或R?       

如何从字串中创建一条序列对象以及将其写回一条字串?       

如何从一条序列中得到子序列?       

如何将一条DNA序列转录成一条RNA序列?       

如何改变序列的名字?       

如何编辑一条序列?
       
如何将一条DNA或RNA或标记链翻译成蛋白质?       

如何将单个密码子翻译成单个氨基酸?       

如何使用非标准的翻译表?       

如何将一条序列以Fasta格式输出?       

如何从一个Fasta文件中读取序列?       

如何读取一个GenBank,SwissProtm,EMBL文件?       

如何将ABI序列转化为BioJava序列?(待测试)       

如何列出序列中的注释?       

如何根据物种属性过滤序列?
       
如何定制一个点位置(PointLocaiton)?       

如何定制一个范围位置(RangeLocation)?       

如何处理环状位置?

如何创建一个特征?

如何根据类型来筛选特征?

如何从序列中删除特征?       

       
如何设置一个BLAST解析器解析BLAST结果?       

如何设置一个FASTA解析器解析FASTA搜索结果?

如何从搜索结果中提取信息?       

如何计算序列中的残基数?

如何将计数转化为一个分布?

如何从一个分布得到一条随机序列?       

如何计算一个分布中的信息量或熵?

如何能找到一种简单的方法来判断两种分布是否具有相同的权重?       

如何对一个自定义的成分表创建一个N阶分布(order N distribution)?

如何将一个分布以XML格式输出?       

如何使用一个权重矩阵来寻找一个模体?       

如何创建一个隐马模型序列谱(Profile HMM)?(待测试)       

如何建立一个自定义的隐马模型(HMM)?

如何以树状结构展示特征和注释?

如何图形化一条序列?       

如何展示序列标尺?       

如何图形化一个特征?       
回复 支持 反对

使用道具 举报

板凳
发表于 2012-4-17 18:19:09 | 只看该作者
哇!!好牛逼!!这个文档我要私藏起来。哈哈。
回复 支持 反对

使用道具 举报

地板
 楼主| 发表于 2012-4-17 18:37:09 | 只看该作者
xmubingo 发表于 2012-4-17 18:19
哇!!好牛逼!!这个文档我要私藏起来。哈哈。

写了好久,感觉挺有意思的,就整理写了下~不过里边有一部分还没弄懂,师兄指点下
回复 支持 反对

使用道具 举报

5#
发表于 2012-4-17 19:45:49 | 只看该作者
gooooood
奖励500元,记账!
回复 支持 反对

使用道具 举报

6#
发表于 2012-12-13 09:44:38 | 只看该作者
特意注册帐号感谢一下,不过你这个版本好像是1.X的,现在最新的不是3.0.5么?
回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2012-12-13 19:03:32 | 只看该作者
andyli386 发表于 2012-12-13 09:44
特意注册帐号感谢一下,不过你这个版本好像是1.X的,现在最新的不是3.0.5么?

这个是比较早写的了,写的时候没注意版本的问题,不过大部分应该没问题,可能格式会有点变动而已~~~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-2 13:33 , Processed in 0.068810 second(s), 20 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表