机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 1408|回复: 0
打印 上一主题 下一主题

生物信息学 入门知识--浅谈(一)

[复制链接]
跳转到指定楼层
楼主
发表于 2016-7-30 22:45:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
以下知识均来自中科院 陈润生院士的系列讲座《生物信息学》的观后笔记,视频连接地址:http://v.youku.com/v_show/id_XMzg4MDQ0MDI0.html?firsttime=58  ; 课件下载云盘分享链接:http://pan.baidu.com/s/1c2DjnGG

老先生的讲解 比较生动有趣的,时间充裕的话,还是很建议亲自听一听,但语速比较慢,看完还是挺花时间的,所以将我个人理解的重点知识跟大家分享,如有理解不当的地方,欢迎批评指正。ps: 由于插图排版的不便,图片可在pdf附件中查看

讲座主要内容:大体分为四个章节:第一章 什么叫生物信息学;第二章 生物信息学研究内容之一(讲解几个经典课题);第三章 生物信息学研究内容之二(进入21世纪后的研究热点:基因组研究从测序走向功能);第四章 生物信息学研究内容之三(最近两三年,该领域最热和最值得关注的问题;最重要的研究方向和国际上在做什么)

第一章 什么叫生物信息学
1、从染色体讲起-DNA(四种元素组成的很长的线)   
2、什么是生物信息学?
     历史短(20年)
     伴随着人类遗传密码破译(人类基因组计划)而产生的一门学科
     最早的定义(基本的):主要处理跟遗传密码相关的方方面面,对基因组信息的获取、处理、存储,分配、分析和解释(--来自美国政府文本)
     (1)基因组信息的获取、处理、存储,分配:如何存好,用信息
     (2)基因组信息的分析和解释:深刻挖掘基因组信息所提供的生命活动基本规律的知识
     讲者的定义:破译人类遗传密码(30亿个符号组成的一百万页的天书)
     研究者建立方法去读这本书,读出哪些是功能元件,编码哪些蛋白,蛋白的功能是什么;
     内涵的定义(具体化):生物信息学是把基因组dna序列分析作为源头,破译隐藏在dna序列中的遗传语言,特别是非编码区的实质,同时在发现新基因的信息之后,进行蛋白质空间结构的模拟和预测。
     自然哲学的定义(哲学上):研究目标是揭示基因组信息结构的复杂性和遗传语言的根本规律,它是本世纪自然科学和技术科学领域中基因组、信息结构和复杂性这三个重大科学问题的有机结合。
3、测序
     80年代末,一次测500-1000个碱基,费用一个碱基一美金(人类总共有30亿个碱基对,中国承担1/100:三千万)
     计算机能力达到
4、4类序列数据与生物信息学相关
     碱基的数目(代表我们破译了多少遗传密码,大约14个月增长一倍)
     各种生物的esp数据(表达序列的标签):代表遗传密码中跟基因相关的一小段序列,增长更快
     单核苷酸多态性(snp):代表不同人种之间,病人和正常人之间碱基的变异。
     :肿瘤病人的一个碱基从g变为t,就把这个信号记下来,叫做和该肿瘤相关的单核苷酸多态性
     :比esp数据增长更快,更引起人们重视,跟人类分子水平的疾病相关
     完整基因组数据(有多少生物的遗传密码被破译了)
5、典型的数据库
     genebank(美国,1997建设):关于核酸数据库,非常全面核酸序列
     embl(英国,1982开始服务):
     ddbj(日本,1987开始服务):dna data bank Japan
     以上3个数据库互相交互,更新信息。用三个都可,推荐genebank,登录速度较快
6、方法过程
     破译的遗传密码--拼接好遗传密码--识别基因(遗传密码中基因编码区,不超过3%)--翻译成蛋白质的一级序列(氨基酸序列)--通过蛋白质的一级序列,预测蛋白质的空间结构--预测生物学功能
7、原来的研究核心是研究编码的基因,研究蛋白,这些只占很少的部分
8、97%的遗传序列是非编码序列

tips:
1、美国有由总统签署的科研计划
     一:曼哈顿计划(能源变化-使用核能)
     二:阿波罗计划(离开地球,探索宇宙-登月)
     三:基因组计划(上世纪90年代,30亿美金,克林顿签署,破译人遗传密码,分子水平认识自身)
2、中国独立完成水稻基因组测序,水稻基因组大小是人类基因组的1/7;该研究工作登上science封面
3、基因是割裂开的,由外显子和内显子组成的
      对于真核生物,识别基因就是找外显子


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-5-16 18:57 , Processed in 0.068691 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表