|
以下知识均来自中科院 陈润生院士的系列讲座《生物信息学》的观后笔记,视频连接地址:http://v.youku.com/v_show/id_XMzg4MDQ0MDI0.html?firsttime=58 ; 课件下载云盘分享链接:http://pan.baidu.com/s/1c2DjnGG ;
老先生的讲解 比较生动有趣的,时间充裕的话,还是很建议亲自听一听,但语速比较慢,看完还是挺花时间的,所以将我个人理解的重点知识跟大家分享,如有理解不当的地方,欢迎批评指正。ps: 由于插图排版的不便,图片可在pdf附件中查看
讲座主要内容:大体分为四个章节:第一章 什么叫生物信息学;第二章 生物信息学研究内容之一(讲解几个经典课题);第三章 生物信息学研究内容之二(进入21世纪后的研究热点:基因组研究从测序走向功能);第四章 生物信息学研究内容之三(最近两三年,该领域最热和最值得关注的问题;最重要的研究方向和国际上在做什么)
第一章 什么叫生物信息学
1、从染色体讲起-DNA(四种元素组成的很长的线)
2、什么是生物信息学?
历史短(20年)
伴随着人类遗传密码破译(人类基因组计划)而产生的一门学科
最早的定义(基本的):主要处理跟遗传密码相关的方方面面,对基因组信息的获取、处理、存储,分配、分析和解释(--来自美国政府文本)
(1)基因组信息的获取、处理、存储,分配:如何存好,用信息
(2)基因组信息的分析和解释:深刻挖掘基因组信息所提供的生命活动基本规律的知识
讲者的定义:破译人类遗传密码(30亿个符号组成的一百万页的天书)
研究者建立方法去读这本书,读出哪些是功能元件,编码哪些蛋白,蛋白的功能是什么;
内涵的定义(具体化):生物信息学是把基因组dna序列分析作为源头,破译隐藏在dna序列中的遗传语言,特别是非编码区的实质,同时在发现新基因的信息之后,进行蛋白质空间结构的模拟和预测。
自然哲学的定义(哲学上):研究目标是揭示基因组信息结构的复杂性和遗传语言的根本规律,它是本世纪自然科学和技术科学领域中基因组、信息结构和复杂性这三个重大科学问题的有机结合。
3、测序
80年代末,一次测500-1000个碱基,费用一个碱基一美金(人类总共有30亿个碱基对,中国承担1/100:三千万)
计算机能力达到
4、4类序列数据与生物信息学相关
碱基的数目(代表我们破译了多少遗传密码,大约14个月增长一倍)
各种生物的esp数据(表达序列的标签):代表遗传密码中跟基因相关的一小段序列,增长更快
单核苷酸多态性(snp):代表不同人种之间,病人和正常人之间碱基的变异。
:肿瘤病人的一个碱基从g变为t,就把这个信号记下来,叫做和该肿瘤相关的单核苷酸多态性
:比esp数据增长更快,更引起人们重视,跟人类分子水平的疾病相关
完整基因组数据(有多少生物的遗传密码被破译了)
5、典型的数据库
genebank(美国,1997建设):关于核酸数据库,非常全面核酸序列
embl(英国,1982开始服务):
ddbj(日本,1987开始服务):dna data bank Japan
以上3个数据库互相交互,更新信息。用三个都可,推荐genebank,登录速度较快
6、方法过程
破译的遗传密码--拼接好遗传密码--识别基因(遗传密码中基因编码区,不超过3%)--翻译成蛋白质的一级序列(氨基酸序列)--通过蛋白质的一级序列,预测蛋白质的空间结构--预测生物学功能
7、原来的研究核心是研究编码的基因,研究蛋白,这些只占很少的部分
8、97%的遗传序列是非编码序列
tips:
1、美国有由总统签署的科研计划
一:曼哈顿计划(能源变化-使用核能)
二:阿波罗计划(离开地球,探索宇宙-登月)
三:基因组计划(上世纪90年代,30亿美金,克林顿签署,破译人遗传密码,分子水平认识自身)
2、中国独立完成水稻基因组测序,水稻基因组大小是人类基因组的1/7;该研究工作登上science封面
3、基因是割裂开的,由外显子和内显子组成的
对于真核生物,识别基因就是找外显子
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|