内容简介
本书是一本集生物信息学专业参考书和教材于一体的书,共分为7部分:基础知识、序列联配、进化过程、基因组特征、二级结构、蛋白质三级结构、细胞和组织,以及附录和字符表等。每部分由不同章节构成,大多数章节可以被归为应用章节或理论章节。因此存每部分开始时,都有应用章节,描述了特定研究领域较实用的方面。理论章节则紧随其后,解释了其科学、理论基础以及在已有应用中所使用的技术。本书还提供了思维导图、流程图、扩展阅读等其他书不常见的内容,以供读者能够在每一章、每一节开始时对整体内容有所把握,并能够了解更多扩展知识、发展技能的参考文献。
目录
译者序
前言
给阅读者的短笺
致谢名单
第1部分 基础知识
第1章 核酸的世界
1.1 DNA和 RNA的结构
DNA分子是由4种不同类型的碱基组成的线性多聚体
两条互补 DNA链通过碱基配对形成双螺旋
RNA分子通常为单链结构,但在某些情况下可形成碱基配对结构
1.2 DNARNA和蛋白质:中心法则
DNA是信息载体,而 RNA则是信使
信使RNA根据遗传密码翻译产生蛋白质
翻译过程涉及了含 DNA和 RNA的核糖体的转移
1.3 基因结构和基因调控
特定的定位序列能和 RNA聚合酶结合,并识别转录起始点
真核生物中的转录起始信号远比细菌中复杂得多
真核生物 mRNA转录物在翻译前需经历一系列修饰
翻译的调控
1.4 生命与进化之树
主要生命形式的基本特征
突变可以改变核苷酸序列
总结
名词解释
扩展阅读
第2章 蛋白质结构
2.1 初级结构和二级结构
我们可从多个不同水平考察蛋白质结构
氨基酸是蛋白质的组成单位
侧链决定了氨基酸化学和物理特性的不同
蛋白质链中的氨基酸通过肽键共价连接
蛋白质的二级结构由α螺旋?β链构成
在蛋白质结构中已发现了几种不同类型的β折叠片
螺旋和链通过转角?发夹结构和环连接
2.2 对生物信息学的启发
某些氨基酸倾向于形成特定的结构单元
从进化角度帮助序列分析
蛋白质结构的计算和可视化
2.3 蛋白质通过折叠形成紧凑的结构
蛋白质的三级结构是通过多肽链的路径来定义的
蛋白质折叠的稳定状态是能量最低的状态
很多蛋白质是由多个亚基组成的
总结
名词解释
扩展阅读
第3章 数据库的处理
3.1 数据库的结构
平面文件数据库以文本文件的方式存储数据
关系数据库广泛应用于存储生物信息
XML的灵活性可以确定定制的数据分类
一些用于生物数据的其他数据库结构
数据库可以通过本地访问或通过互联网相互链接
3.2 数据库类型
数据库中不仅仅是数据
原始数据和衍生数据
我们如何定义和链接事物的重要性:本体
3.3 数据库搜索
序列数据库
芯片数据库
蛋白质相互作用数据库
结构数据库
3.4 数据质量
非冗余性对一些应用特别重要
自动化方法可用于检查数据的一致性
初步的分析和注释通常是自动化完成的
为了产生高质量的注释经常需要人为干预
数据库更新和条目注释版本号的重要性
总结
名词解释
扩展阅读
第2部分 序列联配
第4章 产生和分析序列联配
4.1 序列联配的原理
联配是在两个或更多序列的相同区域寻找最大相似性的任务
联配可以揭示序列间的同源性
比较蛋白质序列比核酸序列更容易检测同源性
4.2 联配分值
一个联配的质量是通过给予一个量化的分值来衡量的
量化两个序列间的相似性的最简单的方法是百分数
基于一致度的点图可以可视化地评价相似性
真正的匹配不必相同
最低一致度比可以被接受为具有显著性
对于打分联配有许多不同的方法
4.3 替代矩阵
使用替代矩阵对每个排列后的序列位点分配一个单独的值
PAM 替代矩阵使用密切相关的蛋白质序列集的替代频率
BLOSUM 替代矩阵使用了局部高度保守区域序列的突变数据
替代矩阵的选择取决于要解决的问题
4.4 插入空缺
在序列插入空缺以达到和另一条序列的相似度最大,需要罚分制度
动态规划算法可以决定引入最优空缺
4.5 联配类型
对于不同情况采用不同类型的联配
多重序列联配能同时比较一些相似序列
有几种不同的技术可构造多重联配
多重联配可以提高低相似性序列联配的精确度
ClustalW 可以对 DNA和蛋白质序列进行全局联配