蛋白质分类与结构预测
1 引言
生物信息学的一个主要目标是理解蛋白质中氨基酸序列与三维结构之间的关系。若能知晓这种关系,就可依据氨基酸序列可靠地预测蛋白质结构。然而,序列与结构之间的关系并非如此简单。尽管在依据结构或序列对蛋白质进行分类方面已取得显著进展,且此类信息对蛋白质建模极为有用,但仍有必要对蛋白质的合成和结构进行回顾。
2 蛋白质结构预测
2.1 蛋白质结构形成过程
多肽链首先在核糖体上以 mRNA 上的密码子序列为模板进行组装。形成的线性链通过链中氨基酸之间形成氢键,进而形成二级结构。这些二级结构再通过氨基酸侧基之间的进一步相互作用,折叠成三维结构。伴侣蛋白和膜可能会协助这一过程。为使蛋白质具有生物活性,可能还需要通过切割或化学修饰对蛋白质进行加工。因此,蛋白质结构在很大程度上由氨基酸序列决定,但众多可能的相互作用中,具体哪一组相互作用会发生,目前尚未完全明确。
2.2 结构预测现状
部分蛋白质序列具有独特的氨基酸基序,这些基序总是形成特定的结构。利用现有的方法和信息,从序列预测这些结构是相当可行的。然而,对于大多数蛋白质而言,二级结构预测的准确率约为 70 - 75%。虽然已经提出了将序列与三维结构匹配的方法,但这些方法目前还不太可靠。不过,已经取得了巨大的进展,有众多结构生物化学家和生物信息学家积极致力于改进这些方法。蛋白质序列和结构数量的快速增加凸显了这一努力的必要性。
截至 2000 年 6 月,超过 12,500 个蛋白质结构已存入布鲁克海文蛋白质数据库(PDB),而瑞士蛋白质序列数据库中有 86,500 个蛋白质序列条目,比例约为 1 个结构对应 7 个序列。随着研究
超级会员免费看
订阅专栏 解锁全文

8133

被折叠的 条评论
为什么被折叠?



