其实我们在对接的过程中,无论你用的是什么软件(开源免费的Autodock,还是商业的SYBYL等),我们都需要选择靶点对应的蛋白晶体结构文件作为受体。有时候大家不知道如何去选择蛋白晶体?选择好蛋白晶体后如何处理?

这里,我将和大家分享一下,我的处理过程。如果您有其他的处理流程,请在下面的评论处下,分享您的经验。

1. 蛋白晶体结构的选择

首先,我们需要了解下一RCSB-PDB数据库,这个数据库是目前世界上最大的蛋白晶体结构存储数据库。在这个数据库上,我们能找到不同物种的蛋白的结构晶体信息,包括,蛋白晶体来源,蛋白信息,配体信息等等。我们基本能从这个网站上找到相关蛋白的信息。

1.1. 蛋白晶体结构的要求

对于我们后续用于对接的蛋白晶体结构,基本上有两个要求:蛋白具有配体小分子、蛋白结构完整。下面我们来详细的说明一下:

  1. 蛋白晶体结构中有对应的结合配体(大部分情况下是小分子,极少数是一段氨基酸链;注意对于配体分子的确定都是需要看原文献的,但我们可以通过PDB网站上的数据进行判断),具体如下:

    我们一般可以在PDB数据库上一个具体的蛋白页面上看到如下信息,在这里列出了这个蛋白晶体文件中包含的配体信息:

    PTGS2案例:http://www.rcsb.org/structure/5KIR

    但是,当配体小分子太多的时候,我们需要确定那个是与蛋白结合的小分子?

    这个时候,我们可以结合PDB页面上的标题,或者阅读这个蛋白晶体文件对应的文章来确定配体小分子。

    PTGS2案例:蛋白标题

    PTGS2案例:蛋白对应文章

  2. 蛋白质配体周围大概12A(范围可以缩小)范围的蛋白结构不能出现断链,也就是说在这个范围内的氨基酸结构是完整的

  3. 蛋白质要要足够大:当出现靶点对应的蛋白在PDB中只是很小的一段,查看原文献,观察这个pdb是不是催化亚基,或者是膜外部分的等等

1.2. 蛋白晶体结构存在问题的处理方法

有时候,在寻找靶点对应的蛋白晶体结构的时候,我们会遇到一些情况,这个时候就需要我们进一步的处理。

  1. 蛋白没有配体:我们需要优先找有配体的蛋白结构,如果实在是没有的话就用无配体的蛋白结构,后期可以通过一些网站获得商业软件的功能自动寻找到蛋白可能的结合区,用于后续对接;

  2. 蛋白配体周围12A内有断链:我们需要优先找无断链的蛋白结构,如果实在是没有的话,采取同源模建补齐断链,具体我们可以这样操作:1)在SWISS-MODEL这个网站上,以断链的蛋白的PDB编号为模板,进行同源模建;2)下载建模的蛋白pdb文件,同PyMol打开建模的蛋白pdb文件和断链蛋白的pdb,对齐,选择断链蛋白的pdb的大部分残基,在断链区域选择建模的蛋白pdb的残基,然后保存。

  3. 靶点无对应的蛋白三级结构:可用该靶点在其他物种中的蛋白结构为模板进行建模(相似度越高越好)

2. 蛋白结构的处理

选择好蛋白晶体文件后,我们需要对这个文件进行处理,一般情况下PyMOL就能很好的完成这些处理:

  1. 去掉重复结构(在蛋白晶体文件会出现重复序列结构,根据情况,决定是否去掉重复结构;这里提一下,对于一些二聚体,很多情况下我们是需要保留结构的);

  2. 去水分子;

  3. 去配体周围小分子(注意这个要参考原文献,根据我的经验,对于HME这样的分子通常是保留的);

  4. 金属离子(根据文献分析,是否保留;如果金属离子参与了配体与蛋白的结合,那就需要保留;一个并不一定正确的识别方法就是,你直接看金属离子是否在蛋白和配体的结合区)

3. 其他

在我们确定好了靶点之后,我们并不一定要在PDB数据库中搜索对应的晶体结构,我们可以去Uniprot数据库查找对应蛋白的3D结构信息,这里我们以人类PTGS2为例:

PTGS2案例:Uniprot数据库上的结构信息

在这里我们可以看到以下信息:

PDB Entry:PTGS2蛋白的晶体结构的PDB数据库编号,我们可以直接通过这个编号去PDB数据库查看详细信息

Method:PTGS2蛋白的晶体结构的获得方法:X-ray、NMR,我们常见的是X-ray

Resolution:PTGS2蛋白的晶体结构的分辨率,这个数值越小越好,在有多个候选蛋白,且基本信息一样的情况下,我们选择Resolution数值低的蛋白

Chain:PTGS2蛋白在晶体结构中位置,有时候一个蛋白晶体结构文件包含多个蛋白的信息,我们需要确定我们的目标蛋白所在链(通常一个链一个蛋白);以5IKR为例,PTGS2蛋白在A和B链上,至于这个是蛋白二聚体还是结构重复,需要大家去查看相关信息说明,其实它对应的文章就会有详细的说明。

Positions:PTGS2蛋白的晶体结构结晶出来的长度,以5IKR为例,这里PTGS2蛋白的19-569氨基酸获得了晶体结构

好了,今天关于蛋白晶体结构的选择就说到这里,里面的信息不一定正确,仅作为参考。后续,我在实践和学习中也会修正相关的错误。谢谢。