其实我们在对接的过程中,无论你用的是什么软件(开源免费的Autodock,还是商业的SYBYL等),我们都需要选择靶点对应的蛋白晶体结构文件作为受体。有时候大家不知道如何去选择蛋白晶体?选择好蛋白晶体后如何处理?
这里,我将和大家分享一下,我的处理过程。如果您有其他的处理流程,请在下面的评论处下,分享您的经验。
首先,我们需要了解下一RCSB-PDB数据库,这个数据库是目前世界上最大的蛋白晶体结构存储数据库。在这个数据库上,我们能找到不同物种的蛋白的结构晶体信息,包括,蛋白晶体来源,蛋白信息,配体信息等等。我们基本能从这个网站上找到相关蛋白的信息。
对于我们后续用于对接的蛋白晶体结构,基本上有两个要求:蛋白具有配体小分子、蛋白结构完整。下面我们来详细的说明一下:
蛋白晶体结构中有对应的结合配体(大部分情况下是小分子,极少数是一段氨基酸链;注意对于配体分子的确定都是需要看原文献的,但我们可以通过PDB网站上的数据进行判断),具体如下:
我们一般可以在PDB数据库上一个具体的蛋白页面上看到如下信息,在这里列出了这个蛋白晶体文件中包含的配体信息:
但是,当配体小分子太多的时候,我们需要确定那个是与蛋白结合的小分子?
这个时候,我们可以结合PDB页面上的标题,或者阅读这个蛋白晶体文件对应的文章来确定配体小分子。
蛋白质配体周围大概12A(范围可以缩小)范围的蛋白结构不能出现断链,也就是说在这个范围内的氨基酸结构是完整的
蛋白质要要足够大:当出现靶点对应的蛋白在PDB中只是很小的一段,查看原文献,观察这个pdb是不是催化亚基,或者是膜外部分的等等
有时候,在寻找靶点对应的蛋白晶体结构的时候,我们会遇到一些情况,这个时候就需要我们进一步的处理。
选择好蛋白晶体文件后,我们需要对这个文件进行处理,一般情况下PyMOL就能很好的完成这些处理:
在我们确定好了靶点之后,我们并不一定要在PDB数据库中搜索对应的晶体结构,我们可以去Uniprot数据库查找对应蛋白的3D结构信息,这里我们以人类PTGS2为例:
在这里我们可以看到以下信息:
PDB Entry:PTGS2蛋白的晶体结构的PDB数据库编号,我们可以直接通过这个编号去PDB数据库查看详细信息
Method:PTGS2蛋白的晶体结构的获得方法:X-ray、NMR,我们常见的是X-ray
Resolution:PTGS2蛋白的晶体结构的分辨率,这个数值越小越好,在有多个候选蛋白,且基本信息一样的情况下,我们选择Resolution数值低的蛋白
Chain:PTGS2蛋白在晶体结构中位置,有时候一个蛋白晶体结构文件包含多个蛋白的信息,我们需要确定我们的目标蛋白所在链(通常一个链一个蛋白);以5IKR为例,PTGS2蛋白在A和B链上,至于这个是蛋白二聚体还是结构重复,需要大家去查看相关信息说明,其实它对应的文章就会有详细的说明。
Positions:PTGS2蛋白的晶体结构结晶出来的长度,以5IKR为例,这里PTGS2蛋白的19-569氨基酸获得了晶体结构
好了,今天关于蛋白晶体结构的选择就说到这里,里面的信息不一定正确,仅作为参考。后续,我在实践和学习中也会修正相关的错误。谢谢。
本文由 石九流 创作,如果您觉得本文不错,请随意赞赏
采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
原文链接:https://blog.computsystmed.com/archives/autodock-series-protein-crystal-selection-for-molecular-docking
最后更新:2019-06-11 21:39:50
Update your browser to view this website correctly. Update my browser now