前言
在现实中膜蛋白与非膜蛋白质之间的区别比较大,例如结构形态上、功能上都有较多差异。但是如果放在分子模拟过程中,这仅仅是一层膜的区别。而这层膜是由两层磷酸酯组成的,因此只要我们能解决膜的构建,磷脂分子的力场参数以及把蛋白质嵌入至膜中即可。目前主要的膜蛋白建模工具分别是VMD的扩展工具“Membrane Builder”、Schrödinger的Desmond模块、Packmol软件和CHARMM GUI网站。其中,CHARMM GUI是一个具有多种功能模块的复杂体系建模网站,建模操作简单方便。
VMD的扩展工具“Membrane Builder”:优点是建模操作简单快捷,能瞬间生成一张膜,但缺点同样明显,仅能产生POPC和POPE两种磷脂分子其中一种组成的膜,而且麻烦之处在于要把蛋白质嵌入到膜中,确定好位置后,把蛋白质与膜有冲突的磷脂分子去除,再把蛋白质和膜合并成pdb文件,这几步均需要借助tcl脚本才能完成,而且磷脂分子的力场参数文件要另外准备。
Schrödinger的Desmond模块:优点为无任何操作难度地构建膜蛋白体系;缺点是Schrödinger是商用软件,价值不菲,可供使用的力场只有OPLS系列,而且出现和VMD一样的问题,仅能构建POPC、POPE、DPPC和DMPC四种磷脂中的其中一种膜体系,因此也无法构建混合磷脂的膜体系。
Packmol:优点在于能生成混合磷脂的膜体系,可自由调整各种磷脂的比例;缺点是需要通过设置输入文件来控制体系的产生,对于新手来说非常不友好,有一定的学习成本,而且膜体系建完后还需要通过VMD将蛋白质嵌入其中,后面遇到的问题和VMD的Membrane Builder一致。
CHARMM GUI网站:优点操作简单,只需要按照顺序以及自己的需求点击选项,设置尺寸参数即可,而且还可以生成混合磷脂的膜体系,包含几十种磷脂,基本满足各种生物体系,并且可以自动生成所设置力场的参数文件;缺点暂时想不到,硬要提一下的话我选择咬打火机......
因此,本教程将分为纯膜蛋白模拟和膜蛋白-配体体系模拟两种情况,介绍如何通过CHARMM GUI网站构建复合物体系以及使用GROMACS进行膜蛋白体系的MD模拟的过程。
准备工具
CHARMM GUI[charmm-gui.org/]、PyMOL、GROMACS 2021.4
(一)纯膜蛋白体系的MD模拟
我们将以STX17-SNAP29-VAMP8复合物 (PDB ID: 7BV6) 为例子,介绍膜蛋白体系的建模以及MD模拟的操作过程。
1. 蛋白质结构文件的获得
从PDB Bank数据库中下载PDB ID为7BV6的蛋白晶体结构,按需除去结构中的结晶水分子(本教程去除全部结晶水分子)。去除的方法:用记事本打开pdb文件,直接删除不需要的内容即可,将此pdb文件重新命名为7bv6_nowater.pdb。由于此pdb文件有残基缺失,需要补全,用于补全的程序有多种,此处不作赘述。将补全残基后的蛋白质命名为7bv6_fix.pdb。
2. PDB Reader & Manipulator预处理
a. 登录CHARMM GUI网站,点击左菜单栏的“Input Generator”,然后点击子目录下的“PDB Reader”,PDB Reader可以使输入的PDB文件转化成更容易被CHARMM读取的格式,方便后续的操作;
b. 在Upload PDB File处点击“选择文件”将7bv6_fix.pdb上传至网站上,点选Check/Correct PDB Format,上传完成后点击“Next Step”;
c. 由于该体系是一个多聚体,只取其中的12条氨基酸链,在Model/Chain Selection Option中选中所需要的ABCDQRSTUVWX链,然后点击“Next Step”;
d. 在PDB Manipulation Options中可以留一点蛋白质每条链上均有残基缺失,由于缺失的残基均在每条链的首尾部,因此可以忽略,其他参数保持默认即可,点击“Next Step”;
e. 点击CHARMM PDB后的view structure,观看蛋白结构,确定无误后点击“download tgz”,解压后即可得到step1_pdbreader.pdb,将此pdb文件重命名为7bv6_fix2.pdb,即可进入下一步操作。
3. 膜的构建
a. 点击左菜单栏的“Input Generator”子目录下的“Membrane Builder”的“Bilayer builder”;
b. 在Upload PDB File处点击“选择文件”将7bv6_fix2.pdb上传至网站上,点选Check/Correct PDB Format,上传完成后点击“Next Step”;然后点击“Next Step”;
c. 确定全部链均被选中后点击“Next Step”;
d. PDB Manipulation Options处保持默认,直接点击“Next Step”,这一步开始为CHARMM的STEP 1,读取PDB;
e. STEP 2设置蛋白质的取向,点选“Orientation Options”下的 “Align the First Principal Axis Along Z”,然后点选“Positioning Options”下的“Flip Molecule along the Z axis”,这一步旨在调整磷酸膜与蛋白质之间的方向,使之形成“嵌入”关系,如果遇到蛋白质并没有贯穿膜的情况,则需要点选“ Translate Molecule along Z axis”并按需设置平移的距离,点击“Next Step”;
f. STEP 3设置体系的尺寸,先点击Oriented PDB的view structure,观察蛋白质和膜的取向是否正确,确定无误后,“System Size Determination Options”下方的“Lipid Type”中选择构成膜的磷脂种类,例如本例中,设置上层和下层的磷脂种类均为DPPC,比例是1:1,然后在Length of X and Y处输入120,这里设置的是膜的大小,这里的数值大小视具体蛋白的尺寸设置,要设置成足够大,设置完成后点击“Show the system info”,待出现计算结果后即可点击“Next Step”;
g. STEP 4构建膜以及环境,设置添加离子的种类和浓度,选择添加的盐,设置浓度,然后点击“Calculate Solvent Composition”,计算得到各种离子的数量后,点击“Next Step”;
h. STEP 5膜的自组装,检查输出的结构,确定无误后点击“Next Step”;
i. STEP 6生成输入文件,设置力场类型,在本例中选择的是AMBER力场,其中蛋白和磷脂分别采用AMBER19SB、Lipid17力场描述,设置完成后,由于MD模拟将在GROMACS程序下运行,因此在“Input Generation Options”下选择GROMACS,其他保持默认,点击“Next Step”,完成后点击“Download tgz”即可得到GROMACS所需要的输入文件。
4. MD模拟
a. 将从CHARMM-GUI上下载得到的压缩包文件charmm-gui-XXXX.tgz解压,进入解压后的文件夹,将命名为gromacs的文件夹上传至服务器的工作路径上;
b. gromacs文件夹中有一个命名为toppar的子文件夹,里面存放的是GROMACS进行模拟时所涉及的全部分子的力场文件,通过以下命令粘贴到GROMACS的力场库中
$ cp -r toppar /your/installation/path/of/GMX/gromacs/top/toppar
c. 能量极小化 (如果体系比较难收敛,可以选择使用双精度版本的GROMACS)
$ gmx grompp -f step6.0_minimization.mdp -c step5_input.gro -r step5_input.gro -p topol.top -o em.tpr
$ gmx mdrun -deffnm em
d. 体系预平衡 (按需调整步数)
$ gmx grompp -f step6.1_equilibration.mdp -c em.gro -r em.gro -p topol.top -o eq1.tpr -n index.ndx
$ gmx mdrun -deffnm eq1
$ gmx grompp -f step6.2_equilibration.mdp -c eq1.gro -r eq1.gro -p topol.top -o eq2.tpr -n index.ndx
$ gmx mdrun -deffnm eq2
$ gmx grompp -f step6.3_equilibration.mdp -c eq2.gro -r eq2.gro -p topol.top -o eq3.tpr -n index.ndx
$ gmx mdrun -deffnm eq3
$ gmx grompp -f step6.4_equilibration.mdp -c eq3.gro -r eq3.gro -p topol.top -o eq4.tpr -n index.ndx
$ gmx mdrun -deffnm eq4
$ gmx grompp -f step6.5_equilibration.mdp -c eq4.gro -r eq4.gro -p topol.top -o eq5.tpr -n index.ndx
$ gmx mdrun -deffnm eq5
$ gmx grompp -f step6.6_equilibration.mdp -c eq5.gro -r eq5.gro -p topol.top -o eq6.tpr -n index.ndx
$ gmx mdrun -deffnm eq6
e. 成品动力学模拟 (按需调整步数)
$ gmx grompp -f step7_production.mdp -o md.tpr -c eq6.gro -p topol.top -n index.ndx
$ gmx mdrun -deffnm md #不使用GPU加速或者无GPU运行
$ gmx mdrun -deffnm md -pme gpu -nb gpu -bonded gpu #使用GPU加速运行
5. 结果动画
(二)膜蛋白-配体体系的MD模拟
G蛋白偶联受体(GPCR)是一种重要的药物靶点,FDA认证的药物中有34%靶向GPCR家族的108种蛋白。据估计,GPCR 是目前市场上约 50% 药物的靶标,这主要是由于GPCR的信号通路与多种疾病相关,例如精神类、代谢类、免疫类和癌症等疾病。因此GPCR近年来一直备受制药公司的青睐。由于GPCR是一类跨膜蛋白,在MD模拟中考虑膜的影响可以用作实验结果的支持证据,阐明蛋白质机制和验证蛋白质晶体结构等。下面将以化合物PF 06882961与GLP-1R结合的晶体结构为例子(PDB ID: 7LCK),介绍膜蛋白-配体体系的MD模拟。
1. 蛋白质结构文件的获得
从PDB Bank数据库中下载PDB ID为7LCK的蛋白晶体结构,按需除去结构中的结晶水分子(本教程去除全部结晶水分子)。去除的方法:用记事本打开pdb文件,直接删除不需要的内容即可,将此pdb文件重新命名为7lck_nowater.pdb。由于此pdb文件有残基缺失,需要补全,用于补全的程序有多种,此处不作赘述。将补全残基后的蛋白质命名为7lck_fix.pdb。
2. PDB Reader & Manipulator预处理
a. 登录CHARMM GUI网站,点击左菜单栏的“Input Generator”,然后点击子目录下的“PDB Reader”,PDB Reader可以使输入的PDB文件转化成更容易被CHARMM读取的格式,方便后续的操作;
b. 在Upload PDB File处点击“选择文件”将7lck_fix.pdb上传至网站上,上传完成后点击“Next Step”;
c. 由于该体系包含蛋白质和配体分子,在Model/Chain Selection Option中选中所有部分,然后点击“Next Step”;
d. 在PDB Manipulation Options中可以留一点蛋白质每条链上均有残基缺失,由于缺失的残基均在每条链的首尾部,因此可以忽略,其他参数保持默认即可,点击“Next Step”;
e. 点击CHARMM PDB后的view structure,观看蛋白结构,确定无误后点击“download tgz”,解压后即可得到step1_pdbreader.pdb,将此pdb文件重命名为7lck_fix2.pdb,即可进入下一步操作。
3. 膜的构建
a. 点击左菜单栏的“Input Generator”子目录下的“High-Throughput Simulation”;
b. 先将“System Type”改为“Bilayer”,再点击“Click to choose PDB/SDF files or drag them here”,将7lck_fix2.pdb上传至网站上,然后点击“Next Step”;
c. 确定Protein和Hetero均被选中后点击“Next Step”;
d. PDB Manipulation Options处将Default Ligand FF改为GAFF2,其余参数保持默认,点击“Next Step”;
e. STEP 1读取PDB,在Parameter中选择“GAFF”,点击“Run”;
f. STEP 2设置蛋白质的取向及体系尺寸,点选“Orientation Options”下的 “Align the First Principal Axis Along Z”,然后点选“Positioning Options”下的“Flip Molecule along the Z axis”,这一步旨在调整磷酸膜与蛋白质之间的方向,使之形成“嵌入”关系,如果遇到蛋白质并没有贯穿膜的情况,则需要点选“ Translate Molecule along Z axis”并按需设置平移的距离,点击“Next Step”;
先点击Oriented PDB的view structure,观察蛋白质和膜的取向是否正确,确定无误后,“System Size Determination Options”下方的“Lipid Type”中选择构成膜的磷脂种类,例如本例中,设置上层和下层的磷脂种类均为DPPC,比例是1:1;
然后在Length of X and Y处输入120,这里设置的是膜的大小,这里的数值大小视具体蛋白的尺寸设置,要设置成足够大,设置完成后点击“Show the system info”,待出现计算结果后即可点击“Next Step”;
g. STEP 3确定体系的尺寸及添加离子,设置添加离子的种类和浓度,选择添加的盐,设置浓度,然后点击“Calculate Solvent Composition”,计算得到各种离子的数量后,点击“Next Step”;
h. STEP 4构建膜成分,观察整个膜蛋白体系是否正确,确定无误后,点击“Next Step”;
i. STEP 5膜的自组装,检查输出的结构,确定无误后点击“Next Step”;
j. STEP 6体系的复制,在Force Field Options中选择力场类型,在本例中选择的是AMBER力场,其中蛋白、磷脂和配体分别采用AMBER19SB、Lipid17、GAFF2力场描述,设置完成后,由于MD模拟将在GROMACS程序下运行,因此在“Input Generation Options”下选择GROMACS,确定模拟时的温度,其他保持默认,点击“Next Step”;
k. STEP 7生成输入文件,完成后点击“Download tgz”即可得到GROMACS所需要的输入文件。
4. MD模拟
a. 将从CHARMM-GUI上下载得到的压缩包文件charmm-gui-XXXX.tgz解压,打开解压后的文件夹,依次进入model>>model_1,将命名为gromacs的文件夹上传至服务器的工作路径上;
b. gromacs文件夹中有一个命名为toppar的子文件夹,里面存放的是GROMACS进行模拟时所涉及的全部分子的力场文件,通过以下命令粘贴到GROMACS的力场库中
$ cp -r toppar /your/installation/path/of/GMX/gromacs/top/toppar
c. 能量极小化 (如果体系比较难收敛,可以选择使用双精度版本的GROMACS)
$ gmx grompp -f step6.0_minimization.mdp -c step5_input.gro -r step5_input.gro -p topol.top -o em.tpr
$ gmx mdrun -deffnm em
d. 体系预平衡 (按需调整步数)
$ gmx grompp -f step6.1_equilibration.mdp -c em.gro -r em.gro -p topol.top -o eq1.tpr -n index.ndx
$ gmx mdrun -deffnm eq1
$ gmx grompp -f step6.2_equilibration.mdp -c eq1.gro -r eq1.gro -p topol.top -o eq2.tpr -n index.ndx
$ gmx mdrun -deffnm eq2
$ gmx grompp -f step6.3_equilibration.mdp -c eq2.gro -r eq2.gro -p topol.top -o eq3.tpr -n index.ndx
$ gmx mdrun -deffnm eq3
$ gmx grompp -f step6.4_equilibration.mdp -c eq3.gro -r eq3.gro -p topol.top -o eq4.tpr -n index.ndx
$ gmx mdrun -deffnm eq4
$ gmx grompp -f step6.5_equilibration.mdp -c eq4.gro -r eq4.gro -p topol.top -o eq5.tpr -n index.ndx
$ gmx mdrun -deffnm eq5
$ gmx grompp -f step6.6_equilibration.mdp -c eq5.gro -r eq5.gro -p topol.top -o eq6.tpr -n index.ndx
$ gmx mdrun -deffnm eq6
e. 成品动力学模拟 (按需调整步数)
$ gmx grompp -f step7_production.mdp -o md.tpr -c eq6.gro -p topol.top -n index.ndx
$ gmx mdrun -deffnm md #不使用GPU加速或者无GPU运行
$ gmx mdrun -deffnm md -pme gpu -nb gpu -bonded gpu #使用GPU加速运行
5. 结果动画
参考资料:
B.R. Brooks, C.L. Brooks III, A.D. MacKerell, Jr., L. Nilsson, R.J. Petrella, B. Roux, Y. Won, G. Archontis, C. Bartels, S. Boresch, A. Caflisch, L. Caves, Q. Cui, A.R. Dinner, M. Feig, S. Fischer, J. Gao, M. Hodoscek, W. Im, K. Kuczera, T. Lazaridis, J. Ma, V. Ovchinnikov, E. Paci, R.W. Pastor, C.B. Post, J.Z. Pu, M. Schaefer, B. Tidor, R. M. Venable, H. L. Woodcock, X. Wu, W. Yang, D.M. York, and M. Karplus (2009) CHARMM: The Biomolecular Simulation Program. J. Comput. Chem. 30:1545-1614
J. Lee, X. Cheng, J.M. Swails, M.S. Yeom, P.K. Eastman, J.A. Lemkul, S. Wei, J. Buckner, J.C. Jeong, Y. Qi, S. Jo, V.S. Pande, D.A. Case, C.L. Brooks III, A.D. MacKerell Jr, J.B. Klauda, and W. Im (2016)CHARMM-GUI Input Generator for NAMD, GROMACS, AMBER, OpenMM, and CHARMM/OpenMM Simulations using the CHARMM36 Additive Force Field. J. Chem. Theory Comput. 12:405-413
Trzaskowski B, Latek D, Yuan S, Ghoshdastider U, Debinski A, Filipek S (2012). Action of molecular switches in GPCRs--theoretical and experimental studies. Current Medicinal Chemistry.19 (8): 1090–109.
charmm-gui.org/
☆本文转载自知乎--【GROMACS进阶】膜蛋白体系MD模拟教程,作者:化学系胖子不吃饭
转自:“叮当学术”微信公众号
如有侵权,请联系本站删除!