得益于生物资源和相关基因序列数据如今能够随时便捷获取,加上蛋白质生产系统的进步,许多实验室开始自行生产用作生物试剂的蛋白质。这使研究人员能够控制实验中使用的蛋白质的成本、可用性和质量。然而,许多在各自实验室负责生产重组蛋白的研究人员对现有的基因表达系统几乎没有或根本没有经验。
这篇指南的核心是评估了最常用的基因表达系统的关键特征,以此指导准备开始蛋白质生产的研究者选择最适合其需求和资源的系统。系统的主要特征评估基于对欧洲蛋白质生产和纯化伙伴关系(P4EU, https://p4eu.org)成员中进行的一项调查,该组织是一个由活跃于各种蛋白质生产实验室和平台的专业人士组成的网络。我们收集并评估了由 60 位经验丰富的科学家代表的(主要来自欧洲)蛋白质生产中心的信息。他们的所有经验涵盖了数千种不同类型的蛋白质的生产。
不同基因表达系统的信息以两种方式呈现:
这是一种“只需回答四个关键问题就能确定最适合特定目标蛋白的基因表达系统”的决策方案。这些问题基于目标蛋白的生物学特性,并指导读者通过关键的决策点,从这些点出发,遵循方案的不同分支来决定最合适的基因表达系统(图 1)。
▲ 图 1:基因表达系统选择决策方案
该决策方案包含四个关键决策点(图中的①②③④),每个点对应于插图文本框中显示的特定问题。蓝色箭头指示阅读方向。相关的灰色框描述了在各个决策点需要考虑的参数。表达宿主在蓝色框中展示,常用和较少使用的系统分别以蓝色和黑色标注。决策点如下:
1.初始决策点涉及到待生产的目标蛋白的来源,其性质是原核的还是真核的。通常,原核蛋白在细菌中使用不同的大肠杆菌菌株产生(E. coli) 。
2. 然而,对于真核靶蛋白,决策过程中必须考虑多个参数。在细菌中生产这类蛋白质仅建议用于不需要翻译后修饰(PTM;主要是糖基化 )来获得功能活性和/或稳定性的蛋白质,最多含有 3 个二硫键的蛋白质,分子量(MW)最高为 100 kDa 的蛋白质和蛋白质复合物,以及小型膜整合蛋白(IMPs)。通常,对于在细菌中生产的含有二硫键的蛋白质,使用促进胞质二硫键形成的大肠杆菌菌株或将蛋白质分泌到胞间隙中。相反,对于需要功能性 PTM、含有多个(≥4 个)二硫键、以及大于 100 kDa 的大分子蛋白/复合物和更大的整合膜蛋白(IMPs)的真核目标蛋白,推荐在真核系统中生产。
3. 选择使用哪种真核系统(昆虫、哺乳动物、酵母)取决于获得功能性蛋白所需的糖链类型(见不同天冬酰胺[Asn]连接的糖链的卡通模型)。
4. 如果需要更高的蛋白产量和/或高频的生产周期,那么与瞬时基因表达(TGE)相比,投入额外时间(由虚线指示)生成稳定的细胞系(哺乳动物系统)或杆状病毒表达载体系统(BEVS)是值得的。
本文一目了然地比较了最常用基因表达系统的关键特征,包括其易用性、速度、蛋白质生产、折叠、(复杂的)组装及分泌能力,以及预估的运行成本。这些评估的结果在图 2 中以雷达图形式进行了总结。
▲ 图 2:与主要基因表达系统相关的特征的雷达图。
目前,最常用的蛋白质生产系统是大肠杆菌(E. coli)、酵母、哺乳动物细胞和昆虫细胞。在哺乳动物细胞中,瞬时基因表达(TGE)和稳定细胞系都经常被使用;而在昆虫细胞中,使用杆状病毒介导的表达是主要的选择方法。这些系统中与蛋白质生产相关的主要特征按 1-5 的等级进行排名,这使得不同基因表达系统之间的个体特征易于比较。
这里呈现的结果基于在欧洲蛋白质生产与纯化伙伴关系(P4EU)网络成员间组织的一项调查。评分是根据调查结果计算出的加权平均值。调查首先询问了参与者在其所在实验室使用的不同基因表达系统。这些数据随后构成了决定该研究领域中最常用基因表达系统的基础。接下来,要求参与者根据他们个人的实际经验(而非单纯的教科书内容)对他们熟悉的基因表达系统相关的个别特征进行评分。调查共收到 60 份完整的反馈,虽然参与者数量看起来不多,但实际上对应于对数千种不同表达构建的累积经验。
在调查中评估的特征包括:(i)易用性,表明使用特定基因表达系统需要多少经验/需要经过多少训练;(ii)速度,即从质粒 DNA/表达构建到生物量(表达的蛋白质)处理所需的时间;(iii)蛋白质生产能力,表示细胞内平均蛋白质生产能力,单位为 mg/L;(iv)蛋白质分泌,即以 mg/L 培养物为单位的分泌蛋白质生产能力的平均范围(对于大肠杆菌而言是到胞间隙,对于酵母、哺乳动物和昆虫细胞则是到细胞外环境);(v)与目标蛋白大小相关的蛋白质折叠和组装,代表生产功能性正确折叠的单链多域蛋白或多亚基蛋白复合体的能力(取决于它们各自的最大尺寸);(vi)蛋白质折叠和组装与二硫键(SS)数量相关,表明产生功能性和正确折叠(分泌)蛋白质的能力,这取决于它们各自的二硫键数;(vii)成本效率,估算 1L 生产量的可消耗品成本(例如,培养基、转染试剂、一次性烧瓶、质粒准备、细胞维护、病毒生产、细胞计数等)。评分标准基于正面的表现来进行,即更高的分数对应于更有益的产出。
目标蛋白的生物学特性,以及在较小程度上计划的下游应用将决定最合适的基因表达系统。因此,收集你感兴趣的蛋白的原生定位 native localization(细胞内、分泌型或膜蛋白)、大小/分子量、是单结构域还是多结构域蛋白质、存在的二硫键数量,以及可能需要的翻译后修饰(例如糖基化)和/或辅助因子以确保正确折叠和结构完整性等信息是非常重要的。一些组成多亚基复合物的蛋白质本身可能不稳定,因此需要与它们的相互作用伙伴共表达。这类信息可以通过检索科学文献、查阅 Uniprot 数据库(https://www.uniprot.org)以及使用生物信息学工具如 ProtParam(https://web.expasy.org/protparam/)和 AlphaFold 结构预测(https://alphafold.ebi.ac.uk)来收集。
通常情况下,生产原核目标蛋白的首选是大肠杆菌(图 1),尽管还有其他的细菌基因表达系统可供选择(附表 S1)。真核生物目标蛋白的产生是由多种因素共同决定的。对于不需要翻译后修饰且只含有少量二硫键的简单真核目标蛋白,大肠杆菌也可以考虑作为表达宿主(见图 1)。然而,在许多情况下,真核基因表达系统,如酵母、昆虫细胞或哺乳动物细胞可能更合适。这些真核表达宿主之间的主要差异在于它们所提供的糖基化类型(N-糖基化和 o -糖基化)。哺乳动物细胞主要生产复杂型 N 糖链,在糖链分支上修饰有 N-乙酰葡萄糖胺 N-acetylglucosamine、半乳糖 galactose、岩藻糖 fucose 和唾液酸 sialic acid。相比之下,昆虫细胞的 N-糖链通常不会处理成带有末端唾液酸的复杂型结构,而是修饰成少甘露糖 paucimannos 或寡甘露糖结构。此外,核心α(1,3)-连接的岩藻糖修饰 fucose modifications 在无脊椎动物中很常见,但在哺乳动物中完全不存在,因此这种修饰可能会引起免疫反应。单细胞酵母能进行 N-糖基化和 O -糖基化,但其模式与哺乳动物细胞大不相同。酵母的 N 糖链是高/超高甘露糖型,可能会引起抗原性。
当目标蛋白是膜相关蛋白或膜整合蛋白(IMP)时,选择合适的基因表达系统至关重要。虽然可能在大肠杆菌中生产小型膜蛋白,但对于这类更具挑战性的目标蛋白,我们通常更倾向于使用真核宿主生物和细胞系。目前,对于较大的整合膜蛋白——例如,GPCR、离子通道和转运蛋白——最常用的基因表达系统是昆虫和哺乳动物细胞。尽管许多复杂的膜蛋白可以在昆虫细胞中成功生产,但需要注意的是,昆虫细胞的脂质膜环境与哺乳动物细胞的不完全相同。昆虫细胞通常在 27°C 下培养,而哺乳动物细胞大多在 37°C 下培养。由于昆虫细胞和哺乳动物细胞的培养温度不同,两者维持膜流动性所需的脂质类型也不同。
要获得毫克级别的重组蛋白,通常首选基于细胞的体内基因表达系统。然而,如果只需要微克量的蛋白,或者由于毒性问题无法在体内生产,或需要特定配体或添加剂时,体外无细胞表达(CFE)可能是更合适的方案。尽管 CFE 的正确设置通常需要专业培训且自制试剂可能难以获得,但由于其在某些特定项目中的潜在适用性,我们在“无细胞表达”部分提供了关于 CFE 的详细信息和适当的参考资料。基于这些原因,CFE 并未包含在基因表达系统选择的决策方案(图 1)和基因表达系统的关键特性比较(图 2)中。
图 1 和图 2 主要展示了大肠杆菌、酵母、昆虫细胞和哺乳动物细胞,因为这些是常用的、特性明确的且易于获取的基因表达系统。不过,还有许多其他可用的替代基因表达系统,它们具有不同的特性,对于特定的目标蛋白也可能是合适的选择。鉴于这些更“exotic”的宿主生物通常使用较少,我们建议在尝试在实验室内建立这类系统前,先咨询相关领域的专家。例如,植物细胞能够折叠和分泌更复杂的蛋白,并且还具有将重组产生的蛋白质定向到不同细胞室的能力,这对于处理例如有毒蛋白等情况非常有用(详情请参阅附加信息中的“植物中的蛋白质生产”)。尽管大肠杆菌是迄今为止最著名的原核基因表达系统,但其他细菌基因表达系统,如 Vibrio natriegens、Pseudomonas putida、Mycobacterium smegmatis,以及革兰氏阳性细菌 Lactococcus lactis 和 Bacillus subtilis 也可以是相关的选择(见附表 S1)。此外,果蝇 S2 细胞和单细胞绿藻 Chlamydomonas reinhardtii 也代表了其他有趣的替代基因表达系统(见附表 S1)。
本文的目标是通过提出关键问题来评估蛋白质的特性,并将这些问题与不同可用基因表达系统的特点进行匹配,从而帮助读者选择最适合的系统。一旦初步确定了最合适的基因表达系统,读者便可以在本文的特定章节中找到更加详细的信息。各个章节提供了关于每个系统的详尽信息,包括关键评述和相关参考文献。我们为每种系统提供了基本的信息概览,包括它们的优缺点以及充足的阅读资料供参考。
01
E. coli — 最常用的基因表达系统之一
大肠杆菌是最常用的蛋白质生产宿主生物之一,因为它易于使用,成本效率高,速度快,对设备的要求也很低。大肠杆菌通常是生产原核蛋白的首选生物,但许多真核蛋白也可以成功地在大肠杆菌中生产。然而,与真核系统相比,大肠杆菌无法提供大部分的翻译后修饰(特别是糖基化),并且在折叠复杂蛋白时经常失败,如含有多个二硫键的蛋白、真核膜蛋白,或大型多域组装体和多亚基复合物。
在大肠杆菌中,蛋白质可以在细胞质内产生,也可以进入细胞间质,或分泌到细胞外环境。细胞质是一个还原环境,而细胞间质则是一个氧化环境,有助于二硫键的形成,并且具有较低的蛋白酶活性。然而,将蛋白质定向导入细胞的胞间质会导致其产量低于在细胞质中直接生产的情况,而且通常不是所有表达的蛋白都会分泌到细胞间质中。要将重组蛋白定向传导到细胞间质,需要在蛋白的 N 端添加一个细胞间质信号序列(如 phoA、pelB、ompA、ompT、dsbA、torA),该信号序列在穿过内膜后会被移除。蛋白质可以在翻译后(Sec 机制)或翻译过程中(SPR 机制)分泌出来。
广泛可用的大肠杆菌表达载体集合可以通过商业渠道或通过机构或非营利性质粒库获取。这些表达载体包含一套遗传元件(例如,启动子、终止子、复制起始点、抗生素抗性片段等),这些元件允许对我们需要的蛋白质编码序列进行调控表达(见补充信息,“表达载体和菌株”)。在最常用的细菌基因表达系统之一中,我们的目标基因被放置在强大的 T7 启动子的控制之下,这要求使用 T7 RNA 聚合酶来进行转录。
过去几十年里,尽管我们开发了许多不同的大肠杆菌表达菌株,但在所有菌株中,以大肠杆菌 BL21 为基础的菌株使用最为广泛。广受欢迎的大肠杆菌 BL21(DE3)菌株及其衍生物含有一个编码 T7 RNA 聚合酶的噬菌体前体,该聚合酶受 lacUV5 启动子控制,允许 IPTG 调控的 T7 启动子下基因的表达。各种大肠杆菌表达菌株也具有特定特性(见表 S2),使它们更适合特定亚型的蛋白质。例如,一些菌株可以经过基因工程改造,以产生额外的稀有 tRNA 拷贝。这在目标基因的密码子未针对大肠杆菌的表达系统进行优化时特别有用。
其他菌株更适合处理有毒蛋白质的表达,或者更适合在细胞质中表达富含二硫键的蛋白。所需的质粒相关宿主菌株也可以通过非营利(见补充信息,“生物资源”)或盈利途径获得。在大肠杆菌中开始生产新蛋白时,通常推荐评估不同的菌株和不同的表达条件(例如,不同的培养基、生长和诱导温度、诱导时间、诱导剂浓度等)。这种方法也适合于自动化,因此适合高通量筛选。
多年来,我们已经开发了各种方法来解决大肠杆菌在生产更复杂蛋白方面的一些缺陷。例如,一个常用的方法是在目标蛋白上添加融合标签以提高其溶解度。通常,使用低拷贝数质粒和/或低诱导温度来降低基因表达速度,也有助于提高蛋白质的溶解度。此外,共表达分子伴侣可以让大肠杆菌中蛋白质的正确折叠。使用自动诱导培养基也能够提升大肠杆菌中可溶蛋白的产量。另一个选择是对蛋白质序列进行工程化处理,以提高其在大肠杆菌中的溶解度。目前已有一些易用且经过验证的公开可获取的算法。在某些情况下,重组产生的蛋白质聚集成不溶的包涵体,也可以被用来纯化相对均一的目标蛋白并进行重新折叠。但需要强调的是,从包涵体中重新折叠蛋白质需要耗费大量时间进行方案优化,且这种方法的产量通常较低,且必须仔细验证恢复到天然结构的情况。
文中分享了许多实用的通用论文和实验方法,可帮助初学者开始在大肠杆菌中探索蛋白质的生产。再创对其进行了整理。
[1]A. De Marco,Acting on Folding Effectors to Improve Recombinant Protein Yields and Functional Quality,N.A. Burgess-Brown (Ed.), Heterologous Gene Expression in E.coli Methods in Molecular Biology, Springer New York (2017), pp. 197-210, 10.1007/978-1-4939-6887-9_12
[2]G.L. Rosano, E.S. Morales, E.A. Ceccarelli,New tools for recombinant protein production in Escherichia coli : A 5-year update,Protein Sci., 28 (2019), pp. 1412-1422, 10.1002/pro.3668
[3]A. Karyolaimos, J.-W. De Gier,Strategies to Enhance Periplasmic Recombinant Protein Production Yields in Escherichia coli,Front. Bioeng. Biotechnol., 9 (2021), Article 797334, 10.3389/fbioe.2021.797334
[4]J. Royes, P. Talbot, C. Le Bon, K. Moncoq, M. Uzan, F. Zito, B. Miroux,Membrane Protein Production in Escherichia coli: Protocols and Rules,I. Mus-Veteau (Ed.), Heterologous Expression of Membrane Proteins Methods in Molecular Biology, Springer US) (2022), pp. 19-39, 10.1007/978-1-0716-2368-8_2
[5]Y. Rong, S.I. Jensen, K. Lindorff-Larsen, A.T. Nielsen,Folding of heterologous proteins in bacterial cell factories: Cellular mechanisms and engineering strategies,Biotechnol. Adv., 63 (2023), Article 108079, 10.1016/j.biotechadv.2022.108079
02
利用酵母作为蛋白质生产系统
酵母是单细胞真核宿主生物,结合了原核和真核基因表达系统的一些优点。它们适用于高密度发酵,并具有执行某些翻译后修饰的必要细胞机制,如糖基化、二硫键形成和蛋白水解处理。用于蛋白质生产的酵母包括毕赤酵母(Pichia pastoris,又名 Komagataella phaffii)、酿酒酵母(Saccharomyces cerevisiae)、解脂耶氏酵母( Yarrowia lipolytica )和乳酸克鲁维酵母(Kluyveromyces lactis)。
在这些酵母中,甲醇营养型酵母 P. pastoris 在过去 20 年中已成为最受欢迎的基于酵母的基因表达系统之一,而酿酒酵母 S. cerevisiae 则作为主要的遗传工具使用。
在酵母中,蛋白质可以在细胞内产生,也可以分泌到细胞外环境,这需要 N 端信号肽的存在(例如,α交配因子或 Ost1)。P. pastoris 能够进行 N 链和 O 链糖基化。酵母中的蛋白质糖基化主要由非均一的甘露糖长链组成,这与哺乳动物中更复杂的糖基化结构不同,可能导致在哺乳动物体内引起免疫反应。因此,研究人员们已经投入了大量努力来开发能够进行人源化 N-糖基化的 P. pastoris 菌株。
毕赤酵母(P. pastoris)是一种操作简便且相对便宜的基因表达系统。虽然制备表达菌株的过程比大肠杆菌更耗时,但毕赤酵母能够高效地生产重组蛋白,并且能正确折叠复杂蛋白质,同时避免内毒素污染,这对于药物制造和治疗性蛋白的生产尤为重要。P. pastoris 的表达载体通常被整合进其基因组,从而创建稳定且高效表达的菌株。通常我们会先进行小规模的表达测试,以此筛选出产量最高的克隆菌株。在 P. pastoris 中常用的强启动子包括甲醇诱导的 AOX1 启动子和持续活跃的 GAP 启动子。还有各种 P. pastoris 表达载体可供选择,它们可以是野生型菌株,结合抗生素选择使用,或是辅助营养型菌株,允许与表达载体中的特定标记基因互补。
考虑到 P. pastoris 在学术界和工业界中的广泛应用,目前已经有大量的努力投入到进一步提升其蛋白质产量和优化生长条件上。P. pastoris 表达工具箱不断丰富,添加了不少新元件,如 OPENPichia 菌株、不同的启动子(例如 AOX1、UPP、PDF)和信号肽(α交配因子、Ost139)以及用于降低蛋白酶活性和氧化水平的优化培养基。得益于这一领域的诸多努力,目前市场上已有超过 70 种源自 P. pastoris 的商业产品(详情请见 www.pichia.com)。
P. pastoris 可用于生产各种类型的(复杂)蛋白质,但它尤其适用于生产细胞因子(如 IL342)、某些生长因子(如 GM-CSF43)以及不含 Fc 融合的抗体衍生物,如纳米抗体、双体和三体 nanobodies,bibodies, and tribodies。尽管酿酒酵母(S. cerevisiae)用于蛋白质生产的受欢迎程度不如毕赤酵母(P. pastoris),但它在胰岛素、某些疫苗和工业酶的大规模生产中发挥着重要作用。
对于对使用酵母进行蛋白质生产感兴趣的读者,我们推荐阅读 Matsuzaki、De、Mastropietro、Rinnofer 和 Higgins 等人的论文。这些论文是了解这项技术及其基本协议的良好入门资源。
04
杆状病毒介导的昆虫细胞基因表达
杆状病毒介导的昆虫细胞基因表达是学术界和工业界用于异源蛋白质生产最广泛使用的系统之一,并已成为制造膜蛋白的主要技术,特别是 GPCRs 和离子通道、多亚基蛋白复合物、分泌生长因子、类病毒颗粒(VLPs)和哺乳动物细胞的基因传递载体。过去四十年中开发的一系列工具——包括广泛工程化和改进的杆状病毒 Autographa californica multicapsid nucleopolyhedrovirus(AcMNPV)变体、商业化的昆虫细胞系(如 Spodoptera frugiperda 的 Sf9 和 Sf21 细胞系,Trichoplusia ni 的 High Five 和 Tnao38 细胞系),以及无血清添加的培养基——都极大地促进了这一系统的成功。
在昆虫细胞中,蛋白质可以在细胞内生产,或者分泌到细胞外环境,这需要 N 端信号肽的存在。在许多情况下,昆虫细胞肽酶可以识别哺乳动物信号序列,但也可以使用昆虫细胞本身的信号序列(例如 gp67、HBM、SP1、SP2)。尽管昆虫细胞能进行 N-和 O-糖基化,它们缺乏复杂型 N 糖链,这对于治疗性蛋白质的生产是一个限制。然而,可以采用不同类型的方法从鳞翅目昆虫细胞系中获得更类似于哺乳动物的 N 糖基化蛋白质,这通常基于多种糖酶的共表达。
对于在昆虫细胞中生产蛋白质,目标基因想被整合到杆状病毒基因组中,要么通过在大肠杆菌细胞(如 Thermo Fisher Scientific 的 DH10Bac、Geneva Biotech 的 DH10MultiBac 和 DH10EMBacY)中的 Tn7 介导的转座,要么通过将转移载体和杆状病毒 DNA 共转染昆虫细胞(如 Oxford Expression Technologies 的 flashBAC 及其衍生物、FlexiBac)。尽管转座基于整合的方法更耗时,但对于首次使用者来说更易于采用,因为它允许用户通过抗生素筛选、蓝白筛选和 bacmid PCR/测序来控制和监测目标基因的插入。更有经验的使用者可能更喜欢在昆虫细胞中的共转染/同源重组的方法。由于强大的杆状病毒衍生的 polH 和 p10 启动子驱动目标蛋白的表达,无论使用哪种整合工具,感染的昆虫细胞都可以获得高产量,这在 14 个不同专家实验室进行的基准研究中得到了证明。大多数标准的杆状病毒生成程序使用第一次基于转染的杆状病毒通道 P0 的放大,以产生 P1、P2 或 P3。然而,由于杆状病毒颗粒的稳定性有限,缩短程序使用 P0 或甚至无病毒工作(titerless infected-cells preservation and scale-up [TIPS])也已被引入。
在昆虫或哺乳动物细胞中携带和转导 DNACargo 方面,杆状病毒效率无与伦比。在昆虫细胞中已成功共表达了多达 17 个多蛋白复合体的亚基,而在 HEK293 细胞中,使用 BacMam 杆状病毒转导实现了多达 9 个亚基的表达。多种分子克隆技术,如 Golden Gate(GoldenBac)、Gibson 组装 PCR 片段(biGBac)、Cre-lox 重组(MultiBac),使得在杆状病毒基因组中有效组装多基因成为可能。
昆虫细胞中使用杆状病毒介导表达的主要缺点是从 DNA 到目标蛋白的转化所需时间较长,以及杆状病毒随时间衰变。因此,作为替代,还开发了基于瞬时质粒的基因表达方法(详见“昆虫细胞中的瞬时基因表达”部分)。
对于对昆虫细胞中杆状病毒介导基因表达感兴趣的读者,这几篇论文是了解这项技术并获取初始 protocol 的好起点。
[6]I. Berger, D.J. Fitzgerald, T.J. Richmond,Baculovirus expression system for heterologous multiprotein complexes,Nat. Biotechnol., 22 (2004)
[7]I. Berger, A. Poterszman,Baculovirus expression: old dog, new tricks,Bioengineered, 6 (2015)
[8]R.J. Clem, A.L. Passarelli,Baculoviruses: Sophisticated Pathogens of Insects,PLoS Pathog., 9 (2013)
[9]J. Scholz, S. Suppmann,A fast-track protocol for protein expression using the BEV system,Methods Enzymol., 660 (2021)
[10]F. Weissmann, J.-M. Peters,Expressing Multi-subunit Complexes Using biGBac,J.A. Marsh (Ed.), Protein Complex Assembly Methods in Molecular Biology, Springer New York (2018)
04
昆虫细胞中的瞬时基因表达
在鳞翅目昆虫细胞中,使用杆状病毒表达载体(BEVs)来生产异源蛋白质的技术已经非常成熟。BEVs 是一种持续 3-4 天的瞬时表达系统,其过程中昆虫细胞的分泌机制会解体,细胞结构丢失,最终导致细胞裂解。而基于质粒的瞬时基因表达(TGE)则通过化学转染将表达质粒引入昆虫细胞中,从而实现无病毒的蛋白质表达。这种转染后的细胞仍然保持活力并继续生长,不受杆状病毒感染过程的干扰。这种转染后的细胞仍然保持活力并继续生长,不受杆状病毒感染过程的干扰。然而,在昆虫细胞中进行基于质粒的 TGE,需要依赖强效的内源昆虫细胞启动子或即刻早期的杆状病毒启动子。
自 2014 年起,在 Sf9/Sf21 昆虫细胞中使用基于质粒的载体进行无病毒 TGE 的方法已被开发出来,以避免耗时的杆状病毒制备过程(高滴度杆状病毒库的制备可能需要超过 3 周)。最初在 Sf 起源细胞中尝试建立昆虫 TGE 时,蛋白质产量较低,直到 Beckmann、Shen、Mori 和 Puente-Massaguer 等研究者极大改进了此方法,产量才得以大幅提升。他们将 Sf 衍生细胞替换为烟粉虱(High Five)细胞作为表达宿主,并引入了强效的 RNA 聚合酶 II 依赖型即刻早期启动子(来自松毛虫多胶囊核型多角体病毒 OpMNPV 的 pOpIE2 启动子),在 High Five 昆虫细胞中建立了一种快速且简便的无病毒基因表达系统。此后,许多其他实验参数已得到优化,High Five 昆虫细胞中的 TGE 被证明是一种稳健且高效的方法,在一周内生产细胞内和分泌蛋白质。简而言之,High Five 细胞中的瞬时转染是通过向高密度生长的 High Five 昆虫细胞中添加超纯表达质粒(其中感兴趣的基因克隆在昆虫特异的 pOpIE2 启动子和适当的终止子之间)和聚乙烯亚胺(PEI40)作为转染试剂来进行的。经过短暂的 3-4 小时孵育后,继续稀释和培养细胞数天。每次转染的效率可以通过共转染 GFP 控制载体(作为总转染质粒 DNA 的 5%)来跟踪。转染的细胞可以收获,从细胞生物量(对于细胞质蛋白或整合膜蛋白)或在去除细胞后的细胞培养上清液中(对于分泌蛋白)通过3适量的正确折叠蛋白质。
昆虫细胞 TGE 系统的主要优势是可以简单地扩展到几升的经济昆虫培养基中,同时在没有 CO2 需求的 27°C 恒温箱带摇床上培养细胞(与哺乳动物细胞生长需求相反)。表达时间线快速,只需一周就可以完成,一旦表达质粒准备好。昆虫 TGE 还受益于均一的少甘露糖型糖基化,这对于分泌蛋白的结构分析是理想的。最近,它在生产膜蛋白方面的应用也已显示出来。
对于有兴趣在昆虫细胞中使用杆状病毒介导基因表达的读者,我们推荐阅读 Shen、Bleckmann、Puente-Massaguer 和 Shen 等人的论文,它们是了解这项技术发展和如何在 High Five 昆虫细胞中建立 TGE 的优秀参考资料。
05
哺乳动物细胞中的蛋白质生产
哺乳动物细胞特别适合生产较大或更复杂的真核蛋白质,因为它们可以提供与原生环境非常相似的细胞环境。哺乳动物细胞是生产整合膜蛋白(IMPs)和其他需要功能性原生态翻译后修饰的(分泌型 )真核蛋白质的热门选择。用于蛋白质生产的哺乳动物细胞系通常来源自人胚肾 293(HEK293)或中国仓鼠卵巢(CHO)细胞(见表 S2)。由于易于转染,HEK293 细胞系经常用于研究应用,而 CHO 细胞则常作为生物制药蛋白质生产的系统选择。
哺乳动物细胞可以以贴壁细胞或悬浮培养细胞的形式生长。近五十年来,贴壁 HEK293 细胞已用于瞬时转染,因为它们易于培养和维持高重复性,且可以使用便宜的试剂获得高转染效率。此外培养基成本不高,可以在实验室内自行准备。然而,对于大规模蛋白质生产,可能需要使用辊瓶以避免操作大量培养板。相比之下,基于 HEK293 的悬浮培养,通过简单的稀释进行传代,提供了获取大量生物量的更有吸引力的选择。常用的悬浮培养细胞系例如 HEK293-6E(293-EBNA1)、HEK293F 和 Expi293F。HEK293-6E 细胞系(经 Epstein-Barr 病毒核抗原 1 转化)可以与含有 oriP 复制起始点的质粒结合,使得转染后的表达质粒进行外源复制,从而提高蛋白产量。其他适用于悬浮培养的 HEK293 衍生物,如 HEK293F 和 Expi293F,通常在商业化的无血清培养基中培养。悬浮培养所需的培养基比贴壁细胞的更昂贵,且其配方往往是受专利保护的。高密度的 Expi293F 商业系统结合了专有的培养基和转染试剂,其成本可能超出许多学术研究实验室的预算。
重组蛋白质可以通过将质粒 DNA 转染或使用杆状病毒(如 BacMam)转导的方式在哺乳动物细胞中进行瞬时表达。最广泛使用的瞬时基因表达(TGE)方法是使用质粒 DNA 转染,这种方法快速、易于操作,且如聚乙烯亚胺(PEI)等成本较低的转染试剂容易获取。BacMam 是更耗时的方法,因为它需要生成重组杆状病毒,但它对难以转染的细胞系或需要引入大 DNA 片段(例如,用于表达多组分蛋白复合体的 MultiBacMam)时可能效率较高。
通过使用非靶向基因整合方法(如慢病毒)或使用转座酶(例如 Sleeping Beauty、Frog Prince、Minos 或 piggyBac)来生成稳定的哺乳动物细胞池。从卷心菜夜蛾(Trichoplusia ni)中提取的 piggyBac 转座酶及其高活性变体能够有效地整合高达 15 个基因拷贝,其载荷容量可达 9 至 14 kb。使用 piggyBac 转座酶生成的 HEK293 和 CHO 细胞稳定池在过去 10 年中越来越多地用于蛋白质生产,原因有几个:用于转染的质粒 DNA 量少,选择时间短(通常为 11 天),过程适用于多种细胞系,池可以生产高水平的蛋白,且稳定池易于冷冻保存。基于转座酶的系统还可以整合和表达多个基因,并能够利用诱导性四环素启动子来表达细胞毒性蛋白。与多轮瞬时基因表达(TGE)相比,稳定细胞池提供了一个更实惠的选择。
对于有兴趣使用哺乳动物细胞进行蛋白质生产的读者,我们推荐阅读 Pieprzyk、Goehring、Baldi、Fornwald、Behiels 和 Elegheert,以及 Suppmann 等人的论文。这些论文是了解此技术并获取初始协议的理想起点。
06
无细胞表达系统
无细胞表达(CFE)是指在无细胞环境中,使用对转录和翻译所需的组分进行蛋白质生产的过程。CFE 系统通常基于大肠杆菌或真核细胞(例如小麦胚芽、昆虫和烟草细胞)的细胞裂解物。虽然大多数 CFE 系统使用相对粗糙的细胞裂解物,但也存在基于纯化蛋白质和 RNA 组分重构的更为精细的明确系统。在这些细胞裂解物中,去除了低分子物质,并通过添加氨基酸、核苷酸、能量再生系统以及质粒 DNA、线性 DNA 或 mRNA 形式的表达模板来补充 CFE 反应。
CFE 的蛋白质生产效率极大依赖于细胞裂解物的来源和反应的配置方式。使用大肠杆菌或小麦胚芽裂解物的 CFE 系统,在将反应混合物与提供新鲜低分子前体的供给混合物隔离的双隔室配置中,可以实现每毫升反应产生毫克级别的蛋白质。而单罐批次配置以及基于昆虫或哺乳动物细胞裂解物的 CFE 系统的生产水平通常处于微克每毫升的范围内。
CFE 系统的优势在于其开放性、易于获取的特点以及小批量操作。CFE 系统能够耐受包括那些对细胞基表达系统有毒或难以应用的各种配体、稳定剂和其他添加剂。因此,可以通过在共表达目标蛋白质的同时存在辅助因子、相互作用伙伴或配体的环境中,为个别蛋白质的生产创造定制化的环境条件。CFE 在膜蛋白生产方面也具有特殊价值。昆虫和烟草细胞的裂解物保留了能够转位和糖基化合成膜蛋白的微粒体碎片。然而,这些微粒体碎片仅在几μg/mL 的低表达水平下有效,并且可能很快变得过载。另一种方法是向 CFE 反应中添加脂质体、纳米盘或去污剂等膜模拟物,以促进合成膜蛋白的即时共翻译溶解。这些策略适用于高通量应用,并可用于通过结晶、NMR 或电子显微镜等方法确定膜蛋白的功能和结构。
可以选择使用商业化的或自制的 CFE 系统。商业系统通常以单罐批次配置操作,每毫克产品的成本可能变得过高。这些系统可能更适合于只需合成少量微克级别蛋白的情况。蛋白质的合成通常在几小时内完成,且除了移液器和恒温器外不需要其他设备。为了更高频地使用并充分利用 CFE 的全部潜力,研究人员可能更倾向于使用基于易于准备的大肠杆菌裂解物并在两隔室配置中操作的自制系统。所需的基础设施只是一个设备齐全的生化实验室,而 CFEprotocol 开发可能需要一些培训和经验。
通常通过系统筛选来确定支持添加剂、合适的模板设计以及添加剂和关键基本反应组分的最佳浓度,以获得高质量样品。因此,CFE 并不适用于从常规细胞基系统中以合理数量获得的标准蛋白质样品的生产。然而,它可能成为膜蛋白、毒素或用于例如 NMR 研究的标记蛋白样品生产等困难靶标的完美选择。
总之,如果整个平台(包括细胞裂解物生产)可用,或者预期的应用只需要少量样品,CFE 可以成为首选系统。
结论
这份基因表达系统选择指南是基于与 60 多位蛋白质生产领域专家的咨询结果,并融合了作者的丰富实践经验而制定的。这份指南中的决策方案和关键特性比较,涵盖了目前使用最广泛、可获得性最高、并且最容易被理解的基因表达系统。遗憾的是,并不存在一种基因表达系统能“适合”所有情况。通常,所需蛋白的特定特性和预定的下游应用将决定最合适的基因表达系统。还应考虑当地的专业知识和设备的可用性,因为这些因素可能使得某些较不常用的基因表达系统变得可行且经济。在开始实验室内蛋白质生产之前,我们建议读者利用提供的参考资料来更全面地了解潜在的基因表达系统。
转自:“Super Lab”微信公众号
如有侵权,请联系本站删除!