2024-08-08 10:04来源:本站
大多数真核生物的多通道膜蛋白插入到内质网的膜中。它们的跨膜结构域(TMDs)被认为是在它们从膜结合核糖体中出现时共翻译插入的。本研究发现,哺乳动物多通蛋白羧基末端附近的tmd是由内质网膜蛋白复合物(EMC)在翻译后插入的。位点特异性交联表明,EMC的面向细胞质的亲水性前庭与预易位的c端尾部相邻。emc介导的插入与TMD疏水性无关,有利于短的不带电的c尾,并由先前未组装的TMD束刺激。因此,核糖体-转座复合体可以在不完全插入状态下释放多通膜蛋白,需要单独的emc介导的翻译后插入步骤来纠正其拓扑结构,完成生物发生并逃避质量控制。这种顺序的共翻译和翻译后机制可能适用于约250种不同的多通道蛋白,包括对神经传递至关重要的五聚体离子通道家族的亚基。
多通道膜蛋白,由多个TMD的存在所定义,在生物膜上的信息和分子传递中起着至关重要的作用1,2。大多数真核生物的多通膜蛋白是作为单个tmd从膜结合核糖体中产生的,共翻译插入内质网。最近的研究表明,在哺乳动物内质网,多通蛋白的不同部分是由不同的因素插入的。第一个TMD可以通过EMC插入,也可以通过Sec61易位通道4,5,6,7中的侧栅插入。随后的tmd也可以通过Sec61侧门插入或插入Sec61后面由多通转座子(MPT)形成的脂质腔,MPT是三种复合物PAT、GEL和BOS8、9、10的组装体。GEL在结构和进化上与EMC相关,这表明它可能是mpt内的插入因子11,12,13。
据认为,EMC和MPT仅在两侧易位结构域短于50个氨基酸时插入TMD,而Sec61可以介导两侧有较长易位结构域的TMD插入。Sec61可以转运长亲水性多肽,因为它含有一个水性转运通道15,16,17,18,这是EMC或任何MPT复合物所缺乏的特征8,19,20,21,22,23。通过这些方式使用EMC, Sec61和MPT,具有广泛不同拓扑结构和易位结构域的膜蛋白可以共翻译编织到脂质双分子层中3,9。然而,如果最后一个TMD位于C端(以下称为末端TMD)的约50个氨基酸内,则会产生独特的问题。由于终止发生在它与Sec61或MPT接合之前,它的插入必然是翻译后的。多通蛋白的末端TMD是如何插入的尚不清楚。
最直接的情况是倒数第二个TMD和最后一个TMD被一个长易位环分开。在这种情况下,易位环在终止时已经被插入到核糖体结合的Sec61通道中(图1a)。末端TMD在终止后必然进入Sec61通道,从那里进入翻译后的膜,可能是通过Sec61的侧门。相比之下,末端TMD在短易位环之前的插入机制(图1b)或末端TMD在短易位尾之后的插入机制(图1c)尚不清楚。在第一种情况下,倒数第二枚TMD将没有足够的系绳在终止前与Sec61交战。最后两个tmd将从核糖体中释放出来,两者都需要在翻译后插入,同时进行中间环的易位。在第二种情况下,末端TMD也需要在翻译后插入,同时c端尾部易位(图1c)。介导这些翻译后插入反应的因素尚不清楚。
图1:多通膜蛋白末端TMD插入的三种模式。

位于多通膜蛋白停止密码子约50个氨基酸内的tmd在翻译终止时部分或完全位于核糖体出口通道内。这意味着它们必须通过三种翻译后机制中的一种插入,这取决于前面的膜结构域和干预环。a,当倒数第二个TMD之后是一个长(超过50个氨基酸)易位环时,它的易位将依赖于sec61。因此,到终止时,循环将已经通过Sec61通道线程化(左图)。核糖体内的末端TMD必然会进入Sec61(中图),它可能从那里通过Sec61的侧门进入膜。b,当最后两个TMD间隔很近时,两个TMD都不能共翻译插入,因为倒数第二个TMD下游的系链太短,无法在终止时与Sec61接合(左图)。因此,这两种tmd都会在翻译后通过一种未知的机制被释放和插入。c,当最终的TMD位于易位的c端附近时,TMD和尾部在终止时大部分或全部在核糖体内(左图)。它们的翻译后插入机制也是未知的。注意,为了简单起见,没有显示早期tmd的插入和陪伴所涉及的机制。
大而重要的cys环五聚体离子通道家族就是这个问题的例证。该家族包括乙酰胆碱受体、γ-氨基丁酸A型(GABAA)受体、甘氨酸受体等24。它们在神经传递中起着至关重要的作用,它们不正确的生物发生将导致复杂的神经系统后果。每个亚基由4个tmd组成,N端和C端均面向细胞外环境。最后一个TMD后面是一条通常只有10-20个氨基酸的尾巴。这意味着当翻译终止时,TMD4将大部分或全部在核糖体内。鉴于TMD3和TMD4之间存在约100个氨基酸长的胞质环,上述三个tmd应该已经插入。因此,TMD4将从核糖体中释放出来,必须通过图1c所示的途径在翻译后插入。鉴于这类蛋白的特殊重要性,我们研究了GABAA受体亚基的最终TMD是如何插入的,作为上述末端TMD插入一般问题的模型。
在考虑可能介导GABAA受体亚基末端TMD插入的因素时,我们对早期的观察结果很感兴趣,即EMC的丧失会损害蠕虫中cys环五聚体离子通道的多个成员的表达26。由于这些通道的亚基使用n端信号序列进行内质网靶向和n端易位的启动,现在人们认识到,第一个TMD的插入预计不依赖于emc 4。然后,TMD2和TMD3将通过MPT插入,因为它们之间有短的易位循环8,10。这表明EMC要求可能在插入、折叠或组装的后期阶段。在这些可能性中,TMD4插入的潜在作用是有吸引力的,因为生化反应类似于尾锚定蛋白的翻译后插入,这是EMC7,14的既定作用。
为了研究EMC在cys环通道中的潜在作用,我们重点研究了GABAA受体,其对EMC的依赖在哺乳动物中也被发现27。使用先前鉴定的HEK293细胞系,稳定诱导表达异戊二胺GABAA受体28,29,我们测试了急性EMC耗竭的影响。如早期研究所见,在被EMC4敲除的细胞中,诱导的GABAA受体的表面表达减少到不到50%,这通常是EMC30、31、32的其他核心亚基EMC2、EMC3、EMC5或EMC6缺失时插入酶缺失的表型(图2a)。插入sec61的角鲨糖蛋白受体1 (ASGR1)的双色荧光报告基因未见影响,但插入emc的尾锚蛋白角鲨烯合成酶(SQS)的类似报告基因明显减少。GABAA受体α1亚基GABRA1的免疫印迹显示,GABAA受体α1亚基GABRA1缺乏表面表达与其降解相对应,与生物发生失败相一致(图2b)。重要的是,缺乏EMC的细胞含有参与内质网蛋白生物生成的所有主要因子的正常补体(扩展数据图1和参考文献4),与大多数分泌途径蛋白的正常生物生成一致4,14,31,32,33。这表明EMC对GABAA受体生物发生的影响不太可能是间接的。
图2:GABRA1的c端TMD插入需要EMC。

a,用非靶向或靶向emc4的sirna处理表达上述可诱导构建物的稳定细胞系3天,诱导6小时,用植红蛋白(PE)标记的抗体(左)、RFP-SQS总水平(中)或RFP-ASGR1总水平(右)通过流式细胞术分析表面GABAA受体水平。SQS和ASGR1水平归一化为GFP, GFP是一种内部表达控制,通过核糖体跳跃病毒P2A序列与报告基因分离。KD表示击倒。b,用对照或EMC4 siRNA处理的细胞,通过印迹分析GABRA1和EMC4的总水平。β-肌动蛋白作为加载对照。c,人体GABRA1拓扑图;由蛋白酶K (PK)消化产生的预测片段显示在顶部。尾部和回环的长度已标明。NPF, n端保护片段;CPF, c端保护片段。下图为野生型(WT)和emc6敲除(ΔE) 293细胞内质网GABRA1的拓扑分析。35s -蛋氨酸标记的GABRA1在没有(?)或存在来自WT或ΔE 293细胞的SPCs的兔网织网细胞裂解液中被翻译。翻译后,通过离心回收SPCs,并通过SDS-PAGE和放射自显影直接分析(- PK)或进行PK消化(+PK)。不含SPCs的反应在不离心的情况下进行类似分析。?PK和+PK样品的等分通过针对GABRA1 C端的抗体(紫色标记的抗原)进行免疫沉淀。指出了糖基化(+glyc)和非糖基化(-glyc)产物。NPF和CPF分别用绿色和紫色箭头表示。d, 35s -甲硫氨酸标记的SQS和GABRA1都有一个c端糖基化位点,在来自ΔEMC细胞或稳定过表达野生型EMC3-FLAG或EMC3-FLAG变体插入酶缺陷突变体(Mcyt-1-S和R31A)的细胞的SPCs存在下进行翻译。SS表示可切割的信号序列。e,三个独立实验的量化,如d所示,平均值±s.d。绘制。通过绘制糖基化的百分比(对于SQS)或含有两个聚糖的糖基化产物的百分比(对于GABRA1)来量化c尾易位。c, c端。
源数据
为了研究emc依赖性步骤是否涉及GABAA受体的膜插入,我们在体外重建了GABRA1的插入。在半透性细胞(SPCs)存在的情况下,网络细胞裂解液中35s标记的GABRA1的翻译导致内质网腔内n端结构域的信号序列裂解和糖基化(图2c)。使用来自EMC敲除(ΔEMC)细胞的SPCs可以看到相同的结果,这与先前的研究结果一致,表明信号序列使用Sec61来启动独立于EMC4的n端结构域的易位。
我们使用蛋白酶保护实验来监测n端易位下游GABRA1的TMD插入。蛋白酶K切割TMD3和TMD4之间的长胞质环,产生两个保护片段:一个n端保护片段对应于GABRA1的前三个tmd,一个c端保护片段对应于TMD4和一个短易位的c端尾部(图2c)。野生型和ΔEMC SPCs在蛋白酶K消化后产生相似水平的n端保护片段,表明EMC不参与GABRA1的前三个tmd的插入。相比之下,c端保护片段(使用针对GABRA1 c尾的抗体恢复)在ΔEMC型SPCs中减少到不到野生型SPCs的一半,表明TMD4插入受损。为了证实这一结论,我们在GABRA1 c -尾部引入了一个糖基化位点(GABRA1-glyc),以监测c -尾部易位,作为TMD4插入的代理(图2d)。在缺乏EMC的情况下,c尾的糖基化受损超过50%。这种损伤水平与SQS-glyc相似,SQS-glyc是emc介导插入的一种完善的底物。
与SQS一样,GABRA1 TMD4的插入在ΔEMC SPCs中并没有完全消除,这可能解释了为什么GABAA受体表面表达在ΔEMC细胞中没有完全消除。我们考虑了ΔEMC SPCs中残留的GABRA1 TMD4插入是否可能由Sec61的侧门、GEL复合物或GET复合物介导,后者插入高疏水性的尾部锚定蛋白。其中,GET插入酶似乎不太可能,因为后来的交联实验没有观察到膜系住的c端TMD和GET3之间的相互作用,GET3是进入GET插入酶所需的靶向因子14,34,35。由于Sec61和GEL复合物可能分别用于GABRA1 n端易位和TMD2-TMD3模块的插入,因此我们设计了一个简化的报告程序来分离检测TMD4的插入。这个c尾易位报告基因由一个人工信号锚组成,包括23个亮氨酸残基(23L),随后是一个细胞质环、GABRA1的TMD4和易位的c尾(23L-GABRA1)。由于23L可以独立于EMC, GEL或Sec61插入,因此我们可以测试这些因素在TMD4插入中的作用。n端和c端尾部的糖基化位点被用来监测易位。
与全长GABRA1一样,23L-GABRA1的c尾易位依赖于emc。消除GEL复合物(通过敲除其TMCO1亚基)或用Apratoxin A (ApraA) (Sec61侧门36,37,38的有效抑制剂)治疗对23L-GABRA1插入没有影响(扩展数据图2)。将一种或两种操作与消除EMC相结合,没有进一步损害c -尾移位,这表明Sec61和GEL都不能促进TMD4插入。这些结果表明TMD4的插入主要是由EMC介导的,剩余的与EMC无关的插入是在没有帮助的情况下或通过未知的插入酶进行的。鉴于无辅助插入的实验和理论支持39,40,膜系住的TMD4可以很容易地进入这一插入途径。尽管如此,相对于EMC,这些替代机制似乎只是次要的贡献者。
EMC使用一个面向细胞溶胶的亲水性前庭和嵌入膜的亲水性凹槽,它们主要位于EMC3中,以促进与TMD插入相伴随的侧翼亲水性片段的易位7,19,21,23。为了验证这种已建立的机制是否用于TMD4插入GABRA1,我们分析了EMC3突变沿易位途径的影响。在这些实验中,~ 70-90%的内源性EMC3被长期稳定的过表达flag标记的EMC3所取代,多余的EMC3通过细胞质量控制被有效降解6。EMC3在亲水前庭入口的富含甲硫氨酸的胞质环(Mcyt-1-S)或亲水沟槽内的带电残基(R31A)突变都会损害GABRA1的SQS和TMD4的插入(图2e)。这一结果表明,EMC的插入酶活性涉及末端TMD插入,而不是EMC的其他部分,如其假定的伴侣表面41。我们推断这一结论是因为这些突变体的损伤程度在GABRA1的SQS和TMD4中是相似的,而且这些EMC突变体是完全组装和完整的23。因此,GABRA1的最后一个TMD是通过EMC在翻译后插入内质网膜,其机制与先前已知的底物相似。
23L-TMD策略提供了一个简化的报告器来分析影响依赖emc的终端TMD插入的衬底参数。然而,GABRA1 TMD4在该报告中的插入效率相对较低(这一点我们将在稍后讨论),因此我们设计了一个更有效的插入结构,包含SQS的TMD (23L-SQS;图3 a)。23L和SQS之间的连接体与GABRA1最终TMD之前的胞质环长度相同(约100个氨基酸),因此在翻译结束时,23L结构域应该已经插入并扩散到转座子之外,并且终端TMD从核糖体42中出现。我们证实23L-SQS保留了EMC依赖的SQS TMD插入,这是由于EMC插入酶路径的突变而受损的(图3a)。
图3:易位前衬底c尾样品EMC。

a、23L-SQS报告基因(上)由一个短易位n尾、一个由23个亮氨酸残基组成的第一个TMD、一个约100个氨基酸的胞质环、一个第二个TMD和来自SQS的侧边序列以及一个短易位c尾组成。两个端尾都有糖基化位点来监测易位。35s -蛋氨酸标记23L-SQS在来自ΔEMC细胞或表达EMC3变体(WT、Mcyt-1-S和R31A)的细胞的SPCs存在下进行翻译。产品具有不同的糖基化状态。绘制了三个独立实验的定量(均数±标准差)。c尾易位是由含有两种聚糖的糖基化产物的百分比决定的。b, 35s -蛋氨酸标记的23L-SQS在c尾部没有或只有一个半胱氨酸,在来自ΔEMC (ΔE)细胞或表达EMC3- 216c的细胞(其中单个半胱氨酸被引入到位于其细胞质前庭的残基216处无半胱氨酸的EMC3)的spc存在下翻译6。一组直接分析(- BMH),另一组用BMH处理。交联样品直接(+BMH)或EMC3变性免疫沉淀后通过FLAG标签(+BMH EMC3 denat)进行分析。IP)。指出了23L-SQS与0个、1个或2个聚糖的位置,以及23L-SQS与EMC3或管状蛋白的交联。用PNGase F消化含有EMC3交联的通道,以确认交联含有零或一个聚糖,因此不是完全易位的双糖基化23L-SQS的交联。c, 35s -蛋氨酸标记的23L-SQS在c尾或SQS TMD中含有单个半胱氨酸,在EMC3-216C spc存在的情况下进行翻译,并与b.进行类似的分析。d, 35s -蛋氨酸标记的23L-SQS不含或在c尾中含有单个Bpa(通过琥珀色抑制系统),在来自WT或ΔE细胞的spc存在的情况下进行翻译。一种同物直接(- UV)分析,另一种用UV交联。通过FLAG标签(+UV EMC3 denat)对EMC3变性免疫沉淀后的交联样品进行分析。IP)。标注类似于b。
源数据
有了这个结构,我们使用特定位点的化学交联来探测c端TMD插入时的局部环境。23L-SQS c尾的单个半胱氨酸与EMC3 216位EMC细胞质前庭中的单个半胱氨酸交联(图3b)。EMC3与非糖基化和单糖基化底物交联,但与双糖基化底物不交联。这表明EMC的细胞质前庭可以与c端TMD尚未插入但n端TMD已经插入(并糖基化)的底物交联。重要的是,邻近SQS TMD中间的半胱氨酸几乎没有与EMC3交联(图3c)。这为观察到的尾部介导的交联提供了特异性控制,并支持了EMC通过其亲水性前厅介导亲水性尾部易位的模型。
为了进一步支持这一观点,两个独立的EMC3突变体部分损害易位,导致c尾和EMC细胞质前庭之间的交联增加约1.9倍(扩展数据图3)。这一观察结果与易位反应受损时在易位前步骤停留时间较长一致,类似于早期对n端依赖EMC的TMD6的观察结果。尽管效率较低,但在野生型EMC中,23L-SQS c尾部的紫外线激活光交联剂与EMC3交联(图3d)。这些结果表明,一个未完全插入的膜蛋白可能通过膜内的扩散采样遇到了EMC,并利用EMC的亲水性前室在TMD插入时进行了c端尾部的易位。在缺少功能性EMC插入酶的情况下,c端TMD可能会迅速结合到附近的膜表面40,但显然不能通过无辅助机制或其他插入因子有效插入(扩展数据图2)。与膜表面的结合可能解释了为什么在没有EMC的情况下,TMD与细胞质伴侣或靶向因子的交联没有明显增加,而暴露于细胞质中的TMD可能会出现这种情况14,43,44,45。
然后对23L-SQS报告基因进行修改,以测试影响终端TMD插入的底物特征。在第一个系列的实验中,我们发现延长c尾将插入通路从EMC转移到Sec61(图4a)。在25和35个氨基酸的长度上,TMD没有充分暴露在核糖体外,无法参与c尾易位所需的发夹拓扑结构中的Sec61侧门。因此,这些结构不受Sec61抑制剂ApraA的影响,并且对EMC的损失敏感。相比之下,在ΔEMC SPCs中,在55个氨基酸或更长氨基酸处,c尾易位不受影响,但被ApraA完全抑制。45个氨基酸的尾部表现出中间效应,对EMC损失和Sec61抑制都部分敏感。因此,EMC和Sec61在终端TMD插入中基本上是不冗余的。emc依赖性和sec61依赖性之间的关键切换点是~45个氨基酸。这个长度接近Oxa1家族的易位极限(EMC是其中的一个成员46,47),但足以使TMD在适当的环形拓扑中到达Sec61的侧门18。
图4:底物c尾易位的决定因素。

a, 35s -蛋氨酸标记的23L-SQS变体具有不同的c尾长度(上图),在来自WT或ΔE细胞的SPCs存在下翻译。在翻译反应中加入2μM Sec61抑制剂ApraA。直接分析了翻译反应,指出了含有零、一个或两个聚糖的底物。双聚糖产物表明成功的c尾易位。通过计算含有两个聚糖的所有糖基化产物的百分比来量化c尾易位。b,对TMD两侧c尾带电荷残基突变的35s -蛋氨酸标记的23L-SQS变异进行分析,如a所示。变异序列如图所示,显示了c尾侧的净电荷。c,在TMD中分析35s -蛋氨酸标记的23L-SQS突变,如a所示。变异序列与每个TMD的疏水性一起显示为ΔGapp得分65,其中负值表示有利于膜插入。
源数据
23L-SQS c端尾部的带电残基可以适度但明显地减少尾部易位(图4b)。带净正电荷和净负电荷的尾巴没有差异。重要的是,所有这些电荷变体都以一种依赖于emc的方式易位。23L-SQS的c尾易位的电荷不渗透性是出乎意料的,因为如果要易位的尾部含有多个正电荷,则emc介导的n端TMD(即信号锚)或尾部锚定蛋白的插入选择性地不受欢迎4,6,48。这种不同行为的基础可能与emc介导的信号锚点或尾锚点插入与多通蛋白的终端TMD的可用时间长度有关。显示信号锚点的核糖体在对接到Sec61之前有有限的时间进行EMC介导的插入,此时EMC无法进入。类似地,不能被EMC迅速插入的中度疏水尾部锚定蛋白可以插入线粒体。与这一解释一致的是,当Sec61缺失或线粒体靶向受损时,这些信号锚点和尾部锚点的插入分别得到改善6,49。相比之下,当EMC必须插入最后的拴系TMD时,多通道蛋白已经致力于内质网插入,这将延长和重复进入EMC。因此,EMC的底物对正电荷易位的偏好可以通过提供更多的时间来克服,这意味着它可以容纳更广泛的底物作为终端TMD插入酶。
类似的原理可能解释了在23L-SQS背景下,EMC能够适应大范围的TMD疏水性的发现(图4c)。对于尾部锚定的蛋白质插入,emc依赖性受到疏水性的强烈影响,疏水性较高的tmd依赖于GET途径。例如,通过用亮氨酸残基取代TMD中疏水性较低的残基,SQS可以逐渐成为不依赖emc和get的。23L-SQS的相同变化不仅没有改变emc依赖性,但总体上改善了插入。这表明EMC对尾部锚定蛋白的低疏水性tmd的偏好并不是EMC局限性的反映,而是高疏水性tmd被胞浆中的GET途径捕获的结果。综上所述,这些发现表明,EMC对多通蛋白的末端tmd的底物特异性在侧面电荷和疏水性方面是广泛的,但受限于尾部长度短于50个氨基酸。
如上所述,23L-GABRA1显示出终端TMD的emc依赖插入(扩展数据图2),但其效率明显低于天然GABRA1(~38%相比~65%;图5)在考虑可能的解释时,我们认识到,除了其插入酶活性外,EMC还被认为是一种伴侣蛋白33,41。这表明,在原生GABRA1中,TMD4可能是通过其假定的伴侣功能,通过其先前的tmd与EMC接合而接近EMC的。用23L取代GABRA1的前三个tmd会消除这种“靶向”活性,这解释了TMD4插入效率的损失。
图5:针对EMC,便于c端TMD插入。

GABRA1 TMD4或SQS TMD之前是视紫质的23L TMD或TMD1-3,由100个氨基酸连接体分开。这些结构在没有(?)或有来自WT或ΔE细胞的SPCs的情况下进行翻译,并通过SDS-PAGE和放射自显影进行分析。带有0个、1个或2个聚糖的底物被标记。如图4所示,表示c尾易位的百分比。
源数据
作为对这一观点的检验,我们询问如果TMD4之前有一个不相关的膜结构域,可能是假定的伴侣底物,TMD4的插入是否可以被挽救。早期的研究表明,在其所有的tmd插入之前,g蛋白偶联受体是膜内陪伴的目标50。因此,我们在GABRA1的TMD4之前插入前三个视紫质TMD(称为Rho(1-3)),并测试末端TMD插入的效率。为了确保Rho(1-3)不是EMC插入底物,我们在其首次TMD之前使用n端信号肽和管腔结构域启动其易位。相对于23L-GABRA1, Rho(1-3)-GABRA1的末端TMD插入量明显更高,与天然GABRA1相似(图5)。
由于Rho(1-3)与GABRA1的TMD1-3无关,这些结果表明TMD4的有效插入不是由于其与早期tmd的互补。相反,研究结果支持一种模型,在这种模型中,早期的tmd将插入不良的TMD4靶向到EMC以实现有效插入。与这一观点相一致的是,相对于23L-SQS,在插入Rho(1-3)之前插入SQS TMD会得到改善(图5),后者本身比作为尾部锚定蛋白插入的SQS效率略高。这表明,通过将TMD系在膜附近(例如,用23L), emc介导的插入可以略微改善,如果蛋白质的其他部分未成熟(例如,Rho或GABRA1的前三个TMD),则进一步改善。
利用从GABRA1和23L-SQS中获得的见解,我们试图预测人类基因组中EMC的所有其他终端TMD底物。利用AlphaFold2(参考文献51)提供的结构预测,结合positive-inside rule52,我们手动整理了人类基因组中所有1784个注释的多通内质网膜蛋白的方向。通过拓扑结构、总TMD数量和末端TMD的疏水性绘制c尾长度(图6a,b),我们发现244个多通蛋白含有末端TMD,其下游尾部为非胞质,50个氨基酸或更短(补充表1)。从这个人工整理的列表中,我们选择了6个含有不同疏水性和c尾长度的末端TMD的蛋白进行分析。在早期的研究中,已经观察到这些蛋白中的五种或其相近同源物的功能表达依赖于emc26,27,31,33。因此,我们在具有c端糖基化位点的23L-TMD报告基因中测试了它们的末端tmd(扩展数据图4),以确定受损的c尾易位是否可以解释它们的EMC依赖性。其中每一个都至少部分依赖于c端TMD插入的EMC(图7a,b)。不同衬底之间在无EMC情况下的不同插入水平可能反映了它们的无辅助插入能力。或者,根据TMD疏水性或c尾长度,它们可能能够进入其他插入酶,如GET、Sec61或GEL,但这仍有待研究。
图6:多通膜蛋白取向的系统分析。

a,人类基因组中所有注释的多通蛋白(共1784个)的拓扑结构,使用AlphaFold2结构预测来确定TMDs和正内规则来推断取向(见补充表1)。c尾位置(分别为外质和细胞质的ceo或Ccyt)和长度被制成表格并绘制与蛋白质中TMDs的数量相关的图。b, a中的数据相对于最终TMD的ΔGapp65评分重新绘制。图7中分析的c端tmd与emc相关易位的代表性底物以红色突出显示。
图7:EMC有助于c端TMD插入不同类型的衬底。

a, c端TMD报告基因的结构域组织,包含23L和测试TMD(黄色),胞质环(约100个氨基酸)和n尾和c尾的两个糖基化位点(左);包含c端糖基化位点的全长SOAT1(中)和YIPF1(右)的拓扑结构和结构域。b, 35s -蛋氨酸标记的c端TMD报告基因,具有指定的TMD,在没有(?)或有来自WT或ΔE细胞的SPCs的情况下翻译。通过SDS-PAGE和放射自显影直接分析翻译反应。用0、1或2个聚糖表示翻译后的记者的位置。在没有内质网膜的情况下,细胞质质量控制因子识别非易位底物,并用单或多泛素(Ub(n))修饰它们,如黑点所示。注意,S38A1含有两个c尾糖基化位点,导致三糖基化产物(蓝色箭头)。c尾易位按前文数据量化。c, 35s -蛋氨酸标记的SOAT1或SOAT1的n端结构域缺失(SOAT1ΔN),在没有(?)或有来自WT或ΔE细胞的SPCs的情况下进行翻译。其中一组通过n端HA标记进行变性免疫沉淀(总计);另一组进行conconavalin A拉降(ConA)以恢复糖基化群体。指出非糖基化和糖基化产物,并计算糖基化百分比。在ConA恢复的细胞中,糖基化归一化为WT. d,在WT或ΔE细胞中SPCs缺失(?)或存在的情况下,35s -甲硫氨酸标记的YIPF1被翻译,并通过SDS-PAGE和放射自显影直接分析。显示底物糖基化状态和c尾易位的百分比。
源数据
我们还测试了两种不相关的天然蛋白,SOAT1和YIPF1,它们也含有一个带有易位c尾的末端TMD。这些选择是基于其插入的早期步骤与emc无关的预测,从而允许我们使用单个c尾糖基化位点监测终端TMD插入(见图7a)。根据我们的预测(图6),观察到两者都部分依赖于emc的c尾易位(图7c)。由于全长SOAT1的糖基化产物与非糖基化产物的分离具有挑战性,因此我们用一个缺乏n端胞质结构域的分辨率更高的SOAT1结构体验证了我们的结论。通过使用凝集素conconavalin a选择性恢复糖基化产物,进一步验证了全长和n端缺失的SOAT1的全长TMD易位。值得注意的是,早期研究表明,内源性和外源性表达的SOAT1在细胞中都强烈依赖于EMC,但这种依赖的基础尚不清楚32。我们发现SOAT1的最终TMD的插入与细胞中SOAT1的生物发生水平相当,这一发现现在提供了一个解释。约250种新的假定的EMC底物在其拓扑结构和功能上高度多样化,可能有助于解释广泛生物体中EMC损失的复杂和多致表型7,53。
从

摘要。
主要
结果
讨论
方法
数据可用性
参考文献。
致谢。
作者信息
道德声明
同行评审
扩展数据
补充信息
源数据
# # # # #
我们的研究提供了关于膜蛋白拓扑形成问题的三个见解。首先,我们发现,与之前的研究不同,EMC不是亲水性差的tmd所特有的,并且对正电荷的易位没有很强的区分能力。相反,在早期的研究中观察到的EMC对正电荷和高疏水性的偏好似乎是竞争反应的结果。因此,EMC对TMD插入的内在能力比以前认为的要广泛。其次,在细胞中显示EMC要求的各种衬底,如五元离子通道26,27和SOAT132,可能归因于终端TMD插入失败。这些底物一直令人困惑,因为它们既不是尾部锚定蛋白,也不是由Nexo拓扑中的信号锚点启动的(其中N端面向膜的外质侧),这是以前已知的EMC功能靶点。虽然我们不能排除EMC在GABRA1或SOAT1中的其他作用,但在c端TMD插入中看到的缺陷的大小可以解释细胞中的后果。
第三,也许是最重要的概念,是发现多通道蛋白质的拓扑结构可以通过共同翻译和翻译后反应的组合来确定。共翻译事件导致大多数tmd的内质网靶向和插入,而其他tmd可以在底物离开核糖体-易位复合体后在翻译后插入。远离核糖体的扩散(或核糖体与膜的分离)将是EMC介导插入的先决条件,因为EMC不能接近sec61结合核糖体出口通道附近的底物6,22。因此,我们的研究结果表明,至少有一些多通蛋白以拓扑不成熟的形式从核糖体-易位体复合体中释放出来,EMC在稍后的步骤中纠正拓扑结构。针对翻译后校正步骤的EMC可能通过EMC假定的伴侣活性得到促进33,41,它将优先参与未成熟的膜嵌入结构域,如缺乏终端TMD的结构域。在细胞中,未能及时纠正拓扑可能会导致质量控制因子在拓扑不完整的蛋白54,55的膜内或未插入的tmd45,56,57的细胞质中参与,从而解释了为什么这些EMC底物在ΔEMC细胞中被降解。
虽然我们已经证明了c端TMDs的翻译后拓扑校正,但在其他情况下,由短环分隔的TMDs对在翻译后插入也是合理的(例如,图1b)。Oxa1家族(在真核生物中由EMC, GEL和GET复合物组成)已被证明能够进行这种插入8,10,58,59,60,如果在共翻译插入过程中跳过一些tmd,则可能需要这种插入。在早期的研究中已经提出了tmd的跳过以及翻译后的重排,但这种机制的基础尚不清楚。我们的研究结果现在提出了一种利用Oxa1家族成员的合理机制,这是一个值得在未来工作中进行实验分析的想法。
我们的研究增加了Oxa1家族和SecY家族之间存在直接功能分离的新原理3,9。Oxa1家族成员在侧翼多肽易位片段短于50个氨基酸时介导TMD插入,而Sec61(或原核生物中的SecY)在侧翼易位结构域较长时介导TMD插入。在真核生物中,尾部锚定蛋白通过GET和EMC插入蛋白14,62,63,带有短易位n末端尾部的信号锚定蛋白通过EMC4,6插入,带有短环的内部TMD对通过GEL8,10插入,如图所示,带有短易位c尾部的末端TMD使用EMC插入。在细菌中,唯一的Oxa1家族成员YidC将完成所有这些工作,这也许可以解释为什么它是必不可少的。真核生物中更大、更多样化的膜蛋白质组可能推动了内质网定位Oxa1家族成员的扩展和特化,这可能也为膜蛋白生物发生的基本过程提供了一定程度的冗余和稳健性。
所有细胞在37°C、5% CO2的DMEM (Gibco, 10569-010)和10%胎牛血清(Gibco, 10270106)中培养。野生型和ΔEMC6 HEK293细胞之前已经被描述过14。ΔTMCO1 HEK293细胞系来源于R. Keenan20。通过敲除ΔEMC6细胞中的TMCO1产生ΔEMC6ΔTMCO1双敲除细胞。Alt-R S.p Cas9-GFP V3 (IDT, 10008100)与Alt-R CRISPR-Cas9 sgRNA (5 ' -ACTTGTCTGTCCTGTAAACC-3 ';IDT)按照制造商的建议。按照制造商的方案,使用Lipofectamine RNAiMAX (Invitrogen, 13778150)将核糖核蛋白复合物转染ΔEMC6细胞;48 h后,绿色荧光蛋白(GFP)阳性细胞分选成单菌落并扩增。免疫印迹法筛选敲除细胞。Flp-In T-REx 293细胞稳定表达野生型EMC3-FLAG (NP_060917.1)或EMC3-FLAG变体(Mcyt-1-S: M101、106、110、111S;R31A;F148L;R13E)是通过将每个构建体整合到FRT位点,并选择通过100μg ml-1的潮霉素B进行2周的flp介导重组而产生的。先前已经报道过四环素诱导的表达人GABAA受体的293细胞系29。在该细胞系中,pcDNA4-TO-Zeocin主链α1亚基(NP_001178048.1)在其27个氨基酸信号序列后被flag标记;pcDNA3.1-TO-Hygromycin主干中的β3亚基(NP_068712.1)未标记;pACMV-TO-blasticidin主干中的γ2L亚基(NP_944494.1)在(GGS)3GK连接子后的C端被标记为1d4 (TETSQVAPA)。在pcDNA5-FRT-TO骨架中表达GFP-P2A-RFP-SQS (NP_004453.3, aa378-410)和GFP-P2A-RFP-ASGR1 (NP_001662.1)报告基因的四环素诱导293细胞系是通过将报告基因质粒稳定地整合到FRT位点而产生的,此前已有报道4。
用于体外转录和翻译试验的质粒或gblock (IDT)含有SP6启动子和编码序列。所有质粒均经测序验证。野生型GABRA1 (NP_001345964.1)包含两个突变(V436M和L448M),在不改变TMD长度、疏水性和c尾电荷的情况下,便于通过放射自显影技术检测c端结构域。GABRA1-glyc是通过在野生型GABRA1的C端添加一个视蛋白标签(MNGTEGPNFYVPFSNKTVD)66生成的。SQS-glyc (NP_004453.3, aa378-410)先前已被描述过14。23L-GABRA1包含一个n端9×His标签、一个糖基化序列、β1-肾上腺素能受体的可溶性尾部(NP_001290104.1,残基29-44)、23个亮氨酸密码子、一个可溶性胞浆环(GGSG-mEGFP(1-92))、TMD4和GABRA1的侧翼区域(NP_001345964.1, aa 407-455)和一个视蛋白标签。23L-SQS用SQS的TMD和侧翼区域取代23L-GABRA1的TMD4和侧翼序列(NP_004453.3, aa378-410)。图3和图4中使用的23L-SQS变体是通过定点诱变获得的:P202C (c尾半胱氨酸用于EMC交联);p202琥珀(用于将光反应性氨基酸掺入c尾);S168C (TMD中的半胱氨酸);S185E(?3);E189R (0);E189R D190R (+ 2);S185R、E189R D190R (+ 3);T183L(1升);T182L T183L (2 l);Q179L、T182L T183L l (3);S177L、Q179L T182L T183L (4 l);及S168L、S177L、Q179L、T182L、T183L (5L)。通过插入mCherry的部分编码序列,将c尾长度延长至25、35、45、55、65和225个氨基酸。如图5所示,GABRA1和SQS结构体中位于胞质环之前的Rho(1-3)结构域包含以下内容:泌乳素信号序列(NP_776378, aa1-33)、双链标签(SAWSHPQFEKGGGSGGGSGGSAWSHPQFEK)、连接子(aggsagsggsagggsa)、VHP结构域(NP_990773, aa792-826)、糖基化位点、连接子(GGGSAGGGSA)和视紫红质(NP_001014890, aa32-152)。对于图7b所示的报告基因构建,TMD4和23L-GABRA1的侧翼区域被以下序列取代:CNIH2 (NP_872359, aa126-160);VATL (NP_001685, aa119-155);S38A1 (NP_109599, aa440-487);ACHA4 (NP_000735, aa588-627);5HT3B (NP_006019, aa402-441);GLRB (NP_001159532, aa463-497)。SOAT1 (NP_003092.4)以视蛋白糖基化标签附加在C端。SOAT1的n端缺失去除了2-125个氨基酸。YIPF1 (NP_061855.1)来源于R. Keenan。
为了监测GABAA受体的表面表达,根据制造商的方案,使用Lipofectamine RNAiMAX将阴性对照小干扰RNA (siRNA) (Invitrogen, 4390843)或EMC4 siRNA (Ambion, s27733)转染到表达人GABAA受体的293细胞系中。siRNA终浓度为10 nM,总敲除时间为66 h。60 h,加入终浓度为0.1μg ml-1的强力霉素,诱导GABAA受体表达6 h。然后收集细胞并进行表面标记。将细胞用100μl冷PBS重悬,加入1μl植红蛋白标记的FLAG抗体(biolgend, 637310),在4℃黑暗孵育1小时。然后用冷PBS洗涤细胞,通过70μm过滤器,然后在BD LSR II流式细胞仪上分析合适的荧光通道。总共分析了30,000个事件,并使用FlowJo将反映GABAA受体表面水平的藻红蛋白荧光绘制为直方图。为了分析ASGR1或SQS的稳定性,我们采用293株稳定表达GFP-P2A-RFP-ASGR1或GFP-P2A-RFP-SQS的细胞系。这些结构体中的P2A序列导致核糖体跳变,导致等量的GFP和rfp标记蛋白的翻译。因此,一个稳定的RFP:GFP比值反映了RFP标记蛋白的稳定性。生物发生的失败将导致细胞质量控制途径的降解和RFP:GFP比率的降低。对GABAA受体细胞进行敲除,用流式细胞术检测3万个细胞的GFP和RFP荧光。RFP:GFP比率使用FlowJo绘制为直方图。
95-100%合流的细胞胰蛋白酶化,4℃离心收集,用冷水1×PBS洗涤一次,重悬于含有0.01%纯化洋地黄苷67的1×RNC缓冲液(50 mM HEPES, pH 7.4, 100 mM KOAc, 5 mM Mg(OAc)2)中。SPCs成球,并用1×RNC洗涤一次。为了消化内源性mrna,将SPCs重悬在100μl含有1 mM CaCl2和150单位/ ml微球菌核酸酶的1×RNC中(Roche, 10107921001)。在室温(20℃)下酶切10分钟,加入终浓度为2mm的EGTA终止酶切。核酸酶消化的SPCs成球,用1×RNC缓冲液洗涤一次,在0.5×RNC缓冲液中重悬至每ml 6,000-10,000个细胞,并立即用于易位试验。
约80%的融合细胞通过胰蛋白酶化收集。细胞成球,用冷1×PBS清洗一次,并在液氮中快速冷冻。解冻后的细胞球与5体积20 mM HEPES混合,pH 7.4;5mm KCl;1.5 mM MgCl2;2 mM二硫苏糖醇(DTT);和蛋白酶抑制剂(Roche, 10106399001),在冰上孵育15分钟。细胞在冰上通过35次浸泡均质溶解(DWK Life Sciences, 357542)。细胞裂解液调整为20 mM HEPES, pH 7.4;210 mM甘露醇;蔗糖70mm;0.5 mM EDTA;2 mM DTT;还有蛋白酶抑制剂。在700×g上,4°C离心10分钟,清除细胞碎片和细胞核。然后在8,500×g上4℃离心10分钟使膜成球,洗涤一次,在含有20 mM HEPES, pH 7.4的缓冲液中重悬;210 mM甘露醇;蔗糖70mm;0.5 mM EDTA;2 mM DTT;和蛋白酶抑制剂,OD280为20。用不同量的重悬膜印迹法测定关键易位成分的水平。
SP6聚合酶转录反应在37℃下进行1小时,包含以下成分:编码翻译反应所需区域的DNA (PCR扩增,由Qiagen PCR纯化试剂盒纯化,10 ngμl-1);HEPES, pH 7.4 (40 mM);亚精胺(2 mM;σ,S0266);RNA帽结构类似物(0.33 mM;内,S1404L);还原性谷胱甘肽(10 mM);MgCl2 (6mm);ntp(每个0.5 mM用于ATP;罗氏,10519979001),CTP (Sigma, C1506)和UTP (Sigma, U6875), 0.1 mM用于GTP(罗氏,10106399001);SP6 RNA聚合酶(0.4 Uμl-1;内,M0207L);RNase inhibitor (0.8 Uμl-1);Promega N2515)。
翻译反应在32°C下进行30分钟,包含以下成分:微球菌核酸酶消化的兔网织细胞裂解物(Green公顷)(占总体积的34%);上一步的转录反应(5%体积);SPCs(10%体积);ATP和GTP各1mm;ATP再生系统(磷酸肌酸(12 mM);罗氏公司,10621714001);肌酸激酶(0.04 mg ml-1;罗氏公司,10127566001));亚精胺0.3 mM;HEPES, pH 7.4 (20 mM);KOAc (50 mM);Mg(OAC)2 (2mm);还原性谷胱甘肽(1mm);纯化自猪肝的trna (0.05 mg ml-1);20种氨基酸中除蛋氨酸外19种(每种40μM);Promega L9961);35s -蛋氨酸(0.5μCiμl-1);PerkinElmer NEG709A001MC)。
为了将光反应性氨基酸对苯甲酰-l-苯丙氨酸(Bpa)通过琥珀色抑制,翻译反应中包括以下成分68:抑制物Bacillus stearothermophilus tRNACUATyr(5μM);大肠杆菌Bpa tRNA合成酶(0.25μM);Bpa(100μM)。将这些组分预混合到10倍溶液中(50 mM HEPES, pH 7.4, 100 mM KOAc, 1 mM Mg(OAC)2),在32°C下预孵育15分钟,然后加入平移反应。如需说明,Sec61侧门抑制剂ApraA(从V. Paavilainen和K. McPhail获得)在2μM处加入翻译反应。
60μl体外翻译反应在冰上冷冻,将SPCs成丸(20,000×g 2 min),用1×RNC缓冲液(50 mM HEPES, pH 7.4, 100 mM KOAc, 5 mM Mg(OAc)2)洗涤一次,并在30μl 0.5×RNC缓冲液中重悬。不含SPCs的样品直接使用,不进行制粒。样本被分成两个等分;1等分物(占总体积的2 / 3)调整为0.5 mg ml-1蛋白酶K,冰孵育50分钟。蛋白酶K通过加入250 mM PMSF淬灭2分钟,然后将整个反应转移到10倍多余体积的1% SDS, 100 mM Tris-HCl, pH 8.0,预热到100℃,加热10分钟。样品要么直接分析,要么进行免疫沉淀,如图图例所示。
120μl体外翻译反应用于双马来烯-亚胺己烷(BMH)交联实验。翻译反应后的所有步骤都在4°C下进行,直到反应在SDS中变性。将SPCs制成颗粒,用60μl 0.5×RNC缓冲液重悬。去除一个等分物作为无交联对照,其余样品调整到250μM BMH (Thermo Scientific, 22330),在冰上孵育10分钟。通过调整DTT的终浓度为25 mM来抑制交联反应。样品在1% SDS, 100 mM Tris-HCl, pH 8.0中变性后,直接分析或进一步处理进行免疫沉淀或去糖基化。SMPH(琥珀酰亚胺基6-(β -马来酰丙胺)己酸酯))和UV交联实验与BMH交联实验相似,不同之处是:SMPH (Thermo Scientific, 22363)交联(200μl总反应)在200μM终浓度下反应30 min,用50 mM Tris-HCl pH 7.4和5 mM DTT猝灭;在UVP black - ray B-100AP高强度灯照射下,在样品上方约10 cm处进行UV交联(总反应量为100μl)。
在交联、蛋白酶K消化和聚糖酶消化后变性免疫沉淀已经被描述过6。sds变性后的样品在冷冻免疫沉淀缓冲液(1×PBS, 250 mM NaCl, 0.5% x -100, 10 mM咪唑)中稀释10倍,与2.5μl抗flag树脂(Millipore, A2220), 2.5μl单克隆抗ha树脂(Millipore, A2095)或5μl蛋白A树脂(Repligen, CA-HF-0100)以及相应的抗体混合。每次免疫沉淀共使用1.25μg GABRA1抗体(Invitrogen公司,PA5-79291)。在4°C下,将混合物端对端旋转1.5 h (FLAG或HA)或3 h (GABRA1免疫沉淀)。用冷免疫沉淀缓冲液洗涤2次,在10μl 2.5× SDS-PAGE样品缓冲液中煮沸洗脱10 min。对于去糖基化实验,交联样品(图3)或总翻译反应(扩展数据图4)在0.5% SDS和50 mM Tris-HCl, pH 8变性后分成两半。一半未经处理,另一半调整为1% NP-40, 1× GlycoBuffer 2和25 U ml-1的PNGase F (NEB, P0704S),在32℃下消化30分钟。两半均进行如上所述的免疫沉淀(图3)或直接分析(扩展数据图4)。
所有含有tmd的蛋白均从UniProt数据库中检索69。UniProt注释用于定义TMD螺旋的开始和结束。含有单个TMD或定位于线粒体的多通膜蛋白的蛋白质被手动从这组中移除。AlphaFold2(参考文献51)预测结构,可从UniProt数据库中获得,用于剩余的1784个多通膜蛋白,人工检查以注释TMD螺旋的数量和每个TMD侧翼结构的总电荷。整个基本侧翼被指定为细胞质,按照正内规则52。然后识别c端TMD并分配适当的取向、疏水性(使用?Gapp predictor65计算)和侧翼c尾长度。面向胞浆的c -尾被命名为“Ccyt”,面向相反方向的c -尾被命名为“ceo”。策划清单载于补充表1;利用该表的信息生成图6中的图。
细胞裂解物或内质网富集膜在12% Tris-Tricine凝胶上进行SDS-PAGE分析。将SDS-PAGE凝胶转移到硝化纤维素膜(Biorad, 1620112)上,使用5%脱脂奶粉作为阻断剂,按照标准程序进行印迹。使用以下抗体和稀释液进行印迹:CCDC47 (Bethyl Laboratories, A305-100A;1:5,000);EMC3 (Invitrogen, 711771;1:5,000);EMC6 (Abcam, ab84902;1:1,000);Calnexin (Enzo, ADI-SPA-865;1:5,000);Sec61α (ref. 70;1:5,000);TMCO1 (Invitrogen, PA5-43350;1:50 0);Sec61β(参考文献71;1:5,000);CAML (Cell Signaling Technology, 13913S;1:1,000);FLAG M2-HRP (Sigma, A8592;1:5,000);EMC4 (Abcam, ab123719;下);β-肌动蛋白- hrp (Sigma, A3854;1:10,000)。
使用Fiji对原始磷成像仪文件进行定量。测量每个波段的像素强度和面积,并从中减去背景强度。对于c端TMD报告者,c尾易位的计算方法是将c尾易位带(通常为2×-glycosylated积)的值除以总膜插入带(通常为1×-glycosylated和2×-glycosylated带)的总和。在SQS-glyc(图1d,e), SOAT1(图7c)和YIPF1(图7d)的情况下,通过将糖基化带的强度除以糖基化带和非糖基化带的总和来计算c -尾易位的百分比。
本研究不包含任何统计分析。本文中的所有数据都是在独立实验中得到的。以下主要数据图面板和扩展数据图面板的独立实验数量用括号表示:图2a (2);图2b (2);图2c (2);图2d (3);图3a (3);图3b (3);图3c (2);图3d (3);图4a (2);图4b (2);图4c (2);图5 (2);图7b (2);图7c (SOAT1图4,SOAT1ΔN图2);图7d (6);扩展数据图1 (2);扩展数据图2 (2);扩展数据图3 (2);图4(2)。
有关研究设计的更多信息可在本文链接的自然组合报告摘要中获得。
ccDownload: /内容/ pdf / 10.1038 / s41594 - 023 - 01120 - 6. - pdf