基因组测序表明,除了少数常见的突变基因外,影响癌症基因组的大多数突变都很罕见。为了解释这些罕见突变,一种有力的方法是依据突变所影响的蛋白质系统将他们进行划分。以这种方式来理解癌症基因组需要克服两个关键的挑战:(i) 我们如何全面绘制癌细胞中的蛋白质系统?(ii) 我们如何确定哪些系统处于突变选择之下?近日,由加州大学旧金山分校(UCSF)和圣地亚哥分校(UCSD)主导的研究团队在Science杂志上背靠背发表了三篇文章,以亲和纯化质谱(AP-MS)测定了癌细胞中以关键癌症蛋白为中心的蛋白质相互作用(PPI)网络,并通过和现有的蛋白质互作网络和癌症基因组数据整合,构建了一个多尺度的图谱,对癌症中具有显著突变的蛋白质系统进行了研究。其中两篇文章分别侧重于对乳腺癌和头颈癌细胞系中发现的的描述和下游生物功能分析。最后一篇文章(Zheng et al.)系统描述了构建癌症突变的图谱的信息学方法,题为:Interpretation of cancer mutations using a multiscale map of protein systems。研究者进一步通过多种实验手段研究图谱中全新的蛋白质系统,并发现了之前未知的突变促致癌症的机理。
系统生物学:通过多尺度蛋白质系统图谱理解癌症中的突变-肽度TIMEDOO系统生物学:通过多尺度蛋白质系统图谱理解癌症中的突变-肽度TIMEDOO
在本文中,研究者首先整合了两篇配套文章中的PPI和先前研究中的PPI数据以及四种其他类型的证据——包括mRNA和蛋白质的共表达,序列相似性以及遗传共依赖性。基于监督机器学习,对所有证据进行定量加权和组合,以创建每对人类蛋白质的综合关联严格性 (Integrated Association Stringency, IAS) 。由于IAS分数代表了蛋白质关联的连续度量,在不同的IAS阈值下可从PPI网络中识别出不同强度和大小的蛋白质系统。通过分层社区检测(hierarchical community detection)算法,强关联且较小的蛋白质复合体被包含在较大的组件中,从而形成了层次结构。当应用于整个 IAS 网络时,分层社区检测总共识别出 2338 个蛋白质系统。值得注意的是,当数据支持时,该方法允许蛋白质出现在不同的系统中。例如,β-catenin被置于不同的系统,分别代表了其在adherens junction和β-catenin destruction complex中的功能。为确定哪些系统在癌症中面临突变的压力,研究者开发了一个统计模型HiSig,以确定一组系统,可以最佳地解释所有基因中观察到的突变模式,同时寻求尽量减少此类解释所需的系统数量。利用TCGA的癌症体细胞突变数据,在13种常见癌症中,HiSig分析共确定了319个在一种或多种癌症中存在突变选择的系统,从而产生了称为NeST(Nested Systems in Tumors)的最终图谱。研究者对NeST的系统做了全面的注释,并使用独立的癌症数据集进行了重复性验证。

接下来,研究者选择了两个新发现的NeST系统进行实验验证。AP-MS数据中的PPI建立了PIK3CA和一组肌动球蛋白(myosin; 包括MYH9和MYH10)之间的新的特异性物理关联。通过邻近连接测定(Proximity Ligation Assay)和超分辨率显微镜,研究者证明了PIK3CA和MYH9在头颈癌细胞系CAL-33中共定位。通过测量PI3K信号通路的下游标志物AKT和S6的磷酸化水平,实验结果表明抑制myosin功能可激活PIK3CA介导的的信号传导。

系统生物学:通过多尺度蛋白质系统图谱理解癌症中的突变-肽度TIMEDOO
在另一个由纤维状胶原蛋白(fibrillar collagen)组成的系统中,HiSig分析在多种癌症中发现了这一系统具有显著升高的突变频率——这些突变在过去对显著突变的单基因分析中往往被忽略。胶原蛋白含有富含甘氨酸和脯氨酸残基的螺旋重复区域,这些结构域对于胶原蛋白正确折叠成三聚体束至关重要。研究者假设胶原蛋白的突变可能通过破坏蛋白质折叠从而破坏细胞外基质的结构来促进肿瘤进展。使用成纤维细胞(fibroblast)表达正常或突变体的胶原蛋白基质,研究者发现在突变体基质中培养的肺癌细胞的增殖大大增加,这些数据支持胶原蛋白突变在破坏肿瘤微环境以促进癌症进展方面的作用。
系统生物学:通过多尺度蛋白质系统图谱理解癌症中的突变-肽度TIMEDOO
最后,研究者分析了NeST系统的突变和癌症预后的关联,并使用NeST系统提名了一个548个基因的癌症基因目录。目录中预测的新的癌基因和已知的癌症基因具有相似的性质,而和其他的基因显著不同。研究者们展望,相对于单基因水平的突变,系统水平的突变有望成为更有效的预后分析和药物治疗响应的生物标志物。同时,文章中的信息学方法不仅适用于癌症,未来可用于分析和研究其他多基因突变导致的疾病。UCSD的Trey Ideker教授和UCSF的Nevan Krogan教授共同领导了此项研究。

郑凡博士(时为UCSD博士后)为此文的第一作者。UCSD的J. Silvio Gutkind教授,Stephanie Fraley教授,和俄勒冈健康与科学大学(Oregon Health and Science University)的南小林教授也为本研究提供了关键数据。

原文链接:
https://doi.org/10.1126/science.abf3067

来源:结构生物学高精尖创新中心