【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

文|吴思涵

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

前言

DNA存在于真核细胞的哪些位置呢?如果你学习过高中生物,应该可以很轻松地回答:细胞核、线粒体、叶绿体。

绝大多数DNA位于细胞核之中。按照目前所有教科书的说法,在真核细胞的细胞核中,DNA一圈圈缠绕在组蛋白上,形成具有高级结构的染色体。所以一直以来我们都有这样的基本认知:核DNA全部位于染色体中。

然而事实却并非如此完美。

在特殊情况下(这里排除病毒感染等外源核酸的入侵),核DNA是有可能从染色体上脱离开来的。比如说,由于电离辐射、紫外线等因素,造成DNA双链断裂。通常情况下,我们的细胞会有相应的修复机制,将缺失的DNA补回去,将废掉的DNA排出细胞外。假设损伤过大,无法修复,细胞也会启动死亡机制,避免表达错误的基因,也避免将错误的遗传信息传递给子代细胞。

不过,这个世界上却有一类特立独行的细胞。它们的遗传信息出现了错误,既不好好修复,又不想去死,让我们十分为难。而这一类细胞便是我的研究对象——肿瘤细胞。

最近,我们实验室在Nature上发表了一篇有关肿瘤细胞染色体外DNA(extrachromosomal DNA,简称ecDNA)的文章:Extrachromosomal oncogene amplification drives tumour evolution and genetic heterogeneity。(传送门 http://www.nature.com/nature/journal/vaop/ncurrent/full/nature21356.html)借此机会,本专栏将连续推出3篇文章,给各位读者介绍肿瘤ecDNA的方方面面。

一、倍体异常和基因扩增是恶性转化细胞的共性

早在1842年,瑞士植物学家Carl Wilhelm von Nägeli率先观察到染色体的存在,从而奠定了细胞遗传学的基础。然而直到百余年后的1956年,科学家们才正式确定,人类体细胞具有46条染色体。不过在正式确定染色体数目之前,已经有不少致力于观察人类肿瘤染色体的研究,并得到一致的结论:恶性转化细胞,或者说肿瘤细胞,其染色体数量和正常细胞的是不一致的,通常是非整倍体地增多。如下图是一篇很早期的文献,报道了人脑胶质瘤有81条染色体。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

染色体数量的增加,意味着基因拷贝数的增加。如果刺激生长的基因数量增加了,那么这个细胞的增殖就容易失控,并在复杂的多基因相互作用及环境选择的驱动下,演化成肿瘤。比如说,许多上皮型肿瘤的7号染色体往往会增加,而这条染色体携带了驱动这一类型肿瘤的EGFR基因(表皮生长因子受体)。

染色体数目增加,是否就是肿瘤细胞原癌基因拷贝数增加的唯一机制呢?其实不是。在肿瘤细胞混乱的核型之中,其实埋藏了许多基因扩增的可能性。

二、染色体外DNA携带扩增的原癌基因

在研究肿瘤核型的时候,科学家们发现了很奇怪的现象。除了染色体数量非整倍增加之外,还可观察到:1、染色体外还有许多能够被染料着色的小点;2、带型染色时,会发现部分染色体呈现大面积的明带或暗带。

如下图A和B,我们可以发现染色体外还存在一些或大或小的染色信号。图C则可以发现,染色体有异常长的明带。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

图A和B的那些小点到底是什么?是染料中的杂质吗?是制备样本时不小心把染色体打碎了吗?答案是否定的,因为用同样的方法制备正常细胞的样本时,却没有发现这些小点的存在,说明这并不是技术错误导致的。而图C的大面积异常的带型,也并非是制备样品时把几条染色体黏在一起了。在荧光显微技术,以及荧光原位杂交技术(fluorescence in situ hybridization,FISH)发展起来之后,我们终于明白,原来这里面蕴藏着大量的原癌基因拷贝。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

比如说上图这个肿瘤细胞系,我们用DAPI(蓝色)来染DNA,用红色的FISH探针来染原癌基因EGFR,用绿色的FISH探针来标记人类7号染色体。(注:EGFR基因位于7号染色体。以及这张图出自我们实验室。)

可以发现,只用DAPI标记DNA,同样可以在左边的样本中观察到许多游离于染色体外的小点,即ecDNA。通过FISH探针可以发现,几乎所有的ecDNA都包含了EGFR基因。右边的样本,EGFR基因的信号则“挤”在一起,形成强染色区域。这也是在做核型染色时会出现连续大面积的明带或暗带的原因。我们把这样的染色区域称为homogeneously staining regions(HSR,均匀染色区)。值得注意的一个现象是,HSR上的EGFR基因,绝大部分不在7号染色体上,而是插到别的染色体,或者自成一体了。

三、ecDNA普遍存在于肿瘤细胞中

我们不禁要问,ecDNA这种现象,是不是肿瘤细胞所特有的?又是否为肿瘤细胞的共性?如下图所示(第三节的图都出自那篇Nature文章,不逐一标注来源了),我们统计了来自143个样本、共计2572个me taphase有丝分裂中期核型(只有制备有丝分裂中期的核型才可检测ecDNA),发现正常细胞的me taphase中极少出现ecDNA,永生化细胞的me taphase存在ecDNA的比例增高,恶性转化肿瘤细胞me taphase的ecDNA比例更高。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

(注:这种图叫做beanplot,中文名姑且称为豆荚图。它是传统box plot箱式图的升级版,既展示了所有数据的分布范围——可展示最大值和最小值,又在水平方向上展示数据的相对分布频数——越“胖”则相对频数越高。据我所知,目前可用R语言来生成beanplot。)

假如把受检的me taphase按照癌种分类,我们可以看出,不同肿瘤细胞类型中ecDNA的比例和数量是不同的。比如结肠癌细胞系me taphase的ecDNA比例低、数量少,而脑肿瘤GBM的ecDNA比例高,数量多。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

在每个样本至少统计20个me taphase的情况下,如果将超过10%的me taphase出现不少于2个ecDNA的样本,定义为ecDNA阳性样本,并重新绘制一张如下的统计图(蓝色阴性,红色阳性),我们可以看到,正常细胞极少阳性,而在传统的肿瘤细胞系(established cell line)中,有接近40%存在ecDNA。在PDX,也就是patient-derived xenograft原代异位移植瘤中,近90%的样本是ecDNA阳性。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

同样地,按照癌种来划分的话,不同类型的肿瘤,ecDNA阳性的比例也不同。如下图所示:

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

此外,还有一个值得重视的现象:对于一个细胞群体来说,不同细胞携带ecDNA的数量是不同的。有的细胞,可能完全没有ecDNA,而有的细胞,可以携带几十甚至上百个ecDNA。通过直方图我们可以看出,在细胞群体中,单细胞中ecDNA数量的分布可能呈正态分布,也可能呈偏锋或双峰分布。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

结合新一代测序和FISH实验,我们进一步证明,常见的扩增原癌基因普遍位于ecDNA,包括仅存在于ecDNA和共同存在于HSR。至此我们可以得出结论,携带原癌基因的ecDNA广泛存在于肿瘤中,并具有复杂的分布方式。而正常细胞几乎不存在ecDNA。

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

四、为什么ecDNA直到近年才得到重视?

或许各位读者并不清楚,早在1962年,科学家就获得了第一张疑似肿瘤细胞存在ecDNA的照片,并于1965年正式在肿瘤细胞中确认ecDNA的存在(当时的叫法是微型染色质小体minute chromatin bodies,这里minute的读音是/mainju:t/,而不是/minit/)。

读到这里,你是不是也很疑惑:为什么如此普遍的现象,却一直没有受到足够的重视?按道理这种几十年前的发现,早就应该被写进教科书了,为何在我们本科甚至研究生的细胞、遗传学等学科的课堂上,相关知识却鲜被提起?而在肿瘤研究领域,尽管在上世纪60年代以后陆续有证据支持,这些ecDNA携带着原癌基因,但却甚少有研究去探讨为何ecDNA会在肿瘤演化中被选择出来,对肿瘤有什么意义。是因为ecDNA并不是什么重要的东西吗?其实不是。我们对此的理解是,新技术的诞生,反而让科学家忘记去思考一些最基本的问题。

提到研究原癌基因的拷贝数,不知各位首先会想到什么方法?

我想绝大多数人的第一反应是:设计引物做一下qPCR,或者干脆直接上测序。FISH?这么老土又费力的方法,才懒得去做,只有诞生在几十年前没有PCR更没有测序时代的长者才会去用吧。

我承认我以前也这么naive过。没错,测序技术的发展,我们对基因组的研究精度是越来越高,分辨率早就到达单碱基水平了。但是,这种序列分辨率的提升,却牺牲了空间分辨率——我们越来越搞不清楚,测出来的某一段序列,到底位于基因组的什么位置。

这时候可能有人跳出来尝试打本司机的脸说,人类基因组早就不知道测完多少年了,现在拿到测序数据后,只要mapping回去就知道是染色体的什么位置了。但我们要明白的是,人类基因组计划测的是健康人的基因组,默认46条染色体不多不少。可是在肿瘤中却有ecDNA的存在,而测序在mapping的时候可不管那么多。因此我们经常会发现,现在的测序数据得到的基因扩增图谱,就是一段染色体,上面画一些高高低低的曲线,代表扩增或者缺失的区域,但却鲜有人去问,扩增出来的序列,到底扩增到哪里去了,或者干脆默认多份串联排列在同一条染色体上了。(如下图所示,扩增在ecDNA与扩增在HSR的EGFRvIII基因,通过测序绘制出来的图谱几乎是一样的,但通过老土的FISH方法却能得知两者的空间定位不同。所以说,要听长者的话。)

【老司机的生物学课堂】染色体外DNA(上篇):原癌基因的载体-肽度TIMEDOO

第二个原因是,传统肿瘤细胞系(established cell line)在过去几十年间成为了绝对主流的研究对象。然而我们的研究却指出,这类经多次传代的established cell line,仅有40%是ecDNA阳性的,而在PDX模型中却高达90%。这说明,研究对象的“先天”不足,也可能导致ecDNA受到忽视。近几年,肿瘤领域支持使用PDX或原代球培养PDC(patient-derived cell)的呼声越来越高,并指出established cell line的各种缺陷,我想,以后应该会有越来越多的科学家加入ecDNA的研究队伍之中。

还有一个可能的原因是技术的限制。研究ecDNA必须观察有丝分裂中期me taphase的核型。而制备me taphase必须使用处于有丝分裂的细胞,因此无法直接在组织块中研究,而须先进行原代分离培养。而一旦使用传统的建系方案而非近几年推崇的无血清球培养方案,则变成了established cell line,有可能丢失ecDNA。此外,制备me taphase的步骤也比较繁琐,并不是每个人都愿意去做。

小结

这一篇文章,本司机向大家介绍了蕴藏着原癌基因的染色体外DNA。原来,肿瘤扩增原癌基因,并不仅仅是通过扩增染色体数目、或者串联排列在同一条染色体上来实现的,而可以存在于ecDNA和HSR。有了ecDNA的机制,每个肿瘤细胞可以获得高达上百个拷贝的原癌基因。

除了可以拥有更高的拷贝数之外,利用ecDNA来承载原癌基因还有什么优势呢?敬请期待下一篇文章的讲解。

原文地址:https://zhuanlan.zhihu.com/p/25158126?refer=bioandchill

(知乎栏目:老司机的生物学课堂)

文 | 吴思涵

本文为作者授权肽度时界首发

仅为作者观点,不代表肽度时界立场

本文未经允许,不得转载