麻省总医院研发了促进人类基因组研究准确性和包容性的方法-肽度TIMEDOO

某种性状或疾病 “存在于你的基因中 “的想法是一个相对较新的科学概念,如果没有对无数人类基因组的研究,就不会被发现。如今,有一些柜台上的DNA检测试剂盒就可以让人了解你的祖先以及疾病的遗传风险–但结果是基于什么?

基因组关联研究(Genome-wide association studies,GWAS)检查不同个体集合中的遗传变异(基因中DNA序列的变化),以确定它们与特定性状的关联。某些变异是常见的良性变异,例如那些导致头发颜色的变异,而其他变异则会导致疾病或增加疾病风险。

每个人类基因组都充满了信息和基因变异,因此识别需要收集和分析大量的数据。不过,大部分可用的数据并不适用于每个人。

大约80%的GWAS研究是利用欧洲人后裔的样本进行的,但这些人只占全球人口的16%。

欧洲人的DNA占现有遗传数据的大多数,这不仅与全球人口现状脱节,而且还意味着科学家对欧洲人的基本遗传学的了解比对其他血统人的了解更多。

麻省总医院综合分析和转化遗传学部门讲师、Broad附属研究所研究员Elizabeth Atkinson博士说:“这实际上可以渗透到健康差异中,因为根据现有的数据,相比其他血统种群,如果你是欧洲人的后裔,我们能更好地弄清楚谁会得病,这显然会是个问题。”

麻省总医院研发了促进人类基因组研究准确性和包容性的方法-肽度TIMEDOO

Elizabeth Atkinson博士

麻省总医院综合分析和转化遗传学部门讲师、Broad附属研究所研究员

Atkinson博士和她的团队正在努力使遗传学研究更具包容性,他们开发了一个名为Tractor的新统计框架和软件包,旨在将混合血统的个体纳入其中。在最近的一篇Nature Genetics 《自然-遗传学》研究论文中,他们的方法能够发现在传统GWAS中被遗漏的新关联,同时提高了研究结果的精度。

为什么传统研究使用欧洲人的样本

一个潜在的解释可能是,最初的基因组收集更多的是在欧洲血统的个体上进行的,这创造了一个循环,不可避免地使GWAS研究更容易使用欧洲血统的样本。”Atkinson解释说:”研究建立在现有知识的基础上,所以如果有很多使用欧洲人的公共数据集,人们就会沿着这条道路走下去,扩展这项工作。”

另一个解释可以归因于与研究具有混合背景的个体和具有多个祖先的个体集合的遗传复杂性所带来的。所有的人类都是在非洲进化的,但后来慢慢分散并迁移到全球各地。Atkinson说:“人口历史的差异导致了不同的遗传变异模式,其中一些可能对健康有参考价值,但很多都是偶然的。”

随着时间的推移,基因变异在特定人群中会自然地根据他们生存环境和生活经验进行漂移。因此,如果不进行适当地校正,”你可能会得到一个与变异显著关联,并认为它使你容易患某种疾病的结果,而实际上这种变异只是在参与研究的人群中更常见而已。”Atkinson博士解释说。

由于这个原因,以前的大多数研究都局限于一次只研究一个祖先血统的群体,在大多数数据队列中,主要的祖先是欧洲人,因而其他血统的人就被排除在外。

Tractor:在基因遗传研究中包括混血人群的影响

混血人群是指其基因组中含有来自多个大陆血统贡献的个体群体。混血群体的例子包括非裔美国人和拉丁美洲人。

Atkinson说,多种祖先使统计分析更具挑战性,这可能是混血群体历来被排除在GWAS研究之外的另一个原因。

但这是一个挑战,并不意味着它不可能。

“美国和全球人口中的这一大部分实际上可以被适当地研究,或者单独在队列中研究,或者与来自多个不同祖先血统群体的混合人群一起研究。这样一来,你就不一定非要把他们排除在外。”

在传统的GWAS中,科学家会通过观察一个人的染色体的总览来说明一个人的多种祖先,并提供总体比例,称为全球祖先分部。例如,一个拉丁裔人的全球祖先分部可能是40%的欧洲人、40%的土著人和20%的非洲人。

然而,Tractor方法利用本地祖先血统,更仔细地观察染色体单个染色体片段以及这些片段来自哪个祖先。这样一来,同一祖先的变异只能相互比较,混淆因素和虚假关联可以得到限制。

麻省总医院研发了促进人类基因组研究准确性和包容性的方法-肽度TIMEDOO

拉丁美洲混血个体的染色体组成                            Tractor方法中显示的来自欧洲的染色体片段

进行这些区分也使科学家能够进行对特定祖先遗传效应大小的估计,这意味着他们可以更准确地衡量某些特定变异对来自特定祖先的人群中的影响,而不是使用一般的平均值。

遗传效应大小是关键的数据点,通常用于根据病人的基因和GWAS汇总统计(多基因风险得分)来估计病人的患病风险。因为现有的遗传效应大小和GWAS摘要统计主要是基于欧洲人,所以它们对非欧洲人来说不太可能准确。

例如,麻省总医院研究员Alicia Martin博士在Nature Genetics 《自然-遗传学》上发表了一篇论文,发现将基于欧洲人基因组的多基因风险评分应用于非洲人的人群时,预测的准确性降低了五倍。

Tractor能帮助提高基因发现工作中混血和非欧洲血统群体的准确性和包容性,有可能改善患者的预后,而且也强化了研究结果。

Atkinson博士指出:”我们不仅更好地控制了人口结构,允许对混合人群进行研究,而且我们也得到了能力上的提升。这使我们有能力发现影响疾病的变异,而这些变异是你使用先前的工具无法发现的。” 为了测试这一点,该团队使用Tractor与已知影响的模拟数据进行对比。当比较标准GWAS的结果和Tractor的结果时,研究人员发现Tractor往往对混合人群的队列数据产生了更优秀的结果。

为所有人提供更好的科学,向前迈进

Atkinson博士开展这项工作的主要动机是允许并鼓励在大规模基因组学工作中能够研究更多样的人群。她表示:“不同祖先之间存在着明显的健康差异,这可以通过将更多不同的祖先纳入GWAS工作中来部分解决。”

她致力于开发一种校准良好的方法来研究不同的人群,这不仅有助于改善这些群体的健康,同时也有助于改善所有人的健康。

Atkinson表示:”我认为强调这一点真的很重要,的确,我们在找出这些多样化和混合人群疾病的遗传基础方面做得不错,但是纳入这些数据对每个人的健康也是有参考价值的。”通过利用混合基因组中发现的多样性,提高了我们对所有种群的疾病遗传基础的理解。”

关于美国麻省总医院

麻省总医院成立于1811年,是哈佛医学院最初设立且规模最大的教学医院。我们拥有全美最大的以医院为基础的研究项目,同时也是美国国立卫生研究院研究资金最大的接受者,我们的研究项目横跨医院的20多个临床部门和中心。麻省总医院可以为几乎每一个专科和次专科、内科和外科领域提供精准的诊断和治疗。我们的六个多学科护理中心以癌症、消化系统疾病、心脏病、神经内科、血管医学和创伤中心的创新而闻名世界。另外麻省儿童总医院提供全面的小儿保健服务,从初级护理到运用尖端疗法诊治复杂和罕见的疾病。麻省总医院连续多年被《美国新闻与世界报道》评为美国最顶级医院之一,也是唯一一家在所有16项专科排名中均获得名次的医院。在接受评估的近5000家医院中,麻省总医院自1990年评选举办开始便一直占据荣誉榜顶级医院之列。

参考原文链接:

https://mgriblog.org/2021/06/01/new-software-promotes-inclusivity-in-genetic-research-and-strengthens-study-results/

Nature Genetics  :https://www.nature.com/articles/s41588-020-00766-y

编辑:李丽