广东省人民医院余学清团队、南方医科大学张镇海团队以及中国人民解放军海军军医大学曹广文团队联合在线发表了群体水平下人抗体组库特征谱的研究,揭示了包括基因使用率、基因重组偏好、公共克隆以及体细胞超突变在内的多个抗体组库的关键特征。

2021年5月11日,国际学术期刊《细胞报告》在线发表了这一研究成果,博士生杨修佳为第一作者。

抗体组库(Antibody repertoire)是指某一特定个体或组织所包含的全部抗体的集合,它是人类适应性免疫系统的重要组成部分。抗体的多样性源于多个机制,包括生殖系基因片段的重组、连接位点的修饰、体细胞超突变以及重轻链配对等。据估计,这些机制可以产生至少1012种不同的抗体,因此,多样化的抗体能够特异性地识别几乎是无限的潜在免疫原。

早期的技术(即Sanger测序和谱型分析)由于通量小或分辨率低,极大地限制了对抗体组库的研究。然而,高通量测序的出现使人们能够以单个核苷酸的高分辨率同时对数以百万计的抗体进行深入仔细的研究,这一技术被称为抗体组库测序(Ig-seq)。抗体组库测序的出现极大地促进了我们对体液免疫的理解,目前抗体组库测序的应用已在过敏反应、炎症反应、传染病、自身免疫、抗体发现以及疫苗筛选等领域取得了重要进展。特别地,在全球新冠病毒大流行期间,抗体组库测序还被成功地用于新冠病毒感染患者体液免疫动态变化的监视以及针对新冠病毒的中和抗体的筛选。

鉴于其巨大的潜力,研究者们根据特定的研究目的,生产了一批又一批的抗体组库测序数据。然而,由于其难以估量的多样性,单个研究所使用的样本的代表性相当有限。此外,不同的研究通常使用不同的分析流程,这使得不同的研究之间的结果难以相互比较。因此,基于大数据的抗体组库特征描述显得尤为重要。

在张镇海教授的指导下,博士研究生杨修佳、张艳芳、朱燕以及硕士研究生曽惠昆等收集了2,152套高质量的抗体重链测序数据集,并对包括基因使用率、基因重组偏好、公共克隆以及体细胞超突变在内的多个抗体组库关键特征进行了深入细致的分析。该团队发现:52个核心V基因参与了超过99%的抗体的重组;V基因重组在染色体上同时具有近端和远端的位置偏好性;人与人之间幼稚B细胞抗体组库的相似性在取样不足的情况下可能会被低估;RGYW相关的体细胞超突变(Somatic hypermutations,SHMs)倾向于被阳性选择。以上这些研究成果为抗体组库研究提供了重要的基线(baseline)参考。

余学清/张镇海/曹广文团队联合揭示人抗体组库的关键特征-肽度TIMEDOO

实验设计及主要研究成果示意图。

基于上述52个核心V基因的发现,该团队进一步的研究表明,其中26个V基因的使用在健康人和非健康人之间有显著的差别。例如,在非健康人中,IGHV4-34、IGHV4-39和IGHV4-59被下调,而IGHV1-18、IGHV1-69和IGHV3-11被上调,这一结果暗示可根据V基因的使用率来区分个体的免疫状态。紧接着该团队利用机器学习的方法以V基因的使用率作为输入,比较了包括该研究所定义的52个核心V基因在内的三个V基因集合在区分健康和非健康个体时的性能表现,结果表明该研究所定义的52个核心V基因集预测性能更优(AC=0.686,AUC=0.763)。因此,这一结果不仅证明了利用抗体组库特征对个体的健康状态进行分类的可行性,还表明了该研究所定义的52个核心V基因集是一个更好的预测器(predictor)。

另外,值得注意的是,该团队在体细胞超突变的分析中,将V基因生殖系序列上的每个位点按照突变的后果(即错义突变或同义突变)进行分类,从而揭示了RGYW模体在体细胞超突变中的阳性选择现象。这一研究成果表明靶向不同突变热点位点对抗体亲和力成熟可能会带来不同的影响,从而对疫苗的设计和选择提供重要指导。

“人类抗体组库极度多样。与之前的研究相比,我们所分析的样本数量虽然有了显著的提升,但还远远不足以捕捉到抗体组库所有的多样性。此外,为了更好地理解体液免疫,我们还需要更为广泛的疾病状态下以及不同亚型和组织类型的抗体组库数据集。与其他项目相比(如TCGA),目前的数据集相当有限。想要充分释放抗体组库测序应用的潜力,未来还需要更多在不同生理条件和免疫学干扰下的样本数据集。”该文的第一作者杨修佳评论道。

相关论文信息:https://doi.org/10.1016/j.celrep.2021.109110

来源:科学网