近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(NGDC)开发的表观基因组关联研究资源开放平台EWAS Open Platform上线。相关研究成果以EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study为题在Nucleic Acids Research上在线发表。

随着表观基因组关联研究(EWAS)的爆炸式增长,出现了大量EWAS学术论文,积累了海量EWAS相关数据。对这些数据进行标准化整合,并从已发表论文中提取和挖掘表观关联知识,对于系统的表征和研究不同实验条件下的甲基化状态、探索与各种性状相关的表观遗传分子机制具有重要意义。NGDC在2019年和2020年先后开发了基于高质量的人工审编EWAS知识库(EWAS Atlas)和存储了海量标准化DNA甲基化芯片数据的EWAS数据库(EWAS Data Hub)。

为了提供从数据浏览与下载、在线分析与可视化到知识解释与验证的全面系统的资源和服务,NGDC研究团队在不断整合和更新中心已有EWAS资源基础上,构建了表观组关联研究资源开放平台(EWAS Open Platform)。EWAS Open Platform包括标准化的数据信息库 (EWAS Data Hub)、人工信息提取的知识库(EWAS Atlas)和表观-特征关联在线工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115852个样本的DNA甲基化芯片数据和对应的元数据,并统一采用GMQN方法进行标准化。同时,EWAS Data Hub利用海量高质量DNA甲基化芯片数据和标准化元数据的优势,为485512个探针和36397个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考DNA甲基化图谱;EWAS Atlas共整合了910篇文献中报道的617018个高质量的甲基化与表型关联,涉及618种表型和3385个队列;EWAS Toolkit利用EWAS Atlas和EWAS Data Hub提供的高质量的甲基化与表型关联知识和标准化的DNA甲基化芯片数据,为用户提供多种在线分析和可视化工具,包括富集分析、注释、知识图谱可视化等。

该研究得到了中科院战略性先导科技专项、国家重点研发计划、中科院关键技术人才等项目资助。

论文链接

北京基因组所发布表观基因组关联研究开放平台EWAS Open Platform-肽度TIMEDOO

EWAS Open Platform数据处理流程示意图

来源: 北京基因组研究所