2020年10月19日,国际学术期刊Nucleic Acids Research在线发布了中国科学院上海营养与健康研究所(中国科学院-马普学会计算生物学伙伴研究所)王泽峰课题组与生物医学大数据中心合作开发的专门提供各类支持环状RNA (circRNAs)翻译证据的数据库TransCirchttps://www.biosino.org/transcirc/),该数据库通过整合多种组学数据来预测特定环状RNA编码蛋白质的潜力并推断其翻译产物。文章题为“TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence”。

环形RNA是一类由反向剪接形成的具有共价闭环解构的RNA,在真核生物中具有广泛表达且保守的特点。由于其序列与对应线性RNA大部分重合,因此可以天然通过结合miRNA或RNA结合蛋白(RBP)来调控亲本基因的表达。近年来的研究发现,定位在细胞质中由外显子构成的环形RNA也可以发挥类似mRNA的作用来指导蛋白质的翻译,这类非帽依赖性翻译通常在应激反应(如癌症发生过程)中上调,是细胞在翻译水平上改变应激反应途径的重要表现。

随着测序技术的发展,目前有大量的环形RNA被鉴定出来,与之不匹配的是为数不多的注释数据库,TransCirc就是针对这一需求构建的基于多组学证据的环状RNA翻译数据库。目前,TransCirc中收录了328080条人类环状RNA信息和七类相关证据,其中:1) 核糖体谱(ribosome profiling)鉴定出与核糖体结合的环状RNA共4284条;2) 含实验鉴定的翻译起始位点(TIS)、内部核糖体进入位点(IRES)和N-6-甲基腺苷修饰位点(m6A)的环状RNA分别有10058、314111和40324条;3) 274762条环状RNA含环状RNA特有编码框(ORF),其推断翻译产物中机器学习预测可形成稳定蛋白质和含质谱数据(MS)直接支持的分别有194927和168条。除以上数据外,TransCirc还提供了友好的搜索/浏览界面及辅助分析软件。TransCirc作为研究环状RNA翻译能力及其编码肽段功能的重要资源,未来将收录更多相关组学数据并将扩展覆盖到其他非人物种。

中国科学院上海营养与健康研究所王泽峰研究员和张国庆研究员为文章的共同通讯作者,黄文娣和凌鋆超为共同第一作者。上述研究工作得到了科技部国家重点研发计划、中国科学院、国家自然科学基金委和上海市科学技术委员会等经费的支持。(科技处)

原文标题:

TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa823/5930392

来源:中科院