新型人工智能提升CRISPRi引导RNA效能预测-肽度TIMEDOO

多种CRISPR技术被用于有针对性地改变或沉默基因,抑制蛋白质的产生。其中之一是CRISPRi(CRISPR干扰),它可以在不修改DNA序列的情况下阻断基因和基因表达。与传统CRISPR机制类似,引导RNA指导核酸酶(Cas)。然而,CRISPRi核酸酶结合到DNA而不进行切割,导致相应基因的下调表达。CRISPRi已成为在细菌中沉默基因表达的主要技术之一。然而,设计规则仍然缺乏明确定义。

直到现在,预测特定基因的CRISPRi性能一直是具有挑战性的。但研究人员现在已经开发了一种使用数据整合和人工智能(AI)的机器学习方法,以改善未来这种预测的方法。科学家们利用了多个全基因组CRISPRi必需性筛选的数据来训练机器学习方法。他们的目标是更好地预测CRISPRi系统中使用的工程引导RNA的功效。

研究人员发现,目标基因的基因特异性特征对全基因组筛选中引导RNA的减少有显著影响。此外,结合多个CRISPRi筛选的数据显著提高了预测模型的准确性,使引导RNA效能的估计更加可靠。该研究为通过预测引导RNA效能实现更有效的基因沉默策略提供了有价值的见解。

这项工作发表在《基因组生物学》杂志上,题为“通过混合效应机器学习和数据整合改善细菌CRISPRi引导RNA效能的预测”。

“不幸的是,全基因组筛选只能提供关于引导RNA效能的间接信息。因此,我们应用了一种新的机器学习方法,将引导RNA的功效与沉默基因的影响分离开来,”Würzburg RNA感染研究所(HIRI)的研究组长、Würzburg大学医学院的副教授Lars Barquist博士解释说。

该团队开发了一种“混合效应随机森林回归模型,提供更好的引导RNA效能估计”。通过这样做,他们为未来的CRISPRi实验建立了可理解的设计规则。研究作者通过进行一个针对细菌基因的独立筛选验证了他们的方法,结果显示其预测比先前的方法更准确。

“研究结果表明,我们的模型优于现有方法,对特定基因的CRISPRi性能提供了更可靠的预测,”Barquist研究组的博士生Yanying Yu说。

科学家们对发现引导RNA本身并非决定CRISPRi在必需性筛选中减少的主要因素感到意外。“与先前的认知相比,某些与基因表达相关的基因特异性特征似乎影响更大,”Yu解释道。

研究还表明,整合来自多个数据集的数据显著提高了预测的准确性,使引导RNA效能的评估更加可靠。

“通过整合多个实验的培训数据是创建更好的预测模型的关键。在我们的研究之前,数据不足是预测准确性的主要限制因素,”Barquist指出。“我们的研究为开发更精密的工具以操纵细菌基因表达提供了蓝图,最终有助于更好地理解和对抗病原体。”

参考文献: “Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration.

编辑:王洪

排版:李丽