Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO

2024年1月22日,《自然》杂志发布了2024年的最值得关注七大技术,其中最后一项技术中国科学家高彩霞团队开发的新技术成果入选。与以往不同的是,今年最显著的变化之一是人工智能在许多激动人心的技术创新中占据核心地位。

蛋白质设计的深度学习

20年前,位于美国西雅图的华盛顿大学的大卫·贝克(David Baker)教授及其团队取得了一项重大突破:他们利用计算工具从零开始设计了一个全新的蛋白质。这个名为‘Top7’的蛋白按照预测的方式折叠,但它是惰性的,没有执行任何有意义的生物功能。如今,全新蛋白质设计已经发展成为一个实用的工具,用于生成定制的酶和其他蛋白质。“这是一个巨大的推动力,”与贝克团队合作设计基于蛋白质的疫苗和药物传递载体的华盛顿大学生物化学家尼尔·金说道,“一年半前还不可能的事情,现在你只需去做。”这一进展的许多原因归结于日益庞大的数据集,将蛋白质序列与结构相联系。但深度学习,一种人工智能(AI)形式,也变得至关重要。“基于序列”的策略使用了像ChatGPT这样的大型语言模型(LLMs),将蛋白质序列视为包含多肽‘词语’的文档。通过这些算法,研究人员可以识别出构建真实世界蛋白质的架构规律。“它们真的学到了隐藏的语法,”西班牙巴塞罗那分子生物学研究所的蛋白质生物化学家诺埃利亚·费鲁兹表示。2022年,她的团队开发了一个名为ProtGPT2的算法,该算法在实验室中生产时始终产生折叠稳定的合成蛋白质。费鲁兹还共同开发了一种名为ZymCTRL的工具,利用序列和功能数据设计天然酶家族的成员。基于序列的方法可以在现有蛋白质特征的基础上构建和调整新的框架,但对于定制结构元素或功能的设计,例如以可预测方式结合特定目标的能力,它们的效果较差。而“基于结构”的方法更适用于这一点,2023年也取得了这类蛋白质设计算法的显著进展。其中一些最复杂的方法使用‘扩散’模型,这也是图像生成工具如DALL-E的基础。这些算法最初被训练用于从大量真实结构中去除计算机生成的噪音;通过学习区分真实的结构元素和噪音,它们获得了形成生物合理的、用户定义的结构的能力。

贝克实验室开发的RFdiffusion软件和马萨诸塞州桑默维尔Generate Biomedicines公司的Chroma工具利用了这一策略,取得了显著的效果。例如,贝克的团队正在使用RFdiffusion工程新型蛋白质,这些蛋白质可以与感兴趣的目标形成紧密的界面,产生“完美符合表面”的设计。RFdiffusion的新版本甚至允许设计师在计算上塑造蛋白质,使其围绕非蛋白质目标,如DNA、小分子,甚至金属离子。

深度换脸检测

随着可生成人工智能算法的公开化,制作逼真但完全虚构的图像、音频和视频变得越来越简单。尽管这为人们提供了有趣的娱乐选择,但在多场地发生的地缘政治冲突和即将到来的美国总统选举之际,武器化媒体操纵的机会也屡见不鲜。纽约布法罗大学的计算机科学家Siwei Lyu表示,他已经看到了与以色列-哈马斯冲突相关的许多人工智能生成的“深度伪造”图像和音频。这只是一场高风险的猫鼠游戏,人工智能用户制作欺骗性内容,而李思维和其他媒体取证专家努力检测和拦截它。解决方案之一是让生成人工智能的开发者在模型输出中嵌入隐藏信号,形成内容的水印。其他策略集中在内容本身。例如,某些篡改视频会用另一位公众人物的面部特征替换掉原有特征,新算法能够识别替换特征边界的痕迹。外耳的独特褶皱也可显示出面部和头部之间的不匹配,而牙齿的不规则性可显示出编辑口型同步视频的迹象,其中一个人的嘴巴被数字处理,说出主体未说过的内容。AI生成的照片也带来难题,且不断变化。2019年,那不勒斯弗雷德里科二世大学的媒体取证专家路易莎·维尔多利瓦(Luisa Verdoliva)协助开发了FaceForensics++,用于检测多个常用软件处理的脸部图像。但图像取证方法因主体和软件而异,通用性是一个挑战。“你不能有一个单一的通用检测器——这非常困难,”她说。实施也面临挑战。美国国防高级研究计划局(DARPA)的语义取证(SemaFor)项目虽然开发了实用工具箱用于深度伪造分析,但主要社交媒体网站并未定期使用。增加对这类工具的访问或有助于推动采用,为此,Siwei Lyu的团队开发了DeepFake-O-Meter,这是一个集中的公共算法库,可以从不同角度分析视频内容以嗅探深度伪造内容。这些资源有助于解决问题,但对抗人工智能生成的虚假信息的战斗可能将持续多年。

脑机接口

Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO
△脑机接口技术让Pat Bennett(坐着)重新开始说话
帕特·贝内特(Pat Bennett)的生活曾经受到运动神经元病的影响,也被称为肌萎缩侧索硬化症。这使得她的言语速度较慢,有时候还会出现使用错误词语的情况。然而,这一切都发生在她无法通过口头表达自己的时期。幸运的是,贝内特的生活改变得归功于由斯坦福大学神经科学家弗朗西斯·威利特和美国BrainGate联盟团队开发的先进脑机接口(BCI)设备。为了帮助贝内特重拾语言能力,威利特和他的同事在她的大脑中植入了电极,用于追踪神经活动。接着,通过深度学习算法,科学家们成功将这些神经信号翻译成了语言。在经过几周的系统训练后,贝内特竟然能够以每分钟62个单词的速度说话,她的词汇量高达125,000个词汇,超过了普通英语说话者的两倍。这对于一个之前无法通过语言表达的个体来说,无疑是一个惊人的成就。值得一提的是,类似BrainGate的试验不仅仅是一例。在过去的几年里,各种研究表明,BCI技术对于帮助那些受到严重神经损伤的人恢复失去的技能、实现更大独立性方面取得了显著进展。这其中,对各种神经病症患者大脑功能的深入了解起到了关键作用。而机器学习驱动的分析方法则进一步加强了对电极放置和信号解读的认识。

除了在神经学领域的应用,研究人员还将基于人工智能的语言模型用于更快速地解释患者试图传达的信息。这种“大脑自动完成”的核心组成部分在不同研究中都得到了应用,取得了令人瞩目的成果。

总体而言,BCI技术的不断发展为那些面临严重残疾的患者带来了新的希望。而随着技术的演进,科学家们看到了将其应用于治疗中度认知障碍和心理健康状况的潜力。霍奇伯格教授认为,这种由脑-计算机接口启发的闭环神经调节系统可能对更广泛的人群产生巨大帮助。

Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO

超分辨率显微技术

2014年,Stefan Hell、Eric Betzig和William Moerner因突破光学显微镜“衍射极限”获得诺贝尔化学奖,将空间分辨率提高至几十纳米。然而,科学家们渴望更高分辨率,近期取得重要进展。德国普兰格的Max Planck团队于2022年底推出MINSTED方法,使用专业光学显微镜可以以2.3埃的精度解析单个荧光标签。较新的RESI方法使用传统显微镜在标准荧光显微镜下解析DNA链上的个别碱基对,展示ångström级分辨率。
Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO
△一种称为 RESI 的成像形式可以对 DNA 中的单个碱基对进行成像。图片来源:Nature
来自哥廷根大学医学中心的科学家团队开发的ONE显微镜通过将样本中的蛋白质与水凝胶基质化学耦合,使蛋白质分解,再扩展水凝胶体积1000倍,实现了在标准共聚焦显微镜下解析相隔几纳米特征的能力。这些超分辨率显微镜方法的进步为科学家提供了更深入地研究生物分子和蛋白质结构的能力。从个体蛋白质的构象动态到蛋白质异构障碍的诊断,这些技术在生物医学研究中具有巨大潜力。科学家们对未来进一步提高空间分辨率的可能性充满期待,这也许只是超分辨率领域的开始。

细胞图谱

Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO
△人肺细胞图谱描述了不同的细胞类型及其调节方式。图片来源:Nature
人体细胞图谱项目像是为身体打造了一张谷歌地图。谷歌地图能帮你找到咖啡馆,而细胞图谱则可以帮助生物学家们了解身体内部的复杂结构。最大的项目之一是人类细胞图谱(HCA)。它由英国威康萨研究所的萨拉·泰克曼和美国Genentech公司的阿维夫·雷格夫于2016年发起,有来自近百个国家的3000名科学家,合作处理来自1万名捐赠者的组织样本。此外,还有美国国立卫生研究院资助的其他项目,如Human BioMolecular Atlas Program(HuBMAP)和Brain Research through Advancing Innovative Neurotechnologies(BRAIN)倡议下的Cell Census Network(BICCN),以及由艾伦研究所资助的Allen脑细胞图谱。这些项目得益于分析工具的发展,这些工具能够在单细胞水平解读分子内容。通过这些技术,科学家们取得了生成器官特异性图谱的进展。例如,HCA去年发布了对人类肺部的综合分析。泰克曼表示,这种清晰的肺部图谱对了解肺部疾病如纤维化、肿瘤以及COVID-19等具有指导作用。尽管还有大量工作需要完成,但这些细胞图谱一旦完成,将为医学研究提供无价的资源。泰克曼预测,这些图谱将用于指导药物研发,而其他科学家则希望通过图谱了解细胞环境对疾病的影响。

纳米3D打印

纳米尺度的世界充满了奇妙和有趣的事物,而科学家们正在利用这个特性制造轻巧且功能独特的材料。他们使用激光进行“光聚合”来精确制作这些纳米材料,近年来,他们在克服一些难题上取得了进展。首先是速度问题,通过新的方法,科学家们加快了组装纳米结构的速度,比之前快了一千倍。其次,不同于一些常见的3D打印方法,这种技术可以更灵活地使用各种材料,甚至包括金属。最后,虽然之前的设备价格昂贵,但现在科学家们也在研究更便宜、更紧凑的激光系统。这项技术的发展有望在未来为我们带来更先进的材料,比如更耐用的防弹衣或者飞机外层。
Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO

大片段DNA插入

2023年末,美英监管机构首次批准了CRISPR基因编辑疗法,用于治疗镰刀细胞病和依赖输血的β-地中海贫血,这标志着基因编辑正式迈入临床应用的新时代。CRISPR及其衍生技术通过使用短的可编程RNA将DNA切割酶(如Cas9)引导到特定的基因组位点。这些技术通常用于实验室中,用于关闭缺陷基因和引入小的序列变化。然而,精确地插入跨越数千个核苷酸的较大DNA序列是一项具有挑战性的任务。为解决这一问题,科学家们正在尝试不同的方法,以实现对缺陷基因关键部分的替换或插入完全功能的基因序列。在斯坦福大学的分子遗传学家Le Cong的研究团队中,科学家们正在研究一种称为单链退火蛋白(SSAPs)的病毒衍生分子,这种分子介导DNA的重组。通过将SSAPs与已禁用Cas9的CRISPR–Cas系统结合,研究人员成功实现了对人类基因组的精确定位插入长达2千碱基的DNA。另一种方法利用了称为prime editing的CRISPR方法,引入短的“着陆垫”序列,选择性地招募酶,再将大DNA片段精确地剪接到基因组中。在麻省理工学院,研究人员首次描述了可编程靶向元素介导的prime editing(PASTE)方法,这种方法可以精确插入长达36千碱基的DNA。PASTE尤其有望在离体修改患者细胞方面发挥作用,而底层的prime-editing技术已经在进行临床研究。
Nature发布2024年最值得关注七大技术,中国科学家新技术成果入选!-肽度TIMEDOO
△高彩霞照片
这些技术不仅局限于人类健康领域。中国科学院遗传与发育生物学研究所高彩霞开发了一种名为PrimeRoot的方法,使用prime editing引入特定的靶点位点,这些靶点位点可用于在水稻和玉米中插入长达20千碱基的DNA。这种技术被认为可能广泛应用于为作物赋予疾病和病原体抗性,延续了CRISPR基因编辑植物的创新浪潮。随着这些突破性技术的出现,基因编辑正朝着更为精准和高效的方向迈进,为治疗遗传性疾病和改善作物品质提供了新的可能性。这一切预示着基因编辑将在未来扮演着越来越重要的角色,为人类健康和农业生产带来福音。
编辑:王洪排版:李丽参考文献:1.https://www.nature.com/articles/d41586-024-00173-x

2.Ferruz, N., Schmidt, S. & Höcker, B. Nature Commun. 13, 4348 (2022).

3.Munsamy, G., Lindner, S., Lorenz, P. & Ferruz, N. ZymCTRL: A Conditional Language Model for the Controllable Generation of Artificial Enzymes (MLSB, 2022).

4.Ingraham, J. B. et al. Nature 623, 1070–1078 (2023).

5.Krishna, R. et al. Preprint at bioRxiv https://doi.org/10.1101/2023.10.09.561603 (2023).

6.Rössler, A. et al. Preprint at https://arxiv.org/abs/1901.08971 (2019).

7.Li, Y., Zhang, C., Sun, P., Qi, H. & Lyu, S. Preprint at https://arxiv.org/abs/2103.02018 (2021).

8.Yarnall, M. T. N. et al. Nature Biotechnol. 41, 500–512 (2023).

9.Sun, C. et al. Nature Biotechnol. https://doi.org/10.1038/s41587-023-01769-w (2023).

10.Willett, F. R. et al. Nature 620, 1031–1036 (2023).

11.Metzger, S. L. et al. Nature 620, 1037–1046 (2023).

12.Sharlene, N. et al. Science 372, 831–836 (2021).

13.Weber, M. et al. Nature Biotechnol. 41, 569–576 (2023).

14.Reinhardt, S. C. M. et al. Nature 617, 711–716 (2023).

15.Shaib, A. H. et al. Preprint at bioRxiv https://doi.org/10.1101/2022.08.03.502284 (2023).

16.Sikkema, L. et al. Nature Med. 29, 1563–1577 (2023).

17.Saha, S. K. et al. Science 366, 105–109 (2019).

18.Ouyang, W. et al. Nature Commun. 14, 1716 (2023).

19.Saccone, M. A. et al. Nature 612, 685–690 (2022).

20.Hahn, V. et al. Nature Photon. 16, 784–791 (2022).