“亚楠是现代的具有文艺复兴风格的研究者。”

加州理工学院的 Yisong Yue 教授对眭亚楠给出了颇富诗意的评价。这个通常用来描述建筑或文艺作品的形容词放在他身上，意味着导师对其研究风格和成果的高度肯定。

过去十年中，眭亚楠一直身处机器学习、神经工程、机器人三个前沿学科的交叉领域，通过将原创机器学习方法引入神经调控技术，对瘫痪、帕金森病等神经系统疾病进行临床治疗，在理论、方法、实践三个方向均有建树。

在 2020 年机器人与自动化国际会议（ICRA）上，他与合作者关于偏好反馈学习优化机器人外骨骼的研究成果同时斩获大会最佳论文奖和最佳人机交互论文奖，成为首位获得最佳论文奖的中国大陆学者。这也是大会历史上首次有论文同时获得两项大奖。

凭借在机器学习和神经调控技术领域的基础理论研究以及创新技术应用，清华大学航天航空学院助理教授眭亚楠入选了《麻省理工科技评论》“35 岁以下科技创新 35 人” 2020 年中国区榜单。

图 | 《麻省理工科技评论》“35 岁以下科技创新 35 人” 2020 年中国区榜单入选者眭亚楠

让 AI 学习神经调控

眭亚楠本科毕业于清华大学，曾在中国科学院神经所研究神经环路可塑性。在 2019 年加入清华任教之前，他先后在加州理工学院和斯坦福大学攻读博士学位及从事博士后研究，师从 Joel Burdick 教授、Yisong Yue 教授及 Fei-Fei Li 教授。

谈到返回清华的原因，他表示自己 “在留学之前就希望回国建立自己的实验室做研究，现在我就在清华，是如愿以偿。”

神经调控技术，一般指利用植入或非植入技术、电或化学作用方式，刺激或改变神经系统中的神经元或神经信号。目标人群通常患有神经系统损伤、运动障碍、瘫痪、视觉或听觉障碍等疾病。

眭亚楠告诉 DeepTech，神经调控是治疗此类疾病的重要方法。他长期关注脊神经损伤导致的瘫痪，因为这个领域曾长期缺乏安全高效的治疗手段。

通过植入脊髓的阵列电极，刺激感觉-运动神经通路，是目前治疗脊髓损伤导致瘫痪的最先进医疗方案。

图 | 将刺激电极（中）植入脊髓硬膜外进行治疗（来源：眭亚楠）

不过使用这些阵列电极时，还要面临不少问题，其中核心难点是寻找最佳刺激模式。

患者的生理和病理差异，决定了每个人对电压水平和刺激频率的承受能力不同。而在临床治疗中，面对海量的刺激模式组合，用试错、穷举的实验方法为每个患者寻找最佳方案也是不切实际的。

那能不能让人工智能（AI）来解决这个问题？

如果把所有可能的刺激模式视作一个输入空间，那么就可以把诸如电极、电压、频率一类的变量的排列组合都罗列出来，然后进行全局优化。把这个过程抽象成函数，就可以尝试用传统优化算法找到函数的最优解。

遗憾的是，传统优化方法在实际操作中行不通，因为普通的全局优化策略无法顾及安全约束，尤其是未知的安全约束。

在没有在患者身上施加刺激之前，没人知道哪种刺激模式会奏效，同样也没人知道哪种刺激模式会造成伤害 —— 这就是所谓的 “未知安全约束”。

图 | 脊神经刺激在线临床实验（来源：yanansui.com）

医生会充分考虑在施加神经刺激的过程中保障患者安全，但传统 AI 方法面对未知的安全约束时，寻找最优解的过程可能缺乏安全性。

针对这个难题，眭亚楠开发了用于控制复杂多电极刺激阵列的新型在线学习算法的理论和实践方法，在保证算法满足安全约束的前提下，高效寻找最优解。这些方法还能拓展到如深部脑刺激等其他多电极问题和机器人系统的安全控制。

更重要的是，他的研究成果已经成功帮助下肢瘫痪患者重新站起来，并恢复高位截瘫患者手部抓握功能，是这个领域最早用于有创临床治疗的机器学习算法之一。

如何满足未知的安全约束

具体来说，眭亚楠利用并融合了自己之前的两项研究成果：面向未知安全约束的在线机器学习方法和利用偏好反馈进行在线强化学习。

第一项工作是他在加州理工学院攻读博士时开始的，主要解决在线强化学习方法缺乏安全性保证的问题。

在探索优化问题时，研究者通常会设立约束，但有时人们并不知道全部的约束条件。以此为前提，AI 算法需要既满足约束条件，又要求出最优解。

他提出的方法是首先将安全约束抽象成一个函数 —— 由于安全约束条件未知，因此函数的形状也是未知的 —— 但可以利用高斯过程作为数学工具对其建模，由此得到安全约束在数学上的显式表达式。

在此基础上加入一些合理的假设和初始值，比如由人类专家提供一套安全的神经刺激模式作为初始点，然后就可以利用在线学习等 AI 算法不断摸索并扩大安全区间，勾勒出满足安全约束的函数的形状。

图 | 利用高斯过程进行安全优化（来源：眭亚楠）

这个过程有点像打游戏，玩家在探索战争迷雾笼罩的未知区域：选择安全的出生点之后，玩家要一点点逼近迷雾边缘，才能开拓视野，探明地图上哪些区域是安全的，哪些区域是不安全的，然后确保自己在安全区内活动。

眭亚楠提出的安全在线探索理论和方法，经过理论证明和实践验证，其安全性和有效性受到了肯定，并且引发了学术界和产业界的广泛关注。相关成果已成为加州理工学院、斯坦福大学、卡耐基梅隆大学等顶尖高校的本科课程和教材内容。

图 | 入选顶尖高校教材的 SafeOpt 算法（来源：yanansui.com）

处理非量化信息的偏好反馈

利用偏好反馈进行在线强化学习，则是从 AI 算法难以处理非量化信息的角度切入。相关研究成果不仅用于脊髓电刺激治疗上，还能用于外骨骼机器人控制优化上。

以外骨骼机器人为例，它的参数包括重量、尺寸、步态、跨步长度、关节灵敏度等等。通过改变这些参数，研究者可以在一定程度上调节使用者的舒适度，比如尽量减少消耗的能量，使其走起路来更轻松。

但在实际应用中，使用者的反馈通常是 “不舒服”，“现在感觉不错”，或者 “更喜欢上一种控制模式”，这些都是不易量化的信息。

“每个人的偏好是不同的。即使是客观的量化指标，比如代谢率、呼吸频率、心率等等，它们和使用者的偏好之间的关联度也不太强，没办法准确描述使用者的偏好，” 眭亚楠解释道。

针对这个问题，他将偏好反馈构建成一个对弈过程的胜负结果，通过构建自博弈机制，可以灵活处理结构化与非结构化的输入，并且从理论上证明了渐进最优的收敛性。

通过对偏好反馈的有效收集和利用，外骨骼机器人可以快速且自动地适应每个用户，实现控制方案的优化。

也就是关于这项研究的论文，最终斩获 2020 年机器人与自动化国际会议（ICRA）大会最佳论文奖和最佳人机交互论文奖。

应用广泛，科技向善

如文章开头所说，眭亚楠的研究方向正处于机器学习、神经工程、机器人三个前沿学科的交叉领域，其研究成果有着十分广泛的应用场景。

譬如在医学领域，可以改善瘫痪、帕金森病等神经系统疾病的临床治疗效果，让患者重新恢复运动能力，还能拓展到如深部脑刺激等其他多电极问题。而在机器人和航空航天领域，可以用于外骨骼机器人，无人机飞行器，甚至是火星车上，实现更高效地控制参数优化以及安全操控。

目前，除了持续拓展上述科研项目，眭亚楠还启动了有关医疗数据隐私保护的新课题，专注于解决医学人工智能领域的现实挑战。

用于医学研究的数据共享一直是业界难题，如果操作不当，开源临床数据很可能会泄露患者的隐私。

相较于医学影像等数据，有关运动障碍或者交互行为的视频资料更难处理。虽然可以打上马赛克，但会影响后续的分析工作。

眭亚楠另辟蹊径，选择了 Deepfake 作为患者隐私保护的工具。这是一种可以替换视频中人脸的技术，但因被用于制造假视频而受到广泛批评。

这并不妨碍技术本身的价值。他的研究表明，利用 Deepfake 技术，医疗视频中患者的脸部可以被替换为适当的目标脸部，保护患者面部隐私，同时保留所需的互动信息（例如面部表情）供研究人员分析和诊断。

图 | 用 Deepfake 实现患者视频隐私保护：左图是换脸之前，右图是换脸之后（来源：眭亚楠）

这是一个很好的科技向善的应用案例：技术作恶还是从善，很大程度上取决于人们如何使用它。

清华大学航天航空学院院长李路明教授认为，眭亚楠独特而新颖的尝试使得 “开源高质量的医学视频数据集更加可行，并且促进了有益于整个社会的未来医学研究。”

相关成果发表于人工智能伦理学研究领域的领先会议 AIES 上，是第一篇被 AIES 接收的中国论文，也受到 Science 杂志的关注和报道。

谈及未来，眭亚楠表示将继续带领研究组从事机器学习、机器人学和神经调控的基础研究，推动患者隐私保护和在此基础上的医学人工智能研究。他还将继续与医院合作进行临床转化研究，服务更多患者。

“我希望以人工智能为代表的先进计算技术能做到更多人类做不到的事情，而非人类擅长的事情，”他强调，“随着相关技术的进步，人类在智能层面将面临越来越多的挑战。作为研究者，我们应该有更强的责任意识，要从超越技术的角度看待 AI 的发展。”

来源：麻省理工科技评论

清华学者让AI学习神经调控，帮瘫痪患者重新站立

让 AI 学习神经调控

如何满足未知的安全约束

处理非量化信息的偏好反馈

应用广泛，科技向善