科学是无止境的,还是像地图一样是有界的?
编者按:尽管花费在研究上的时间和金钱大幅增加,但科研进展却跟不上过去,到底是哪的问题?本文译自Theatlantic原标题为” Science Is Getting Less Bang for Its Buck”的文章。

科研的“边际递减”悲剧:投入巨大,进展却越来越慢了-肽度TIMEDOO

作家斯图尔特·布兰德(Stewart Brand)曾经写道:“科学是唯一的新闻。”尽管新闻的标题主要被政治、经济和八卦占领,但却是科学和技术在很大程度上支撑着人类福祉的进步和人类文明的长期发展。这反映在对科学进行公共投资的迅速增长上。如今,科学家数量、科学基金金额和科学论文发表数量比以往任何时候都要多:

科研的“边际递减”悲剧:投入巨大,进展却越来越慢了-肽度TIMEDOO

数据来源:帕特里克·克里森和迈克尔·尼尔森

从表面上看,这是鼓舞人心的结果。但是对于所有这些努力的增加,我们在科学上的理解是否得到了相应的增加?抑或是我们投资的更多只是为了维持(甚至是看到了下降趋势)科学进步的速度?

用有意义的方式来衡量科学进步是非常困难的。部分问题在于,很难准确评估一项科学发现的重要性。

让我们想想那些关于电的早期实验。许多这样的实验在当时看来很奇怪。在一个实验中,科学家们注意到,把琥珀在猫的皮毛上摩擦后,琥珀会莫名其妙地吸引诸如羽毛之类的物体。在另一个实验中,一位科学家注意到青蛙的腿在被金属手术刀触碰时会不自主地抽搐。

即使是做这些实验的科学家,也不清楚这些发现是不重要的奇怪现象,还是通向更深层次真相的通道。在当今时代的人们看来,这些是划时代的实验,是发现新自然力量的早期迹象。

但即使很难评估科学工作的重要性,也有必要做出这样的评估。我们需要这些评估来授予科学奖项,并决定哪些科学家应该得到聘用或接受资助。一般来讲,标准的方法是询问独立科学家对相关工作的意见。这种方法并不完美,但它是我们目前拥有的最好的评估方式。

考虑到这一点,我们进行了一项调查,要求科学家对各自领域获得诺贝尔奖的发现进行比较。然后,我们会得到一个排名。用这些排名,我们可以确定,在科学家们的眼里,这些获得贝尔奖的发现的重要性在过去几十年中发生了怎样的变化。

作为一个抽样调查问题,我们可能会问物理学家,对科学理解的更重要贡献是什么:中子(构成宇宙中大约一半普通物质的粒子)的发现,还是宇宙微波背景辐射(大爆炸的余光)的发现。我们可以把这项调查看作是一场循环赛,通过专业科学家的判断,让这些科学发现相互之间进行竞争性匹配。

针对诺贝尔物理学奖,我们调查了93位来自世界顶尖学术物理部门的物理学家(根据上海世界大学排名),这些科学家对1370对发现进行了判断。以下条形图显示了“每个十年的分数”。所谓“每个十年的分数”指的是这十年间的发现被认为比其他几十年的发现更重要的可能性。需要说明的是,某项研究的贡献属于完成的那一年,而不是属于在奖项颁发的那一年。

科研的“边际递减”悲剧:投入巨大,进展却越来越慢了-肽度TIMEDOO

帕特里克·克里森和迈克尔·尼尔森提供的数据

第一个十年表现不佳。在那十年里,诺贝尔委员会还没有搞清这个奖到底是为了什么。例如,有一个奖项是为更好地照亮海上灯塔和浮标而设立的。如果你是在船上,那这是个好消息,但它在现代物理学家中得分很低。但到了20世纪10年代,这些奖项大多颁发给符合现代物理学理念的发现。

从1910年代到1930年代,物理学迎来了一个黄金时代。这是量子力学的发明的时间段,量子力学是有史以来最伟大的科学发现之一,这一发现彻底改变了我们对现实的理解。其他一些革命性的发现也是在这个时间段:x射线结晶学的发明,它让我们探索原子世界;中子和反物质的发现;还有许多关于放射性和核力的实质的发现。这是科学史上最伟大的时期之一。

在这一时期之后,分数出现了大幅度的下降,在60年代出现了一定的复苏。这是由于两个发现:宇宙-微波背景辐射和粒子物理的标准模型,这是粒子物理是构成宇宙的基本粒子和力的最佳理论。即使有了这些发现,物理学家们仍然认为,从20世纪40年代到80年代的每个十年都比20世纪10年代到30年代最差的十年还要更糟糕。物理学家们自己判断,一些以往物理学中最伟大的发现变得不那么重要了。

我们的图表只画到了20世纪80年代末。原因是,近年来,诺贝尔委员会更倾向于为上世纪80年代和70年代的工作颁奖。事实上,自1990年以来,只有三项发现获得了诺贝尔奖。这太少了,无法得到90年代的高质量评估,所以我们没有对这些奖项进行调查。

然而,自1990年以来诺贝尔奖的缺乏本身就暗示了一些东西。20世纪90年代和21世纪头十年,诺贝尔委员会最想跳过这几十年,而对早期作品颁发奖项。考虑到上世纪80年代和70年代本身分数也并不高,这一现象对物理学界来说是个坏消息。

我们的研究可能会听到各种反对的声音。也许在我们的研究中,被调查的物理学家在某种程度上是有偏的,或者他们对获奖发现的理解不够完全。如前所述,很难界定一个发现比另一个发现更重要的标准。然而,科学家的判断仍然是我们比较科学工作成果的最好方法。

物理学做得不是很好,或许其他领域做得更好?我们对诺贝尔化学奖和诺贝尔生理学或医学奖进行了类似的调查。以下是得分:

科研的“边际递减”悲剧:投入巨大,进展却越来越慢了-肽度TIMEDOO

帕特里克·克里森和迈克尔·尼尔森提供的数据

这一结果比物理学略令人鼓舞。看起来科研情况在20世纪下半叶略有改善,但幅度很小。与物理学一样,上世纪90年代和本世纪头十年没有放入图中,因为诺贝尔委员会强烈倾向于授奖于更早的工作成果:在上世纪90年代和本世纪头十年里,诺贝尔委员会颁发的诺贝尔奖比过去每个十年都要少。

这项调查描绘的图景是暗淡的:在过去的一个世纪里,我们大大增加了投入在科学上的时间和金钱,但根据科学家自己的判断,我们产生最重要的突破的速度近乎是恒定的。以每美元或人均计算,这表明科学的效率正在大大降低。

一些评论家可能会回应称,诺贝尔奖发现成果的质量不一定能代表科学进展的总体水平。在我们的调查方法中所用的评估方式当然有许多局限性。诺贝尔奖不包括部分科学领域,尤其是计算机科学等较新的领域。诺贝尔委员会也可能会错过一些重要的工作成果。也许一些偏见的存在导致科学家更有可能崇敬过去的奖项。但也许更重要的是科学工作数量巨大,就是这些普普通通的成果构成了科学的大部分。

我们认识到了这些局限性:调查结果令人震惊,但只涵盖了部分情况。然而,我们很快就会看到有力的证据表明,要在所有领域都取得重大发现正变得越来越困难。它需要更大的团队和更广泛的科学培训,而科学成果产生的整体经济影响正变得越来越小。综上所述,研究结果表明,如今投入在科学中努力的回报在不断减少。

当我们向同事说明这一状况时,他们有时会告诉我们这是无稽之谈,并坚持认为科学正处于一个黄金时代。他们列举出了一些惊人的最新发现,比如希格斯粒子和引力波,并认为这就是如今科学发展比以往任何时候都更好的证据。

这些确实是惊人的发现。但前几代人的发现,也同样引人注目。例如,将引力波的发现与爱因斯坦1915年发现广义相对论进行比较。广义相对论不仅预测了引力波,而且从根本上改变了我们对空间、时间、质量、能量和重力的理解。引力波的发现,虽然在技术上令人印象深刻,但在改变我们对宇宙的认识方面,作用却小得多。

虽然希格斯粒子的发现确实了不起,但与上世纪30年代发现的众多粒子相比,它就相形见绌了。这些粒子包括中子和正电子。从某种意义上说,希格斯粒子的发现是一种非凡的成就,因为它是又回到了20世纪上半叶常见的状态,但这种状态在近几十年里却很罕见。

对我们的研究结果另一种常见的反应是,有人说科学比以往任何时候都更好,因为他们自己的领域正在取得巨大进步。我们经常会听到一些关于人工智能(AI)的成果和CRISPR基因编辑技术在生物学中的应用。但是,尽管人工智能、CRISPR和类似的领域发展迅速,但在整个现代科学史上,一直都有一些领域和人工智能一样热,甚至更热。

让我们回顾一下1924年到1928年之间物理学取得的进步。在这段时间里,物理学家了解到物质的基本成分既有粒子的性质又有波的性质;他们创立了量子力学的定律,提出了海森堡的不确定原理(一个运动粒子的位置和它的动量不可被同时确定。);他们预测反物质的存在;还有许多其他的成就。正如保罗·狄拉克(Paul Dirac)所说,在那个时代,“即使是二流物理学家也能做出一流的发现”。

相比之下,过去几年人工智能的主要发现包括:识别图像和人类语言能力的提高,以及玩围棋等游戏能力的提高。这些都是重要的结果,我们乐观地认为人工智能的成果将在未来几十年产生巨大的影响。但产生这些成果需要投入更多的时间、金钱和努力,而且还不清楚它们是否比20世纪20年代发现的成就更重要。

同样,CRISPR在过去几年也取得了许多突破,包括可以通过改变人类胚胎来治疗一种遗传性心脏疾病,以及培育出了一种能够在整个蚊子种群中传播疟疾抗性基因的蚊子。但是,尽管这些实验室成果是显著的,CRISPR的长期潜力是巨大的,但最近的成果并不比过去生物学快速进步时期的成果更令人钦佩。

为什么科学变得如此昂贵,却没有产生相应的效益?

经济学家本杰明•琼斯(Benjamin Jones)和布鲁斯•温伯格(Bruce Weinberg)的研究给这个问题予以了部分解答。他们研究了科学家做出重大发现时的年龄。他们发现,在诺贝尔奖的早期,获得诺贝尔奖的科学家做出获奖成果的时候平均只有37岁。但是近年来,这个数字上升到平均47岁,增加了相当于科学家工作生涯四分之一的时间。

也许当今的科学家需要知道的更多才能做出重大发现。因此,他们需要学习更长的时间,所以在年龄更大的时候才能完成他们最重要的工作。也就是说,伟大的发现越来越难以实现。而且,如果它们更难以实现,那就意味着重大成果的数量将会越来越少,或者说它们需要付出越来越多的努力。

与此类似,如今的科学合作涉及的人往往比一个世纪前多得多。欧内斯特·卢瑟福(Ernest Rutherford)于1911年发现了原子核,他发表的那篇论文中只有一位作者:他自己。相比之下,2012年发表的两篇宣布发现希格斯粒子(Higgs particle)的论文,每一篇大约有1000名作者。平均而言,研究团队的规模在20世纪增长了近四倍,这种增长一直持续到今天。对于许多研究问题,在如今都需要更多的技能、昂贵的设备和庞大的团队才能取得进展。

如果科学真的在变得越来越难,原因是什么呢?

假设我们认为科学,即对自然的探索,类似于对新大陆的探索。在早期,人们知之甚少。探索者很容易在开始时取得重大的新发现。但是他们渐渐地填补了关于新大陆的知识。为了取得重大发现,探险者必须在越来越困难的条件下走向越来越偏远的地区。探索变得更加困难。在这种观点看来,科学是一个有限的领域,需要边际递增的努力来“填满地图”。总有一天,填充地图的工作会接近完成,科学也将在很大程度上枯竭。按照这种观点,取得科研成果难度的增加是科学知识结构本身所固有的。

这一观点的原型来自于基础物理学。在基础物理学领域,许多人着迷于寻找“普适性的理论”,一个能够解释我们在世界上看到的所有基本粒子和力的理论。这种理论我们只能发现一次。如果你认为这是科学的首要目标,那么科学确实是存在有限边界的。

但是还有一种不同的观点,这种观点认为科学研究是无止境的,在科学中总是有新现象要发现,总是有新的重大问题要解答。科学无穷无尽的边界是新想法的不断涌现的结果。以水为例,描述单个水分子行为的方程是一回事,而解释彩虹的形成,或者海浪的撞击,抑或是太空中彗星的的起源则是完全不同的另一回事。所有这些都是在研究“水”,但复杂程度不同。每一个都是从描述水的基本方程中推演出来的,但谁又会从这些方程中想到到像彩虹或海浪撞击这样复杂的现象呢?

虽然仅仅有新想法涌现并不一定意味着就会有无穷无尽的新现象有待发现,新的问题有待解答。但在某些领域,似乎确实是这样的。例如,始于1936年的计算机科学。当时阿兰·图灵(Alan Turing)开发了计算的数学模型,我们现在称之为图灵机。那个模型非常简陋,几乎就像一个孩子的玩具。然而,这个模型在数学上等同于今天的计算机:计算机科学实际上是从它的“普适性的理论”开始的。尽管如此,自那以后,计算机科学领域还是出现了许多非凡的发现:诸如构成互联网商业和加密货币基础的加密协议等想法;编程语言设计中无穷无尽的巧妙想法;而且最好的电子游戏中也有一些富有想象力的想法。

这些就是计算机科学中的彩虹、海浪和彗星。更重要的是,到目前为止,我们的计算经验表明,它确实是取之不尽的,总是有可能发现新的现象,新层次的行为。随着对这些新现象和新的行为的研究,又提出了新的基本问题,并引发了新的研究领域。计算机科学似乎是开放式的。

在生物学领域中,以类似的方式,随着我们获得编辑基因组、合成新生物体的能力,以及更好地理解生物体基因组与其形态和行为之间的关系,生物学领域也可能会继续出现新的前沿。物理和化学领域也可能发生类似的事情,比如可编程物质和物质的新设计阶段。在每一种情况下,新现象都提出了新问题,其方式可能是开放式的。

所以乐观的观点是,科学是无止境的,我们将持续有新发现,甚至创造全新的领域,这些领域依然有自己的基本问题。如果我们今天看到科学研究增长放缓,那是因为科学仍然过于关注已经建立起来的领域,而这些领域正变得越来越难以取得进展。我们希望,未来会更加迅速地涌现出新的领域,产生新的重大研究课题。这才是科学加速发展的机会。

如果科学的效益正在减少,那对我们的长期的未来意味着什么?在过去的一个世纪里,我们的世界因为新技术的产生发生了巨大的变化,而如今促进这种新技术发展的科学见解会越来越少吗?事实上,经济学家的发现表明这种情况正在发生,他们称之为生产率放缓。

当谈论到生产率放缓时,经济学家们所谓的生产率和它的日常含义略有不同:大致来讲,工人的生产率是制造产品的精巧程度。因此,当我们开发出新技术,使得制造东西更容易时,生产率就会提高。

例如,1909年德国化学家Fritz Haber发现了固氮法,一种将空气中的氮转化为氨的方法。然后,这些氨可以被用来制造肥料。这些肥料使得同样数量的工人能生产更多的食物,因此生产率提高了。

生产率的增长是社会经济健康的一个标志,这样的社会能不断产生提高其创造财富能力的想法。但坏消息是,美国的生产率增长正在大幅下降。自20世纪50年代以来,这一数字一直在下降,当时的水平大约是今天的6倍。这意味着,在过去10年里,我们经历的变化与上世纪50年代18个月里的变化差不多。

这听起来可能有些令人惊讶。在过去的几十年里,我们难道没有看到许多新发明吗?今天不是加速技术变革的黄金时代吗?

经济学家泰勒•考恩(Tyler Cowen)和罗伯特•戈登(Robert Gordon)认为,事实并非如此。在他们的著作《大停滞和美国增长的起起落落》(The Great Stagnation and The Rise and Fall of American Growth)一书中指出,20世纪初出现了大量强大的通用技术:电力、内燃机、无线电、电话、航空旅行、装配线、化肥等等。

相比之下,他们整理的经济数据表明,自上世纪70年代以来,情况几乎没有什么变化。虽然我们已经在两种强大的通用技术上取得了进展:计算机和互联网,但许多其他技术的改进只是渐进式的。

例如,汽车、航空旅行和太空计划在1910年至1970年间极大地改变了我们的社会,扩展了人们对世界的体验。到1970年,这些形式的旅行已经达到了接近现代形式的程度,而诸如协和式飞机和阿波罗计划等雄心勃勃的项目基本上未能进一步扩大交通方式。也许像自动驾驶汽车这样的技术在未来会给交通带来巨大的变化。但是,与过去相比,当今在运输方面的进展是渐进式的。

是什么原因导致了生产率下降?经济学家对这一问题存在争议,他们提出了许多不同的答案。一些人认为,这仅仅是因为现有的生产率衡量方法不能很好地衡量新技术的影响。但我们在这里更倾向于另一种更观点,即在科学上的支出回报的减少导致了真正的生产率放缓。

我们并不是第一个认为科学研究正在收益递减的人。1971年,著名生物学家宾利·格拉斯(Bentley Glass)在《科学》杂志(Science)上发表了一篇文章,认为科学的辉煌时代已经过去,最重要的发现已经出现:

无论如何,对我来说,很难相信像达尔文关于生命进化的观点或孟德尔对遗传本质的理解那样全面而震撼人心的东西会再次出现。毕竟,这些已经被发现了!

在1996年出版的《科学的终结》(The End of Science)一书中,科学作家约翰·霍根(John Horgan)采访了许多顶尖科学家,询问他们对各自领域取得进展的前景的看法。他的发现并不乐观。例如,著名理论物理学家利奥·卡达诺夫(Leo Kadanoff)就最近的科学进展发表了看法:

事实是,没有任何研究成果能够取得量子力学、双螺旋或相对论同等量级的成就。在过去的几十年里,这样的成就从未发生过。

然而,尽管许多人对科学回报的递减提出了担忧,但很少有机构对此做出回应。目前被提名为唐纳德·特朗普(Donald Trump)总统科学顾问的气象学家开尔文·德罗杰梅耶(Kelvin Droegemeier)在2016年对美国参议院一个委员会发表的讲话中称,“科研的步伐正在加快”。美国国家科学基金会(National Science Foundation)在2018年的报告中没有提到回报递减的问题,而是乐观地谈到“具有潜在变革意义的研究,将产生开创性的发现,并推动令人兴奋的科学新前沿”。当然,也许多科学机构,尤其是新机构的目标是找到在各自领域的改进方法。但这并不能广泛代表组织机构回应科研收益递减的方式。

也许机构对此缺乏回应的部分原因是,一些科学家认为承认收益递减违背了科学家的集体利益。大多数科学家强烈赞同增加研究经费。他们喜欢用积极的态度来描述科学,强调益处,尽量减少负面影响。虽然这种做法可以理解,但有证据表明,每花一美元或一小时带来的科学发展在大幅放缓。这一现象需要大规模的机构做出回应。这应该成为公共政策、资助机构和大学研究的一个重要主题。更好地理解造成这一现象的原因是很重要的,找出扭转这一现象的方法是改善我们未来生活的最大机会之一。

来源:36kr