无穷的发现:目标从解释世界到创造意义

日期:2025-12-28 13:59:02 / 人气:3


在人类理解自己和宇宙的方法当中,科学不只是向前推进新知识的产生,也在不断帮人们看到“更大更丰富”的世界,以及帮助人们理解我们究竟想进入怎样的世界。在这个过程中,奇妙的是“科学”随时可能推翻自己,但作为一个整体,它更像是人类为自己编织的“宇宙编辑部故事”。每一次新的发现,每一次新的启发,我们都会让这个故事更新,也让我们眼中的世界随之开始改变,世界又变得可以理解了。
“科学发现本质上是人类撰写、供人类阅读的叙事,科学发现是一种讲故事的活动......随着发现过程被机器人技术和AI自动化,人类科学家的角色将转向""科学策展人""”
我欣赏这篇文章里上面的观点,人类所掌握的关于宇宙和自然的知识,其实只是冰山一角,而且总是以我们自身为中心去理解世界。还有近乎无限的空间等待人类和人工智能科学家一起去探索,但是人类可以作为“意义的策展人”这样的新角色,成为连接冷酷的物理宇宙与有情的人类世界的那个不可替代的桥梁,这让我们可以更坦然的走向一个“无穷的开始”。
今天分享的这篇文章的作者是Andrew White,他是新型科学研究机构FutureHouse的联合创始人与首席科学家,在之前的文章里我分享过FutureHouse如何通过人工智能科学家和自动化实验室加速科学发现的进程。
延伸阅读:FutureHouse创始人:如何在生物学领域创造AI科学家?人类科学家的未来工作是?
打造AI科学家:FutureHouse如何推动大规模科学智能|Asimov Press独家采访
希望今天的文章对你有启发。
网址:diffuse.one/infinite_discoveries
编号:D2-001
作者:安德鲁·怀特(Andrew White)
状态:已完成
摘要:发现究竟是什么?它们是否正变得越来越难?在此,我分享一些关于""发现是否有限""这一命题的正反思考。我认为科学发现永无止境,但它们正从发现""新能力""的形态转变为供人类理解的""新叙事""(they are morphing from new capabilities to narratives for human consumption)。
什么是发现?
what is a discovery
以下是一些关于科学发现的著名定义:
""科学发现是成功科学探究的过程或产物。发现的对象可以是事物、事件、过程、原因、属性,也可以是理论、假说及其特征(例如其解释力)。""——《斯坦福哲学百科全书》(2022)
""发现是产生关于自然的新知识,通常通过认识或识别新事物(the production of new knowledge about nature,often by recognizing or identifying something new)。""——《牛津参考》(《现代科学史指南》)
“科学发现是一种复杂的事件,它既要求认识到一种新的现象确实存在,也要求理解它是什么—也就是说,既包括观察,也包括正确的概念化。”——托马斯·库恩,《科学革命的结构》(1962)
以下是我目前的工作定义:
科学发现是对宇宙运行原理的编目(a scientific discovery is the cataloging of a principle about how the universe works)。例如,中子的发现,或者找到导致松树气味的分子。
这里的“原理”并不一定意味着简化我们对宇宙理解的复杂性。通常情况恰恰相反:比如量子力学的早期实验就曾让我们对宇宙的理论理解变得更加复杂。然而,原理在某种程度上减少了我们观察到的但无法解释或未纳入理论体系的现象数量(A principle somehow reduces the number of unexplained or unaccounted physical phenomena we observe though)。就像基本作用力、自然选择和化学键,它们都为经验观察提供了更好的“核算”依据(better accounting of empirical observations)。如果采纳这个观点,那么科学显然会在我们枚举完所有这些原理后达到某个终点(it should seem clear that science has some endpoint when we've enumerated all of these principles)。
当然,也可能存在一条很长的“长尾”。会有一长串可检验的假说,它们要么成本高得离谱(some long list of testable hypotheses that require insane cost)(比如100 TeV级别的粒子加速器),要么位于某条技术链的末端,需要大量多项工程突破之后才有可能实现,比如获取来自脉冲星的物理样本。但是,这条长尾也意味着,我们应该预期到科学产出的效率将会下降。在我们识别并编录了容易的发现之后,剩下的工作自然会需要更长时间,这种自然排序几乎不可避免。
发现正在变得越来越困难
discovery is getting harder
我们可以从多个彼此独立的来源中看到一个经验性事实:科学的生产力正在下降。
1.诺贝尔奖成果从完成到获奖之间的时间正在拉长,这意味着越来越难以识别真正具有突破性的工作。¹
2.药物研发的成本持续上升,意味着制药科研的生产力在不断下降。²
3.即便控制了论文数量和期刊质量,每年发表的颠覆性论文数量仍在减少。³
4.以通胀调整后的美元计,重大科学发现的成本大约每十年翻一倍,远远快于科研经费的增长速度。⁴
5.论文对高度专业化技术的依赖越来越强,平均合著作者数量在过去50年里从1人增长到接近5人。⁵
这种观点早在面向大众的著作中就被约翰·霍根(John Horgan)在《科学的终结》(The End of Science)一书中系统阐述过,而近年布鲁姆(Bloom)等人也通过多种量化指标再次提出了类似结论。⁶
这看起来是一个相当合理的假说,而且来自多个渠道的证据也相当清晰。
我认为,共识性的""重大""发现确实在减少(there is a decrease in consensus ""major"" discoveries)。
科学发现真的是有限的吗?
is discovery really finite?
然而,也存在一种反驳观点。宇宙中存在着许多涌现的复杂系统,它们难以被简化为基本原理解释。比如蚂蚁的生物学。要理解蚂蚁行为的所有组成部分—它们如何协作,为什么同一巢穴的行军蚁不攻击其他行军蚁巢穴,却会攻击非行军蚁物种—可能需要许多年的基础研究。生物学领域充斥着这类复杂的现象,每一个都可能消耗上百篇博士学位论文的精力。假设地球生命进程不停,进化也应该会继续催生这样的系统(Assuming no pause in life on earth,evolution should continue to produce such systems as well)。
另一个例子是数学—定理应无穷尽,发现也应无穷尽。由于大部分数学是人类创造的,而非物理观察的结果,数学领域的发现可能永无止境。数学中总会有新问题涌现,源于人类创造出新结构并加以探索。当然,我们总可以计算出π的更多位数!
我曾从事粒子系统的物理模拟工作(physical simulations of particle systems)—比如伊辛模型或波茨模型(Ising models or Potts models)。这些模拟只需几百行计算机代码即可完成,然而已有成千上万篇论文基于伊辛模型模拟的观察和原理发表,例如在不同温度下进行多个并行模拟或采用复杂的采样程序。
蚂蚁、数学或伊辛模型在你听来或许微不足道。那么请思考人类疾病。人类基因组中有30亿个碱基对,而任何一个人相对于某个假想的“参考”基因组,大约有300–400万个差异。从30亿中选300万,其组合数量之巨大,远远超过宇宙中原子的数量。每一种变异都可能关联某种疾病;至少在当前现实中,每个人最终都会死于某种疾病。识别并治愈所有人类疾病,是一个有明确终点的任务:当人类不再死于疾病之时便宣告完成。但若要系统性地编目这些突变所产生的所有效应,则可能引向一个天文数量级的发现空间(a cataloging of all the effects of these mutations may lead to an astronomical number of discoveries)。接着,你还可以对地球上所有生物重复这一过程;再对地球过去的生物,或对地球未来的模拟生物;再进一步,扩展到所有假想的、位于所有假想宜居行星上的生命形式(all hypothetical organisms in all hypothetical habitable planets)。
存在这样一类""迷宫""式任务(this category of ""labyrinth"" tasks),例如模拟蚂蚁行为、揭示伊辛模型的原理、以及描述所有人类基因突变的影响,它们提供了近乎无穷无尽的发现资源。我们还在不断通过创造新的复杂系统来发明新的""迷宫"",例如等变神经网络、标准化流和Wordle—这些都是人类近期定义的主题,仍有许多发现等待挖掘。
这让我得出一个假设:科学发现本质上是人类撰写、供人类阅读的叙事(scientific discoveries are fundamentally narratives written by humans,for humans)。可供我们发现的资源是无限的,而我们将什么提升为""新颖的科学发现"",是一个基于人类偏好的选择(what we elevate to be a ""novel scientific discovery"" is a human preference decision)。科学发现是一种讲故事的活动(Discoveries are story telling exercises)。当然,它必须有证据支撑,如果还能配以简洁的方程和清晰优雅的解释,那就更好了。
科学发现中的一部分,确实能帮助我们更好地预测宇宙,比如太阳何时升起、施肥会产生什么效果。但另一部分发现,则只是更好地描述了人类所定义的、几乎无穷无尽的复杂系统(another set only better describes some endless supply of complex systems that humans define),例如数学的某个分支、虎鲸的生物学,或一种新型高熵合金的性质。这两者之间的界线是模糊的。我相信,区分一项卓越的科学发现与一次对宇宙显而易见事实的平庸重述的,归根结底只是人类的判断(what separates an amazing scientific discovery from a trivial restatement of an obvious fact of the universe is simply human judgement)。
信息论
information theory
显然,关于定义和衡量发现的先例非常丰富。实验的贝叶斯设计为评估假说和实验提供了工具。
注:Berger,James O.Statistical decision theory and Bayesian analysis.Springer Science&Business Media,2013.
https://link.springer.com/book/10.1007/978-1-4757-4286-2
与柯尔莫哥洛夫复杂性(Kolmogorov complexity)相关的所罗门诺夫归纳法,则为将发现阐述为一个有限程序提供了一个精妙的思想实验(a nice thought experiment for articulating a discovery as a finite program)。
注:Rathmanner,Samuel,and Marcus Hutter.""A philosophical treatise of universal induction."" Entropy 13.6(2011):1076-1136.
https://www.mdpi.com/1099-4300/13/6/1076
如果你将发现定义为预测模型(discovery as a predictive model),则存在许多工具(如贝叶斯层次模型)(Bayesian hierarchical modelling)来比较模型。这些方法在特定领域被常规使用,尽管通常它们的重要性次于实证表现(secondary to empirical performance)。
这些工具在某种受约束的环境下是有用的。例如你只从某个特定分布中采样(比如观察一个单一的黑箱函数)(a single black box function),或者你面对的是一个有限集合的发现、需要对它们进行排序。但当问题变成:1491年加州鸟类种群的统计算不算一项新发现,还是仅仅重述了已知的种群动力学?或者:在一个竞争性卡牌游戏中证明某个支配策略,是否足够重要,能被算作科学发现?—这类方法要么变得不可计算,要么失去意义。
讨论
discussion
当我翻阅《科学》杂志最近的研究文章时,几乎所有的发现都是效用未知的实例,却引起了其他科学家的高度兴趣。以本周(2025年5月,第388卷,第6746期)为例,文章涉及花朵的力学特性、北美鸟类种群下降、通过冷冻电镜观察RNA如何多价结合,以及对一种新型三金属铈催化剂的表征,该催化剂在丙烷脱氢制丙烯方面具有高选择性。这些都是非常基础、源自""无穷的发现之井""的发现(These are all basic discoveries very much from the well of infinite discovery)。它们可能是通往更好地控制RNA,或更好地设计催化剂的持续路径的一部分,但其效用尚属未知,其重要性的提升来自科学家们基于兴趣的判断,而非其对人类的预期效用(their utility is unknown and their rise to significance is from judgement of human scientists of interest,not expected utility on humanity)。
让我们与大约100年前的第30卷(1909年)进行比较。那一期有卡尔·皮尔逊(Karl Pearson)题为""相关系数的确定""的信件(他发明了相关系数),有路易斯的文章(他是现代酸碱理论的创始人),有关于美国抗击肺结核运动的更新,还有关于干涉仪简易构造的描述。我确实是随机抽取这期的,但其中的所有内容都具有惊人的高效用。一种简单的反驳是:今天关于铈催化剂之类的文章,其真正的价值会在100年后显现。我们当然无法在今天证明这一点,但本文前面提到的统计数据,强烈暗示这种情况并不会普遍成立。
那么,该如何调和这些矛盾?我相信,发现的速度并没有下降,我们也不会耗尽发现,但单个发现的平均效用正在下降(the utility of an average discovery is declining)。也许这只是因为我们仍然试图把发现塞进“一篇论文一个发现”的框架中;也许只是我过于犬儒和虚无(cynical and nihilistic),而每一代科学家都会觉得事情正在走向衰落。
人工智能
artificial intelligence
随着发现过程被机器人技术和AI自动化,人类科学家的角色将转向""科学策展人""(the role of a scientist will move towards a ""science curator"")。我们的职责是决定什么足够有趣,值得作为发现被报道(Our role is to decide what is interesting enough to report as a discovery)。
阿克沙伊·文卡泰什(Akshay Venkatesh)关于数学领域中人类角色演变的讲座让我深受启发。
注:Akshay Venkatesh:(Re)imagining mathematics in a world of reasoning machines
https://www.youtube.com/watch?v=vYCT7cw0ycw
在我看来,他正确地把握了未来科学的面貌。我们将成为决定研究自动化方向的决策者—决定提出什么问题(We will become the deciders of where to orient research automation--what questions to ask)。因此,如果你想构建一个AI科学家,请确保你有办法捕捉到并内化良好的人类品味(if you want to build an AI Scientist,make sure you have a way to capture good human taste)。
科学家-工程师
scientist-engineer
这确实让我思考,是否有一种更直接的方法来衡量发现的""效用""。我认为,AI科学家-工程师的概念(一个围绕工程成果进行发现的AI科学家)是一个更易于处理和引导的问题。例如,为将二氧化碳转化为航空燃料寻找更好的催化剂,就需要一系列发现,而这些发现可以根据其向预期工程目标推进的程度进行排序(identifying a better catalyst for converting carbon dioxide to aviation fuel is something that requires a number of discoveries that can then be ranked according to their progress towards the desired engineering goal)。
人类健康领域的AI科学家—工程师是另一个例子。与其追求任何关于人类生物学的发现,不如引导AI围绕治愈特定疾病展开探索(an AI scientist-engineer in would be steered towards curing specific diseases via discoveries)。此时,我们评判的标准不再是人类对发现本身的主观评价,而是它们是否能成为技术链中的关键一环,最终通向一种治疗手段(a therapeutic)。
反思
reflection
我认为,自动化科学(automating science)有两条前进路径。
路径一:我们尽最大努力从无穷发现之井中智能地采样(we do our best to sample intelligently from an infinite well of discovery)。建立偏好模型、聚焦于有趣的假说,并根据高影响力论文的数量来判断AI科学家的成功(build preference models,focus on interesting hypotheses,and judge success of an AI scientist on number of high-impact papers),这是合理的。
路径二:我们选择一个具体目标(a concrete goal)。一个我们希望在宇宙中实现的、可测量的结果或改变(A measurable outcome or change in the universe we want to effect)。例如治愈疾病、创造新材料、催化新化学反应。然后,我们根据向目标前进的程度来判断我们的发现。这里没有无穷的发现之井,而是一组我们需要找到的特定发现(There is not an infinite well of discovery,but instead of set of specific discoveries we need to find)。
注释:
1.The Nobel Prize delay
https://arxiv.org/abs/1405.7136;The Nobel Prize time gap.
https://www.nature.com/articles/s41599-022-01418-8
2.Eroom's law
https://en.wikipedia.org/wiki/Eroom%27s_law
3.Park,Michael,Erin Leahey,and Russell J.Funk.""Papers and patents are becoming less disruptive over time."" Nature 613.7942(2023):138-144.
https://www.nature.com/articles/s41586-022-05543-x
4.estimating the cost of all discoveries
https://diffuse.one/p/d1-003
5.Analysis of 10.6084/m9.figshare.17064419.v3
6.Bloom,Nicholas,et al.""Are ideas getting harder to find?."" American Economic Review 110.4(2020):1104-1144.
https://doi.org/10.1257/aer.20180338"

作者:杏耀注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

杏耀注册登录平台 版权所有