.hd-box .hd-fr

增量式科学时代:论文数量狂飙增长,真正创新却日渐稀缺

2023-02-12 14:12返朴(小叶)33评

本文来自微信公众号:返朴 (ID:fanpu2019),作者:小叶

近日,Nature 发表的一项研究,通过对上千万篇论文和数万项专利的统计分析显示,近年来研究论文数量猛增,但颠覆性的发现和技术创新的增长速度大幅下降。但我们并不知道确切的原因,以及如何改善。

撰文 | 小叶

不可置否,重大科学发现和技术突破会彻底改变我们的生活,颠覆对世界的认知、改变社会运作。随着科研队伍不断壮大,科研论文发表和技术专利数量增长迅猛,共同为推动科研技术生产力添加“新燃料”。然而,许多科学家们并不乐观。相反,他们保持冷静、客观,始终关注科研发展方向问题,也时不时给大众泼一泼冷水,告诉大家:科学技术当前的发展状态可能不容乐观。

保守还是颠覆?

1996 年,《科学美国人》(Scientific American)杂志的资深撰稿人 John Horgan 采访了诸多学界名家,在《科学的终结》(The end of science)一书中展示了科学家们对科学未来的深度思考。书中就不同学科提出了很多有趣问题,其中一个更是直击 21 世纪以来的科学整体上所隐藏的重大危机:今天的科学是否已衰退到只能解答细枝末节的问题、只能修补现有理论的地步? [1]

2023 年初发表在《自然》(Nature)期刊上的一篇论文对于这个问题给出了近乎肯定的回答[2]。要了解科学技术发展的程度,论文和专利是最直观、简洁的衡量标准。来自美国明尼苏达大学(University of Minnesota)的 Russell J. Funk 与两位同事定义了两类突破性科研发现和专利技术:第一类是改进现有的科学知识库,发挥巩固作用(consolidation);第二类则是颠覆了现有的科学认识,从而推动学科朝着某一全新方向发展,发挥颠覆性作用(disruptive)。

那么如何衡量是巩固作用还是颠覆性作用呢?作者判断,带有巩固性质的论文及专利会更有可能引用该成果出现之前的相关研究,可能有可能承接已有知识;而对于颠覆性研究,其后续研究则不太可能引用之前的文章。在此基础上,团队提出了一个新指标:CD 指数,以表征科技成果的巩固或者颠覆倾向。该指数区间介于-1(巩固)与 1(颠覆)之间,时间则限定在每篇论文 / 专利发表年份过后的五年,以 CD5表示。

团队分析了 Web of Science(简称 WoS)上记录的从 1945 到 2010 年的 2500 万篇论文,美国专利和商标办公室(USPTO)专利浏览数据库记录的从 1976 到 2010 年的 390 万份专利,以及其他四个额外数据库:JSTOR、美国物理学会论文库、微软学术科学文献及专利以及 PuBMed,总共囊括 2000 万篇论文。通过 CD5指数,一条条清晰的下沉曲线揭示了人类引以为豪的科技从上世纪中叶至今的走向:整体上,新科学知识和技术越来越不具颠覆性。在考察的所有学科领域内,1945 年至 2010 年论文 / 专利的 CD5指数下降了 91.9%。从上世纪 80 年代起,生命科学、生物医学和物理学的 CD5指数下降程度颇为温和,而社会科学与技术方面的下降程度更显著且持久,例如,这段时期内,药物和医学技术方面的 CD5指数下降比率达到 91.5%。

图 1 从 1945 到 2010 年,所考察学科领域成果(论文和专利)的 CD5指数变化趋势。图片来源:参考资料 [2]

论文 / 专利文献中的遣词造句也被用来印证团队的观点。颠覆性论文和专利更倾向于发明新词、新术语,从而建立新的科学范式以区别于现有范式。而且,颠覆性的减少可能也会导致科学技术用词(该研究分析了论文标题用词)多样性的减少。

此外,文献中的动词选词也发生了变化,随着时间的推移,与“创造”、“发现”、“感知新事物”相关的动词(具有颠覆性含义)使用频率越来越低,而“改进”、 “应用”、 “评估现有事物”相关的动词(具有巩固含义)使用越来越频繁。团队从文献语言模式的角度也证明随着时间的流逝,我们的科研发现和专利技术越来越滑向保守的境地,以巩固现有知识为主要目的而非颠覆、创建新领域。

图 2. 上世纪 80 年代和 2010 年发表的论文、专利标题中最频繁使用的前 10 个动词变化情况。在 80 年代常用的指代创造、发现和感知新事物的动词到了 2010 年几乎完全被“改进”、“应用”、“评估”等含义的动词所取代。图片来源:参考资料 [2]

这篇论文登上了《自然》2023 年第一期的封面。在相关的新闻报道中,其他科学家也对此发表了自己的见解,伊利诺斯州埃文斯顿西北大学的计算社会科学家 Dashun Wang 表示:“很高兴看到这种 [现象] 以如此细致的方式记录下来,他们以 100 种不同的方式看待这个问题,我发现它总体上非常有说服力。”[3]

图 3 Net loss,净损失。图片来源:Nature

大投入,低回报

《自然》论文凭借扎实的数据打破了我们往日对科研颠覆性质的乐观滤镜,事实上,早在多年前,学界就已注意到了另一个问题:我们培养出越来越多的科学家,国家、机构投入越来越多的资金赞助科技成果,越来越多的论文随之发表,然而科研生产力却并没有“水涨船高”。

图 4.《科研生产力现状》报告中举例美国近 80 多年来的科研生产力趋势。图片来源:《科研生产力现状》

2018 年 ,默克公司委托牛津经济研究院,在全球七个国家五个行业不同规模和类型的组织内展开采访调查,并对现有文献进行回顾,于 2021 年发表了《科研生产力现状》报告[4],牛津团队将科研生产力定义为科研活动投入与科研成果产出之间的关系。除了基础研究与应用研究,团队添加了实验开发用于反映科研成果转化为商业产品的过程,三者之间紧密关联,相辅相成。另外,团队采用论文发表和专利授权数量等作为衡量标准,从一定程度上说明了科研生产力的变化趋势。

首先,近半个多世纪以来,全球论文发表数量呈显著增长趋势。2018 年,美国自然科学基金会报告[5]从 2008 年至 2018 年,全世界同行评议科学和工程类期刊论文以及会议论文数量以平均每年约 3.8% 的速度增长。同年,国际科学、技术和医学出版商协会(STM)则统计出,自 17 世纪以来同行评审期刊数量以每年 3.5% 的速度稳步增长,2008 年至 2018 年增速达到每年 5%-6%,每年平均发表 150 万至 300 万篇文章[6]

与论文数量增长密切相关的还有研究人员数量的增长,根据联合国教科文组织的最新[7]统计,从 2014 年至 2018 年,全球全时工作当量(FTE)研究人员数量增加的速度(13.7%)是全球人口增长速度(4.6%)的 3 倍,截至 2018 年,全球总计有 885.4 万名 FTE 研究人员。

图 5. 以美国为例,1997 年至 2019 年,美国研究人员数量和论文发表数量保持同步发展,整体呈正向走势。来源:《科研生产力现状》

充沛的科研人员数量和论文发表是推动科研生产力的一大重要支柱,而另一支柱则是赞助资金的投入。以科研经费全球第一的美国为例,美国科学促进会(AAAS)统计了从上世纪 50 年代截至 2019 年全美研发经费总量投入趋势,长势迅猛。(见下图)[8],近几年,中国也迎头赶上:2016 年至 2021 年,我国研发经费年均增长 12.3%,已明显高于美国(7.8%),全国经费投入总量达到 2.8 万亿元,且连续 6 年保持两位数增长。[9]

图 6. 美国科学促进会(AAAS)官网统计的美国近 60 年来的全国研发经费总量投入趋势,来源:AAAS.org

科研界人力和财力的高投入让科研论文数量生产力节节攀升,但诸多迹象表明,数量的增长并没有带来质量的提升:五花八门的期刊降低了论文发表的难度;“研究膨胀”导致更多低质量研究不断涌现,其他研究人员往往无法复现低质量研究中的实验结果;此外,因错误和学术不端行为导致的撤稿论文比例也不断攀升。

海量的论文发表不但不能反映科学发展的真实情况,反而还可能阻碍科学发展。2021 年 8 月一篇发表在《美国科学院院刊》(PNAS)上的研究[10]分析了 1960 年至 2014 年间超过 9000 万篇论文的 18 亿条引用记录,揭示了论文引用存在明显的差异:发表的论文很多,但大量被引用的论文只是少数。一个领域的年发文量越多,前一年被大量引用的论文到了下一年仍然被高引用,从而吸引了绝大部分研究人员的注意,忽视了新发表的论文,这便是科研界的“阶级固化”现象。而且团队还得出了与《自然》封面论文类似的结论,并担忧保守化倾向容易导致科研“垄断”现象。[11]

另一方面,在应用和实验开发这两个与实际生产以及经济效益关系更密切的层面,牛津团队以每百万美元 / 欧元研发支出的专利申请和授予数量作为衡量科研生产力的标准(注:报告承认该方法没有考虑专利质量、影响力和实用性,故结论更偏向于说明性而非确定性),发现除中国、日本外,许多国家的专利申请和授权数量或基本持平或有所下降,说明相应的应用研发生产力呈停滞甚至下滑趋势。

以电子行业为例,虽然摩尔定律预测计算机芯片上的晶体管数量大约每两年翻一番,但实际情况却并非如此。2020 年发表在《美国经济评论》(American Economic Review)上的分析文章指出[12],与上世纪 70 年代相比,如今要实现芯片密度指数级增长的难度是 50 多年前的 18 倍,而研发生产力则以每年 6.8% 的速度在下降。与此同时,新一代电子技术要求更多研发资源,迭代更新成本增加 35%,“无晶圆厂”半导体公司的下一代工艺成本更是将增加 60%[13]

图 7. 从 1930 年至 2000 年,电子芯片产业研究人员数量不断增长,但相对应的科研生产力却以每年 6.8% 的速度在下降。来源:10.1257 / aer.20180338

科研生产力下降的原因

面对科研颠覆性降低、科研生产力下滑的复杂现状,学界仍在探索其深层原因,不同专家学者提出了各种可能原因。对于实际的科研工作者,可能很多问题是老生常谈。

“科研负担”(the burden of research)理论[14]是其中之一,也就是说,科学发展至今日,要全面透彻掌握专业领域,从学生时代起到成为科研人员,必须不停学习海量现有的相关专业知识,还要及时跟进新出现的知识,科学知识整体上呈爆炸式增长势头,那需要突破专业领域边界的时间战线也被拉长,更不要说真正颠覆一门学科。

被专业知识浪潮卷晕的科学家和发明家们还往往“囿于垂直的专业知识领域,如同钻牛角尖般陷入更狭窄的研究课题,结果往往只能忙于巩固完善,而不去考虑颠覆”[13],这是今年《自然》封面论文第一作者 Michel Park 给出的见解。作者也承认,科学知识的增长对论文颠覆性有积极影响,但对专利发明却有消极影响。因此,为了促进颠覆性的科技成果出现,团队建议科学家们更广泛地阅读,扩展自己对前沿知识的认知范围。

鉴于现在的科研建立在数百年的成果累积,不断将学科前沿推得更远,“低垂的果实”(low-hanging fruit)理论来源于经济学,即一棵果树上总有一些果子结果位置低,人们伸手就能摘得,因此也很快被摘完,而果实位置越高,摘取难度也越大,付出成本也越大。这一模式也适用于解释科研界的发展现状[15]。站在现有科学知识的基石上,带有那么一点创新、能巩固已有基石的科学观点犹如“低垂的果实”,更容易得手,但竞争往往激烈,且会越摘越少。剩下的是那些悬在高处的果实,即那些或可颠覆一门学科的现有成果、或引导开创学科内全新领域的科学观点,摘取难度只会越来越大,不仅对科研人员本身实力的要求极大,而且还涉及很多其他实际相关利益,例如团队规模、经费申请等。

前面提到的几个因素,基本从科研内容本身出发,而更多的问题出现于科研环境自身。

《科研生产力现状》报告直接总结出四个主要科研生产力产生负面影响的因素:因科研团队规模和专业度提高带来的行政负担;“唯论文”式的科研评价体系;合作与“外包”的失衡;以及许多国家资金支持的增长放缓,并指出美国政府在实验开发方面的资金支持比基础研究或应用研究要低。

科学未来怎么走?

如今,科学发展似乎向着以巩固科学知识为目标的方向前进,相对于上个世纪,前进步伐、生产力也有所放缓,可以说我们进入了一个相对平稳的增量式科学时代。Funk 告诉《自然》:“一个健康的科学生态系统既包含对之前工作的巩固改进,也包括新的颠覆性发现,但研究的性质正在发生变化。随着渐进型创新越来越普遍,未来可能需要更长的时间才能取得明显推动科学发展的关键突破。”

不过也有科学家认为不该极端地在增量式科学和颠覆式科学中做非此即彼的选择,王大顺认为,颠覆性并非本质上是好的,增量式科学也不一定是坏的,二者健康组合有时能带来巨大惊喜,例如第一次直接观测引力波既是革命性的,也是增量科学的产物。亚特兰大佐治亚理工学院科学技术政策专家 John Walsh 则表示,理想情况是将增量研究和颠覆性研究健康地结合起来。他说:“在一个我们关注研究结果有效性的世界里,有更多的重复和复现可能是一件好事。”[3]

如今,随着人工智能技术的蓬勃发展,已经有论文中加入了人工智能作者,它可以轻松学习海量的已有知识,这或许会为我们的增量式科学时代带来新的变化。

参考资料

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

下载IT之家APP,分享赚金币换豪礼
相关文章
大家都在买广告
热门评论
查看更多评论