近年来,科研评价改革呼声越来越高,但成效一直并不明显。政府和科研管理人员仍然希望运用定量指标来评价一切,包括对普通教师、教授、课程、科研项目和大学的评价。
国际知名科技政策专家伊夫斯·金格拉斯的批判性著作《大学的新衣:对基于文献计量学的科研评价的反思》,围绕文献计量方法展开了热烈的讨论,通过聚焦评价的基本问题及其对科研的影响,厘清科研评价中很多似是而非的概念,帮助评价者和被评价者更合理地理解和使用目前在新兴的科研评价市场上盛行的排名“黑匣子”里的许多指标;同时也探究了大学急于让无效指标影响其科研战略的缘由,提出问题:尽管大多数的大学领导者、聪明的学者、有经验的管理人员认为排名并不具有科学价值,但他们仍然使用排名为其机构做宣传并应用于资源投入、教师聘任和晋升等重要战略决策,是否是在重演“皇帝的新衣”这个古老的故事?
期刊影响因子
在科研评价中使用引文数据带来的最大问题可能是反映期刊引文影响力的指标被用来评价论文的水平。科学期刊已经成为一个非常有利可图且竞争激烈的市场。期刊使用影响因子作为推广工具,说服作者提交他们水平最高的论文,并向图书馆出售订阅服务。20世纪90年代末以来,影响因子不仅被视为衡量期刊质量的指标,而且还被误认为是衡量论文质量的标准。但是,对影响因子的日益关注导致了一种丑陋的行为,即试图干扰科学家的引用行为来提高期刊影响因子。要理解一个简单的指标是如何导致了这种极端行为,首先要回顾一下期刊影响因子的发明。
作者伊夫斯·金格拉斯,图片来源:来自蒙特利尔魁北克大学官网
02
04
最后,值得注意的是期刊影响因子被精确到小数点后三位!在科学中,我们认为很少有自然现象可以精确到这种程度。例如,有谁想知道温度是20.233摄氏度吗?一个突出的问题是,为什么不将影响因子限制为整数:1、2、3……20、21……呢?显然,基于影响因子的各种排名将会因此丧失他们的大部分价值。经济学家们特别喜欢用影响因子对他们的期刊进行排名。
基本上,滥用排名和表面看似精确的指标说明对所用指标的属性一无所知。我不必在这里赘述使用这些有缺陷指标带来的负面效应。没有人相信这种系统是合理的,所以就不必讨论这种系统是否公平公正了。只有那些从不合适的奖励制度中获益的机会主义研究者以及利用影响因子来达到某种评价目的的期刊编辑们可能会相信(无论如何都假装相信)。
