科学的逻辑、它的结构、动态以及同其他社会组织、同社会物质与精神生活圈的相互作用,组成了一个比较新的研究领域,即科学的认识论的研究主题。科学发展的某些方面早已是哲学和其他有关学科的研究对象,尤其是从十九世纪中叶开始。用跨学科的方法考查科学,这种需要随着二十世纪初的科学和技术革命而产生了。科学的认识论的课题在三十年代已形成。在四十年代,很多先进国家开始发起对科学活动的经验考察。科学的认识论作为一门自主的学科出现于六十年代,这时候在很多国家里,科学家们清楚地认识到了事实上已站稳脚跟的认识论课题和问题,科学组织纷纷讨论好几个世纪中出现的问题,他们对分析的和规范的研究深感兴趣。这也正是对科学领域的情报的结构与动态进行定量研究,即科学计量学首次出现的时候。怎样才能客观地评价科学研究的质量,这个问题不可避免地涉及科学计量学的基本原理。

几年来,在很多国家里,在讨论利用引证分析评估科学出版物的可行性问题。有几种方法可以使引证分析用于确定有意义的研究。全世界现有一百多万研究人员,在五万多种科学和技术杂志上制造出洪水般的文献。大多数发达国家将它们国民生产总值的大约3%用于科学研究。今天真正的问题不是我们能否确定有意义的课题,而是我们负担不起不这样做的代价。

利用引证分析作为评价工具一直是有争议的。几乎人人都同意,引证分析是有价值的情报管理和检索工具。如果你声称引证分析可以在科学的历史与社会学研究中起重要作用,你也不会遭到很多人的反对。但是只要提到,引证数据可以用于评价一个科学家或组织所作出的贡献,你将遭到激烈的反驳。即使是用引证数据去评价杂志也还是颇有争议的做法。

1963年,费城科学情报研究所出版了试验性的《科学引证索引》,即SCI,从1964年开始SCI就定期出版了。科学出版物形成了互相引证的网络,它使人们可以追踪任何给定论文的来龙去脉。在引证索引上你可以找到一份论文清单,它们在索引所覆盖的时期内引证了这份参考材料。所以,这个参考工具可以让人们不断延续下去,而一般的目录寻检工具只能让人们往前回溯查找。引证索引让你能够寻检与你的工作有关的论文,即使这些论文不是发表在与你相应的学科范围内。这样,引证索引使读者摆脱了传统的主题索引的专断分类方法。

这些年中,我们已经在Current Contents上发表了被经常引证的文章、作者、杂志、书籍的名单。我们发现,引证频率通常是能和科学承认的其他形式保持一致的,不管这种承认是采取授奖、授予学会会员称号的形式,还是采取同行主观评价的形式。

这一点是至关紧要的,因为对引证数据负责的是数以百计的有才能的研究人员,他们从没获得过什么褒奖。引证分析可以成为有用的质量评价工具,因此,让科学界了解引证分析能够测量出什么,这是十分重要的。

什么是引证?

什么是引证?在你的论文中引证另一位作者意味着什么?几年前,《科学》(Science)上有一篇写我的文章,说我是一个“只用脚注”的人。“只用脚注”的言下之意是说引证是琐细的事。成百上千的杂志对目录引证的处理都是不能令人满意的,这种态度也反映了引证乃琐碎小事的观念。但是,引证本身是一种交流形式。它们有助于追溯作者的贡献是如何发展的,它们提供了背景材料,它们使当前的工作具有权威性。更重要的是,引证显示了论文之间的正式的、明确的联系。引证是有用的概念符号,这一前概是引证索引的理论根据。SCI作为一种情报检索工具的明显成功证明这一前提是成立的。

我们在三十年前就认识到,引证还起着另一个作用。社会学家说,它们是科学的报酬体系的一部分。一般地说,引用某一个人的论文,承认这个人对你自己的工作的影响,这是向你所引证的人付出酬报的一种方式。引证是科学家个人向他们前人的智力付酬的通货。所以,被引证意味着一个同行注意到了你的工作,那么,计算一下被引证的次数与频率又意味着什么呢?它的含义很丰富,因为只有少数人是被人们反复引证的,他们通常是具有巨大影响的人。

人们担心引证分析的另一个原因是,他们老是认为,有些重要的文章是出现在不引人注目的杂志上。这就是所谓“孟德尔综合症”,它的根据是,孟德尔的工作就是被一家不引人注目的杂志葬送掉的。然而,即使事实真的是这样,我却还要像贝克莱主教那样问一问:“如果一棵大树在森林里倒下而附近恰好没人,它发出声音了吗?”科学成果必须与其他科学家交流才能产生影响。而引证率所要测定的,正是这项研究工作对科学界的影响,这一研究对其他科学家的用处。引证率并不测定研究工作本身的质量。它们表明,有意义的研究可以在引证率很高的论文中找到的概率是很高的。但是最终的判断必须由同行专家来议定。引证分析并不是要代替,而是要帮助同行评议,使之更客观更准确。

错觉是怎样产生的?

现在我想谈谈关于引证分析的一些错觉,同时说明引证分析的一些作用。第一个错觉是,有关方法的论文必定是引证率很高的。

这个错觉的产生也许是因为,在科学史上被引用得最多的论文是圣路易斯华盛顿大学的奥列弗 · 劳拉(Oliver Lowry)的论文,它讨论测定蛋白质的一种新方法,从1951年以来被引用了100,000次。但是,有关方法的论文并不一定被引证得很多。成千的这类论文根本不被人所引用。有关方法的论文是否获得高引证率似乎依赖于该专业领域的倾向。在倾向于方法论的领域内,比如分析化学,有关方法的论文确实趋向于获得较高的引证率。但是在其他领域,有关方法的论文扣理论性论文一样较少被引用。然而有些方法曾开辟了一个崭新的研究园地。难道有人能对测定蛋白质的意义提出异议吗?劳拉的方法论文在科学史上被引用得最多,这一事实当然并不意味着它是最重要的论文。它所指出的是,很多研究人员关注着蛋白质的测定。它只反映科学界的工作和兴趣所在。

这儿还有两个错觉。一是认为自我引证会使个人的被引证数大大膨胀。一定数量的自我引证是合理的,因为科学家总要建立他自己的工作。但是,感谢那些质量较高的杂志的审查,你很难使你自己的引证数大大膨胀。另二个错觉是,批评性的或否定性的引证也常常增长了某作者的被引证数。然而这毕竟是不多的,因为科学家们不会抛下自己的工作去驳斥劣等的论文。受到很多否定性引证的论文首先必须被人认为是重要的,是值得一驳的。更何况,很多新理论在一开始常常是招人批评的。我们不能认为凡批评总是正确的。所以,即使是否定性引证,尽管并不多见,也能够用来测定一篇论文的肯定性的质量。

劳拉的论文多年来名列最高引证率之首,这一事实引起了另一个错觉。有人认为,被引证得最多的作者和论文名单是不变的,一些超级明星高居名单之首,固定在那儿了。可实际上并非如此。引证率总是在变动,总是在反映着科学研究的变化潮流。几年以前,我们公布了从1961年到1976年被引证得最多的300位作者的名单。在1981年我们编出了稍后一段时间,即1965年到1978年的1000位被引证得最多的作者名单,检查了名单前列的300个名字,发现将近三分之一,即91人,是前面的名单中所没有的。

还有一个错觉是,一个作者的被引用得最多的论文应该是他或她的最重要的论文,但这不确实。重要性是一种主观判断,引证分析永远作不出这种判断。有些作者常常抱怨说,他们曾经发表过比引证得最多的论文重要得多的论文。有一篇引用得最多的论文的三位联名作者说:“三位作者每人至少有十篇论文在重要性方面位于此篇之上。”尽管如此,作者们反映,他们的最重要的论文总是被引用得较多的。

最近几年,费城科学情报研究所在研究引证和其他承认形式,特别是诺贝尔奖之间的关系。这项研究已引起了另一个错觉。有时候,诺贝尔奖的获奖者并没出现在我们的最高引证率名单中。在解释这一现象时,有人否定引证分析可作为科研质量评估工具的价值。例如,1978年诺贝尔奖授予两个无线电天文学家,阿诺 · 本齐亚斯(Arno Penzias)和罗伯特 · 威尔逊(Robert Wilson)。这两个人在1961年和1975年期间分别被引证了1400次和1200次。虽然这两个数字也够引人注目了,可至少有1000个作者在同一时期被引证了2000次以上。但是,如果我们只限于考察无线电天文学,我们发现他们俩都已接近最高数。

引证数据能够预言诺贝尔获奖者吗?显然不能。对于每二个获得诺贝尔奖的科学家和学者,至少有十几个人同样有资格获奖。朱克曼(H. Zucker-man)和她的名著《科学界的精英》中把他们比作流芳百世者,他们虽有资格,却不能成为法国科学院院士,因为法国科学院院士仅限四十人。朱克曼说,这些人无论从哪一方面讲都有资格获奖,但却只得到一种褒奖,坐上了第四十一把交椅。这些出类拔萃的科学家是可以用引证数据来预言的。此外,我们在这些年中发现了引证率和获诺贝尔奖之间很强的联系。1967年被引证得最多的60位作者中,有六人成为诺贝尔奖获得者,其中还有多人在1970年以后获奖。在前述1961年到1976年的300位被引证得最多的作者中,我们找到了26位诺贝尔奖获得者。此外,名单上一半以上的人获得了别的奖金或被接纳为国家科学院或科学学会的成员。可见,引证率和其他承认形式之间的关系已很清楚了。

引证分析对授奖委员会挑选获奖候选人是有用的。这可以通过互引证集束(cocitation clustering)技术来做j引证集束技术是研究科学的学科结构、确定紧急研究领域的一种科学计量学工具。但这种技术也可以用于质量评价。互引证集束的概念是费城科技情报研究所的亨利 · 斯莫尔(Henry Small)和全苏医学与医疗技术情报研究所的伊莉娜 · 马尔莎可娃(Irina Marshakova)分别独立地建立起来的。

互引证集束

互引证集束是这样进行的。首先,我们对某年SCI所记载的四百余万种文献进行分类。我们通常规定一个引证率阈值,大约为15至17。这样约包括了SCI所载的文献的1%不到。然后我们来确定这些被引证得较多的论文中,哪些是互相引用的,或被其他论文同时引用的,经常被互引证的论文可以认为是在讨论相关的概念或方法。

1978年,阿尔伯特 · 拉斯克(Albert Lasker)医学研究奖金的授奖给我们一个机会来考察互引证集束的定性作用。这项奖金授予斯纳德(S. Snyder)、休斯(J Hughes)和柯斯特利茨(H. Kosterlitz),嘉奖他们关于麻醉剂受体的研究。我们检查了集束数据,得到了可以认为同样能获奖的一些人的名字。图1所示的集束是从1974年SCI数据中取得的。这是我们能够确立一个麻醉剂受体研究集束的第一年。图上的直线表示互引证联系。只有戈德斯坦(Goldstein)的论文是1973年以前发表的,它给出了用物理方法显示麻醉剂受体存在的思路。宣布发现这种受体的论文有三组:约翰 · 霍普金斯(John Hopkins)、彼得(Pert)和斯纳德;纽约大学的西蒙(Simon)及其同事;Uppsala大学的泰勒尼乌斯(Terenius)。

11.1

图2所示1975年的集束,反映出追随最初发现的研究活动增加了。注意集束右边标志“休斯75”的论文,它在发表的当年就被多次引用而形成集束。彼得和泰勒尼乌斯的论文仍然出现在集束中,以后的集束表明他们继续发表了该领域影响深远的论文。我展示这些集束图当然不是为了讨论科学获奖者的人选问题。这些图只是表明了集束分析怎样跟踪一个领域的发展,怎样确定作出意义重大的贡献的人们。

11.2

我们科学情报研究所把集束分析用于生物医学目录。1982年研究所宣布了新的在线数据库。索引系统包括建立在互引证基础上的自动分类系统。使用者将得到一本小册子,上面列出了生物医学的3,000个集束。假如你对细胞核内的染色体蛋白质和非染色体蛋白质感兴趣,你可以从指南中的染色体开始查找,发现“染色体”这个词出现在18个集束中。标题为“核内染色体蛋白质和非染色体蛋白质”的集束包含这个课题的46篇论文。如果你嫌太多,你可以选择那些与该专业关系最密切的论文,即引证了该集束内的很多文献的论文。

1982年10月,我们科学情报研究所出版了百科全书式的《生物化学和分子生物学学科图集》,它会引起科学史家的极大兴趣。图集共100章,每一章给出一个用我们的集束数据确定的生物化学子专业。每一章分四个部分:一张集束图,一份集束内的文章的目录,一篇说明性文章,以及引用了集束的最新论文的目录。说明性文章提供了该子专业的历史概况,说明什么科学论文在该专业内起了重要作用,总结了正在进行着的研究。

引证分析的一个重要应用是确定那些所谓“休眠者”。休眠者是那些一开始对当代研究几乎没有产生什么影响的重要发现。这些论文起初没被人好好引用,但以后他们被其他研究者发掘出来,受到大量引证。图3是希格斯(R. Higgs)关于基本粒子物理学中自发的对称破坏的简单模型的论文被引证数的变化,该论文刊载于1966年《物理学评论》(Physical Review)上。它在1972年前每年被引证次数不到10次。1973年引证数陡升,达55次,此后几年该文每年被引证数仍然高于刚发表时的几年。

11.3

有几个原因可以说明,为什么论文会延迟得到承认。或许,信息爆炸阻塞了信息通道,有时阻碍新观念透过已经建立起来的思想壁障。也许是某一发现超越了它的时代,在概念上无法和已有的范式联系起来。但有时候一篇论文开头被忽视是由于作者是没有名气的研究所里的无名小辈。在这种情况下,通过引证分析确定休眠者可以有助于年轻研究人员获得他或她应得的承认。

正如你们所看到的,费城科学情报研究所已发现了引证数据的很多用处,包括确定重要的研究项目,我们可以将某个人的引证记录与该学科中其他作者进行比较,我们可以很容易地用集束数据找出作者的专业范围,从而只把他和他的同行作比较。可惜的是,积累了几年SCI数据的一般科技管理人员还不会这样做。SCI是科学文献的统一索引,它并不在学科之间进行区分。此外,SCI不列出第二作者的姓名,同名作者的区分也是一个特殊问题。我相信,否认引证数据可用于评价科研工作质量的真正原由是滥用SCI。所以,我们正在探索新的路子,要提供定性数据。很多人忘记了BCI是一个目录工具,不是引证计数器。它的存在使得引证率的比较成为不可避免的。我们认为,如果你想用引证数据去评价个人、研究所等确实未尝不可。

我们正在试验性地建立科学引证分析系统(SCAS)。SCAS将克服SCI作为评价工具的一些缺陷。这个系统有希望能恰当地比较同行专家,解决联名作者问题,消除同名问题。考察不同专业引证频率的不同,还可以跨专业进行比较。SCI有一个特点将得到改良并纳入SCAS系统,即社团索引,它列出各个机构是谁在发表论文。可惜很多国家不实施共同的规则,提供有关组结机构的情报。很多杂志不提供与作者有关的机构的任何信息。

总之,任何想定性地使用引证数据的人必须理解它的能力和局限。有意义的引证分析不是一件简单的事,你不能瞥一眼SCI上某一个人的条目就对他或她作出评价。然而,利用引证分析去确定和评价有意义的学科,这一概念是能够成立的。正确池利用它,它能加深我们对科学事业的理解。

[Scientific World,1983年第1期]