最近一个时期,在不同的知识领域里开展了科学计量的研究。但是至今为止,这些工作和科学管理问题还没有系统的联系,借助机器进行情报加工的可能性没有得到充分利用。诸如《科学引证索引》(SCI)这样的情报检索系统的出现,使得有可能进行评价科学现状及发展的新型综合性客观定量研究了。应该指出,美国的科学情报研究所(费城)和匈牙利科学院已广泛地进行了类似的科学计量研究。这些研究的基础是SCI系统所引的世界出版物。由于缺乏在机读系统上编制的数据库及其技术基础,这样的研究在苏联还没有开展。
众所周知,情报在科学管理中具有重大的意义。就管理的目的而言,情报的利用可以分为两个方面——实用的方面和战略的方面。
实用的方面包括寻检有关文献和情报,提供给领导者和研究者。为此而建成了各种自动化情报系统。就其实质而言,情报利用的实用方面就是使已经发表的情报在新的研究工作中得到利用。
让我们详尽地考察一下在战略方面利用情报的情况。除了少数从事科学计量研究的专家外,战略方面的重要性尚未被充分认识。在战略方面利用情报包括在整个科学领域或学科中揭示科学所具有的参数和规律,这些参数和规律不仅对于具有一定目的的研究计划、计划的期限等等实行最优管理是必需的,而且为了在这个或那个科学方向中按照其进步而调拨资财也是必需的。
为了评价当代科学发展的水平——出于管理、计划、预测的目的——必须对科学或某学科的状况进行综合性研究。这种研究的手段可以是科学计量方面的各种方法,主要是世界文献流分析的算法程序和所得结果的定性解释。
现在,有可能对传统方式或机读方式记录的世界出版物总体进行科学计量的研究。这样的研究可用种种方法(下文将提到)在科学系统内揭示其内部结构,它的发展趋势,显示整个科学所固有的定性的和定量的指标。
在这儿我们只研究世界文献流的分析方法,从而获得科学管理系统所必需的关于科学进步规律以及科学或某学科发展的基本趋势的信息。
研究科学状况及其发展趋势的种种方法可归纳为科学计量研究的三种类型:
1。目录计量分析;
2。引证分析;
3。词汇分析。
这些研究的核心是全世界出版物总体的定量指标。科学的系统研究就是这样的研究之一,包括分析算法程序及其定性解释。
让我们来考察一下这种科学计量研究。
科学的目录计量研究
这儿研究的是各种类型的文献,如科学论文、学位论文等等。对较长时期(10 ~ 15年)的目录计量研究可以表明现代科学的稳定趋势。
目录计量分析是指对某种分类范围内的文献流作出定量分析。这样的文献流可以是二次文献,特别是书刊述评。把书刊述评按某种分类系统分解成各个栏目,这些就是目录计量分析的原始资料。必须指出,我们所谓目录计量分析不仅要揭示填入各个栏目的文献的统计数(将文献按栏目分类),而且要指出文献流内部数量变化的定性解释。
作为例子,我们对两种文摘杂志进行目录计量分析,一是《医学文摘杂志》(苏联医学科技情报研究所出版)第六部分临床肿瘤学、放射性医学、X射线学,二是文摘杂志Excerpta Medica(《医学文摘》)第十七集公共保健、社会医疗和卫生。
1969 ~ 1978年间在《医学文摘杂志》上发表的肿瘤学文摘5,350篇。表1是目录计量分析的统计部分。将文摘按栏分开统计后的定性分析表明,《医学文摘杂志》第六部分各个栏目编制不平衡。所以只有将数据按1969—1972年,1973 ~ 1976年,1977 ~ 1978年分别统计才能探究肿瘤学各个研究方向的动态。
必须注意《医学文摘杂志》该部分的硬性分栏法。从表1可看出,这个分栏法分为两部分,一是按概念分(普通肿瘤学),分为四栏;二是根据解剖学分(局部肿瘤学),分为十三栏。当然,这样的分栏法不能表明诸如癌症研究方法的变化这样的问题*。但是,即使用这种分栏法还是可以清晰地表明各种癌症研究的比重变化:内脏肿瘤从3.0%,4.8%到7.3%;乳腺肿瘤从8.8%,10.8%到13.7%,男性生殖器肿瘤从0.4%,1.2%到2.2%。
文摘杂志Excerpta Medica第十七集公共保健,社会医疗和卫生中的材料按细致的分类方法分为135栏,包括与保健组织、社会医疗与卫生有关的问题。研究的目的是,指出社会医疗发展的动态,获取预测今后二、三年保健事业各个方向发展的先兆。
研究资料总体是1972 ~ 1978年间在该杂志上公布的54,206篇文摘。将这些文摘按年度统计,如表2和图1所示。可以指出,在七年中,文摘杂志Excerpta Medica第十七集的文献流是相当稳定的,波动平均只有7%。这个定量信息是各栏按年分布的相对频数表现出来的。按三个相交的时期(各为三年即1972 ~ 1974,1974 ~ 1976,1976 ~ 1978)所计算的各栏频数给出了探索各课题变化情况的可能。频数计算表一部分如表3所示。
研究表明,各栏相对频数的变化反映了保健与社会医疗研究方向的动态。一般的目录计量分析还可以显示所考察的杂志中各栏文献的不平衡。比如Excerpta Medica第十七集的分类体系中,像4.5和4.6这样的并列项目(儿童保健和儿童卫生)有很不同的频数,但没有精确的语义界限,所以有可能归并为一栏。
世界文献流研究的定量特征的定性解释表明,对研究文献流的动态最有意义的是各栏相对频数变化的单调趋势(图2)。可以指望文献流在最近二、三年有较大增长的领域是社会卫生、心血管和癌症问题、先天性缺陷,以及各种中毒问题、心理卫生、性病、嗜毒症等等。文献量将下降的领域涉及一些公共问题——医疗史、医疗实践、医疗伦理、病人问题、各种统计研究(数据加工除外)、战时医疗(灾时除外)和原子战争、实验动物学问题等等。对Excerpta Medica的目录计量分析还可以得出改善《医学文摘杂志》分类法的几点意见。
引证分析
自动化系统SCI的出现使得有可能揭示整个科学领域内的“热点”。借助于SCI的数据库,可为评价科学的现状和发展作出一系列的定量判断。引证分析可以分为两种形式:
1)文献引证统计,
2)引证网络分析。
引证统计可显示苏联和外国(资本主义国家和经互会成员国)科学发展的规律、可能的发展速度和“突破”。另外,在SCI所反映的某些知识领域中,应该为苏联的成果作出一系列修正系数,因为这些成果由于种种原因没能被国外充分引证。
引证网络分析
有两种引证网络分析法:
—是目录偶方法(bibliographic coupling),由美国的凯斯勒(M. Kessler)教授于1963年提出。
二是提纲关联法(excitation),1973年美国和苏联同时提出。
在关于全世界出版物的数据库上建立的引证网络分析的算法程序,进行问题(主题)和作者的登记,显示整个科学或学科的结构,探究其变化动态,说明新的研究方向的产生,同时揭示社会的科学体制。作为例子,图3中用引证网络分析表明了情报学的分科组织。引证网络分析是获取在某个学科中是否集中了主要科学力量的有关信息的工具,同时也能揭示,这种倾向究竟是偶然的,还是某个国家精心筹划的科学政策的结果。
在七十年代进行了一系列科学结构研究,用的手段是引证网络。例如激光技术、情报学、地质学、生物医学、自然科学与社会科学领域中的研究。所有这些研究都可以证明,各学科中的主要动态变化首先是和科学研究前沿的推进联系在一起的,进入引证过程的新文献要么是反映了极为重要的事件,要么是用相邻学科的方法研究解决某个问题的实验。一般地,科学学科形成了特征相似的网络,并且可以观察到相同类型的联络分布。同时可以指出,在社会科学中情报流的分解比较弱,跨学科的联系比自然科学强得多。
美国在分配资财给各活动领域并控制这些资财时进行了引证网络分析。例如费城科学情报研究所应英国广播公司的要求所做的研究,全国癌症研究所的研究等等。
引证网络分析的副产品是科学技术重要研究者的自动卡片集,它的自动跟踪无疑对于国际双边合作的管理和制订专家出访计划是有用的。
词汇分析方法
这些方法严密地跟踪各种变动中的索引——特别是SCI的索引,苏联科技情报研究所文摘杂志的索引和科技情报中心的医学文摘杂志的索引等等。这儿,自动化系统数据库中的任何词汇信息——频率词典等等都可以利用。
例如在激光领域内对频率词典的研究。我们知道,关键词频率的变化可以反映科研方向中部署的实质性变更,还可以反映(较少见)科研活动中语言特征的变化。这些变化首先涉及术语,如表示“受激辐射量子发生器”这一概念的术语的变化(表4)。从表4可以看出,在第一个时期(1961 ~ 1963年),这个概念的表达方法各不相同,用长的表达形式,如激励辐射光线发生器,激励辐射发生器,光线量子发生器以及它们的缩略形式。同时,在文摘杂志《物理》上出现了英语缩略形式的术语,莱塞或梅塞。在第二个时期(1964—1965年),达成了某种统一,经常用的是两个同义词,光线量子发生器和莱塞(激光)。但是到1966 ~ 1967年,莱塞一词形成了对应的形容词,从而取得了这一术语的最终胜利。其他的关键词变化都证明了激光研究领域中各研究方向比重的突化。
这种词汇研究的主要应用是预测科学发展的道路、从而确定科学及其各领域的力量配置(如资财、干部、技术等)。
总之,上述方法可用于战略研究的第一阶段,合理地解决两个尖锐的问题:
① 在各个科学领域中找出占首位的最重要的工作,在这些领域中将本国科学势能与其他国家进行比较。
② 揭露活跃的学科的未来基础研究中所存在的问题,从而确定科学发展的稳定趋势。
[Hayчно-Texнuчecкaя Информачuя Cepuя 2. Йнформачuоныe Пpочeccы u Cucmeмы,1982年2期]