今年2月14日出版的《自然》杂志撰文指出, 中国人在国际上发表的文章越来越多, 他们理应为自己的学术成果得到应有的承认而高兴; 但如果连作者的名字都无法被大家识别, 中国学术交流的国际步伐将迈向何处—
 
 

署名雷同带来身份识别危机_许谷渊

 

作者身份难鉴别
 
  上海交通大学药学院副院长贾伟(Jia Wei,音译)有着极好的记忆力,他可以熟记许多生物体的代谢途径,但在对学生的论文鉴别时却犯了难。他有3个学生的中文名分别为王晓艳、王小荣和王小雪。这3个名字在中文语境中是完全不同的,但在发表的英语文献中的署名却统一缩写为相同的“X.Wang”。贾伟对此叹息说:“要我分清楚其中的文章到底是她们中的哪个人发表的真的很难。”
 
  贾伟的困扰形象地反映了目前世界各国媒体普遍遇到的作者身份识别问题。由于国际上未对作者的署名有统一、可行的标识和鉴别方法,导致人们无法对文献作者的身份作出识别,也很难对“到底是谁发表了哪些文章”这个问题作出准确的判断。
 
 
身份无法识别的隐忧
 
  当然,这个问题不只是发生在中国作者身上,其他国家(包括日本、韩国以及英语母语国)的作者也遇到类似的问题。假设约翰·罗伯茨(John Roberts)和简·罗伯茨(Jane Roberts)在同一个实验室工作,并都以J.Roberts的缩写名在论文上署名,估计几乎没有人能够分清是谁发表了哪些文章,甚至大家会以为他们是同一人。
 
  作者身份无法识别会产生许多负面影响。第一个负面影响是阻碍不同国家作者之间的交流及个人发展。国外许多研究人员和编辑们一致反映,在使用搜索引擎和出版物数据库时遇到的一个普遍问题就是很难识别亚洲作者的身份。这绝对不是一个小事情,作者身份无法识别会影响他们与西方合作伙伴的平等竞争,进而影响其未来发展。对此,国际人类前沿科学计划(Human FrontierScience Program)主席伊藤正雄说:“这也是亚洲的研究人员很少被邀请参加国际合作项目或者成为评论员的原因之一。”
 

1

 
  第二个负面影响是助长科研不诚信行为。有些研究人员已经利用这个问题进行造假。原清华大学医学院院长助理刘辉(LiuHui)在填写其履历时将他人的研究成果据为己有,因为他们的姓名首字母都是一样的。造假被发现后,刘辉于2006年3月被开除。
 
  美国物理学会《研究》杂志主编吉恩·斯普拉尔斯(GeneSprouse)说,如果亚洲人自己都没有办法对他们国家的研究人员的身份进行识别和分类,那么这对于西方国家而言将是更加困难了。根据汤姆森科技信息集团的科学引文索引(SCI)统计显示,最近几年,来自中国、日本和韩国的出版物增长得非常快,到2006年已经占到科学文献的五分之一,大约是美国的三分之二。根据SCI统计显示,来自中国大陆的科技文献的增长尤其迅速,从1996年2.3%增长到了2006年的8.4%。斯普拉尔斯表示,当亚洲作者发表更多的文章,这个问题只会变得更糟。而我们对作者进行评价时是否会“对牛弹琴”?寻找作者本人时会不会“张冠李戴”,这都是十分棘手的问题。
 
 
原因探究
 
  正如前文所述,作者身份识别的问题在世界各国普遍存在,但这一问题对中国作者来说可能更加严重。就中国作者的身份识别困难问题,其原因至少有以下五个方面:
 
  1.翻译转换的问题。在发表的英语文献中,中国作者通常采用语音方式进行署名,即通过罗马拼音系统进行转换,用拉丁字母来表示中文发音。但是,这种转换并不是双向的。例如,对“Wang”进行“拼写翻译”得到的姓一般有两个,即王和汪。仅仅根据这个“Wang”姓来寻找中国作者可不是一件容易的事情,因为有着同姓的中国作者的数量不在少数。更“糟糕”的是,他们中好多人的名字的首字母是一样的。据了解,在美国国家医药图书馆建立的PubMed医学文献数据库中搜索以“Wang X”署名的文献,出来的结果是8904个。令搜索者痛苦和烦恼的是,这个数字几乎每天都在增长。
 
  2.同姓过多的问题。很多中国作者的姓是相同的。据中国公安部估计,有超过11亿的人(大约占中国总人口的85%)只用129个姓。其中,大约有9300人拥有“王”这个姓,他们中从事相近工作或者相同工作的几率也很高。这意味着他们发表的文献越多,对他们进行识别和分类就愈加困难。
 
  3.缩写方式问题。目前,不少外国出版商对亚洲作者名字的缩写方法存在一些问题。例如,不同杂志在如何缩写多音节名的方式上存在差异。有些杂志把作者姓名的拼音全部缩写,如Xiao-rong缩写为X.R.,Xiao-xue缩写为X.X.;而有些杂志仅仅保留姓名的首字母,即把Xiao-rong和Xiao-xue统一缩写为X.。这就为人们对作者的身份识别造成了困难。
 
  4.名和姓的顺序问题。有的杂志一贯坚持将作者的名字排在姓的前面,而有的杂志是根据国家的传统习惯来表达他们的姓名。例如,曾经同是研究碳纳米技术的两个中国研究人员,他们都在北京清华大学,中文姓名的拼音分别为Yang Wei(杨卫)和WeiYang(魏洋)。杨卫现在杭州的浙江大学,他表示,当初在清华大学工作时确实发现有几位研究人员和他的姓名有着同样的拼音,用相同的首字母在文献中署名。虽然研究领域是相同的,但他说,“要找到其他这些研究人员却只能靠运气。”
 
  5.真名与笔名的不一致问题。中国作者在发表文章时,有时会使用笔名,有时又使用真名,这都会使读者(尤其外国读者)产生困扰和迷惑。
 
  解决问题的办法为解决身份识别问题,各国都积极研究并提出了一些想法。
 
  1.添加母语标志。美国物理学会已经采取了非常措施,如让作者选择在文献上以中文、日文或韩文写上自己的姓名而不是统一要求转换成英文格式。斯普拉尔斯说:“这不仅是一个出版问题。姓名对一个人来说很重要,这项措施意在向大家表明我们尊重我们的亚洲合作伙伴,欢迎他们在我们的杂志上投稿。”美国物理学会有将这种措施扩大到其他语言如阿拉伯语的打算。尽管有不少人对这一举措表示赞同和欢迎,但也有人提出质疑。第一,其
 
  他出版商是否也会马上采取相同的策略?第二,以几种外文字体打印,打字员需要组合每种字体和编码规则,会提高成本。第三,仅仅对文献署名进行改革是远远不够的。只有当这种方式应用于出版物数据库后,不同国家的作者们就能用他们自己的语言进行搜索。”
 
  2.添加注册标识。荷兰出版集团爱思唯尔(世界上公认的高品位学术出版集团,也是全球最大的出版商)驻北京代表处主管孙晓鹏(Sun Xiao-peng,音译)认为,身份识别的问题实质是效率的问题,“即一个作者是否能在15分钟内被找到,或甚至要6个小时。”爱思唯尔集团的Scopus数据库
 
  (当今世界最大的文摘和索引数据库)其独有的作者标识系统提供了一种可行的方式以识别来自不同国家的作者。即使他们有着相同的姓名,这一数据系统会根据那些有着相似或相同姓名的作者的出版历史、主题领域以及合著者等进行分类。自2006年启动以来,这个作者识别系统为大约2000万作者分配了识别代码(这些作者的名字分布在Scopus数据库中。Scopus声称对其中95%的记录拥有99%的确信度,并为每个作者指定了一个网站,在掌握了这些作者的基本概貌后并不断进行修正。孙晓鹏说:“它的作用好比研究人员的护照,到哪里都能找到他们。”
 
  爱思唯尔集团并不是唯一一家提供这种商业服务的公司。今年1月,费城的汤姆森科技信息集团展示了其研制的“研究者ID”软件———可以让研究人员创造稳定的个人标识符来管理他们的索引标准(该软件在用户注册时分配一个代码)。该集团产品研发负责人吉姆·普林格尔(JimPringle)说:“研究者ID”不仅解决了利用标识符搜寻的索引标准问题,还提供了一个安全的空间来进行虚拟的合作。”该服务目前已经有大约3500个受邀用户。
 
身份识别的发展方向
 
  尽管许多机构都提出了很好的想法并付诸了实施,但也有人认为,目前的方法仅在一定空间内提供了问题的解决方式;而关于作者标识的问题其实很复杂。比如,目前市场上的产品所提供的识别功能还不能通行于所有的数据库。不同的出版商对姓名的管理规则还存在不一致性,这会导致不同系统的查询结果不相吻合,从而影响结果的权威性。只有当出版商们坐在一起商定出一个通行办法来管理作者的姓名,这些举措才会真正有用。
 

Scopus操作界面

Scopus操作界面

 

  鉴于此,一项由众多出版机构合作的CrossRef计划———由出版商国际链接协会(PILA)运作,使用数字内容标识符(DigitalObject Identifier,简称DOI)技术来确保链接的永久性———提出了一种可能完美的解决方式,那就是组建由2046家出版商参与的联盟(其中包括爱思唯尔集团
 
  和自然出版集团)。该计划提出了使用“作者唯一标识”的系统,类似于电子出版物的数字唯一识别符号(DOIs,digital object identifiers)。“作者唯一标识”可以为用户提供身份鉴定,结果可用于专业目的的识别。据悉,Cross-Ref即将对一个原型系统进行测试,并将邀请包括书籍和学术论文的作者来对他们的成果进行注册。经过身份鉴定的作者列出的出版物将会与出版商的网站相连接并进行校核,从而进一步保证了内容的真实性。
 
  人们期待未来有一个全球作者标识系统可以为作者身份识别提供有效地帮助。