人工智能、计算机视觉是当代高科技领域的前沿课题,也是世界各先进国家投入大量人力、物力竞相开发的新领域,对智能本质的研究是人类认识自然的最具有挑战性的课题,也是21世纪高技术开发最关键的课题。

国内以中国科学院自动化研究所模式识别国家重点实验室加入了这一领域的科技竞争,在经费短缺、人员不足的情况下起步,经过短短的几年时间,已做出了足以让世界先进国家的同行们刮目相看的优异成果,一批年轻人已跻身世界这一前沿领域。实验室主任是一位中年科学家,他的名字——马颂德——也随着实验室取得的业绩传播开来。在1991年全国国家重点实验室的严格评比中,4个实验室荣获国家优秀实验室的称号,而马颂德领导的实验室就名列其中,他本人也获得国家级有突出贡献的中青年科学家称号。为什么他们能在强手如林的国际竞争中获得如此的成功?管理者希望了解他们是如何实行科学管理的;同行们希望交流学术,寻找新的突破点;大学生们更多的是羡慕,希望将来有机会去该实验室从事研究;而我们这些已过“而立”之年的研究人员,深知成功和名誉背后的艰苦拼搏。受《世界科学》编辑部的委托,我们采访了马颂德研究员和他们的实验室,希望通过这篇采访,让更多的人们了解中国的一批优秀的科学家是怎样在艰苦的环境中、在崎岖小路的攀登上,跻身于世界科学的先进行列的。

1993年北京的深秋季节,中关村科学城、高技术金三角地区仍是一派繁忙景象。

应我们的要求马教授先简述了他自己的经历。他1968年毕业于北京清华大学自动控制系,10年之后以优秀的成绩考上“文革”后中国科学院自动化研究所第一届研究生,1979年他被派到法国巴黎第六大学即著名的玛丽 · 居里(Marry Curier)大学攻读图像处理和计算机视觉专业的博士,1983年获博士学位。同年他在美国马里兰大学计算机视觉实验室任客座研究员,实验室主任是计算机视觉领域的著名学者罗森费德(A. Rosenfeld)。1984~1986年马颂德任法国信息与自动化研究所客座研究员,并于1986年获法国国家博士学位,之后他回到中国科学院自动化所开始筹建和主持模式识别实验室的工作。

我们的话题很自然地转到了模式识别、人工智能、机器人视觉这些高科技前沿学科上来。马教授告诉我们:无论是模式识别、人工智能,还是机器人视觉,这些都是计算机科学高度发展的产物,其研究目的是想让计算机具有感知、识别、判断、推理等高层次智能。模式识别就是对人类通过视觉、嗅觉、触觉、听觉来感知外界信息的能力进行计算机模拟,这个模拟过程分为两个阶段:第一是信息感受阶段,即通过传感器来获得信息;第二是信息的分析、判断、处理阶段,也就是通过计算机对感受到的信息进行处理。由于人们认为人感受到的信息有80%来自于视觉,所谓的百闻不如一见大概源出于此,因此视觉信息处理是模式识别的主要研究对象之一、人的视网膜上有几千万个感觉细胞 · 它们把感受到的光信号转换成在神经纤维中传输的电信号,他们对图像的感觉就像我们看到的新闻图片一样是由密集的点阵列组成的。每一个点都有一个灰度和颜色信号,它们是离散的。离散后的一幅图像可能有几兆位的容量,而满足人们视觉习惯的连续运动图像每秒中要有25幅,这样1秒钟就有上百兆位的信号,要处理这么大的信息量,没有高速计算机是不能想象的。现在的计算机虽然能够进行复杂的逻辑判断,但它很难去“感受”外界的信息,从计算机诞生以来,人们就一直试图寻求一种方法,使计算机能够“感受”外界的信息,并能对感觉到的信息进行处理,也就是现在所说的计算机视觉。早期的计算机受到速度的限制,不可能像人一样灵活处理视觉信号。但在六、七十年代开始,人们在计算机视觉方面做了大量的研究工作。其中最成功的应用就是遥感和遥测。即在飞机和人造卫星上装上摄像机,摄像机不仅像人一样能感受可见光,还能感受像红外等其它波段的不可见光,不论它感受的是什么,从计算机上看就是一幅图像。通过计算机的分析、处理,我们可以获得地面上植被分布、各种建筑以及大气分布、天气云图等等。不论是遥测还是遥感、它们处理的是二维的图像,目前计算机视觉还要解决感知三维世界的问题。简单地说它是模拟人眼看物体的原理用两部摄像机同时取得两幅图像,使计算机在“看见”物体的同时也“看”出物体在三维空间中的位置。它第一个成功的应用将是在智能机器上,给机器人安装上双眼,再配之以判断、处理系统和执行机构,它就能完成人所能完成的某些工作。这是一项很有应用前景的研究,它对提高工业产品的竞争力有着不可估量的价值,因为随着社会的不断进步,今后的生产将是小批量、多品种,产品的生命周期也将大大缩短,目前工业上使用的没有视觉、没有处理功能的、只能完成固定动作的机器人不能胜任。图像处理的另一个非常成功的应用是在医学方面。人们所熟知的CT(计算机层析扫描)、MRT(核磁共振),它们的基本原理就是用某种射线,例如X射线对物体进行360度扫描,对扫描获得的信号经过Radon变换后就可以确定所扫描物体断层中的结构(密度分布),将各层的处理结果结合起来就可以重建物体三维结构,从而,大大方便了医生们的诊断。当然,模式识别和图像处理的应用远不止于此,它在资源勘测、工业自动化、医学、军事等各个领域都具有非常广泛的应用前景。虽然,计算机视觉,尤其是三维计算机视觉还没有到成熟的大规模应用阶段,但专家们认为,计算机视觉将是人工智能应用的第一个突破口,也是人们认识自己、认识智能行为的第一个突破口。

当谈到模式识别实验室的研究工作水平时,马教授是这样讲的,我们研究的问题是国际上该领域的前沿问题,如果不是这样,你就不能获得前沿的成果,也就不能在国际刊物和会议上发表文章,你的水平也得不到国际上的承认。举两个例子,一是1993年11月20日在日本召开第一届亚洲计算机视觉会议,会议上只安排了两个大会邀请报告,一个是日本的,另一个就是我们实验室的。再有就是在1993年上半年举行的国际计算机视觉会议上报告的论文中有我们实验室一篇,而另外还有三篇的第一作者也是我们实验室出国的研究人员。该会议是这一领域最高级的国际会议,每3年才开一次,文章的录取率约为10%,如果能被它录取一篇文章,这在国际上也是引以为荣的。可以毫不夸张地说,在我们实验室做过研究工作的人,出去之后都是出类拔萃的。我们的实验室在国内是领先的,在国际上也是知名的。但我不能说我们是国际领先,原因也很简单,国为我们的研究不论在数量上还是涉及题目的广度上都不能与先进国家相比,这里主要是一个经费问题。我们的经费只是先进国家同类实验室经费的1%,因此我们只能在少数题目上做深入的研究。

马教授现在除担任实验室主任、研究所副所长外,还兼任“863”计划自动化领域专家委员会委员和国家攀登计划课题认知科学专家组成员。于是,我们向他提出了一个中青年科学家面临的共同问题:怎样处理社会兼职和专业研究工作的关系。马教授讲:就我个人来讲,我当然希望有更多的时间来做我的专业研究,但社会兼职是一种责任,实际不仅在我们国家,就是在那些先进国家,搞专业研究的教授、负责人等也要兼一些社会职务,出席很多的评审会。这些表面看起来是占用了很多时间,但这对你了解本专业的研究动态、争取课题的经费是必不可少的。当然其中也有一部分是纯粹的行政会议,这就是我所说的责任。不论是中科院,还是研究所,他们都为你的研究工作提供了支持,你当然也应为他们的管理、决策尽一些义务。从小的方面讲是为了实验室的发展,从广义的角度上看是对社会的贡献。但是研究工作也必须要做,就我本人来讲,我现在还承担着863计划自动化领域,国家攀登计划和自然科学基金重大项目的研究工作,我本人也动手编程序。完全不做专业工作,整天忙于行政事务也不行,学术思想会落后。去年我在法国做了7个月的研究工作,这是我7年来第一次专门出国去做学问,这对我当然是非常有益的。

紧接着我们问到了该室年轻人的培养情况,马教授说他们实验室的大部分工作是由年轻人承担的,他所在的计算机视觉课题组只有3名固定成员。其余12人均为硕士、博士研究生和博士后,他鼓励年轻人独立思考,只是在必要时给一些指导。令他感到欣慰的是,他们研究室涌现了许多优秀年轻人才。中国科学院6年来共有近70位青年获青年科学家奖(每2年评1次,每次20多人),该实验室就有3人获此殊荣。但同时,他也对年轻人急于出国,而已经出去的年轻人没有再回来的现实情况很有感触。他支持年轻人出去学习深造,但也要求他们在实验室努力工作,因为他们在实验室工作也同样可以做出很好的成绩。你在自己的国家、自己的实验室做出成绩再出去,你自己的感觉和在别人心目中的地位与没有建树的人是绝对不一样的。马教授讲:我感到我和现在年轻人的差别是我曾在中国最落后的农村生活工作过2年,在你亲身经历了那种艰难困苦之后,你总想到你有责任、有义务去为改变这种落后的状况做点工作。我们想,马教授也大概正是基于这点,放弃了一次又一次在国外工作的机会,而植根于祖国的土地上辛勤耕耘的。

在谈话中马教授几次提到“863”计划,攀登计划和自然科学基金在振兴科技中的积极作用,他说,在市场经济的环境下,如果没有“863”、没有攀登计划、没有自然科学基金,我国的科学研究工作就很难维持下去。他希望年轻人能看到祖国在这方面所做的努力,在计算机视觉研究方兴未艾的今天,为自己的实验室,为曾经培养了他们的祖国做些工作。我们想,那些曾经与马教授共同做这些研究工作的年轻人、那些曾经得益于祖国教育和科研的年轻人们,大概不会不为马教授的这段肺腑之言所触动吧?!

2个小时的采访很快过去了,当我们离开马教授的办公室后,我们一直在想,如果科学研究能获得更多一些经费的支持,如果所有的科技人员都像马教授那样对自己的研究室、对自己的国家有一份责任感,我们对祖国科技的振兴还有什么可怀疑的呢?

(本刊特约记者:熊小芸、陈硕)