一 前 言
研究生物、利用生物学研究成果来帮助开发新的信息处理元件和计算机的方法在80年代中期开始得到重视,同时,生物芯片、生物计算这类术语也流行起来,虽然生物计算机的概念尚不能明确定义,但有一点可以肯定:它绝不局限于过去基于某种简单概念而开发的定义清晰的计算机类型,比如超大规模集成电路、第五代并行处理机、模糊计算机、神经网络等。由于人们对生物尤其是人脑的功能着迷,生物的感觉系统和人脑将来可能成为能降低计算机下载荷的图灵机的一种模式。无论是生物还是计算机都是由内装的程序控制的信息机构,假如将生物计算机定义为“具备生物与现有计算机双方特点的计算机”,开发过程中就能明确生物和计算机的异同。所以,生物计算机的研制不止于开发新一代的计算机,它还与生命的本质相连。本文旨在回顾以生物计算机为终极目的的生物学和计算机工程学交流过程,并考察当前适当的研究战略。
二 生物计算机
1. 控制论
参照生物优秀的信息处理功能开发计算机的设想,最早可追溯到计算机诞生前的40年代初。后来《控制论》作者数学家韦勒(N. Wiener)写到“数学家、电子工程师、大脑生理学者集中起来,就计算机、脑的信息处理交换了意见”。控制论思想及神经回路的感知模式即是交流的成果。但这些观念没有直接反映到计算机设计上。
2. 生物机械学
60年代出现了生物机械学一词,即把生物的优秀功能吸收到工程学上来。遗憾的是生物机械的悬臂上并未产生新的信息处理元件和计算机。同时,模式识别研究开始发轫,比如视觉识别即是其一。模式识别反映了模仿生物特别是人的识别能力的一个侧面。例如,人们早已知道人的视觉具有根据浓淡变化来识别的功能,这一机制在神经生理学上称为“侧抑制”。侧抑制也在听觉信息处理中出现。该机制常常用作计算机数字图像分析的算法。但这样的例子只是个例外。一般地,计算机模式识别与生物和人的模式识别有着质的不同。
3. 人工智能
80年代初,专家系统迅速发展。这种系统能像老练的临床医生一样,凭经验即可推知问题的症结何在,其表现形式是以计算机能够实现的三段论法进行机械的逻辑推导。该方法不是从数学模型出发,以数理逻辑严格地把问题格式化然后求解,而是尽量模仿人的思维,让计算机进行模糊推导。人工智能(A1)方法意味着“模仿专家思维”,但它对专家思维的再现还不那么灵活。
4. 模糊论
近年来出现的模糊计算机实施的算法是以处理人的“暧昧”的模糊集合论为基础的表现论和行为理论。模糊理论产生于60年代,由于传感器技术和芯片技术的进步,已开辟了几个实用领域。模糊计算机的有效性在于它不需要最优化,而是让极优良的传感器给出一个正确的状态量,因此说模糊计算机能像人那样接收到模糊信息就能确切地下判断是一个误解。
5. 神经网络
顾名思义,神经计算机很容易使人想到它是参照神经细胞或神经回路网的功能制作的。的确,它的雏形——感知机(perceptron)即是现有神经系统一部分的模式化。实验证明控制小脑运动的回路与这种模拟相符,但后来的神经网络研究和现有的神经计算机同真正生物的神经系统没有必然的直接的联系,只是“网络所表达的算法研究”。因此,神经计算机研究尚未进展到“学习神经系统机制并予以仿真”的程度。
6. 揭开黑匣子
60年代就提出的模式识别或人工智能之所以重新引起注意,是因为伴随微芯片的进步、很容易开发出各种用途的特殊处理器。无论第五代、AI、神经计算机还是模糊计算机,不管实效如何,都是软件易于实现的方法论,而没有超出冯 · 诺依曼式数字计算机的范畴。换言之,计算机研究人员以往一直只对“学习生物”的方法论感兴趣:然而,在分子生物学尚不发达的70年代,“学习生物”(仿生)之类的研究哲学一直把生物当成分子机械,却对这个黑匣子的秘密一无所知,这意味着它只对信息处理的输出输入进行了模仿。不过,由于现在生物的分子结构性质渐趋明朗,进一步开辟了工程上予以再现的道路,所以生物这个黑匣子的内在机制也逐渐清晰。这股技术潮流当然地导致了计算机工程上利用它的设想。
三 分子电路和生物芯片
1. 分子器件
分子器件(Molecular Electronic Devices,MED)是利用每个分子的功能特性构成逻辑运算电路的技术。它最先由已故学者卡特尔(F. Carter)提出,所以又叫“卡特尔之梦”。
“卡特尔之梦”的实现依靠的基础技术是:分别设计具有所需功能的分子;把它们排列成希望的形式;加工处理这些分子的结构。第一项称之为“分子设计”(Molecular Design);第二项叫分子制作技术(Molec-ular Fabrication);第三项分子加工技术尚无统一名目。它们跟半导体技术基础印制版技术和超精密技术有关。随着它们各自稳步发展,分子工程学这一整体也发展壮大。
MED最初被提出时,它所倡导的分子电路大概还缺乏稳定性和无法有效地发挥性能,并受指责:即使那种分子电路管用,具体的技术仍不得而知。但它还是得到极大关注并被接受了。这主要是因为人们担心支撑计算机技术大厦的栋梁——半导体技术不定何时就钻进死胡同。
80年代中期兴起的MED热历史尚短,这期间除了MED外,还有阿维拉蒙(A. Aviram)的分子电路的基本电路元件、霍普菲尔德(J. J. Hopfield)的高分子记忆器等,但都远不能实用。与此相反,有机导体、有机半导体研究非常活跃,特别是有机超导材料的研究猛然间引人注目,虽然它与MED尚无直接联系。由于隧道扫描型电子显微镜(STM)的出现,可以对分子进行直接观察。最近,IBM的研究者们发现,STM的电子束能把存在于结晶表面附近的分子固定在晶体表面上。他们进一步发展这一技术,尝试将各种原子分子同晶体组配,结果,通过氙原子和镍晶体、CO分子和铂晶体的组配,成功地描述了将原子、分子符号化成“IBM”或“CO”的文字。
2. 生物器件
生物器件的基本设想是:以生物大分子及与之相似的高分子为材料,利用生命体内抗原抗体反应那样的分子识别功能或自组织功能作成集成电路。
跟分子器件一样,生物器件同样需要以下基础技术:设计用作基本部件的生物大分子;把基本部件排列成二维或三维结构;加工分子组合体这一素材。第一项是设计所需蛋白质的技术,即蛋白质工程。但目前的蛋白质工程中蛋白技术研究的主流是有意识地运用于医药品中而不是计算机上。
3. 分子机器
与卡特尔的MED相对,麻省理工学院(MIT)的德勒克纳(K. E. Drexler)提出了分子机器(MMD),并论述了分子级机械手的可行性。MMD的出发点生物是由一种可称之分子机械的分子部件构成的。一般认为,如果能制成分子机械,则可用作随机处理器、存储器之类的计算机元件。送到生物体内的指定部位,可按文字要求修理机械故障,即分子治疗机器人。目前已开始关注纳米级超精密技术。如AT&T贝尔研究所已通过印制板技术在半导体基板上成功地作成了微小型自动引擎。
4. invitro神经网络
它是一种通过培养重要的神经细胞、与所需神经键相结合来组织网络的技术。首先,在二维基択上培养神经细胞,控制神经生长,形成所需神经的二维形式,进一步促进所需神经键的形成。例如,国际电话电报公司(AT&T)的贝尔研究所的杰林斯基(L,Jelinski)小组尝试在硅板上培养蛞蝓的神经细胞。
该项研究的主要技术课题是形成所需网络模型的控制技术:创造生物体外存活神经细胞的环境;通过适当的刺激或环境,在神经纤维上产生神经键。为此,需要了解细胞之间或细胞表面与外界接触的分子机制,控制主管细胞内增殖信号的分工。
四 怎样模仿生物的结构
我们对生物计算机的期待不只是材料的生物性,而且要求它具有生物结构方面的发展性(生长)和思维方面的创造性。
生物的生长特征表现为:构成生物的分十的自组织功能或自我修复功能;单细胞生物的增殖能力:多细胞生物的产生、成形;生物的各种系统的产生(进化);人的学习能力;人类社会的发展等。这些都是从简单结构到复杂结构的生发过程,从低级智慧到高级智慧的进化过程。需强调的是:结构和功能往往复杂地联系在一起,要单方面的考察生物几平不可能,而且两者和生命进化过程的历史紧密相关。例如复杂的神经或脑,其信息处理能力如果不与它的产生和进化联系起来就无法予以充分理解。可见,人的想法或创造性思考也与生物的发展性深深相连,要“获得生物特性”或“仿生”并不容易。有幸的是生物学的发展跟计算机的发展一样迅速,因此生物的奥秘可望由生物学者解开。但是,生物学需要以往不可比拟的理论计算和计算机的帮助,所以,在理论计算和计算机应用中,生物学专家和理论计算、计算机专家之间应建立对等的伙伴关系。
然而,目前认识到计算能力和理论计算重要性的生物学者毕竟还是极少数,而且那些没有认识到计算机重要性(即不认为它能理解自己学问的本质)的生物学者只把计算机及其开发它的专家视为工具。如果生物和计算机都是由内装的程序来控制的信息机器,则原来的生物学者和计算机专家就有机会围绕共同的问题和科学概念进行实质性对话。有了这种交流,当然会涌现出对生命科学和计算机双方都有效的新设想。它不会是某种单一形象的生物计算机那样狭隘的概念,而是贯穿于元器件、软件、硬件、应用等各种新技术的。可以说,创造富于成果的交流环境,是研究如何仿生的全部战略。
五 尖端分子生物学需要高级计算机
1. 基因分析
确定遗传信息(DNA)序列技术提高的结果,是开始规划确定某种生物所有的基因的排列。该设想希望美国、欧洲、日本等先进国家研究的同时也建立国际协作组织—-HUGO(Human. Genome Organization)。最近提倡的大量复制特定基因片断的方法和让计算机配合分析与记录的方法开辟了并列破译的道路。目前已制成大肠杆菌、酵母菌、线虫、果蝇的基因图(geneticmap),可以确定基因在染色体的什么位置,或收集染色体片断绘制成有标志的物理地图(physical map)。确定碱序列的工作效率越高、破译遗传信息的课题越紧迫。下一步迫切需要用高级计算机来编辑、整理、存储迅速增大的碱数据,从中抽出有意义的信息。
2. 蛋白质结构和功能分析
第二个研究课题是生物大分子的三维结构和功能。特别是要弄清与多细胞生物体内的信息传递相关的蛋白质的产生、致癌、神经活动、免疫功能等。形成多细胞生物中信息传递机制的是荷尔蒙、神经传感物质、增殖因子等分子,传递形式是从细胞外到细胞膜。近来,又发现了许多蛋白质磷酸根转移酶那样的分子,它在细胞内的信息网中起着把外面进来的信号从细胞膜传给细胞质、再传给细胞核的作用。钙也是信号传递的主角之一。已逐渐明确这些分子与生殖、成长、致癌、神经系统的学习等重要现象有广泛的联系。
这项研究的基础是探明蛋白质结构与功能关系的一般方法。以往,用X射线结晶分析蛋白质结构的方法几乎是唯一的,近来又以二维NMR法为测定溶液中的蛋白质结构开辟了道路。但还无法测定氨基酸数为170、分子量为4~5万那么大的蛋白质。最近,利用加速器的放射线、SOR(Syncrotron Orbital Radiation)同时收集波长各异的大量X线散乱数据的Laue法已进入实用阶段。它不仅能分析结构,也能描述动态的功能。例如,MIT的拍茨科(GLA. Petsko)小组用该方法从结构上成功地搞清了蛋白质的开关功能——起着在癌基因(ras)的产物(P31)的细胞表面传递信息的作用。
X射线分析需要大量的数值计算,distance geometry之类的算法也用于确定NMR的结果。为寻求稳定的结构,应用MD(Molecular Dynamics)法或Simulated Annealing法的例子也多起来。为搞清膜蛋白的结构,也用了电子显微镜像的三维再组织法来计算,并以图形显示其结果。此外,也频繁地使用计算机测控/映像显示测试以及图像处理等计算机技术。显然,应用STM原理的原子显微镜(AFM)已能用于观察生物体分子。由于从DNA可知蛋白质的氨基酸排列,因此,通过检索已知用X射线获得的结构数据、计算机图形或模式来推断三维结构的技术已大大前进了。
3. 多细胞动物的胚胎研究
该项研究探讨多细胞生物自律发展系统的三维设计原理及与进化的关系。在此,进化可以被看成是一种适应学习机能。
以往的胚胎学研究的一般方法是:用光学显微镜观察海胆的卵:或者周毛发扎上初期的胚胎、切断,使之分离成许多个体;或者把蝾螈的四肢切断,让它再生等。但从计算机角度说,重要的是搞清胚胎的生成是由怎样的程序来控制的。生物控制程序是遗传密码,因此这项研究叫胚胎遗传学。为开展胚胎遗传学,首先必须选择可进行遗传学分析的多细胞生物作为材料。目前,最利于进行遗传学分析的生物是果蝇和线虫,用它们作实验可陆续发现决定初期胚胎空间方向性(头尾、背腹、左右的轴)的基因、决定体节的基因,与细胞运动或器官形成有关的细胞相互识别分子的基因等。这样,研究将从了解个别基因的鉴别及其功能转向了解这些基因相互间的作用或决定某种现象的多个基因的“系统”。
线虫研究中开发了很多方法,可确定生物细胞的整个谱系。通过电子显微镜,可以从解剖学上鉴别大约300路神经的9000个神经键的整个连接情况,并可分裂受精卵,直接观察记录、控制和分析它在增殖、形成过程中细胞的生成和死灭。此外,还用到了计算机控制的罗曼斯基微分干涉显微镜、激光扫描型显微镜、击破细胞的激光设备、微小喷射器、计算机映像分析或四维图形学。从这项研究也许可以逐渐明确多细胞生物作为未来的计算机,将如何自建三维结构。
4. 神经系统、脑的研究
实验证明小脑有类似于感知机(perceptron)的回路,但人们对脑的回路尤其是大脑的回路几乎一无所知。因此,所谓的神经网络还不能说与真正的神经回路很相似。人们尝试着观察可以进行条件反射地学习的低等动物,例如海牛。不是观察所有的神经系统,仅仅是一部分活着的状态。这种方法选取与神经细胞的兴奋(活动电位)相应发出强弱光的色素,用空间分辨率好的光敏传感器捕捉它并予以映像比。神经系统的活动跟钙的浓度变化有很深的关系,钙的浓度分布及其变化可以吊免疫荧光显微镜观察。还有一种方法是用已在临床医学中使用的放射性同位元素,把营养成分代谢活动的分布形象地再现出来,即正电子切割(CT)法,它的分辨率低,但可无损伤地观测脑的活动。
5. 开发加快生物学研究的专用计算机
包括超级计算机在内,目前计算机的能力还不能满足最尖端的生物学研究。由于目的不同,更需要针对问题的专用计算机。因此,当前较现实的开发应当是:分子计算机、基因序列分析并行计算机、随时间变化的三维映像分析计算机。需要同时开发的是模拟设备。它的目的是考察当异物进入生物体时,将同生物体系统怎样相互作用。它可以不用动物做试验就预测生物活性。生物活性有药效和毒性两个方面。用该设备可以有效地开发药物和明确化学物质的安全性,以免破坏生物圈及其环境。
[bit(日)1991 vol. 23 No. 5]