对生物学发展稍加关心的读者可能会注意到近年来一个日趋热门的大项目,即“人的基因组分析”,国外科学报刊近2年来时时报道这方面的进展、我刊也为此刊登过一些这方面的译文、评述,但为使读者能更多地了解这一典型的大科学计划的内容及其意义,前不久,我专门去复旦大学遗传学研究所采访了该所所长、本刊编委赵寿元教授。据我所知,赵先生所在的复旦遗传所是国内正在开展这方面研究的少数几家研究机构之一,赵先生本人在这方面也潜心研究多年,有一些独到的见解,因此,请赵先生来谈谈这方面的工作该是很恰当的。以下是根据赵教授谈话录音形成的文稿。
目前生物学界有一个大科学计划,即“人的基因组分析”,美国、日本、前苏联及第三世界一些国家如印度等国都在准备搞。所谓人的基因组是指包含人的遗传信息的整套染色体。人的基因是由核苷酸组成的,即由4种核苷酸排列成的DNA分子。一段DNA分子,或者说一个基因(几千~几万个核苷酸排列组合成一个基因)可以决定产生一种蛋白质。这些蛋白质参加细胞里面结构的形成或参与生命活动中代谢的催化,如酶等等,并最终确定个体的宏观性状。凡是有生命的东西(无论是病毒、细菌、植物、动物还是人),其性状均由基因确定。人的基因组分析最终就要把储存遗传信息的所有核苷酸的排列次序统统搞清楚。为何说这—计划庞大呢?因为人的单倍体基因组由30亿个核苷酸对构成,形象地说、30亿个核苷酸对是指一套基因(人有两套基因,一是父亲给的,一是母亲给的),如将一个核苷酸对比作一个印刷符号,光这一套30亿个核苷酸对印成书,就相当于300本辞海缩印本。印成书后还要了解哪一种排列起着什么作用。所以,这等于是一部无字天书。人们之所以对基因组感兴趣,是因为这一研究将对诸多学科的基础理论和实际应用产生巨大的推动作用。如在医学上,现在传染病已能控制,但癌症和遗传病的发生往往就是因为基因水平上或核苷酸水平上发生了变化,致使细胞不能正常分裂、生长所致;或是由于基因缺失,以致不能产生某些蛋白质,代谢发生紊乱而致病。现在国际上关注的一种遗传病——进行性肌营养不良症就是因患者的基因中缺失了某一段,导致肌肉萎缩,最后连手都抬不起。遗传病已知有几千种,在基因组分析中会发现诊断、预防以及治疗的很多线索。癌症也是这样,人体基因组的原癌基因发生突变引起细胞失控生长,使细胞癌变,因此从医学上看,分析哪些基因发生突变,基因结构发生了什么样的改变,突变基因在染色体上处于什么位置等都可望能从基因组分析中获得某种答案。
这一课题的提出一开始是从研究辐射的遗传学效应开始的。特别是日本长崎、广岛原子弹爆炸后,在研究幸存者后代的基因突变率时,发现他们与正常人群相差无几,可是在理论上这两种群体应是有明显差异的,只是由于现有的检测手段还不够灵敏,而未能揭示出这其中的差别。为了精确检测低剂量、慢性照射引起的人类突变效应,最好的办法是测定人的基因组序列,将正常人与受射线照射者加以对比。美国能源部的科学家最早就是从研究射线对人的遗传效应着眼提出了这一研究课题。之后,美国一些分子遗传学家也提出,若要搞清肿瘤形成机制,最好能将肿瘤病人的基因组与正常人的基因组加以比较,看哪些方面有差别。在此背景下,国际上开始搞起了基因组计划。美国准备两15年时间、30亿美元将30亿个核苷酸的排列顺序搞清楚。
要搞清楚数目如此巨大的核苷酸的排列次序,任务之艰巨是可想而知的。目前先采取分段的办法,即先进行染色体的作图和测序,所谓作图就是确定一些标记在染色体DNA分子上的位置,就像在一条公路上确定一些路标。这样就把一条染色体分成很多区段,在某一区段中去寻找所需要的基因。如把某一段DNA或某一个基因的位置搞清楚了,分离出来了,再进一步测定该基因的核苷酸序列,然后积少成多,把一段段核苷酸序列连接起来。
现在国际上分析人的基因组是从染色体着手的。人有22对常染色体,一对性染色体,X或Y染色体。有些实验室做1号染色体,有些做2号染色体,一直做到22号染色体,加上X、Y染色体。一条染色体可分成长臂和短臂,通过染色,臂上又可分出若干条区带,因此, 一条染色体可分别由好几个实验室研究分析。数据出来后通过计算机网络汇总验证,这是国际协作的一个办法。
从生物学基础理论角度看,人基因组研究也有重要价值,人要对自身有深入地了解,人何以从一个单细胞(受精卵)分化、分裂到形成一个个体。人的个体约有个细胞,这么多细胞构建成不同的组织、器官。从人的个体发育来看,从一个单细胞发育到1014个细胞,且分化成各种器官、组织,行使不同的功能,这就提出了一系列的问题。现在知道,所有的发育程序均由包含在基因组中的遗传指令所确定。人体中约有5~10万个基因,它们并不是同步工作,而是受到精确严格的调控。在一定的时间内、一定的细胞里一些基因表达,而一些基因则不表达。这样,编码在核苷酸一维结构中的遗传信息转化为人体的三维结构。如果把时间因素计算在内,这是一个四维的调控程序。基因表达的失控将导致疾病、死亡,肿瘤的形成即与此有关。其次,这些基因是如何受到调控的,如何使基因的开关开启和关闭的,这些也都是包含在基因组的遗传信息中。根据分子遗传学研究结果,有些核苷酸序列不产生蛋白质,但起调控作用即调控序列。因此,在DNA分子中,尽管都是四种核苷酸的排列顺序,但每一段的作用不同,或起编码产生蛋白质的结构基因作用,或起基因活性开关的调控作用。如能把人基因组的所有核苷酸序列及其功能都搞清楚,即将无字天书字母一一破译,这样对人的遗传本性也就一目了然了。
国外在作人基因组分析的同时,也作小鼠、果蝇、细菌等模式生物的基因组分析,以作为人基因组的对照,因为人也是从低等生物进化而来的,低等生物和高等生物的基因组里有一些序列是保守的,具有同样功能。对模式生物基因组的分析特别是功能研究的结果,可以推论人的基因组。
鉴于人基因组分析对基础生物学、医学、进化等的贡献,国外科学界认为可与当年的试验原子弹的曼哈顿计划和阿波罗飞船载人登月计划相比,甚至有过之而无不及。人基因组分析是试图全面、彻底了解人体自身奥秘的“阿波罗”计划。目前的15年计划只是指望把人的基因组的核苷酸序列搞清楚,如要搞清楚所有核苷酸序列的功能以及比较正常和异常的基因组,看来还要花十几年。
最近5年内研究工作还不是测定DNA序列,现有方法的速度不够快,成本高,因此,首先要设计、研制测序的助新方法、新仪器,使之快速、精确、简便,并力求做到将费用降低到现有的1%左右。同时先进行作图,分段地粗线条地研究,作图技术可以带动基础生物学研究,如分离几百上千kb(1 kb=1千个碱基对)的DNA片断,从大到小,从长到短加以分割,弄清基本标记,然后作核苷酸序列分析。这就发展了一些基因克隆技术、构建基因文库技术(即把人的基因组切成一段段,装入粘粒或噬菌体中,让其在宿主菌中不断繁殖,数量扩增,以利研究)。常规的方法最长可克隆40-50 kb的DNA片断,目前发展的YAC(酵母人工染色体)可带几百上千kb的外源DNA,这样分、析、作图就方便了。目前包括载体系统等方面的工作正在发展中。
另一方面,基因组分析又带动了电脑技术,各个实验室可以分析不同长度的DNA片断,并在杂志上发表,但如何将这些发表的资料加以汇总(因为肯定有不少重叠的部分),通过作图的标记,可以发现序列是否重叠。目前用STS(特定序列位点)和EST(表达序列标记)作为标记,将两段有重叠部分的片段连接起来,就可逐渐连成一个染色体DNA分子的图谱。再将基因定位和测序结合起来,更有利于基因的克隆和功能分析。所有这些资料的搜集、验证工作都有赖于电脑。
日本、美国还为此设计了机械人、机械手等,因为—些具体操作都可实现程序化,由机械人(手)完成构建参考基因文库、分子杂交等工作。日本的一些大公司都参与了相关的实验仪器的制作,不少大工厂、企业也都跻身于这一大科学领域。
在西方社会中,人们还从伦理、商业、法律等社会问题来考虑其影响。这一研究会涉及人的隐私,并将由此引起保险、就业、婚姻等一系列问题。如通过基因组分析知道某人是一种隐性遗传病有害基因的携带者,或者是会在以后年月中发病的有害基因的携带者,这样,在求职、保险和婚姻等方面可能会遭到歧视。在德国,更有人害怕因此引起人种改变、人种优劣问题,为种族主义张目、美国在该计划中列入社会科学研究项目,招收社科研究人员,旨在了解公众可能产生哪些误解,强调社会宣传的作用,以消除顾虑,并就法律、就业、商业中可能出现的问题提出相应对策。
国内目前这方面的研究工作还只是刚刚起步,“863”计划中有这方面的计划,我们遗传所有些课题组已拿到了这方面的题目,对一些YAC克隆作了分析,开始摸索构建中国人的YAC文库。我们准备与其它实验室合作开展显微切割和微克隆研究,建立单条染色体和染色体区带的分子克隆库。国内已初步开展的工作希望能跟上国际的发展趋势,具备与国际同行进行学术交流的基础,建立一些最基本的实验技术。
人基因组分析不仅对基础理论研究有重大意义,而且具有很强的应用前景。如现在医学上很受关注的细胞因子、淋巴因子研究,这些微量的蛋白质往往对细胞的免疫调节、对外来病毒的入侵都有很大作用,如肿瘤坏死因子、干扰素、白细胞介素等因子人体内都有,但量太少,现在用基因工程办法加以大规模提取,可满足临床应用的需求e通过基因组分析还将发现更多的目前功能未知的细胞因子的序列。相对而言,这些源于人体的药物对人的副作用较少,是一条获取新型药物的好途径,这是国际上发展的趋势之一。其次,这些因子涉及到人体免疫反应,这些反应的机制现在尚未完全搞清楚,借助于基因组分析也可推进对免疫反应机制的认识。
(江世亮整理)