分子生物学领域的成就,已改变了人们对有关人类疾病许多方面的认识。发展中的在核酸水平上对病因进行分析的DNA诊断技术,不久的将来就会对遗传病、癌病及感染病有关的DNA和RNA进行自动、快速、简便的分析。DNA诊断技术还将促进识别出生时关系疾病的基因,从而为寻找新的防治药物创造了机会。
DNA诊断的主要内容是:(1)确定相关疾病的核酸顺序;U)发展对个别病人中的这类顺序进行监测的技术,极广大的基因组无疑增加了这两项任务的难度。(图1)人类基因组约含105个基因,大约由全部3×109个碱基对的3 ~ 5%所编码,这些DNA顺序分配到24条不同的染色体上。每一个体分别从父母的一方继承一全套22条常染色体和1条性染色体X或Y;这样,每一条常染色体基因就以两个拷贝形式出现;基因分为外显子(编码区)和内含子(间插顺序)。个别顺序可横越200万个碱基对。
在对影响各种疾病的核酸顺序的鉴别分析方面进展迅速。将来,可用适当的系统对人类全部基因组进行有效的识别和分析;绘制出人类基因组的完整物理图谱,作为最终DNA探针,用于测定人类的任何基因。下边,我们讨论最近时兴起来的DNA和RNA诊断技术;介绍这些技术的应用范围;以及将来的发展方向和自动化问题。
核酸顺序的分析技术
核酸顺序的分析:(1)物理化学技术,根据探针股加入互补靶后的杂交或变性;(2)核酸和特异酶的反应,如特异分裂核酸的酶内核酸酶,结合核酸的连接酶和合成核酸的聚合酶。利用这些酶的反应,可在DNA和RNA水平上对核酸进行研究。前者分析个别人的遗传潜力,后者表达特别细胞的信息。
膜固定靶顺序的测定 在多功能DNA吸印技术(Southern blot)中,是用限制酶在其独立的识别顺序上特异分裂DNA分子,在琼脂糖凝胶上将消化后的DNA分子按其大小分离后,转移到硝酸纤维素或尼龙膜上,普通电泳分离的片段长度为100 ~ 30000碱基对;而脉冲场电泳分辨的片段可长达2千万个碱基对,(图1)固定在膜上的限制片段所包括的个别基因,可由特异标记的核苷酸探针检测出来。如果限制酶识别顺序受到破坏或DNA片断的大小发生了变化,就可以测定出单核苷酸的改变了。(图2)
可用特异等位基因寡核苷酸(ASO)探针分析固定的DNA顺序。这种探针是由约20个核苷酸合成的DNA寡聚物,其长度足能代表基因组内的单独顺序;对于造成它和靶分子的杂种中内部错配形成的不平衡,它又是足够短的了。因此,仔细控制杂交条件,可以用ASO探针,区别探针和正常靶或探针和突变体靶之间杂种的不同的变性特点。
溶液内靶顺序的测定 业已研究出了几种不需要纯化或固定核酸的快速技术。例如,可以在固定基质上面选择分离探针/靶杂种,如羟基磷灰石能优先和双股核酸结合,另外,可把探针核酸固定于固形支持物上,或用探针从溶液内捕获靶顺序;然后再用第2个标记的探针测定靶顺序;第2个标记的探针,既可以在靶顺序竞争型分析中由支持物中消失;也可以通过靶顺序的桥联作用、以夹层的形式参入进支持物中。
最近我们研究了一种办法,用ASO杂交区别因任何单核苷酸替代所造成的DNA顺序的改变。在寡核苷酸结扎分析(OLA)中,用DNA连接酶选择性地共价结合两个合成的寡核苷酸顺序,使它们的碱基对和靶顺序之间以严格的头 - 尾并置的方式排列,通过结合区内配对核苷酸阻断两个寡聚物的连接(图2)。这种程序能区别开细胞样品内已知顺序的变化,不需要纯化DNA. 两个结合在一起的寡核苷酸,通过固定其中一个的办法而监测出来,并观察第2个标记的寡核苷酸是否也被俘获。这项技术适于自动的遗传分析。
测定碱基替换的扫描技术 有3种技术使对出现在探针/靶双链几个碱基对内的未知单核苷酸替换和其他顺序变化进行分析成为可能。在核糖核酸酶(RANase)A技术中,用酶在探针和靶RNA或DNA顺序形成错配的位置上分裂标记的RNA探针,可将分裂的片段按大小分开,并确定突变点发生的适当位置;变性梯度凝胶电泳技术,是根据变性强度的梯度变化,分析探针/靶!双链。变性强度提高,伴随迁移率的降低。由错配碱基对组成的双链,比全部错配的双链变性要快得多。RNAase A技术和变性凝胶电泳技术,分别可以测出所有单碱基改变的近50%(图2)。第3种方法依靠的是错配碱基对的化学分裂。可以测出异源双链内T和C、G或T之间,以及C和T、A或C之间的错配。和四氧化锇(T和C配错)或轻胺(C错配)进行反应,接着用六氢吡啶在适当配错的位置上分裂探针。
DNA顺序分析 识别DNA顺序变化的最后手段,是对DNA顺序进行直接分析。用Maxam和Gilber的化学分解技术或桑格(Sanger)等人的链终点技术,可以确定以单股DNA形式排列的300 ~ 600个核苷酸顺序。这项技术,可在聚丙烯酰胺凝胶电泳的4条带上,分离出跨越未知顺序的4组DNA片段的各自终点G、A、T或C,凝胶可分辨出DNA顺序中单核苷酸的变化(图3)。由这4个反应中DNA成分形成的图像的大小不同,鉴别出DNA顺序_自动DNA顺序编排技术,很有可能会替代以前介绍的扫描技术,因为它可以提供有关突变的精确信息,从而采取简单手段,干扰在受影响的家族内的突变遗传。
染色体原位杂交 基因在染色体上的定位,可在DNA探针和细胞分裂期间产生的中期后浓缩的染色体进行原位杂交之后,用显微镜观察。
RNA的测定 既可采用估价特别基因表达水平的办法,也可通过鉴别结构变化对BNA分子进行分析。可按其大小在凝胶上分离特异RNA分子,转移到膜上后:用互补探针(RNA或Souther blot)加以测定。一项更快的措施,可以得到有关个别RNA数量和结构的信息,是把组织溶解在变性溶液内,使分解RNA的酶失活,而使RNA和标记的探针在溶液内进行杂交。在以后的消化过程中,靶分子保护探针免遭单股特异酶的分解,进而经过凝胶电泳达到识别目的。组织内DNA分子的识别,可通过和一个标记的探针进行原位杂交。该法在分子病理学中有重要用途,还可用依靠RNA的DNA聚合酶的反转录作用,把RNA分子转化成更稳定的DNA分子后,再用适当分析DNA的技术进行测定。
核酸探针的标记
通常是用放射性同位素标定,主要是用32P和35S。可以用酶技术很容易地将它们引入(表1),为在每一探针中掺入多种标记提供了可能。这样就提高了测定的灵敏度。
可用化学方法和酶进行偶联,如过氧化物酶和碱性磷酸酶,合成寡核苷酸探针;通过酶对适当基质的催化作用,提供有潜力的高灵敏度的测定方法。用化学或酶的方法,把酶结合进探针中。发现掺入进探针内的多生物素基团,在一种实际不可逆的相互反应中,把酶分子和抗生物素蛋白质或链霉抗生物素蛋白质结合到一起。随着发色团的沉淀,可以测出酶的活动;或者在溶液内释放着色、荧光或发光的物质。通过杂交,每一探针内掺入多种酶分子,测定的灵敏度可达到相当于放射性同位素标记的水平。
荧光团稳定并可以直接测定,为同时测定多种探针创造了机会,当利用不同发射光谱的不同荧光团时。可采用化学或酶的方法把荧光团引入探针内。由于荧光寿命长,在金属离子受激发放出多数有机荧光之后,可把测定推迟到内部本底荧光降至近零的程度进行,而这时稀土金属的荧光却无明显变化。这样,分开时间进行测定,加强了本底信号。事实表明,和普通的有机荧光团相比,加入多级稀土金属离子螯合物到探针中,荧光可成比例地加强,因为不存有负干扰。
在利用DNA吸印、ASO和OLA技术,对顺序进行放射性同位素标定时,一般仅需要5 ~ 10 ug基因组DNA(约2×10-18 mol)。这个数量的DNA相当于106个具核细胞内的存在量,可由少于1 ml的血样中取得。1 ml血样,可由怀孕10周的绒膜绒毛中取得;也可在妊娠第16周时,用羊膜穿刺术得到。如果分析是按近来研究的靶扩增技术程序进行的话,需要的DNA样品很少。在溶液内可结合OLA技术同时进行。或者结合碱基替代的扫描技术共同进行,当有效片段达一定程度时,就能确定核酸顺序。这些技术,不需要预先纯化DNA。
DNA诊断技术的应用
遗传病 按照遗传方式,把单基因错乱分为 ① 常染色体显性病,突变体基因的个别杂合子受影响(基因拷贝的一种缺失)。② 常染色体隐性病,影响纯合子个体(两种基因拷贝缺失)。③ X - 连接的隐性病,主要影响X-连接基因单一拷贝发生突变的男性。
现已识别的缺失基因产物、引起至少400多种人类单基因疾病。对其中45种的突变性质已测定出来了。在45种病中,有13种是长突变(插入或缺失),23种属于单核苷酸替代;另外9种出现长突变和单核苷酸替代两种形式。根据两位加拿大科学家的研究,把一些常见遗传病的遗传方式和发病率列于表2。多余染色体代表常见的遗传错乱,是用显微镜对分裂中的细胞进行的观察中得到的。
许多遗传病是由数量有限的突变体等位基因和在人群中以高频率出现的各种变化基因所引起。就是利用了这些顺序的差别,筛选载体和对胎儿进行诊断。例如对β - 地中海贫血和镰刀细胞病,α – 1 - 抗胰蛋白酶缺失病、苯酮尿等病的诊断、这些病中的每一种,主要都是由一个或几个单核苷酸的错误引起的,在个别人群中,一些常染色体隐性突变体基因载体以高频率出现,这可由基础影响进行解释(繁殖个体,使其子代突变);或选择杂合子载体的优点,对抗或减少个别纯合子的突变。
基因编码与人类表型之间的关系复杂,例如免疫反应和胆固醇的代谢。由一个或多个基因缺失造成的疾病,可因环境因素而加重。这类多因素疾病,典型例子是冠状动脉症、糖尿病和多发性硬化。因它们较单基因病更常见,所以更有讨论的实际意义。而且,有可能使易受感染的个体避开已知的外源危险因子(如饮食或感染剂),或者是注视症状的发展,在早期阶段就采取对付措施。例如,肺气肿与α – 1 - 抗膜蛋白酶缺失有关,吸烟可提高发病率并使症状加重。这就提供了避免发病的明显的可能性。一定的基因与胆固醇的代谢有关,如各式各样的低密度脂蛋白质受体或Apob、C和E基因,是冠状动脉病的发病因素。主要组织相容性复合物的高度多形态Ⅱ型基因,与免疫反应和大量自身奔疫病的敏感性密切相关。业已用关系Ⅱ型基因分子的抗体,对和疾病有关的Ⅱ型等位基因进行了研究。提高了有关Ⅱ型基因片段与依靠胰岛素的糖尿病和自体免疫皮肤病寻常天疱疹的易感性之间的精确程度。
生殖受阻的X-连接的隐性和常染色体显性病,由于受突变影响常大量在人群中出现。由于这些情况是随机出现而且不能预测严格的突变位点,所以不可能对每一代都进行遗传筛选。对受影响的家族进行遗传分析,鉴别妊娠期突变体基因的性质,并对突变体的等位基因进行筛选,研究和突变体基因一起遗传的基因标记,对于由新发生的突变引起的一些疾病,如假肥大性肌营养障碍,损伤主要是大的缺失;在另外情况下,如莱希 - 尼亨综合症,则主要是因核苷酸替代。用于确定这些突变的技术,必须能够识别出广泛DNA成分上面的缺失或突变体核苷酸的位置。用脉冲场梯度凝胶电泳或DNA扩增技术,对个体外显子进行测定,从而发现缺失、对单核苷酸替代,可采用错配扫描技术进行识别。另有一项研究,是用PCR技术,把基因组DNA中的次黄嘌呤 - 鸟嘌呤磷酸核糖转移酶基因(在莱希 - 尼亨综合症中缺失)进行扩增后,再用分析DNA顺序的办法确定突变。这种办法,使合成用于研究个别家庭的DNA探针成为可能。
不管突变体的性质如何,甚至不管内部基因或蛋白质是否已知,都可以利用和突变体基因有联系的标记的遗传,完成对受影响家族的预测实验。这项研究,正被用于对一些疾病,如假肥大性肌营养障碍、纤维囊泡症、成人多囊肾病和亨廷顿舞蹈病的诊断。
遗传连锁分析,是根据父母的碱基对之间遗传信息的重组交换所进行的。这些碱基对是从细胞减数分裂期间在细胞内形成的同源染色体中衍生出来的。当在每一代中重组的几率为1%时,便把两个标记间的遗传距离定为1摩(CM)。这对应的是106碱基对标记之间的平均物理距离。遗传和物理图之间是非线性关系,因为有重组位点优先出现。人类基因组的总遗传长度确定为3300CM,相应地是,每代中每条染色体平均约含3个重组位点。
顺序多态性普遍存在,基因组内几个核苷酸中就出现一次,主要是单核苷酸替代,有时是改变限制酶的分裂位点。在不同个体间因分裂位点改变形成大小不等的DNA断片。命名这种性质为限制片段长度多态性(RFLPs),它是很有用途的遗传连锁标记,其中有的是由数量不等前后相连的重复DNA顺序(VNTRs)的出现引起的。在出现多等位基因时,VNTPs产生高信息的RFLPs。
有关连锁中2个标记间遗传距离的信息,可从对大家族内标记间重组频率的分析研究中得到。业已确定了平均标记横越10℃M的人类连锁图。这个图提供了涉及任何遗传的95%的座位。改进计算系统,使用致密的连锁图和其他分析遗传标记的方法,将使对更多人类遗传病进行遗传连锁分析成为可能;包括对关系遗传方式的复杂条件的分析。
把确定一个基因的碱基在其染色体上面位置的过程称作为反向遗传。成功利用遗传连锁技术,可以定位1-10CM区域的基因。如果确定基因组包含106个基因,那么每1分摩平均将有30个基因。根据在和疾病有关基因相对应的互补基因内确定的突变,识别致病基因,并最终证实突变体基因和功能受阻之间的直接联系。利用反向遗传技术,已成功鉴别了和假肥大性肌营养障碍,慢性肉芽瘤和成视网膜细胞瘤有联系的基因。在这3种情况的任何1种下,几个不同的突变都和有效的大缺失有关。这些缺失创造了分离相关基因片段的机会。相反,引起亨廷顿舞蹈病和纤维囊泡症的突变体基因,可能是一种或极少几种突变体等位基因,已定位到特别的染色体内,但尚未鉴别挫败的时间长度。识别大的染色体区内的突变体基因的新技术,需要加速反向遗传研究,识别致病基因。
癌症 许多形式的癌出现在家族内或以偶发形式出现。时常可见的偏离的遗传变化,不同形式肿瘤的特性,被视为是引起和促进癌症表型发展的因素。对这些变化加以分析,是癌症诊断的重要任务。已观察到了癌症转化的显性和隐性形式。代表显性的致癌基因,是由一类基因组成。目前发现的有40种。当被引入细胞,细胞发生结构变化或是不成比例地表达时,便能诱导发癌 · 在隐性瘤形成中,肿瘤细胞已失去“抗致癌基因”的两个拷贝。因此,可以设计一条正常染色体并引入到适当的表型内。
激活代表显性致癌基因的机制不同。举例如下。
①单核苷酸替代。C-K-ras基因上面第12位上的密码子发生变化。绝大多数胰腺瘤和近1/3的结肠直肠癌属于这种情况。突变改变了C-K-ras蛋白质的结构,这种结构关系到细胞膜中信号传递。
②费城染色体(Phs染色体)。是慢性骨髓性白血病的特征,起因于染色体的易位。易位激活了致癌基因c-abl,在其5'末端被另一基因ber取而代之。在产生自不同个体的慢性骨髓性白血病细胞内,相互易位的断点,分布在c-abl基因的100000碱基对区和C-abl基因的6000个碱基对区。而且,除了在由bcr外显子之一所编码的24种氨基酸存在或缺乏时,融合蛋白质都是一致的。bcr/abl融合蛋白质和正常c-abl相比,酪氨酸激酶的活性显著增加。
③在一些成神经细胞瘤内,伴随mRNA水平的增加,N-myc被扩增到300个拷贝。这种扩增明显影响到不良的预后。当缺乏有关基因在染色体区的特异染色体上和染色体外的成分上扩增的微观证据时,常用分子遗传技术进行观察。
成视网膜细胞瘤出现在幼儿的视网膜内,可作为—个由代表隐性致癌基因所引起肿瘤的例子。可以从每一个基因拷贝的Rb座位上出现的突变破坏中,对遗传的和自发的情况作出遗传学的解释,在家族形式中,突变基因的一个拷贝是遗传的;第2个拷贝的丧失,往往是因有丝分裂期间染色体分裂不正确所造成,或是因为发生了有丝分裂重组的事件。根据肿瘤内和遗传标志有关的杂合性的丧失,可以测定出大规模的缺失。
从在不同个体的相同肿瘤内一定染色体片段杂合性的丧失中,可以识别隐性致癌基因的染色体图的位置。在一般固形组织瘤中,如膀胱癌、结肠癌、乳腺癌和肺癌中,可以观察到这些隐性病因学的指示信号。
需要用有效的分析技术对肿瘤加以分析;在癌病情况下,RNAs很有诊断价值,利用探针载体,鉴别代表显性和隐性的致癌基因。其他探针也很重要。例如,P-糖蛋白基因,在肿瘤内特异扩增,肿瘤细胞系对多级化学治疗药物产生抗性。可以从涂了石蜡的组织中用针吸的细胞中和脱落的细胞中(如从尿囊产生),利用PCR技术,识别基因型的变化,当在重排过程中产生独一的DNA和RNA片段时,也可以对低频率的血癌和骨髓病如慢性骨髓白血病进行分析测定。由于可以合成探针,根据DNA顺序设计反应剂就成为可能,以便测定和遗传变化特性有关系的癌细胞的复发或传播。
感染病 在世界上,感染病是威胁人类健康的—个重要方面。核酸技术的问世,为改进对感染病的诊断提供了可能。美国食品和药物管理部门已批准使用许多工具对病人和受污染食品中的微生物核酸进行测定。在DNA或RNA顺序水平上对感染剂进行测定,业已促进了免疫学分析技术的提高。例如,可以特异设计出专对个别微生物或对广泛微生物的反应剂。可用设计的试剂直接分析微生物的毒性因素和对抗菌素产生抗性的基因。这样,会有助于尽快地确定治疗方案。
法医学 在DNA顺序变化的水平上对个体进行鉴别,比平常所用的标准方法如指印、血型、物理特征的分析方法等要先进得多。与绝大多数表型标记形成鲜明对照,从对DNA的分析中,可很容易地推断出个体间的相互关系。如确定父子关系。业已证实,遗传分析在骨髓移植中非常重要,需要严格区别开受体细胞和供体细胞之间的关系。现在,通过DNA吸印技术,已有两类探针应用于DNA指印技术中。多形态的小随体DNA探针,鉴别多种DNA顺序。个体中的每种顺序都是不同的,这在个体之间出现了复杂的和高度可变化的形式。VNTK探针识别基因组内的单核苷酸。但是,正如已被识别的那样,片段大小不等,在人群内,这些顺序是以多达30多种不同形式存在。用VNTR或小随体DNA探针测出的与个体无关却有相同杂交图型的可能性是极小的。DNA探针需要的组织样品极少,甚至只要一根头发即可。一根头发就可以为基于PCR的遗传标记分析提供足量的DNA。而且由于需要的DNA量很少,部分分解的组织就可满足分析要求。法医DNA分析,最终要由多态DNA顺序来完成,因为它可用简便自动的技术手段如OLA进行研究。假如对22个顺序基因片段进行分析,在群体内每个片段以两种形式出现,将产生1010个不同结果,可以识别人类个体。这些标记,为分析、储存、比较由大量人群中获得的结果提供了方便。
将来的发展方向
DNA诊断技术的广泛应用,将取决于精确、敏感、快速而经济的常规核酸顺序测定程序的发展,通过把PCR方法的DNA扩增技术和适当的分析技术结合起来,为将来提供了一种可以充分自动化的灵敏的分析技术 · 现在,许多不同的分析方法,都已和PCR扩增技术结合起来了(表3)。
对于一些分析来讲,并不需要扩增指示分子。在用PCR技术时,可以容易地引入错误成分。对于遗传筛选,同时完成对单一核苷酸的多项分析是很有意义的,在连锁分析中研究遗传标记,测试感染成分,探测RNA在肿瘤组织内的表达。具有潜力的是,能够由荧光激活细胞的分类器,从母体周围血液中分离出脸儿滋养层细胞,为遗传筛选提供和胎儿基因组相近似的样品。
从几项标准技术中,可以看出常规DNA诊断中存在的许多问题。也许,配有全套现成探针的测定和定量DNA及RNA顺序的仪器将成为临床背景的标准设备。其他核酸分析技术将会优先得到研究应用。
而且将对鉴别新的探针顺序充分有用。测定确定的DNA顺序,有助于感染病的诊断和对个体的识别。在法医学方面,对血污进行遗传分析,可以提供有价值的线索,帮助确定受怀疑者或罪犯的性别及其他物理特征。同样,分析RNA的结构,测定数量,对于描述组织内,主要是癌组织内表达基因的特征是极重要的。在兽医和农学方面,也同样应用到核酸的测定技术。
发展中的核酸顺序分析技术,必将会更加简化,而且,人类分子遗传学的研究,将会不断拓宽DNA诊断技术的临床应用领域。前进的动力有两个方面:1. 快速精确核酸分析程序的发展;2. 对各种疾病中的顺序进行监测,往往可以直接查出病因。对许多遗传病来说,比起有限的治疗选择来,遗传诊断的潜力在扩大。我们可以预期,将来会有各种不同的研究,可把正常基因引入体细胞内弥补遗传缺失;利用修饰合成的寡核苷酸,特异地干扰病毒的基因功能。分子遗传技术在医学领域的增加应用,将关系到心理学、社会学和道德问题,需要引起重视。尽管存在着这些问题,但DNA诊断会根本改变人类疾病的面貌。它不仅仅是提供精确而快速的诊断技术,而且能够发展新的治疗方案。
[Science,1988年10月14日]