人工智能预测蛋白质三维结构是年度最大突破, 另有九大突破。

AI 预测蛋白质三维结构

1972年,被授予诺贝尔奖的美国生物化学家克里斯蒂安 · 安芬森(Christian Anfinsen)在发表获奖感言时提出:有一天,我们可以仅仅根据氨基酸的序列来预测任意蛋白质的三维结构。要知道光人体内的蛋白质就有数十万种——结构预测若成真,将被广泛应用,并为基础生物学带来新见解,更有望揭示新药物靶点。

经过近50年的努力,现在研究人员已经成功通过人工智能算法预测了数千个精准的蛋白质结构。

科学家曾经只能通过实验室分析来确定蛋白质三维结构,如今却可以快速计算出数以万计的蛋白质以及相互作用的蛋白质复合物。美国伦斯勒理工学院的结构生物学家加埃塔诺 · 蒙特利奥内(Gaetano Montelione)称“这是结构生物学的巨大变革”。

蛋白质是生命活动的承担者。它们收缩人体肌肉,将食物转化为细胞能量,在血液中运送氧气,对抗微生物入侵者。尽管技能职责各异,但所有蛋白质的基本形式都相同:一条由20种不同氨基酸组成的线性链,以DNA编码的序列串在一起。在被称为核糖体的细胞工厂里完成组装后,每条链都会折叠成独特、精致而复杂的三维形状。这些形状决定了它们如何与其他分子相互作用,决定了它们在细胞内发挥的作用。

安芬森和其他人的工作表明氨基酸之间的相互作用决定了蛋白质的空间形态,但这些作用单元的数量如此之巨——即便中等大小的蛋白质所形成的形状数量可达天文数字。1969年,美国分子生物学家赛勒斯 · 莱文塔尔(Cyrus Levinthal)计算后表示,若以穷举法列出某种蛋白质可能存在的构象,所需要的时间比已知宇宙的年龄更长。

20世纪50年代,研究人员开始通过X射线衍射分析来绘制蛋白质的3D结构图。这一被称为X射线晶体学的技术很快成为行业领先的方法。今天,全球最大蛋白质结构信息库之一、主要基于X射线晶体学等技术的蛋白质数据银行包含大约18.5万个以实验方法获得的三维结构。然而,如此绘制一个蛋白结构可能需要数年时间,成本高达数十万美元。为了提升效率,科学家于20世纪70年代开始创建计算机模型来预测给定蛋白质的折叠方式。

起初,这仅适用于小尺寸蛋白质或较大蛋白质的短片段。到了1994年,计算机模型升级至相当高的水准,两年一度的蛋白质结构预测的关键评估(CASP)竞赛也就此开始。大赛组织者向建模者提供数十种蛋白质的氨基酸序列,建模者计算得到的形状与通过X射线晶体学和新兴技术——如核磁共振波谱和冷冻电镜——确定的结构进行比较。得分90分以上的预测被认为与实验结果相当。

2.1.1

人工智能预测了两种参与酵母DNA修复的蛋白质复合体的三维形状

早期的预测令人沮丧,得分中位数低于60分。但随着时间推移,建模者改进了计算技巧。例如,由两种蛋白质共享的氨基酸片段通常有着相似的折叠。如果一种未知结构蛋白质与一种已知蛋白有50%的氨基酸序列相同,则后者可作为指导计算机模型的“模板”。

到2018年,建模师的CASP得分通常保持在70多分的水平。随后,谷歌旗下DeepMind开发的AI预测神器AlphaFold登场。经历过蛋白质数据库训练的AlphaFold在CASP首秀中收获了中位数得分接近80分的佳绩,也赢下与其他算法的90轮角逐(即90种蛋白质预测)里的43场。2020年,新版AlphaFold2更加闪耀。由182个经过机器学习优化的处理程序组成的网络是AlphaFold2大显神威的基础,帮助它斩获92.4分的中位数得分——换言之,机器预测准度与实验方法相当。

马里兰大学的结构生物学家、CASP联合创始人约翰 · 莫尔特(John Moult)表示:“我从没想过自己有生之年会看到这种情况。”

2021年7月中旬,贝克和同事在《科学》杂志上发文称,他们的AI程序RoseTTAFold已经预测了数百种蛋白质的结构——全部来自一类常见的药物靶点。贝克团队的成果发布一周后,DeepMind的新论文又登上《自然》:他们对35万种人体蛋白质——占所有已知人类蛋白质的44%——进行了高精度预测。当时他们预计,自己的数据库将在接下来的几个月里爆炸式增长,拥有来自各种生物体的总计1亿种蛋白质——几乎达到生物界蛋白质总数的一半。

下一步工作是预测这些蛋白质中的哪些是一起工作的,以及它们如何相互作用。DeepMind已经着手这方面的工作了。在2021年10月份发布的预印本中,科学家揭开了4 433种蛋白质复合物的神秘面纱,向世人展示了哪些蛋白质以怎样的方式彼此结合。11月,RoseTTAfold又增加了912个复合物的计算结果。

AlphaFold2和RoseTTAFold的代码现已公开发布,可作科学家的研究工具。2021年11月,德国和美国的研究人员使用AlphaFold2和冷冻电镜绘制了核孔复合物的结构图。核孔复合物由30种不同的蛋白质组成,控制着细胞质与细胞核内的物质输送活动。2021年8月,中国科学家使用AlphaFold2绘制了近200种结合DNA的蛋白质结构图,这些蛋白质可能涉及从DNA修复到基因表达的方方面面。最近,谷歌母公司Alphabet成立了一家新企业,旨在通过预测得到的蛋白质结构来设计新的候选药物。贝克团队正使用其软件设计可折叠成稳定结构的新型蛋白质序列,这可能带来新的抗病毒药物和催化剂。

目前,研究SARS-CoV-2的科学家也在使用AlphaFold2来模拟奥密克戎毒株刺突蛋白突变的影响。突变使得刺突蛋白中插入了更大的氨基酸因而它们的形状发生改变——或许这种改变足以妨碍抗体结合并中和病毒了。

AlphaFold2和RoseTTAFold等的确将蛋白质领域的想象空间完全打开,不过我们现在还要解决不少问题。例如,蛋白质结构并非静态,它们在工作时弯曲或扭曲,对这些变化进行建模仍是挑战。此外,对大多数在细胞内执行海量工作的大型多蛋白质复合物进行可视化无疑是一项艰巨任务。

逼近核聚变的平衡点

2021年8月,美国国家点火装置(NIF)产生了一种聚变反应,非常接近所谓的“产耗平衡点”——如果越过平衡点,聚变产能将比点燃聚变反应所需的激光能量更多。

核聚变为太阳等恒星提供能量,长期以来一直被视为地球能源问题的解决方案。但要达到聚变所需的压力和温度——是太阳核心温度的10倍——极为困难。很多研究者选择用磁场约束超热等离子体,NIF则使用来自世界上最高能量激光的脉冲来压缩胡椒粒大小的氢同位素氘和氚胶囊。早些时候,该方法每次发射产生170千焦的聚变能量——远低于1.9兆焦的激光输入能量。

但在2021年8月8日的一次记录中,聚变产能飙升至1.35兆焦。研究人员认为这是燃烧等离子体的结果,意味着聚变反应产生了足够的热量,可以像火焰一样通过压缩燃料传播。

现在,NIF的团队正尝试通过用更大或更光滑的燃料胶囊、更均匀的冷冻燃料层或更高质量的激光脉冲来探究如此高产能背后的原理,以及如何调整启动条件以取得更好效果。

随着NIF方面接近平衡点,私人核聚变项目正加快步伐。国际热核聚变实验堆(ITER)是目前世界最大的托卡马克磁约束聚变装置,坐落于法国,总投资达250亿美元,由中国、美国、欧盟、俄罗斯以及日本等国参与建设。一些人预测,在ITER正式产能之前很久,私人的聚变项目就会落地。2021年,私营公司联邦聚变系统(CFS)和托卡马克能源(TE)表示在高温超导磁体方面取得了进展。通用聚变公司(GF)和TAE技术公司正在规划核聚变发电厂。

2.1.2

192束激光束会聚于一个微小的燃料芯块周围

粒子物理学或将被颠覆

2021年4月,美国费米国家加速器实验室(FNAL)发布缪子反常磁矩实验的结果:缪子的行为与标准模型理论预测不相符——它比模型预测的更具磁性,实测结果与理论值相差4.2倍标准方差。该结果可能预示着未知的新粒子和新的高能物理学理论。

粒子物理学中的标准模型从二十世纪六七十年代发展起来,描述了三种基本力——电磁力、强核力和弱核力——以及组成所有物质的基本粒子。不过标准模型不可能成为关于自然的终极描述,因为它忽略了引力和暗物质。当然,在FNAL公布新发现以前,标准模型成功解释了每一个高能粒子实验的结果。

缪子近似电子,不过质量比后者重200倍,其磁性为科学家寻找其他未知粒子提供了间接方法。缪子和电子都有内禀磁矩,在外界磁场的作用下,缪子会发生“摇摆”,不仅绕自身的轴自旋,同时也绕磁场的轴旋转,这就是所谓的进动,而进动频率的大小取决于磁矩。缪子内禀磁矩与进动频率间的比值被称为“旋磁比”,也叫g-因子,科学家可以精确计算出这一比值。

但当缪子于磁场内旋转时,其周围时空存在转瞬即逝的量子泡沫(又称“虚粒子”),二者相互作用,g-因子会因此改变,进动频率自然也发生变化。标准模型可以精确预测这种变化,但如果量子泡沫中包含新的作用力或粒子,g-因子将进一步改变,而标准模型对此无能为力。

纽约布鲁克海文实验室于1989年至1996年间构建了“缪子反常磁矩精确测量”实验(缪子g-2实验),并在1997年至2001年间开展实验收集数据,结果发现测量值与标准模型预测之间存在偏差。2021年,他们证明了20年前的偏差并非差错。

2.1.3

在美国费米国家加速器实验室的这个环内,缪子像指南针一样在磁场中旋转,精确度为十亿分之三十

现在我们的问题是,4.2倍标准方差的差距因何而来?对此疑问的追寻可能引起一轮物理学变革。如果物理学家足够幸运的话,世界最强粒子加速器——欧洲大型强子对撞机——在经过3年升级,于2022年春天再度上线后,某些新粒子可能炸出惊喜。

新冠特效药帮助患者降低风险

疫苗在人类对抗新冠病毒的斗争中扮演重要角色,而抗病毒药物的作用也同样不容忽视。人们可于感染早期服用它们,以防病症发展。

2021年秋天,制药巨头辉瑞和默克公布了临床试验的捷报。根据提交给监管机构的最终数据,默克公司的抗病毒药物莫奈拉韦(Molnupiravir)可将未接种疫苗的高危人群的住院或死亡风险降低30%(低于中期数据50%)。若在患者出现症状的3天内服用辉瑞公司的抗病毒药物PF-07321332,可将住院率降低89%。英国于2021年11月批准了莫奈拉韦。美国食品药品管理局(FDA)的抗菌药物咨询委员会(ADAC)以投票形式通过了对莫奈拉韦的紧急使用授权。监管机构正在研究PF-07321332的授权问题。

另一方面,科学家也强调,抗病毒药物虽无法替代疫苗,但可以说至关重要,如果新的奥密克戎变体导致突破性感染激增,它们可能变得更加重要。默克和辉瑞都在测试这些药物能否帮助疫苗接种者。

当然,相关问题还有很多。抗病毒药物可以减少感染者传播病毒的可能性吗?低收入国家能否获得足够药物供应?会不会出现某些没在临床试验中观察到的副作用?不过无论如何,科学家和医生对已有成果感到满意——并因疗法的多样而激动,因为这可能有助于防止病毒产生抗药性。

2.1.4

默克的莫奈拉韦将未接种疫苗的高风险个体因新冠病毒住院或死亡的风险降低了30%

从泥土解锁远古的核DNA

来自化石的DNA揭示未知的亲缘关系,追踪族群的早期迁徙,证明古老的种间交配,改变进化学研究的范式。2021年,科学家从洞穴地面的泥土中解锁了一个更大的古代DNA宝库。他们在那里首次发现人类细胞核DNA,并以此重建了世界各地穴居人的身份。

这项新工作借鉴了此前针对活物种留在环境里的DNA的研究。为了确定是哪些生物栖息在湖泊、森林或其他地方,科学家们收集了它们释放至空气、水和土壤中的自由漂浮的DNA。2003年,进化遗传学家发现这种环境DNA可以持续存在数千年。2015年,研究人员在没有化石材料的情况下,借助环境DNA重建整个古代生态系统。(不过大部分DNA来自线粒体。)

如今借助新技术,科学家可以从古老的土壤中梳理出携带完整生命指令的核DNA。

2021年,最新解锁的泥土DNA来自三个洞穴。西班牙埃斯塔图斯洞穴土壤内的核DNA揭示了11.3万年前至8万年前生活在那里的古人类的遗传特征和性别,并表明尼安德特人的一个谱系在10万年前结束的冰川期后取代了其他几个谱系。格鲁吉亚的萨萨布里亚的土壤有2.5万年历史,研究人员从中发现了来自以前未知的尼安德特人谱系的女性基因组,以及野牛和现已灭绝的狼的遗传痕迹。研究人员在墨西哥奇基韦特洞穴里发现了属于1.2万年前黑熊的DNA,并将其与现代熊的DNA进行了对比。结果发现,在最后一个冰河时代以后,洞中黑熊的后代向北迁徙至阿拉斯加。

2.1.5

一名研究人员记录了墨西哥奇基韦特洞穴沉积物样本的位置

提取并测序古代土壤中核DNA的技术仍处发展中。科学家希望借助古代泥土回答更多有关古代物种兴衰的问题。

单克隆抗体治疗传染性疾病

单克隆抗体(mAb)彻底改变了某些癌症和自身免疫性疾病的治疗方式,但其在对抗传染病方面一直没能取得重大突破。然而,2021年,mAb的故事发生转变,单克隆抗体重拳出击,对抗SARS-CoV-2以及其他威胁生命的病原体(包括呼吸道合胞病毒RSV、HIV和疟疾寄生虫),并且收得奇效。

为制备单克隆抗体,科学家从实验室动物和人类体内分离出最强大的抗体,并进行大量复制。作为药物,mAb主要用于抑制免疫反应或标记肿瘤细胞继而杀死肿瘤。在美国,唯一获批用于治疗传染病的mAb仅限于应对罕见疾病:埃博拉、吸入性炭疽、复发性艰难梭菌、高危婴儿体内的RSV以及无药可医了的艾滋病人体内的HIV。印度已批准将单克隆抗体用于狂犬病治疗。

随着克隆、动物模型和X射线晶体学等技术的进步,研究人员现在能够制造和筛选比以往更多的 mAb,从而简化他们的搜寻工作。新冠病毒mAb 在2020年的临床试验中取得可喜结果。到2021年底,FDA已批准了3种用于防治COVID-19的单克隆抗体的紧急使用授权。

此外,科学家正在开发针对流感、寨卡病毒和巨细胞病毒的单克隆抗体。两个旨在预防所有婴儿RSV的候选药物也被寄予厚望。另有研究显示,mAb对预防某些HIV毒株效果很好——虽然该研究的整体结果是失败的。

单克隆抗体有望成为传染病武器库中的“标配”。

2.1.6

艺术家概念中的抗体正攻击新冠病毒

洞察号首绘火星内部结构

岩质行星的内部藏着历史:它稠密的地核、黏滞的地幔以及硬化的地壳可以告诉我们它怎样合并、搅动和沉淀,成为今天的样子。在2021年之前,科学家们只能从地球和登月者视角下的月球处挖掘历史,但美国宇航局(NASA)洞察号火星探测器首次将火星面貌呈现于人类眼前。

当洞察号于2018年抵达红色星球时,火星似乎不愿意暴露其埋藏的秘密。尽管多次尝试,火星车的热探测器未能穿透火星的黏性沉积物。洞察号的超灵敏地震仪旨在监测地震以助于绘制行星内部结构,迄今为止探测到了数百次震动,其中有4次地震信号强烈而清晰,来自1 600公里外的裂隙区域科柏洛斯槽沟。基于这几次火星震的数据,再结合对内部成分的估计,研究者的绘制工作大有进展。地震信号表明火星地壳是分层的,厚度不到40公里——比地球大陆地壳更薄。薄地壳令火星迅速散发其早期的内部热量。

经过更深入的观察,洞察号发现火星地幔缺少地球地幔所具有的绝缘底层。此外火星地幔也很浅,被挤压在地壳和超大液态内核(核直径超过火星直径的一半)之间——考虑到火星本身的质量,科学家们得出结论,火星地核的密度相当低。虽然火星的热量流失很快,但硫等轻元素的混合物可能会使其铁和镍保持液态——就像盐防止水结冰一样。研究人员于2021年7月在《科学》杂志上发表了新发现。

2.1.7

地震波显示火星有一层薄薄的地壳、浅层的地幔和一个巨大的液态核心

有了这些新数据,科学家们将在未来几年内进一步探索火星历史,尝试回答这些问题:火星是否曾有过类似于地球的板块运动?它的液态核心是何时冷却下来并关闭磁场的?

洞察号可能还有更多故事要分享,但随着火星尘土继续在其太阳能电池板上积聚,留给洞察号的时间不多了——预计它到2022年底就会耗尽电力。

摇头丸可治疗创伤后应激障碍

迷幻药改变思想的力量令人类抱有利用它缓解精神疾病的期待,但一直鲜有大规模且严格的试验证明其效用。2021年,期待者们迎来喜讯:一项多中心的随机对照试验发现,3,4-亚甲基二氧基甲基苯丙胺(MDMA,俗称摇头丸)可显著减轻创伤后应激障碍(PTSD)患者的症状。

该研究结果于2021年5月发表在《自然-医学》(Nature Medicine)上,显示谈话疗法加MDMA的组合会增强PTSD患者的幸福感和共情能力,帮助他们更好地应对创伤回忆。

亮眼的结果激发了关注者的热情,但部分学者也对此持保留态度。多伦多大学的神经学家马修 · 伯克(Matthew Burke)和精神病学家丹尼尔 · 布伦伯格(Daniel Blumberger)在《自然-医学》杂志上发文称, MDMA试验对参与者的心理影响显而易见,甚至提高了改善症状的概率。对参与者的随访调查也表明,多达90%的参与者都猜出了他们属于哪一组。实际上,“我们需要彻底改变精神病学治疗效果的衡量方式”。

学术机构和商业公司正积极探索MDMA及其他迷幻药在治疗抑郁症、焦虑症和成瘾等精神疾病方面的潜力。2020年11月,总部位于伦敦的精神保健公司COMPASS Pathways宣布了一项233人参与的随机试验的结果。该试验将赛洛西宾(Psilocybin,又称裸盖菇素,迷幻蘑菇中的致幻成分)用于治疗顽固性抑郁症患者。该公司现正计划开展更大规模的MDMA试验。若后续研究结果令人满意,该公司将最早于2023年申请FDA的批准。

2.1.8

使用MDMA治疗创伤后应激障碍患者

体内 CRISPR 编辑成功

基因编辑工具CRISPR在2020年首次展现临床上的巨大潜力,当时人们发现似乎可以通过基因编辑治愈两种遗传性血液疾病——镰状细胞病和β-地中海贫血症。之所以说“似乎”,原因是2020年的治疗开展于实验室培养皿中:科学家从患者体内取出有缺陷的造血干细胞,对其进行编辑,然后将它们重新注入患者体内。到了2021年,科学家更进一步,直接在人体内部署CRISPR。在小型研究中,新策略减少了一种有毒的肝脏蛋白质,并一定程度上改善了遗传性失明患者的视力。

如果能将CRISPR疗法注射到器官或血液中,基因编辑就可治疗更多疾病,但这也会带来重大挑战:在CRISPR的分子成分必须以正确的数量安全地运送至目标细胞内。

2021年6月,美国Intellia公司(NTLA)和再生元公司(RP)的研究团队在《新英格兰医学杂志》(NEJM)发文称,治疗转甲状腺素蛋白淀粉样变性(ATTR)的CRISPR基因编辑疗法NTLA-2001在1期临床试验中取得积极结果:参试者经过4周治疗,血液甲状腺素运载蛋白(TTR)的水平平均下降52%(0.1 mg/kg剂量组)或87%(0.3 mg/kg剂量组)。因TTR基因的特定突变,ATTR患者神经和心脏等组织内的TTR错误折叠并积聚,产生极大损害。NTLA和再生元团队通过非病毒脂质纳米颗粒向人体输送CRISPR,实现了TTR基因编辑。

在另一项研究中,Editas 医药公司的研究人员将一种携带CRISPR DNA的无害病毒注射至6名先天性黑蒙症10型的成年患者眼睛中。病毒携带的DNA会破坏黑蒙症相关的突变基因。2021年9月的一次会议上,研究人员报告称,两名几乎完全失明的患者在3~6个月后感觉到了更多光亮,并且能在昏暗的光线下穿过设有障碍物的路线。

2.1.9

RNA(蓝色)将DNA切割酶(白色)引导至其目标(橙色)

体外胚胎培养新进展

深入理解早期胚胎发育可以帮助科学家了解流产和出生缺陷,并完善体外受精(IVF)方案。但法律、实践和伦理方面的限制在一定程度上阻碍了关于人类胚胎的科学研究。

以往研究人员一般能将小鼠胚胎体外培养3~4天。不过有团队在2021年3月报告称,他们成功将其体外培养时间延长至11天,其培养方案里的一个关键环节是把装着胚胎的培养罐放在类似于微型摩天轮的设备上旋转,令胚胎更充分地接受营养的滋养,并确保氧气水平和大气压力适宜。胚胎在更长培养期间经历了细胞重组、器官生长和后腿出现的关键阶段。

其他科学家设计了囊胚(或者说胚泡)的替代品。囊胚指的是内部产生囊胚液和囊胚腔的胚胎,其中所有细胞都未分化,经过此阶段后方才开始分化。在试管婴儿过程中,囊胚是体外培养的终末阶段,一般胚胎都会以囊胚形式植入母体。

该团队利用人类胚胎干细胞和诱导多能干细胞(iPSCs)制作了囊胚替代品。另一项研究发现,正在向iPSCs过渡的皮肤细胞会产生囊胚样结构。这些人造胚泡并非真正的胚胎,但其中一部分可提供具有指导意义且争议较小的替代方案。

2021年5月,国际干细胞研究学会发布了干细胞研究及其向医学转化应用的最新指南,放宽了数十年来限定人类胚胎培养的“14天规则”,允许科学家探索更晚的发育阶段。

2.1.10

一个小鼠胚胎在一只旋转的罐子里生长。这样的胚胎可以帮助研究人员更好地了解人类发育的早期阶段

资料来源 Science