在有机化学领域,一场无声的竞赛正在悄然展开,化学家们正在尝试构建一种可以合成任何化合物的神奇机器。一旦成功,势必在整个化学领域掀起一场革命。

 

810-14日,正值全世界化学家齐聚旧金山参加美国化学会2014年秋季会议之际,《自然》杂志推出了一组“2014:化学家的选择”专题报道,其中有描述化学家尝试构建自动合成有机化合物的“梦之机器”,也有对制备形貌单一的纳米管的合成方法的描述,包括在实验室中模拟光合作用以及尝试用一种廉价的浴盐(氯化镁)制造太阳能电池。尽管上述尝试会面临诸多挑战,相信,经过化学家们的不懈努力和探索,化学领域终将会出现令人期待的变化。――编者

 

 

呼叫分子

  在二十世纪六十年代的老照片中,有机化学实验室像似一个炼金术士的天堂:试剂瓶、玻璃器皿不是排列在架子上,就是悬挂在带有木楔的支架上,而研究人员则在忙碌着合成各式各样的分子……
 
  “呼叫分子”
 
  如今,上述场景基本不复存在,取而代之的是,配备有成排的通风设备和各种的分析和测试仪器。通常,当有机化学家想合成一个指定的分子时,他们会在纸上快速勾画出各种不同的六边形和碳-链草图,然后通过混合、过滤、蒸馏,最终小心翼翼地将分子拼接在一起,其过程仿佛是在做刺绣活一般。
 
  然而,尝试发明一种自动合成有机分子的装置,以取代现在主流的人工合成方法正在成为一种趋势。英国南安普敦大学的化学家理查德·惠特(Richard Whitby)认为,建立一种能合成十亿分之一的小分子的机器是完全可行的。
 
  如果这样的机器真实存在,将会改变医药学、材料学等领域的研发现状,研究人员从中可以获得多样性或数量惊人的化合物。对此,美国麻省理工学院的化学家蒂姆·贾米森(Tim Jamison)指出,尽管合成机器的构建非常艰难,包括其中的每一个细节都会遭遇挑战。但他不认为这不可完成。
 
  在英国,一个由惠特领衔、耗资70万欧元的被称为“呼叫分子”(Dial-a-Molecule)的项目正在运行。目前有450名研究人员和60多家机构参与,主要研究分子自动合成机器的关键组件。惠特认为,他们的工作将获得长期支持并有望实现最终的目标。该项目从2010年起,计划于2015年5月结束。
 
  尽管与最终的目标还相距甚远,但“呼叫分子”项目成员的初期研究为日后的工作奠定了基础。例如,可以让一系列的化学反应依次有序进行(之前只能一次一步地手动完成);利用算法可以设计出合成分子的最优反应路线(在数据处理方面也有了一些突破)。或许最为重要的是,该项目帮助了化学家们记录并分享他们每天所获取的数据。
 
  有人估计,如果要构筑一个和人类一样技术娴熟的全自动合成“化学家”,至少还需要几十年的时间。然而,发明一种不那么智能、但实用的自动合成装置应该是可行的。目前正在参与合成机器研究的美国西北大学的化学家巴尔托什·格泽鲍夫斯基(Bartosz Grzybowski)坚信,只要经费充足,他们或将在五年内完成这一目标。
 

电子梦想

  如果要完成自动合成机器的构建,化学家们必须要完成以下三个步骤。首先,在机器中建立一个数据库,将目前制备分子的成熟合成方法储存进去,包括哪些反应可用于构筑碳-碳键,哪些试剂在合成目标分子的一部分时却可能破坏底物分子的另一部分;其次,设计一种用来处理海量数据的算法;再次,在内置的反应炉中完成设计好的合成路线。
 
  上述的最后一个步骤却是目前研究进展最为迅速的一环。在过去十年中,化学合成机器在医药研究中的作用日趋显现,但现有的机器能力有限:DNA或蛋白质序列生成器通常只能够结合少数低于六个反应的分子构建模块。更多样化的合成工作站对于大多数实验室来说太昂贵了――成本从3万欧元到超过50万欧元――而且倾向于产生一个狭窄范围化学性质的分子。
 
  目前,部分化学家们在尝试开发一种连续流动式的合成策略,即当化合物流经机器时就开始其化学反应。这样的策略不仅可以提高反应速度和产率,而且更加适用于自动化流程。
 

剑桥Novartis-MIT连续性生产中心

 

  在麻省理工学院的Novartis-MIT连续性生产中心,团队成员之一的贾米森与他人构建了一台用于研究流体化学的合成机(7米×2.5米×2.5米),并于去年首次完成了高血压治疗药物富马酸阿利吉仑的完整的连续合成。该项目负责人伯恩哈特·特劳特(Bernhardt Trout)说:“花了四年时间在‘一切可能出错或将会出错’的地方,经过大量的试验和错误后,研究人员现在做的或是仅仅按动电钮和向机器中加入溶剂与原材料。但问题是需要一步一步地解决,比如,一旦某根管子被堵住,或可以对其他进程提供即时改进。”
 
  与传统的批次合成需要21步以及300多小时相比,这台机器从搅拌、过滤、成型到制备,只需14步操作和47小时。贾米森指出,连续流动策略也可能用于其他反应类型,“50%甚至75%以上的反应或都可以用这样的策略进行,可以进一步提高工作效率。”
 

化学大脑

  “呼叫分子”项目成员、葛兰素史克公司的自动化专家立野雄一指出,虽然自动化机器的功能越来越多,但如何使计算机自行设计合成路线仍是一个难题。“尽管硬件开发比较完善,但软件和数据处理还有待于进一步提高。”
 
  通常,化学家在设计合成路线时会采用一种称为逆合成分析的方法。他们先构画目标分子,然后对分子进行拆分,拆分后的分子片段一般要足够的稳定或可以直接获得。在这一过程中,化学家们可以甄别或构建化学合成砌块所需的原材料,同时还能设计出将这些砌块进行有效拼接的策略。
 
  如果有必要,他们还能在一些商业化的数据库中寻找到灵感,或链接进入美国化学会(化学文摘服务社的一个接口),或爱思唯尔提供的数据库进行相关检索(在这些数据库中输入一个分子结构或一个化学反应,便可以得到一系列的相关文献检索结果)。立野雄一指出,虽然大量的化学知识和规律已经被人们发现,但没有一个人敢说他可以掌握全部这些知识。
 
  对于人们寄望于合成机器可以在未来做得更好,惠特说,这还不仅仅是计算机对海量信息的快速检索,关键是如何让计算机能够自行判断某个反应是否真正可以在一条合成路线中有效使用,尤其在制备一些尚未被合成过的分子的过程中。
 
  美国哈佛大学的化学家埃利亚斯·科瑞(Elias Corey),曾在二十世纪六十年代提出过逆合成分析策略,然而如何让合成路线自动化设计这一问题却一直困扰着他。此后,科瑞发明了一款称为LHASA的软件(合成分析中的逻辑与启发式算法),能够根据目标分子结构推荐一条合成路线。然而,在格泽鲍夫斯基眼里,LHASA实际上并没有获得预想的成功,他认为该算法不能判断给出的反应是否可以与底物分子中的官能团兼容。
 
  在过去的十年里,格泽鲍夫斯基也开发了一款名为Chematica的系统。他首先搭建了一个含有600万有机化合物的检索网络(主要源自Reaxys中的一个数据库)。此后,他的团队花了多年时间对这些数据进行梳理,并逐条验证反应试剂在不同条件下的兼容性等信息。由于Chematica包含了大量的关键信息,它可以给出结构新颖分子的合成路线。
 
  此后,格泽鲍夫斯基团队在Chematica系统中添加的全局把控功能,可以搜索出路线中每一步应该采用的最优反应,或从整体上把握每一条路线的合成效率。这意味着路线中即使某一反应的产率很低,也可被其他步骤中高效的反应所平衡,直至被最终采用。格泽鲍夫斯基说,利用这款软件,我们可以在5秒钟内筛选20亿条反应路线。
 

印象深刻

  格泽鲍夫斯基回忆起2005年首次揭示Chematica内部网络构架时,他自嘲“那时候人们都说它是垃圾。”但到了2012年,他和他的团队发表了一组里程碑式的论文三部曲,展示了Chematica的强大功能和工作原理后,情况就不同了。例如,利用该系统给出一系列可能的“一锅法”合成路线,其反应物可以被依次投入到反应器里,而不需在每一步完成后进行繁琐的分离、纯化。他们选择了一系列的喹啉衍生物作为研究对象(这类化合物的骨架经常被用于药物和染料分子中),结果显示,许多由软件给出的合成路线比传统的路线更为高效和便宜。格泽鲍夫斯基团队试验了51个由Chematica给出的合成路线,与传统路线相比,大约节省了45%的花费。
 
  虽然只有部分化学家尝试使用了Chematica软件,但其功能仍然给很多人留下深刻的印象。不久前,格泽鲍夫斯基在与Elsevier谈判,试图将该系统整合进Reaxys中,同时他还在与医药公司合作,尝试合成一些具备生物活性的天然产物分子,包括参加波兰政府的招标(700万兹罗提,约合230万美元),尝试将Chematica植入到合成机器中,至少合成三个重要的药物分子。
 
  尽管许多人对此表示怀疑,但“呼叫分子”项目参与者、英国卡迪夫市CatScI公司的商务总监西蒙·泰勒(Simon Tyler)坦承:“在可预见的未来,人工干预的合成还是占主流,实验室也不会只有机器人在工作。”
 
  基于Chematica是在已发表研究成果的基础研发的,其在设计未知化合物合成路线时必然会遇到各种问题。对此,惠特指出:“构建一台全自动合成机器,我们不仅要预判什么样的反应是有效的,更需要对什么情况下反应会失败作出准确判断。”
 
  不幸的是,文献报道中很少有失败的记录。理论上化学合成机器或仪器可以将信息备份到电子实验记录(ELN,可以记下成功或失败的反应)上,然后将这些数据上载到开放数据库中,后者有助于合成机器对反应的可靠性进行判断。澳大利亚悉尼大学的化学家马特·托德(Mat Todd)说:“如果掌握了每一个化学反应背后的故事,我们就将获得惊人的化学反应预判能力。”
 
  “呼叫分子”项目目前已经在尝试使用ELN了,他们将ELN设计成一种可以被机器读取的标准格式,同时还开发了将这些数据传输到ChemSpider开放数据库中的相关软件。比如,一种称做PatentEye的雏形软件,可以从专利信息中编辑整理并调取关键的化学反应数据。托德说:“在化学界,我们并没有共享的意识,我认为这样的情况应当得到改善。”
 
  资金问题同样是一个门槛。惠特正在游说一个国家级的中心来研发这类先进的自动合成仪和相关软件,以促进这一领域的发展。在该项目实现之前,他希望“呼叫分子”可以鼓舞更多的青年化学家去体验数据的共享和自动化。
 
  格泽鲍夫斯基作为其中的一员,坚信全自动合成机器的构建终将会实现。他说:“只有一种可能会扼杀这一项目,那就是人们自己对它的怀疑。”
 
 

资料来源 Nature

责任编辑 则 鸣