有机分子由结构式中各原子的数量、类型、拓扑连接以及立体化学来定义,这意味着有机分子的数量相当庞大。时至今日,已有超过一亿个有机分子被制备,其中绝大部分是药物化学研发的结果。这些数以亿记的有机分子产生了海量的信息,化学信息学技术提供了各种计算工具来处理这些信息,以便于这些分子的数据库分类和生物活性预测。那么,究竟有多少有机分子可能存在呢?
曾经有人做过预测,遵守利平斯基(Lipinski)五规则的所谓类药的(drug-like)分子可能有1060个,并且小于30个原子的活性分子在1020至1024之间。但无论如何,这个估计是过于庞大而不实用的。
瑞士伯尔尼大学的Reymond教授最近在《Acc. Chem. Res.》发表综述,概括了他们的“化学空间项目”(chemical space project),他的研究小组使用计算化学方法,枚举了特定大小以下的一切可能存在的有机分子。其中,如果大小限定为最多包括17个C、N、O、S或卤素,再除去不稳定和不易合成的分子,所得到的数据库(GDB-17)中包括超过1,664亿个分子,是当前最大的分子数据库,而且,这些分子和已知分子有密切的关联。
这些数据库可以用于药物的虚拟筛选。在这些数据库中,通过特定的搜索方法,任何分子都能找到非常接近的上百万类似物,这赋予研究者难以置信的“化学空间”深度。
“化学空间项目”为化学多样性打开了前所未有的大门,并将极大促进生物活性分子的筛选效率。当然,这个项目也带来了前所未有的挑战,那就是有机化学家如何合成这些海量的有机分子。
http://pubs.acs.org/doi/full/10.1021/ar500432k?ref=ec-highlight
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!