48891
当前位置: 首页   >  组内活动   >  文献分享 |Chem Sci|AlphaFold加速了基于人工智能的药物发现进程:高效地发现了一种新型CDK20小分子抑制剂
文献分享 |Chem Sci|AlphaFold加速了基于人工智能的药物发现进程:高效地发现了一种新型CDK20小分子抑制剂
发布时间:2024-10-30

今天分享的文献是2023年发表于Chem Sci名为AlphaFold加速了基于人工智能的药物发现进程:高效地发现了一种新型CDK20小分子抑制剂的文章。

  首先介绍一下本文的研究背景人工智能(AI)的应用被认为是药物发现领域的革命性变化。AlphaFold 作为一种突破性技术,在2020年成功预测了整个人类基因组的蛋白质结构,这一成就大大推动了结构生物学的发展。尽管这些预测结构的准确度有所不同,但在缺乏实验数据的情况下,它们为新靶标的结构基础药物设计提供了宝贵的资源。CDK20在多种癌症中具有过表达,尤其是在肝细胞癌(HCC)中,研究证明它是一个潜在的治疗靶点。通过此次研究,希望加快药物发现的效率并降低成本,最终为HCC的治疗提供新型药物。本文旨在利用AlphaFold预测的蛋白质结构,结合AI平台,快速识别靶向CDK20的新型小分子抑制剂。其中AI平台依托的是PandaOmics以及Chemistry42.右图展示的是alpha fold的工作流程。接下来单独介绍一下这两个AI平台,首先是pandaomics,如图所示的是pandaomics的工作流程。

  第一步是数据集的搜索,这些数据集包括基因表达、基因组学、蛋白质组学等多种数据。并且这些数据可能来源于公共数据库(如TCGA、GEO等),研究人员可以通过这些数据集来理解目标疾病的生物学特征。第二步是样本聚类与比较,通过对疾病和健康样本的聚类分析,创建样本之间的比较关系。第三步是基因和通路水平分析在样本聚类和比较的基础上,PandaOmics 进行 基因和通路水平的分析。第四步是聚合多种比较数据到Meta分析第五步是从文献、基金和临床试验中提取的经验和趋势。通过分析文献、专利、基金资助报告和临床试验数据,提取相关的趋势信息和经验。这帮助研究人员了解哪些基因或靶点在现有研究中备受关注,哪些仍未被充分探索。第六步是对治疗靶点和生物标志物的识别结合前面几步的结果,PandaOmics生成一个潜在治疗靶点和生物标志物的候选列表。这些靶点基于其与疾病的关联性、药物可及性、安全性等多维度特征被筛选和排序。第七步是疾病相关的活性化合物识别在确定了治疗靶点后可以识别出与疾病相关的活性化合物,这些化合物可能是现有的药物分子,或者是可以进一步优化的先导化合物。第八步是适应症优先级排序与扩展。第十二步使用Chemistry42生成小分子,最后一步是通过 Chemistry42 生成新的小分子化合物。Chemistry42 是一个基于AI的分子生成平台,它能够利用蛋白结构信息,生成并优化与靶标结合的小分子。这些分子可以进一步被合成和测试,以验证其生物活性和药物潜力。


(1)已知有效的先导化合物:LBDD可以通过分析这些分子的物理化学属性、活性和结合模式,生成具有相似或优化特性的分子。

(2)目标蛋白结构未知时:LBDD可以通过配体信息来预测新分子的活性。


2. 基于结构的药物设计(SBDD, Structure-Based Drug Design)

(1)已知靶标的三维结构:当目标蛋白的晶体结构或同源建模结构可用时,SBDD 可以通过分子对接和结合口袋分析,设计与靶标结合效果最佳的分子。

(2)结合口袋信息丰富:SBDD可以基于蛋白质结合口袋的形状、电荷、氢键位点等信息,精确设计与之匹配的小分子。

总的来说,pandaomics是用于寻找潜在靶点,chemistry42用于药物设计,这种设计可以是已知的或者未知的。


  接下来继续讲本文的技术路线。首先通过对10个数据集(1133个疾病样本和674个健康对照)分析,得到潜在靶点后,为了满足新药开发的目的,选择了没有实验验证过的蛋白质三维结构。在确定了靶点后,Chemistry42负责基于这些靶点生成潜在的小分子药物。最后进行了分子合成和细胞实验。

  其中蛋白质模型是以alphafold构建的。图A展示的是CDK20的三维结构,如图所示,蛋白质C端有一个灵活的环,具有多种构象,不利于抑制剂的设计,将C端移除后再进行分子生成。图B展示的是移除后的蛋白结构,并且存在一个活性口袋,将84位的甲硫氨酸定义为结合点以及口袋的体积,原子排列顺序对小分子进行设计,通过chemistry42共设计出8918中分子,通过分子对接等方式,最后选取了7种化合物进行合成。左图显示了筛选出的7种化合物的化学结构,这些化合物被用于合成并评估其对CDK20的结合能力。在所选化合物中,化合物ISM042-2-001在CDK20激酶结合测定中表现出9.2 ± 0.5 μM(n = 3)的Kd值,并且在CDK20激酶活性测定中的IC50值大于6000 nM。如图6B的分子对接所示:四个氢键相互作用以虚线表示。除了与Met84形成的两个氢键外,ISM042-2-001还通过酰胺-NH基团与亮氨酸85相互作用,并通过吡咯-NH基团与异亮氨酸10相互作用。或者,酰胺-NH基团或吡咯-NH基团也可能与溶剂区域中天冬氨酸87和谷氨酸90形成氢键。

   由上述结果可以了解到,喹啉环,吡咯-NH,酰胺-NH在结合时比较重要,进行了第二轮化合物生成,首先在门控区域附近的疏水口袋中引入喹唑啉环上的功能基团,其次对吡咯-2-甲酰胺基团进行修饰,以进入溶剂区域并与酸性残基Asp87或Glu90相互作用。最后得到6个分子,其中,ISM0ISM0-42-2-0-48与已报道的CDK20抑制剂具有不同的新型骨架结构和较低的分子相似性。通过MST实验生成的结合曲线可以直观展示化合物ISM042-2-048与CDK20之间的结合情况。较低的kd值通常代表较高的结合亲和力。此外,ISM0-42-2-0-48对CDK20激酶活性的抑制作用已得到确认,平均IC 50 为33.4±22.6 nM(n=3),并且在CDK20过表达的HCC细胞系中显示出选择性的抗增殖活性(IC 50 为208.7±3.3 nM),而对照细胞系HEK293(IC 50 为1706.7±670.0 nM)的活性则较低。这表明该化合物对CDK20的抑制能力很强,也显示出了较好的选择性。

文章的结论是:

1本研究通过PandaOmics平台筛选,发现了 CDK20 在肝癌细胞(HCC)中的潜力,尤其是在肝癌细胞中CDK20的过表达为该靶标的药物开发提供了依据。

2.通过Chemistry42平台生成并筛选出一种新的小分子抑制剂 ISM042-2-048,其对 CDK20激酶 表现出强效抑制作用,并且在肝癌细胞Huh7细胞系中显示出显著的选择性抗增殖作用,相比之下对HEK293细胞系的作用较弱。这表明该化合物对肝癌细胞有较好的选择性。

3.本研究展示了AlphaFold预测结构与PandaOmics和Chemistry42平台结合的成功应用,显著加速了新药的发现过程。

 

                                                                             汇报人:童靖扬