有人曾用“地皮”对开发商的重要性来形容“靶标”在药企中的地位,现在基于作用机制的药物发现越来越依靠靶标的确定,以便将药物作用和遗传变异、临床有效性和安全性联系起来,并能区分同一治疗领域内的患者亚群。但不论是已经上市还是处于研发阶段的药物,辨别明确的作用靶标并不容易。近日,来自欧洲分子生物学实验室EMBL(European Molecular Biology Laboratory)-欧洲生物信息研究所EBI(European Bioinformatics Institute)的John P. Overington等人总结了上市药物的作用靶标,这篇统计分析性论文发表在药物发现领域的顶级期刊Nature Reviews Drug Discovery 上。
文中所选药物为2015年6月份前美国FDA批准的1578个药物。确定药物的作用靶标需要清晰的证据,作者除从原始文献获得靶标信息外,还分成三个独立研究小组提供信息,分别来自EMBL-EBI的ChEMBL数据库、新墨西哥大学的DrugCentral数据库和英国癌症研究所的canSAR知识库。这里药物指改善人类健康状况的活性成分,包括获批准的小分子药物和生物药物,不包括造影剂、营养补充剂、疫苗等。此文中靶标特指药物直接结合的蛋白或其他生物大分子如DNA、RNA、肝素、多肽等,并起到治疗效果。能够结合的其他蛋白但不产生治疗效果的,不界定为靶标。这样即使有些药物具有多靶点的性质,文中只考虑起治疗效果的有效靶标(efficacy target),而具有广谱作用的药物归类到多个靶标。
药物、靶标和治疗领域
作者提取了667个人类靶标蛋白和189个病原体靶标蛋白,见表1。
表1 美国FDA批准药物的分子靶标概况
表中也包括其他地方批准的抗疟疾药物。
ChEMBL数据库是欧洲生物信息研究所开发的一个在线的免费大型数据库,它通过从大量药物化学文献和美国选定药名USAN申请中收集各种靶点及化合物的生物活性数据。将靶标按ChEMBL分级系统归类。其中四大家族占据了主导地位,G蛋白偶联受体GPCRs(也称为7TM1)为12%,离子通道为19%,蛋白激酶为10%和核激素受体为3%。它们作为主要的人类蛋白靶标,占比达到44%;如果考虑小分子药物的有效靶标,它们更是占到了70%(图1a)。因很多小分子药物具有多重药理学,激酶和核受体比例的反差较大,而对生物药而言分泌类蛋白和表面蛋白是主要靶标。
图1a. 药物的主要靶蛋白族。图片来源:Nat. Rev. Drug. Disc.
图1b. 应用在临床上的蛋白家族,从ChEMBL 20获取的未批准药物的作用靶标比例(从药物化学文献中提取,生物活性测试针对人类蛋白靶标)和获批药物的作用靶标比例。缩写代表:7TM,7种跨膜蛋白家族;GPCR,G-蛋白偶联受体;LGIC,配体门控离子通道;NTPase,核苷三磷酸酶;VGIC,电压门控离子通道。图片来源:Nat. Rev. Drug. Disc.
不论是药物/靶标之比还是靶标/药物之比都值得注意,有些靶标可选药物很多,如糖皮质激素受体有61个药物,而激酶抑制剂恰好相反,寥寥几个药物作用于很多靶标。单克隆抗体的选择性非常高,专一作用于一个靶标,而小分子化合物则普遍有较复杂的药理学。
图1b展示了ChEMBL数据库中对已成功研发出药物的靶标的偏好,在G蛋白偶联受体、核受体、电压门控离子通道、还原酶、电化学转运载体、配体门控离子通道中比较明显。
按WHO的ATC(Anatomical Therapeutic Chemical)系统,即解剖学、治疗学及化学分类系统,可将这些上市药物分类。ATC代码共有7位,其中第1、3、4位为字母,第2、5、6、7位为数字,有些药物作用于具有多个适应症,会有多个ATC编码。ATC系统将药物分为5个级别,具体为(以药物西地那非sildenafil为例):
第1级按解剖分组,例如:G,生殖泌尿系统和性激素。
第2级按药理作用分组,例如:G04,泌尿系统。
第3级按化学、药理和疗法分组,例如:G04B,泌尿系统。
第4级也按化学、药理和疗法分组,例如:G04BE,勃起机能障碍用药。
第5级按特定单一药物或药物组合分组,例如:G04BE03,sildenafil。
将这些药物按照ATC第3级归类分组得到表2和图2,从图2可以看出心血管系统药物C和皮肤科用药D已经趋于成熟;同时抗肿瘤和免疫抑制剂L正在蓬勃发展;抗寄生虫药、杀虫药和驱虫药P基本毫无进展。
表2 美国FDA批准药物的治疗领域
图2. 按治疗领域ATC第3级将药物分类。图片来源:Nat. Rev. Drug. Disc.
四大靶标蛋白家族中,G蛋白偶联受体共有362个药物,近5年来有24个药物获批,占总数的6.6%;核受体有161个药物,近5年有3个药物获批,占总数的1.9%;离子通道有177个药物,近5年来有5个药物获批,占总数的2.8%;激酶的进展显著,共有71个药物,近5年来有20个药物获批,占总数的28%(见图3)。
图3. 主要靶标四大家族的药物概况。图片来源:Nat. Rev. Drug. Disc.
将作用于同一靶标但治疗领域不同(不同ATC编码)的药物相联系,可以分析药物、靶标和治疗领域之间的关系(图4)。从图4a中可以看出G-蛋白偶联受体几乎作用在每个治疗领域,而激酶集中在抗肿瘤和药免疫调节剂L,在小分子药物靶标中激酶仅占2.4%,但在生物药中占据主要地位(图4b)。
图4. 关键蛋白家族的联系:外环的每个弧线段代表ATC编码第1级,内环弧线段代表第2级,两个片段相连代表两个药物有相同的有效靶标,a有机小分子药物b 生物药物。图片来源:Nat. Rev. Drug. Disc.
世界范围内的药物注册情况
文中药物局限在获得美国FDA批准,作者也分析了约1200个未在美国上市但通过其他国家监管机构批准的药物,其中大部分和美国获批药物的化学结构类似,靶标相同。另外8个未在美国获批上市但在其他国家获批的药物及其靶标见表3。
表3 在美国之外获批药物的有效靶标
动物模型的同源性
在药物发现阶段,选择尽可能接近人类病理学的动物模型,才能更好地研究疾病和预测药效。直系同源(orthologous)指的是不同物种之间的某一部分具有同源性,例如蛋白质的同源性、DNA序列的同源性。在动物模型中编辑直系同源靶标蛋白是研究药物的重要方法。按ATC将靶标分类,从热点图中5可以看到动物和人类的直系同源关系,其中深蓝色代表靶标,颜色深浅代表同源的程度,这样从图中可以很方便的看出哪些靶标是人类的,哪些是大肠杆菌的,脊椎动物如(狗、猪、小鼠、大鼠、斑马鱼等)与人类的靶标具有良好的直系同源性。在开发某类药物时,可以从图中看到哪些动物模型可利用,例如开发一款抗感染药物时,所选靶标尽量不出现在寄主体内(主要是人类),在生物信息学筛选中就过滤掉这些靶标。二氢叶酸还原酶DHFR(Dihydrofolate reductase)就是个例子,在人类缺乏直系同源蛋白,因此以此为靶标的抑制剂(例如甲氧苄啶Trimethoprim)可作为杀菌剂、抗肿瘤药和抗寄生虫药,在人体内选择性高而毒性小。
图5. 直系同源,外环为ATC编码第1级,放大部分为第4级,深蓝色代表药物有效靶标,颜色深浅表示直系同源的程度。图片来源:Nat. Rev. Drug. Disc.
癌症
最近十年发展最迅速的领域当属抗癌药,FDA共批准了154个抗癌药,按照机理可分为三大类:(1)广谱细胞毒性药物,如铂类配合物和DNA嵌入剂,共28个药物;(2)作用于蛋白的细胞毒性药物,如微管蛋白,但对肿瘤无选择性,共有38个药物;(3)作用在明确的功能蛋白上并调节功能,如激酶抑制剂、细胞核激素受体,共85个药物。靶向抗癌药的代表有BRAF抑制剂威罗菲尼Vemurfenib,作为第1个治疗恶性黑色素瘤的药物于2011年上市;2011年批准的ALK抑制剂克唑替尼Crizotinib作为治疗非小细胞肺癌药物;2013年批准的MEK抑制剂曲美替尼Trametinib等。
作者将553种致癌因素和85个抗癌药物的109种蛋白靶标比较,发现交集仅有30个(图6)。造成这种情况的原因之一是在患者样本采集时的统计学以偏概全;之二是这些与癌症相关的因素都是近几年发现的,时间会考验它们是否是有效靶标。作者的经验为至少10%可以作为小分子药物的成药靶标。最后,也是最重要的是,非癌基因成瘾(non-oncogene addiction)仍将作为治疗癌症的重要靶标,例如芳香酶抑制剂治疗乳腺癌,细胞色素P450酶家族的CYP17A1抑制剂作为抗前列腺癌药,治疗卵巢癌的PARP抑制剂等。
图6. 抗肿瘤药物的交集。图片来源:Nat. Rev. Drug. Disc.
展望
现在药物发现和靶向性研究仍然是复杂、耗财和不可预测的过程。伴随着对疾病研究的新视角和基础生物学的兴盛,以及目前成功的药物所带来的靶标、表型效应和适应症关系,希望能够促进新一代药物的发现。
原文(扫描或长按二维码,识别后直达原文页面,或点此查看原文):
A comprehensive map of molecular drug targets
Nat. Rev. Drug. Disc., 2017, 16, 19-34, DOI: 10.1038/nrd.2016.230