当前位置 : X-MOL首页行业资讯 › 靶标-配体相互作用打分函数:游戏规则的制定

靶标-配体相互作用打分函数:游戏规则的制定

药物分子与其生物靶标分子之间产生足够强的相互作用是发挥药效的前提(图1)。在药物研发中,与靶标分子的亲合性(binding affinity)是筛选活性化合物的首要标准。靶标-配体亲合性可以采用多种基于不同原理的实验技术来测量,例如等温滴定量热(ITC)、表面等离子共振(SPR)、荧光偏振(FP)等等。但是动用实验测量毕竟比较费时费力,如果可以使用计算方法来定量计算靶标-配体相互作用,那么就可以实现“虚拟筛选”(virtual screening),从而大幅提高发现活性先导化合物和优化先导化合物的效率,降低新药研发成本。所以,定量计算靶标-配体相互作用在药物分子设计领域中是一个核心问题,在过去30年中以及可预见的未来都是人们竞相追逐的“圣杯”(J. Med. Chem.,2016, 59, 4033−4034)。

图1、配体分子与靶标分子特异性相互作用示意图。


既然传说中的圣杯就在那里,何不我也试上一试?自上世纪80年代以来,研究人员发展了许多理论方法,用于模拟和定量计算靶标-配体相互作用。这些研究你方唱罢我登场,真可算得上是一个竞争激烈、奇葩怒放的领域,有兴趣的读者可以参考更专业的参考文献。

图2. 发展定量计算靶标-配体相互作用的方法,是一场奇葩怒放的竞赛。


在众多方法中,打分函数(scoring function)具有适用性好、计算速度快、精度良好等优点,广泛地应用于分子对接、虚拟筛选、从头设计等各种用途,是在药物研发实践中应用最为普遍的一类方法。发展性能更加优良的打分函数因此是一个竞争激烈的研究领域。据不完全统计,文献中已报道的各类打分函数已经超过100种,而且每年仍有若干新的打分函数出现。


本文将介绍中国科学院上海有机化学研究所王任小研究员课题组近年来在打分函数研究领域中取得的成果。你以为小编将在这里绘声绘色描述王任小课题组发展的一种新打分函数?图样图森破!王任小研究员多年来研究打分函数,在此过程中深切感受到了导致打分函数研究进展缓慢的瓶颈问题。打分函数作为一类理论计算方法,需要大量已知三维结构以及亲合性实验数据的蛋白-配体复合物样本,作为构建和检验计算方法的知识基础。这就有些像建造高楼大厦时必须先要打好地基一样。但是在计算科学领域中的研究人员往往更关注研究理论方法本身,而对收集支持理论研究的相关数据缺乏热情。事实上,在第一批打分函数出现之后的十年内(上世纪90年代初至本世纪初),公开文献中报道的、可用的此类数据样本只有不足300个,而且不少样本存在这样那样的质量问题。所谓“巧妇难为无米之炊”,这种知识基础匮乏的状况在很大程度上制约了打分函数方法的良性发展。


为了解决这一问题,王任小课题组投入了极大的精力,构建并不断发展了PDBbind-CN数据库。该数据库致力于系统地分类整理Protein Data Bank(PDB)数据库中各类生物大分子形成的复合物(包括蛋白-小分子、核酸-小分子、蛋白-蛋白、蛋白-核酸复合物),并从文献中收集这些复合物的亲合性实验数据。他们逐步发展了一套程序流程,能够以比较高的准确率从整个PDB数据库中辨别出各种类型复合物,并人工查阅了大量原始文献来收集实验测定的亲合性数据,最终将复合物的三维结构信息以及相应的亲合性实验数据整合在一个可以通过Web访问的数据库中(图3)。PDBbind-CN数据库自2007年公开上线以来(点击查看详情),一直保持逐年更新,数据年增长幅度超过10%。最新发布的2016版中收录了超过16000种复合物的亲合性实验数据信息,数据量较最初版本相比已经增长了5倍有余。

图3、(左)PDBbind-CN数据库的部分Web界面;(右)自首次公开上线以来,PDBbind-CN数据库的规模一直在稳步增长。


PDBbind-CN数据库的出现,一举将打分函数研究可用的样本总量提升了一个数量级以上。在此基础上,王任小课题组针对打分函数研究的特殊需求,在PDBbind-CN数据库收录的大量样本中进行挑选以及深度加工,提供了高质量的样本子集。由王任小课题组编辑发布的这些数据集,无论是规模还是质量都比该领域中曾经存在的数据集有了极大的提升。一经公开发布,立即大受各路打分函数研究者的欢迎,在该领域中逐渐占据了统治地位。


在研究打分函数的过程中,王任小研究员还注意到了另外一个问题。如前文所述,目前已经存在大量打分函数,新的打分函数仍然在不断出现。对于广大打分函数用户而言,他们当然希望了解这些打分函数中哪些更加值得信赖;对于发展打分函数的研究人员而言,他们也希望洞察目前这些打分函数的优点以及缺点,明确未来的努力方向。但是以往每位研究人员在报道他们的打分函数时,常常采用不同的测试集以及测试方法,存在严重的“自说自话”现象。就像一项体育比赛,虽然竞争很激烈,场面很热闹,但是缺乏一套明确的竞赛规则,终究成不了气候。因此,打分函数研究领域中急需一个大家能普遍接受的方法体系(benchmark)来公平合理地评价各种打分函数的性能。


针对这个问题,王任小课题组逐渐发展了CASF(Comparative Assessment of Scoring Functions)方法体系。他们根据打分函数在实践中的典型应用方式,提出了衡量打分函数性能的四种基本指标(打分能力、排序能力、对接能力、筛选能力),并设计了定量的考察方法,从而使“打分函数的性能”这样比较模糊的一个概念得到具体化、清晰化。同时,他们首次采用了将打分过程(scoring process)与构象采样过程(sampling process)分开的处理方法,克服了传统做法中将打分函数整合在分子对接程序中进行测试所带来的弊病,从而确保对打分函数本身的性能做出准确评价。他们依据PDBbind-CN数据库挑选样本,构建了结构多样性强、去冗余的高质量测试集。采用这一整套方法体系,王任小课题组评测了目前流行分子模拟软件中的20余种打分函数,针对这些打分函数性能的各个层面提供了详细的信息,为用户提供了很有价值的参考。CASF方法体系于2009年首次公开发表,其后王任小课题组又对评价方法、测试集等方面进行持续的改进,迄今已经完成了两次主要的更新工作。


与前人的类似工作相比,CASF方法体系体现了比较先进的学术思想,明确了科学问题并且干净利索地提供了解决方案,逐渐得到了国内外同行的广泛认可。例如,关于CASF方法体系的工作最初投稿美国化学会出版的J. Chem. Inf. Model. 杂志时,论文评审人认为:“该项工作是到目前为止对打分函数评价最系统的工作...... 该工作建立的方法显然将成为其他工作所仿效的标准”。CASF方法体系的所有数据以及源代码均在PDBbind-CN数据库的网站上公开发布,方便其他研究人员采用CASF对各种打分函数进行评测。根据对文献的追踪调研,近年来国内外新报道的打分函数中已有超过半数应用了CASF评价方法体系。CASF方法体系已逐渐成为该领域中的主流方法,有效地减少了以往存在的“自说自话”的混乱局面,被国内外同行誉为“评价打分函数性能事实上的标准”。


以上介绍的建立PDBbind-CN数据库以及CASF方法体系这两项工作,解决了打分函数研究领域中存在的两个基础问题,在国内外同行间形成了极广泛的影响。能够取得这些学术成果,得益于敏锐的学术眼光以及长期坚持不懈的努力,两者缺一不可。由于这些贡献,打分函数研究整个领域开始呈现出加速健康发展的势头。近日,受美国化学会出版的Accounts of Chemical Research 杂志邀请,王任小研究员撰写文章重点介绍了这两方面的工作(Liu, Zhihai; Su, Minyi; Han, Li; Liu, Jie; Yang, Qifan; Li, Yan; Wang, Renxiao *, Forging the Basis for Developing Protein–Ligand Interaction Scoring Functions, Accounts of Chemical Research, 2017, 50 (2): pp 302-309, DOI: 10.1021/acs.accounts.6b00491)。


研究团队简介


王任小,博士,中国科学院上海有机化学研究所研究员,博士生导师。1989年入学北京大学化学与分子工程学院,1994年获理学学士学位,1999年获理学博士学位,物理化学专业,师从唐有祺院士。1999-2005年先后在美国加州大学洛杉矶分校化学系和美国密西根大学医学院从事博士后研究以及任助理研究员。2005年入选中国科学院“百人计划”,加入上海有机化学研究所工作至今。


该课题组主要从事分子靶向药物设计方面的研究,尤其擅长发展分子靶向药物设计中的新理论、新方法,代表工作有X-Score、AT&T、XLOGP等软件和PDBbind-CN数据库。这些成果自公开发布以来,在七十多个国家拥有6300余名注册用户,其中许多来自国际著名的大学、研究所以及大型医药公司,形成了广泛的国际影响。课题组亦注重在实践中应用分子靶向药物设计,近年来领导课题组综合运用分子设计、化学合成以及生物学研究手段,针对蛋白-蛋白相互作用等生物靶标开展工作,最终成功获得了多种类型的活性先导化合物。


已在Acc. Chem. Res., J. Chem. Inf. Model., J. Chem. Theor. Comput., J. Med. Chem., Bioinformatics 等学术刊物上发表论文110余篇,截止至2017年2月底发表论文合计被他引达5800余次,H指数为34。并以第一发明人身份获得国家发明专利授权和计算机软件著作权合计30多项。目前担任美国化学会旗下J. Chem. Inf. Model. 杂志副主编以及多家国内外杂志编委。近年来曾先后获得国际化学信息学学会Corwin Hansch Award,中国药学会-施维雅”青年药物化学家奖”,药明康德“生命化学研究奖”等知名奖项。2017年获得国家自然科学基金委“国家杰出青年科学基金”资助。


导师介绍

王任小

http://www.x-mol.com/university/faculty/15578

课题组主页

http://www.sioc-ccbg.ac.cn


如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOLx-mol.com ), 未经许可,谢绝转载!

阿拉丁
老年学Q1区期刊征稿进行中
FEMS Journals历年主题
分享您的投稿习惯
经济学SSCI期刊
英语语言编辑翻译加编辑新
加速出版服务新
1212购书送好礼
Springer旗下全新催化方向高质新刊
动物学生物学
系统生物学合成生物学
专注于基础生命科学与临床研究的交叉领域
传播分子、细胞和发育生物学领域的重大发现
聚焦分子细胞和生物体生物学
图书出版流程
快速找到合适的投稿机会
热点论文一站获取
定位全球科研英才
中国图象图形学学会合作刊
大连
德国
多伦多
西安科技
多伦多
新加坡
浙江大学
中科院
新加坡
澳门
ACS材料视界
down
wechat
bug