CASP15全新赛道冠军,普美瑞生物复合物结构预测加快PROTAC管线推进

CriticalAssessmentofStructurePrediction(CASP)是国际著名的蛋白质结构计算机预测比赛 , 该竞赛自1994年起每两年举办一次 , 旨在确定和推进从氨基酸序列建模蛋白质结构的最新技术水平 , 是行业内最权威的世界竞赛之一 。
2020年 , 由DeepMind推出的AlphaFold2系统在CASP14大赛中一鸣惊人 , 该系统通过蛋白质一级序列完成了蛋白质三维结构的预测 , 并在精度上与实验解析精度基本达到一致 , 引发了全球制药行业与投资界对深度学习算法在药物研发领域的极大关注 。
2022年12月20日 , 最新一届CASP15比赛结果公布 , 普美瑞(常州)生物科技有限公司(以下简称:普美瑞生物)首席科学家常珊教授团队(CoDock)获今年新增的蛋白/RNA-配体复合物结构预测(Ligand)赛道第一名的好成绩 。
CASP15全新赛道冠军,普美瑞生物复合物结构预测加快PROTAC管线推进
文章图片
CASP15蛋白质-配体组排名
(图片来自:CASP15官方公布)
在本届比赛中 , 原有“Refinement”、“Assistantprediction”赛道被取消 , 新增“RNA”即RNA结构预测 , 以及“Ligand”即蛋白/RNA-配体复合物结构预测赛道 。 从比赛的变化可以看出 , 在后AlphaFold2时代 , 蛋白质单体结构预测问题已基本被解决 , 当前问题则转移到“如何更好地预测蛋白/RNA-配体复合物结构”以及“工业界前沿研发热点的核酸结构预测”等方面 。
CASP15全新赛道冠军,普美瑞生物复合物结构预测加快PROTAC管线推进
文章图片
H1114晶体结构及CoDock预测结构比较
(图片由普美瑞生物提供)
连续三届CASP获组别第一 , 三位跨领域创始人深度学科融合
普美瑞生物成立于2020年6月 , 由来自计算数学、计算化学与基础医学完全不同科研背景的3位科学家创立 。 三位创始人于2015年开始在江苏理工学院生物信息医药工程研究所共事 , 通过深度的学科融合推进算法开发 , 期间成功完成了不少项目研究 。
2018年 , 该团队在CASP13-CAPRI蛋白质复合物结构预测赛道中获得了困难类型复合物排名第1 , 全类复合物排名第8的成绩 。 2020年 , 该团队又在CASP14-CAPRI中获得了蛋白质复合物结构打分组排名第1 , 预测组排名第3的成绩 。 连续多年的第三方权威竞赛结果 , 说明了团队的蛋白质复合物结构预测能力处于国际领先水平 。
三位创始人在各自研究领域沉淀了数十年 , 始终坚信AI技术的深度学习能力能够为创新药研发带来变革 。 但这一变革会何时到来?具体能够带来怎样的影响与变化?三位认为 , 还是需要身体力行地实践 。
算法技术驱动以加速创新药研发进程的普美瑞生物 , 由此诞生 。
后AlphaFold2时代 ,
复合物结构预测或为刚需
就创新药研发来说 , 前端的靶标发现与验证有众多学术团队不断进行研究探索 , 后端的IND申报与临床试验是受法规监管的标准化流程 。 因此 , 在中间阶段 , 如何快速得到PCC , 显得尤为关键 。
但当大部分靶点结构已经可以用AlphaFold2和RossetaFold准确地预测时 , 如何快速获得PCC?
把药物分子视作一种配体 , 通过与靶点蛋白发生结合进而影响其生物学功能 , 从而发挥药效 。 因此 , 阐明蛋白质与配体的复合物结合模式 , 给出相互作用细节 , 对于药物研发具有十分重要的意义 。
基于此 , 普美瑞生物聚焦靶标-配体相互作用的精准预测 , 自主研发了核心算法CoDock , 采用模板搜索的方式 , 发展了结构相似性比对法 。 该算法采用图论中的最大全连接子图搜索 , 找到准确的模板 , 并在模板基础上进行3D-CNN法的深度学习 , 对复合物界面的结构特征进行提取 , 再通过网络打分的形式挑选出最终的近天然复合物结构 。