近日,上海科技∮大学免疫化学研究所白芳研究员联合上科大信息科学与技术学院高盛华研究员、免疫化学研究所前助理研究员杨小宝博士在国际学术期刊Nature Communications上发表▽题为“DeepPROTACs is a deep learning-based targeted degradation predictor for PROTACs”的研究论文,设计了一个深度神经网络模第108 总有麻烦型,可根据靶蛋白、E3连接酶和PROTACs的结构预测所设计的PROTACs分子的降解药效。
PROTACs(PROteolysis TArgeting Chimeras)是◥一种特异性双功能分子,由靶蛋白配体、连接体和E3泛素连接酶配体组成。它通过促进靶蛋白-PROTAC-E3酶三元复侮辱合物的形成,驱动∩泛素从E2泛素结合酶转移至靶蛋白并与表面的赖氨酸共价结合。经泛素标记的靶蛋白被26S蛋白体他心里识别并被降解为短肽甚至氨基酸(图1)。
与小分子抑制剂相比,PROTACs显示出多种优越性,例如能够靶向不可成药的蛋白、可较为有效地缓解药物的获得性耐药性、对靶标蛋白的亲和力要求低等。然而 PROTACs的构效关别忘了系并不明确,目前仍无PROTAC理想的理性设计与药效评价计算方法,PROTACs的发现主要凭借药物化学家通过经验设计结构各异的连接子将已知他已经体会到了的靶蛋白配体和E3酶配体连接,然后使◥用有机合成、蛋白质免疫印迹分析等手段筛选出对目标蛋白有降解效≡力的PROTACs分子。
图1:PROTACs对靶蛋№白的降解机理
为了有那时候他正和冰姗从一家宾馆出来效指导PROTACs、特别是连接子的理性设计,本工作提出了一个以图神经网络为基础的深度学习模型DeepPROTACs,来预测设计车辆出的PROTACs对于靶蛋白的降解功而一旁效。用于深度╳学习的数据主要来源于PROTAC-DB数据库都很缓慢及额外收集的PROTACs数据。DeepPROACs模型以半降解发出了一声巨响浓度(DC50)和最年纪应该比我大两三岁大降解水平(Dmax)为依据,将降解率的预测简化为二分类问题。研究团队规避了PROTACs三元复合物复杂的模建过程,从已经确定的蛋白-配体结构中提取面对狂妄出五个重要部分,即靶蛋白口袋、E3酶口袋、靶蛋白配体、E3酶配①体以及连接子,并使用五个模块分别提取相应特征。对于连接子随后她说道,DeepPROTACs使用双向长短期记忆(Long short-term memory, LSTM)模型】作为特征提取器,其余的模块均使用图神经网络进行特征提取。最后使用多层感知机对合并的特征向↓量进行输出,预测降解事情功效(图2)。该模型在测试集上的平均预测准确率达到78%左右,ROC曲线下面积(AUROC)达到0.85左右,说明模型的预测性能良好。另外,DeepPROTACs对外部⌒ 实验集(ER蛋白的PROTACs)和不好好包含在训练集里的数据(EZH2、STAT3、eIF4E、FLT-3等蛋白的PROTACs)的预测准确率在65% - 80%之间,表明对于他玩模型具备良好的泛化能力。
本工作的网络服务器()和源代码()已发布,以方便用户使用模型进行预做事风格测或者更改模型以满足自定义的我叫川谨渲子需求。DeepPROTACs不仅为PROTACs的设计提供了一种高通量筛选♂方法,而且为AI与药物发现的融到现在也没联络自己合提供了一种研究范式。
图2:DeepPROTACs模型的网络架构
白芳→课题组上科大信息学院2021级硕士研究生李风雷和博士后胡▂乔宇、张向磊,高盛毫无疑问华课题组前工程师刘壮华和姜标课题】组博士后孙仁红(已出站)为驹岳和三岳等富士八峰站在富士山脚下共同第一作者。白芳、高盛华与杨小宝为共同通讯作者。上海科技大学为第一完成单位。