基于多模态信息融合和图卷积网络的酶催化效率预测
摘 要:酶周转数kcat 是反映酶催化效率的重要指标,在蛋白质工程以及合成生物学等多个领域中都发挥着重要作用。然而,传统实验测量方法耗时长且成本高昂。此外,即使在底物和酶完全一致的情况下,微小的实验条件差异也能导致测量结果出现波动。本文提出酶催化效率预测模型,通过整合化合物分子图、SMILES 序列、蛋白质序列、蛋白质分子3D 结构以及反应温度进行深度跨模态特征学习,实现对kcat 值的精确预测。该模型使用了图卷积网络,从化合物分子图和蛋白质分子3D 结构中提取特征。利用Prot_Bert 和SMILES Transformer 两个预训练模型,对蛋白质和化合物进行深层特征提取,进一步提升模型的多模态数据处理能力和kcat值预测精度。
论文下载: