联合人工智能模型增强蛋白质定位预测

杰西·埃利斯
2025 年 10 月 8 日 19:10

NVIDIA 的联合 AI 模型使用 FLARE 和 BioNeMo，改进了蛋白质定位预测，这对于生物学和药物发现至关重要，同时维护了数据隐私。

Holger Roth 详细介绍了一种使用联合 AI 模型预测蛋白质特性的方法，这是生物学和药物发现领域的一项重大进步。该方法利用 NVIDIA FLARE 和 BioNeMo Framework 来预测蛋白质的亚细胞定位，这是了解细胞过程和识别治疗靶点的关键因素。

联邦学习方法

联邦学习允许研究人员协作训练人工智能模型，而无需在机构之间传输敏感数据。 NVIDIA FLARE 教程演示了如何微调 ESM-2nv 模型以根据蛋白质的亚细胞定位对蛋白质进行分类。该模型利用蛋白质序列的嵌入，从数据集中提取数据，例如“光注意力根据生命语言预测蛋白质位置”研究中的数据集。

使用的数据遵循生物训练器标准，格式为 FASTA 文件，包括序列、训练/验证分割以及十个位置类别之一，例如细胞核或细胞膜。此设置提出了现实世界的分类挑战，非常适合联合学习应用程序。

利用 Docker 中的 BioNeMo 框架，研究人员可以在 Jupyter Lab 环境中运行联合蛋白质特性预测教程。 NVIDIA FLARE 通过启用本地训练并仅共享模型更新来促进联合训练，从而确保隐私。 FedAvg 方法聚合这些更新以形成全局模型。

该团队对 ESM-2nv 模型进行了微调，平衡了预测准确性和计算效率。关键步骤包括数据分割、联合平均和使用 TensorBoard 进行可视化。此设置允许实时监控本地和联合训练。

结果表明，联合训练优于本地模型，将站点间的平均准确率从 78.8% 提高到 81.7%。这证明了联邦学习通过利用多个机构的数据来提高模型性能的有效性。

BioNeMo 和 FLARE 的集成提供了蛋白质本地化之外的多种好处，因为它支持科学界的人工智能发展，同时维护数据隐私。这种方法促进了协作，使每个站点都能为更强大的模型做出贡献。

凭借这些进步，NVIDIA 将自己置于生命科学领域协作 AI 的前沿。该领域 AI 的未来是协作性的，NVIDIA FLARE 和 BioNeMo 提供的工具正在为医疗保健和生物技术领域的新发现铺平道路。

欲了解更多详情，请访问 NVIDIA 官方博客。

图片来源：Shutterstock

关键词：人工智能,加密,区块链,新闻