L’année 2021 a été marquée par la formidable concrétisation de la prédiction des structures tridimensionnelles des protéines à partir de leurs séquences en acides aminés grâce à AlphaFold 2 [1] et RoseTTAFold [2], des systèmes d’intelligence artificielle (IA) fondés sur l’apprentissage profond par réseaux de neurones. L’IA a d’ailleurs marqué la toute récente édition 2024 des prix Nobel avec les prix Nobel de physique et de chimie décernés respectivement pour le développement de l’apprentissage profond et son application dans la prédiction des structures des protéines. Cette innovation est un considérable accélérateur de recherche et un remarquable générateur d’hypothèses. Elle transcende les méthodes traditionnelles comme la cristallographie aux rayons X et la cryo-microscopie électronique, en fournissant des modèles structuraux précis qui guident et complètent l’interprétation des données expérimentales [3]. Les prédictions se font à une échelle inédite, avec plus de 200 millions de modèles disponibles dans la base de données AlphaFold hébergée par l’Institut européen de bio-informatique (EBI) de l’EMBL (European molecular biology laboratory) [4]. Bien que très performante, l’IA d’AlphaFold 2 a de nombreuses limitations comme l’impossibilité de prendre en compte les modifications post-traductionnelles (PTM), les ions, les ligands, l’ADN et l’ARN [5]. La nouvelle version, AlphaFold 3, publiée en mai 2024 [6], ainsi que son alter ego RoseTTAFold All-Atom [7], comblent en partie les lacunes d’AlphaFold 2 et de RoseTTAFold.
Open Access | Published October 25, 2024 | DOI: https://doi.org/10.1051/medsci/2024124