Il y a un an, DeepMind a fait sensation en annonçant sa capacité à résoudre le principal mystère de la biologie - prédire la structure de n'importe quelle protéine. Dans le même temps, DeepMind a créé une base de données ouverte contenant des données sur 350 000 protéines, dont la forme a été prédite par le package AlphaFold. Aujourd'hui, la société a annoncé la découverte des formes de presque toutes les protéines connues de la science terrestre - plus de 200 millions de protéines de toutes les sphères de la vie connues sur Terre. C'est une véritable révolution en biologie.
Les protéines sont des séquences d'acides aminés. Selon les combinaisons d'acides aminés, les protéines se replient dans des formes spatiales très bizarres. Ces formes déterminent l'interaction des protéines entre elles et, in fine, régulent les processus biologiques dans les organismes vivants : elles interagissent si les formes correspondent comme une clé s'adapte à une serrure, et restent indifférentes si les formes n'ont pas de structures spatiales compatibles.
Connaître la forme spatiale d'une protéine peut aider à trouver le remède parfait contre les maladies et faire de nombreuses autres découvertes en biologie. Avant l'avènement des algorithmes d'IA, les scientifiques déterminaient expérimentalement la forme des protéines, ce qui est très, très difficile et prend du temps. L'algorithme proposé par DeepMind détermine la forme spatiale d'une protéine de 10 à 20 secondes. Grâce à cela, la société a pu faire passer la base de données des formes spatiales de protéines de 350 000 à plus de 200 millions en un an.
Il convient de préciser que prédire la forme d'une protéine ne signifie pas être précis à 100 %. Cependant, AlphaFold a montré une précision significative dans la détermination des formes, ce qui est suffisant pour commencer. Tout le travail de routine était effectué par un ordinateur, et il a fallu à tous les scientifiques du monde avant cela 50 ans pour démêler environ 10 % seulement des structures protéiques.
Environ un demi-million de scientifiques du monde entier ont déjà utilisé la base de données ouverte sur les protéines, a noté la société. La divulgation de la base de données complète sur les protéines activera ce processus plusieurs fois et conduira dans un avenir prévisible à des découvertes étonnantes en biologie.
2022-07-30 13:21:28
Auteur: Vitalii Babkin