Les séquences d'acides aminés, lorsqu'elles sont combinées les unes avec les autres, se replient en centaines de millions de formes protéiques bizarres, impossibles à prévoir - uniquement à étudier en laboratoire. Des progrès ont été soulignés avec l'avènement des technologies d'IA en biologie, et maintenant une percée est en préparation - la structure de DeepMind de Google promet de présenter bientôt la forme de toutes les protéines connues de la science, ce qui multipliera la recherche de nouveaux médicaments et conduira à d'autres découvertes en biologie.
DeepMind n'a pas encore pu quitter Google, mais promet de créer une base de données ouverte de toutes les formes de protéines prédites. Cela se produira dans quelques mois et promet d'être l'événement le plus ambitieux de l'histoire de la biologie. Des programmes de prédiction de forme de protéines sont développés par de nombreuses entreprises et équipes de recherche, mais le package AlphaFold DeepMind a montré la plus grande précision dans la prédiction de forme. Ces outils sont dans le domaine public, et une base de données de protéines prête à l'emploi facilitera grandement le travail des biologistes du monde entier - prenez-la et utilisez-la.
AlphaFold peut prédire la forme des protéines avec une précision atomique. Mais encore moins de précision permet le développement de nouveaux médicaments, fournissant des informations sur la configuration spatiale approximative de protéines auparavant non étudiées. Ainsi, si au cours des 10 dernières années les biologistes ont pu étudier la structure de seulement 17% des protéines humaines, alors AlphaFold a doublé en quelques semaines la base des formes de protéines humaines à 36%. Cette information n'a pas encore été vérifiée, mais l'algorithme AlphaFold a déjà prouvé sa capacité à être presque faux auparavant.
En plus des protéines humaines, DeepMind promet de présenter les formes protéiques de 20 des organismes les plus étudiés, de la levure aux mouches des fruits, souris et autres - jusqu'à des centaines de millions de formes protéiques. Aujourd'hui, la base de données DeepMind contient des informations sur 350 000 formes de protéines prédites, mais dans quelques mois, elle sera étendue à plus de 100 millions de formes, où se trouveront presque toutes les protéines plus ou moins connues de la science. Les protéines qui prennent une forme spatiale lorsqu'elles sont combinées avec d'autres protéines ne se sont pas encore prêtées à l'étude, mais ce sera la prochaine noix pour l'IA.
2021-07-23 18:31:10
Auteur: Vitalii Babkin