L'année dernière, DeepMind a présenté une solution convaincante à un problème scientifique vieux de 50 ans, démontrant comment son intelligence artificielle AlphaFold peut prédire les structures tridimensionnelles de protéines uniques, ouvrant la voie à une nouvelle ère de découvertes biologiques.
La société a continué à construire ces fondations, partageant désormais les structures prévues pour presque toutes les protéines du corps humain, accélérant la recherche sur tout, de la résistance aux antibiotiques aux traitements contre le cancer et plus encore.
Connaître les formes complexes de diverses protéines individuelles peut aider les scientifiques à comprendre ce qu'elles font et comment elles peuvent être gérées de manière bénéfique, par exemple, avec des médicaments qui combattent les maladies humaines.
Mais toutes les protéines commencent par des chaînes unidimensionnelles d'acides aminés qui se replient en une série presque infinie de structures tridimensionnelles très complexes. L'utilisation de ces chaînes d'acides aminés pour prédire à quoi ressemblera la structure finale est connue sous le nom de « problème de repliement des protéines », et c'est l'un des problèmes auxquels les scientifiques sont confrontés depuis le début des années 1970.
AlphaFold de DeepMind a été conçu pour résoudre ce problème avec la puissance de l'informatique moderne. Le système tire des enseignements des structures protéiques accessibles au public qui ont déjà été identifiées grâce à des expériences scientifiques, et a démontré l'année dernière comment il peut être utilisé pour identifier les structures protéiques sur lesquelles les scientifiques travaillent depuis de nombreuses années.
Décrit comme « étonnamment précis », « changeur de jeu » et « des progrès écrasants », AlphaFold est considéré comme une solution à un problème de repliement des protéines vieux de 50 ans qui annonce un nouveau chapitre de la recherche biologique.
Cela pourrait aider les scientifiques à identifier les protéines défaillantes et les raisons pour lesquelles elles provoquent certaines maladies beaucoup plus rapidement, ou accélérer considérablement le développement de médicaments pour les traiter. Des enzymes pour décomposer les déchets plastiques pourraient être développées plus rapidement et de nouveaux virus pourraient être combattus plus efficacement, par exemple en cartographiant les structures des protéines de pointe.
En moins d'un an, on voit déjà cette technologie commencer à changer le monde de la recherche scientifique. La semaine dernière, un groupe distinct de chercheurs de l'Université de Washington a fait la démonstration d'un logiciel de type AlphaFold appelé RoseTTAFold. Il peut prédire les structures des protéines en aussi peu que 10 minutes à l'aide d'un ordinateur conventionnel et est disponible en ligne gratuitement.
L'équipe DeepMind travaille également à rendre leur outil plus accessible. La semaine dernière, elle a publié un document détaillant le développement du système et publié le code source sur GitHub. DeepMind a publié hier son catalogue de prédictions pour presque toutes les protéines du corps humain, connu sous le nom de protéome humain (la collection de toutes les protéines).
Le catalogue représente 98,5% des protéines humaines, environ 20 000 au total. De plus, DeepMind a fourni un accès ouvert aux protéomes de 20 autres organismes d'intérêt, notamment la mouche des fruits, la souris, la levure et E. coli, pour un total de plus de 350 000 structures protéiques.
DeepMind prévoit d'étendre considérablement cette collection dans les mois à venir pour inclure plus de 100 millions de protéines connues de la science, ce qui mènera à ce que DeepMind appelle "le véritable almanach des protéines du monde".
"Ce sera l'un des ensembles de données les plus importants depuis la cartographie du génome humain", a déclaré le professeur Evan Birney, directeur général adjoint du Laboratoire européen de biologie moléculaire.
Un article décrivant les prédictions du protéome humain a été publié dans Nature, et la vidéo ci-dessous offre une courte démonstration de la base de données sur la structure des protéines.
2021-07-27 05:10:18
Auteur: Vitalii Babkin