Lorsque les scientifiques ont annoncé l'achèvement du projet du génome humain il y a deux décennies, leur annonce était quelque peu prématurée. Il s'agissait sans aucun doute d'une réalisation importante : des chercheurs du monde entier ont eu accès à la séquence d'ADN de la plupart des gènes codant pour les protéines du génome humain.
Mais même après 20 ans de mises à jour, huit pour cent de notre génome restaient toujours non séquencés et inexplorés. Désignés par certains comme de l'ADN indésirable sans fonction claire, les quelque 151 millions de paires de bases de données de séquence dispersées dans le génome étaient toujours une boîte noire.
Aujourd'hui, une équipe internationale de scientifiques a découvert les derniers huit pour cent du génome humain. Ces fragments de notre génome contiennent plus que des déchets.
Les nouvelles données révèlent de mystérieuses régions d'ADN non codant qui ne produisent pas de protéines mais jouent toujours un rôle essentiel dans de nombreuses fonctions cellulaires et peuvent sous-tendre des conditions dans lesquelles la division cellulaire est hors de contrôle, comme le cancer.
Vous pourriez penser que si 92 % du génome est attendu depuis longtemps, 8 % supplémentaires ne feront pas beaucoup de différence », déclare Erich Jarvis, co-auteur de l'étude, qui a aidé à développer un certain nombre de méthodes essentielles pour déverrouiller le génome définitif. Mais à partir de ces huit pour cent manquants, nous acquérons maintenant une toute nouvelle compréhension de la façon dont les cellules se divisent, ce qui nous permet d'étudier un certain nombre de maladies que nous ne pouvions pas comprendre auparavant.
Le projet du génome humain nous a essentiellement donné les clés de l'euchromatine, une grande partie du génome humain qui est riche en gènes, emballée de manière lâche et occupée à fabriquer de l'ARN qui sera plus tard traduit en protéine. Ce qui est resté intact, cependant, était un labyrinthe d'hétérochromatine répétitive étroitement enroulée, la plus petite partie du génome qui ne produit pas de protéines.
Les scientifiques avaient de bonnes raisons pour la dépriorisation initiale de l'hétérochromatine. Les régions euchromatiques contenaient plus de gènes et étaient plus faciles à séquencer. Tout comme un puzzle de pièces séparées est plus facile à assembler qu'un puzzle de pièces identiques, les outils génomiques de l'époque ont découvert que l'ADN euchromatique était plus facile à analyser que son cousin hétérochromatique répétitif.
En conséquence, les généticiens se retrouvent avec une lacune importante dans leur connaissance de ce qui régit certaines fonctions cellulaires de base.
Toutes les séquences d'hétérochromatine au-delà des centromères qui se trouvent au niveau des nœuds des chromosomes et conduisent la division cellulaire ont été marquées par de longues séquences N pour une base inconnue dans le génome humain de référence.
Les séquences des bras courts des chromosomes 13, 14, 15, 21 et 22 ont également été omises. Même le génome euchromatique entier n'a pas été correctement séquencé, disent les scientifiques. Les erreurs telles que les faux doublons devaient être corrigées.
Puis, il y a une dizaine d'années, les scientifiques ont commencé à développer de nouvelles méthodes pour obtenir des séquences plus longues qui comblaient les lacunes des génomes humains et d'autres espèces.
L'une de ces initiatives est le Vertebrate Genomes Project, qui a récemment généré les premiers génomes de référence presque sans erreur et presque complets pour 25 animaux.
Cette étude faisait partie d'un effort international visant à développer de nouveaux outils pour créer des ensembles de gènes de la plus haute qualité », explique Erich Jarvis.
Par rapport aux méthodes utilisées il y a vingt ans, la génomique moderne offre des lectures longues très précises avec une précision de 99,9 %, de meilleurs outils d'assemblage du génome et des algorithmes plus puissants qui distinguent mieux les pièces de puzzle similaires les unes des autres.
Avec les outils mis à jour, les scientifiques ont pu aider à terminer ce que le projet du génome humain avait commencé et enfin décrire le génome humain vraiment complet - ses régions euchromatiques ont été corrigées et ses régions hétérochromatiques entièrement cartographiées.
C'est un gros problème », déclare Erich Jarvis. Chaque paire de bases du génome humain est maintenant complète.
L'étude a été publiée dans la revue Science.
2022-04-02 14:21:03
Auteur: Vitalii Babkin