Au cours de milliards d'années d'évolution de la vie biologique sur Terre, un mécanisme d'enregistrement a été développé dans les organismes vivants pour transférer l'information génétique d'une génération à l'autre. Il s'agit de la formation de brins d'ADN sous forme de paires alternées de combinaisons de quatre bases azotées : adénine (A), guanine (G), cytosine (C) et thymine (T). Quatre unités de codage valent mieux que deux (0 et 1), mais ce n'est pas la limite, ont déclaré les scientifiques et ont synthétisé sept autres composés organiques.
L'extension de «l'alphabet» pour coder les données dans l'ADN de 4 à 11 caractères doublera au moins la capacité déjà incroyable de ces méthodes de stockage d'informations. Cette approche, soit dit en passant, augmentera également la vitesse d'enregistrement des données dans la séquence d'ADN, qui est aujourd'hui considérée comme un frein sérieux aux travaux dans ce sens. Il faut aussi comprendre que les méthodes actuelles de séquençage de l'ADN ne pourront pas détecter les bases azotées synthétisées. Leur lecture nécessite de nouveaux outils et réactions. Mais ce sont tous des problèmes solubles, affirment des chercheurs de l'Université de l'Illinois à Urban-Champaign.
Pour déchiffrer l'ADN, le brin d'ADN passe à travers un nanopore dans une protéine spécialement conçue qui peut détecter des bases azotées individuelles, qu'elles soient naturelles ou synthétiques. Les algorithmes d'apprentissage automatique décodent ensuite les informations stockées à l'intérieur. Oui, on ne peut pas se passer de l'IA en la matière, tant les processus d'encodage et de déchiffrement sont complexes. À l'avenir, à mesure que la technologie progressera, les choses seront beaucoup plus faciles.
Aujourd'hui, compte tenu de l'utilisation de seulement quatre bases azotées de base pour le codage des données, jusqu'à 215 Po de données peuvent être stockées dans un gramme d'ADN. Onze bases doubleront cette densité, et ce n'est pas la limite.
"Nous avons essayé 77 combinaisons différentes de 11 bases azotées, et notre méthode a pu parfaitement distinguer chacune d'entre elles", explique Chao Pan, co-auteur de l'étude. "Le mécanisme d'apprentissage en profondeur utilisé dans notre méthode pour identifier divers nucléotides est polyvalent, ce qui nous permet d'étendre notre approche à de nombreuses autres applications."
2022-03-05 10:20:41
Auteur: Vitalii Babkin