Nel corso di miliardi di anni di evoluzione della vita biologica sulla Terra, negli organismi viventi è stato sviluppato un meccanismo di registrazione per trasferire le informazioni genetiche da una generazione all'altra. Questa è la formazione di filamenti di DNA sotto forma di coppie alternate di combinazioni di quattro basi azotate: adenina (A), guanina (G), citosina (C) e timina (T). Quattro unità di codifica sono meglio di due (0 e 1), ma questo non è il limite, hanno detto gli scienziati e hanno sintetizzato altri sette composti organici.
Espandere l'"alfabeto" per codificare i dati nel DNA da 4 a 11 caratteri raddoppierà almeno la già incredibile capacità di tali metodi di archiviazione delle informazioni. Questo approccio, tra l'altro, aumenterà anche la velocità di registrazione dei dati nella sequenza del DNA, che oggi è considerata un serio freno al lavoro in questa direzione. È inoltre necessario comprendere che gli attuali metodi di sequenziamento del DNA non saranno in grado di rilevare le basi azotate sintetizzate. Leggerli richiede nuovi strumenti e reazioni. Ma questi sono tutti problemi risolvibili, affermano i ricercatori dell'Università dell'Illinois a Urban-Champaign.
Per decifrare il DNA, il filamento di DNA passa attraverso un nanoporo in una proteina appositamente progettata in grado di rilevare singole basi azotate, siano esse naturali o sintetiche. Gli algoritmi di machine learning quindi decodificano le informazioni memorizzate all'interno. Sì, non si può fare a meno dell'IA in questa materia, i processi di codifica e decrittazione sono così complessi. In futuro, con l'avanzare della tecnologia, le cose saranno molto più semplici.
Oggi, tenendo conto dell'uso di sole quattro basi azotate di base per la codifica dei dati, è possibile memorizzare fino a 215 PB di dati in un grammo di DNA. Undici basi raddoppieranno questa densità e questo non è il limite.
"Abbiamo provato 77 diverse combinazioni di 11 basi azotate e il nostro metodo è stato in grado di distinguerle perfettamente", ha affermato Chao Pan, coautore dello studio. "Il meccanismo di deep learning utilizzato nel nostro metodo per identificare vari nucleotidi è versatile, il che ci consente di estendere il nostro approccio a molte altre applicazioni".
2022-03-05 10:20:41
Autore: Vitalii Babkin