Quando gli scienziati hanno annunciato il completamento del Progetto Genoma Umano due decenni fa, il loro annuncio era alquanto prematuro. Indubbiamente, questo è stato un risultato importante: ricercatori di tutto il mondo hanno ottenuto l'accesso alla sequenza del DNA della maggior parte dei geni codificanti le proteine nel genoma umano.
Ma anche dopo 20 anni di aggiornamenti, l'8% del nostro genoma è rimasto ancora non sequenziato e inesplorato. Definito da alcuni come DNA spazzatura senza una chiara funzione, i circa 151 milioni di paia di basi di dati di sequenza sparsi nel genoma erano ancora una scatola nera.
Ora un team internazionale di scienziati ha scoperto l'ultimo otto per cento del genoma umano. Questi frammenti del nostro genoma contengono più della semplice spazzatura.
I nuovi dati rivelano regioni misteriose di DNA non codificante che non producono proteine ma svolgono ancora un ruolo fondamentale in molte funzioni cellulari e possono essere alla base di condizioni in cui la divisione cellulare è fuori controllo, come il cancro.
Si potrebbe pensare che se il 92% del genoma è atteso da tempo, un altro 8% non farà molta differenza", afferma Erich Jarvis, coautore dello studio, che ha contribuito a sviluppare una serie di metodi che sono fondamentali per sbloccare il genoma finale. Ma da quell'otto percento mancante, stiamo ora acquisendo una comprensione completamente nuova di come le cellule si dividono, permettendoci di studiare una serie di malattie che prima non potevamo capire.
Il Progetto Genoma Umano essenzialmente ci ha fornito le chiavi dell'eucromatina, una grande parte del genoma umano che è ricca di geni, confezionata in modo approssimativo e impegnata a produrre RNA che sarà poi tradotto in proteine. Ciò che è rimasto intatto, tuttavia, era un labirinto di eterocromatina strettamente arrotolata e ripetitiva, la porzione più piccola del genoma che non produce proteine.
Gli scienziati avevano buone ragioni per la depriorizzazione iniziale dell'eterocromatina. Le regioni eucromatiche contenevano più geni ed erano più facili da sequenziare. Proprio come un puzzle di pezzi separati è più facile da mettere insieme di un puzzle di pezzi identici, gli strumenti genomici dell'epoca hanno scoperto che il DNA eucromatico era più facile da analizzare rispetto al suo cugino eterocromatico ripetitivo.
Di conseguenza, i genetisti hanno un divario significativo nella loro conoscenza di ciò che governa alcune funzioni cellulari di base.
Tutte le sequenze di eterocromatina oltre i centromeri che si trovano ai nodi dei cromosomi e conducono la divisione cellulare sono state contrassegnate con lunghe sequenze N per una base sconosciuta nel genoma umano di riferimento.
Sono state omesse anche le sequenze dei bracci corti dei cromosomi 13, 14, 15, 21 e 22. Nemmeno l'intero genoma eucromatico è stato sequenziato correttamente, affermano gli scienziati. Errori come falsi duplicati dovevano essere corretti.
Quindi, circa un decennio fa, gli scienziati hanno iniziato a sviluppare nuovi metodi per ottenere sequenze più lunghe che riempissero le lacune nei genomi degli esseri umani e di altre specie.
Una di queste iniziative è il Vertebrate Genomes Project, che ha recentemente generato i primi genomi di riferimento quasi privi di errori e quasi completi per 25 animali.
Questo studio faceva parte di uno sforzo internazionale per sviluppare nuovi strumenti per creare set genetici della massima qualità", afferma Erich Jarvis.
Rispetto ai metodi utilizzati vent'anni fa, la genomica moderna offre letture lunghe altamente accurate con un'accuratezza del 99,9%, migliori strumenti di assemblaggio del genoma e algoritmi più potenti che distinguono meglio pezzi di puzzle simili l'uno dall'altro.
Con gli strumenti aggiornati, gli scienziati sono stati in grado di aiutare a completare ciò che il progetto sul genoma umano aveva iniziato e infine descrivere il genoma umano veramente completo: le sue regioni eucromatiche sono state corrette e le sue regioni eterocromatiche completamente mappate.
È un grosso problema”, afferma Erich Jarvis. Ogni coppia di basi del genoma umano è ora completa.
Lo studio è stato pubblicato sulla rivista Science.
2022-04-02 14:21:03
Autore: Vitalii Babkin