Di circa 20.000 geni, solo il 2% circa dell’intero genoma codifica funzioni note. Da decenni gli scienziati cercano di scoprire a cosa serve il restante 98%.
di Lisa Ovi
Un consorzio di ricerca noto come ENCODE (Encyclopedia of DNA Elements) ha identificato molte posizioni del genoma connesse alle proteine regolatrici, responsabili dell’attivazione e disattivazione dei geni. In collaborazione con ricercatori del MIT ed altri istituti, il gruppo di studio ha ora individuato altri siti che codificano molecole di RNA legate all’espressione genica. I risultati dello studio sono stati pubblicati dalla rivista Nature.
Le sequenze di RNA individuate non portano alla produzione diretta di proteine, ma controllano la quantità di proteine prodotta dai geni che le codificano. I ricercatori hanno utilizzato le proteine RNA-binding per individuare e assegnare possibili funzioni a decine di migliaia di sequenze del genoma.
Finora gran parte del progetto ENCODE aveva rilevato le sequenze regolatorie del DNA utilizzando una tecnica chiamata ChIP-seq. Questa tecnica consente ai ricercatori di determinare le funzioni di una data sequenza di DNA identificando i fattori di trascrizioni ad essa correlati. La tecnica, però, non permetteva di rilevare gli elementi genomici che devono essere copiati nell’RNA prima di essere coinvolti nella regolazione genica.
La nuova squadra ha invece utilizzato una tecnica chiamata eCLIP, che utilizza la luce ultravioletta per mettere in correlazione le molecole di RNA con le proteine RNA-binding (RBP) all’interno delle cellule. Utilizzando anticorpi, i ricercatori isolano quindi specifici RBP e sequenziano i segmenti di RNA ad essi correlati.
I ricercatori hanno eseguito eCLIP su circa 150 RBP per poi integrare i nuovi risultati con i dati raccolti in un’altra serie di esperimenti condotta su circa 260 RBP. Utilizzando una tecnica sviluppata dal laboratorio di Christopher Burge, professore di biologia al MIT e uno degli autori senior dello studio, i ricercatori sono stati anche in grado di localizzare più precisamente dove gli RBP si legano all’RNA. Questa tecnica, nota come RNA Bind-N-Seq, rivela sequenze molto brevi, a volte contenenti motivi strutturali come rigonfiamenti o forcine, a cui si legano gli RBP.
Il gruppo di Eric Lecuyer, presso l’Università di Montreal, ha invece utilizzato una proteina fluorescente verde per contrassegnare più di 300 RBP e individuare le loro posizioni all’interno delle cellule, come il nucleo, il citoplasma o i mitocondri. Queste informazioni sulla posizione possono favorire l’esplorazione delle funzioni di ogni RBP e dell’RNA a cui si legano.
Molti laboratori di ricerca in tutto il mondo stanno ora utilizzando questi dati nel tentativo di scoprire i collegamenti tra alcune delle sequenze di RNA identificate e le malattie umane. Per molte malattie, i ricercatori hanno identificato varianti genetiche chiamate polimorfismi a singolo nucleotide (SNP) che sono più comuni nelle persone con una particolare malattia.
Immagine: Wikimedia Commons
(lo)