DNA e RNA
Gli acidi nucleici che contengono ed esprimono l'informazione genetica
Ogni essere vivente è fatto in un determinato modo ed è capace di molte funzioni (riproduzione, crescita, movimento e altre ancora) perché ha ricevuto dai suoi genitori una lunga molecola di DNA contenente tutte le informazioni necessarie e, mediante l'uso di molecole di RNA, può attuare quelle informazioni. DNA e RNA sono acidi nucleici, molecole complesse che si trovano nelle cellule. Le proprietà chimiche con cui è scritta l'informazione del DNA fanno sì che questo possa essere copiato in un'altra molecola identica, essere trascritto in una molecola di RNA ed essere quindi interpretato per produrre le proteine necessarie alle funzioni della vita
L'informazione genetica. In ogni famiglia c'è qualcuno ‒ uno o entrambi i genitori ‒ che sa fare una torta così buona che tutti ne vanno pazzi. Per essere certi di farla bene, la ricetta viene scritta su un cartoncino e poi conservata in un cassetto. Quando si invitano gli amici e si decide di preparare quella torta, il cartoncino viene ripreso, la ricetta copiata su un foglietto che viene posato sul tavolo della cucina (dove potrebbe rovinarsi, ma non importa: la ricetta vera è al sicuro) e si eseguono le istruzioni. Succede che quella torta piaccia molto agli amici, che chiedono una copia della ricetta. Allora la ricetta viene copiata su un altro cartoncino e data all'amico, che preparerà a sua volta la torta. Ricordiamo questa storia della ricetta, perché servirà per capire meglio cosa sono e come funzionano DNA e RNA.
Anche gli organismi viventi vengono fatti secondo una raccolta di ricette, chiamata informazione genetica, che invece di essere annotata su un cartoncino è scritta in una lunga molecola chiamata DNA. Come le ricette, anche l'informazione genetica contiene istruzioni che servono a preparare un organismo, nel corso del suo sviluppo da embrione a individuo adulto. Come la torta è fatta di tanti ingredienti (crema, pasta frolla, ciliegine, cioccolato) che la rendono squisita, così un organismo vivente è fatto di tanti ingredienti diversi ‒ acqua, sali, zuccheri, grassi e proteine ‒ che lo fanno vivere.
Gli ingredienti della cellula. Le proteine sono molecole di grandi dimensioni incaricate di costruire le strutture e svolgere tutte le funzioni dell'organismo. Il DNA contiene il programma per costruire le diverse proteine necessarie a realizzare il progetto di ogni essere vivente. Il programma per costruire una singola proteina si chiama gene ed è un pezzetto di DNA. Ogni individuo riceve dai genitori la sua informazione genetica scritta in una lunga molecola di DNA contenente i geni capaci di programmare le molte proteine di cui ha bisogno per crescere, vivere a lungo e avere a sua volta figli. Quel DNA, come le ricette delle torte, può dar luogo a un organismo che funziona bene, che quindi riprodurrà molte copie di sé stesso facendo nascere altri organismi somiglianti a quello d'origine.
Cosa ha a che fare l'RNA in tutto questo? Anche questa è una molecola che contiene informazione genetica, ma in una forma meno 'resistente'. Se il DNA equivale al cartoncino, resistente e conservato al sicuro, l'RNA equivale al foglietto, che viene copiato dal DNA e utilizzato per leggere l'informazione e fabbricare le proteine. Come il foglietto sul tavolo da cucina, l'RNA può anche rovinarsi senza problemi, basta che duri per il tempo necessario a costruire una proteina-torta.
Per capire come le molecole di DNA e RNA possano contenere un'informazione genetica ed essere ricopiate e lette per preparare un nuovo oggetto biologico, dobbiamo capire come sono fatte. Innanzi tutto, DNA e RNA sono acidi nucleici. Acidi perché la loro molecola contiene acido fosforico e quindi è acida e nucleici perché sono stati trovati nel nucleo della cellula. La struttura chimica del DNA è stata scoperta nel 1952 a Cambridge in Inghilterra da quattro giovani ricercatori: una inglese di 32 anni, Rosalind Franklin, un neo-zelandese di 36 anni, Maurice Wilkins, un inglese di 35 anni, Francis Crick e un americano di 23 anni, Jim Watson. A partire dalla loro scoperta si sono sviluppate in tutto il mondo infinite ricerche che hanno portato alle moderne biotecnologie e hanno rivoluzionato la biologia e la medicina. Per questo motivo tre di loro (Wilkins, Crick e Watson) hanno ricevuto nel 1962 il premio Nobel per la medicina o fisiologia.
La struttura del DNA su cui poggia l'informazione è formata da una collana di unità semplici, come perle tenute assieme dal filo. Ogni perla è uno zucchero che si chiama desossiribosio e il filo è l'acido fosforico che lega una unità all'altra. Le perle sono identiche una all'altra, ma su ognuna di loro è attaccato un gruppo chimico, come fosse una lettera di un alfabeto, che la rende diversa. Mentre l'alfabeto è fatto di 21 lettere, l'informazione genetica degli acidi nucleici ha solo quattro 'lettere chimiche', che si chiamano basi nucleotidiche (v. fig.): adenina (A), timina (T), guanina (G) e citosina (C). Queste lettere costituiscono il linguaggio della informazione genetica. Se nella lingua italiana si usano le due lettere M e A in questo ordine: M, A, M, M, A, si leggerà "mamma" e ognuno pensa a una persona molto cara. Nel linguaggio genetico le quattro basi A, T, G e C possono formare un'infinità di combinazioni differenti per successioni di basi nucleotidiche e per lunghezza, ognuna delle quali rappresenta un'informazione diversa.
DNA è una sigla che viene dalla parola inglese Deoxyribonucleic acid, che in italiano è tradotta in acido desossiribonucleico. L'RNA, da Ribonucleic acid, acido ribonucleico, è diverso di poco, in quanto le perle sono fatte da uno zucchero un po' differente (ribosio) e una delle quattro basi, invece della timina, è l'uracile.
Quante lettere di messaggio genetico sono necessarie per fare un organismo umano adulto? Se pensiamo a quante diverse parti compongono il corpo e quante diverse cose sappiamo fare, non stupiranno i numeri che seguono. L'informazione genetica complessiva di un organismo vivente si chiama genoma (gene e genoma). Il genoma umano è formato di 3,3 miliardi di basi nucleotidiche, per un totale di circa 35.000 geni. Se il genoma umano fosse scritto in un unico volume, sarebbe contenuto in circa 700.000 pagine. Troppo grosso! In realtà il genoma umano non è contenuto in una molecola unica di DNA, ma è suddiviso in 23 molecole di DNA più corte ‒ di circa 150 milioni di basi ‒ chiamate cromosomi, contenenti ciascuno in media 1.500 geni. Se ora proviamo a stampare l'enciclopedia del genoma umano con un volume per ogni cromosoma, un gene per ogni pagina e un carattere per ogni base nucleotidica (A, T, G, C), avremo una enciclopedia di 23 volumi, ognuno di 1.500 pagine. Siccome ogni gene comprende circa 100.000 basi nucleotidiche, ogni pagina sarà enorme perché dovrà contenere 100.000 caratteri ed essere ben 20 volte più grande di una pagina normale, più di un metro per lato.
Un secondo problema riguarda i significati dei paragrafi delle pagine del genoma. Incredibilmente, meno del 5% di quei caratteri genetici servono veramente a fabbricare proteine, mentre per il 95% si tratta di 'parole' senza senso, come se leggessimo "bla bla bla bla".
A questo punto sorge un terzo problema. Ogni cellula dell'organismo contiene, nel suo nucleo, tutto il genoma. Immaginiamo ora di aprire il nucleo di una cellula, che è una pallina con il diametro di circa un centesimo di millimetro, e con una pinzetta di tirare fuori il DNA dei cromosomi. Verranno fuori molecole di DNA di circa 6 cm ciascuna, in tutto una molecola di DNA lunga ben un metro e mezzo. Come fa a stare un metro e mezzo di DNA in un contenitore che misura un centesimo di millimetro di diametro?
La risposta è che la molecola di DNA è lunga, ma anche molto sottile, circa un milionesimo di millimetro di diametro ed è raggomitolata in una struttura a matassa ripiegata più volte su sé stessa attorno a un 'rocchetto' formato da speciali proteine chiamate istoni. La matassa arruffata di DNA e le proteine formano un complesso unico chiamato cromatina, così compatto da poter essere contenuto nel nucleo cellulare, senza riempirlo neppure troppo.
Come avevano capito Watson e Crick, il DNA non è formato da una collana sola, ma da due collane affacciate fra loro nella lunghezza. Le due collane vengono tenute assieme dal riconoscimento reciproco fra le basi nucleotidiche; le basi che si riconoscono due a due si chiamano complementari, nel senso che A, l'adenina, riconosce sempre T, la timina, e viceversa T riconosce A, mentre G, la guanina, riconosce sempre C, la citosina, e viceversa. Le due collane non hanno una struttura lineare, ma sembrano due scalette a chiocciola connesse tra loro, ognuna a forma di elica. La struttura tipica del DNA è quindi una doppia elica.
Questo riconoscimento reciproco è la base del meccanismo di copiatura del DNA nelle cellule degli organismi. Quando il DNA deve ricopiarsi, le due eliche singole si separano fra loro (v. fig.). Rimangono così separate le basi A e T e quelle G e C, non più affacciate, ma comunque legate ad altre basi lungo la propria collana. Nella cellula esistono sempre basi libere, come perle non ancora infilate nella collana. Per esempio una base T libera può legarsi alla base A legata nella collana, e così una base A libera con una T legata alla collana, una G libera con una C legata e una C libera con una G legata. A questo punto ogni base nucleotidica precedentemente libera, che si è aggregata alla collana, si lega alla successiva mediante il gruppo chimico dell'acido fosforico: come a dire che le perle vengono infilate con l'acido fosforico per tenere assieme le due collane nuove. Le due collane (o eliche) affacciate sono ora diventate quattro: le due vecchie originali e le altre due, nuove, anche loro complementari.
Se osserviamo ora attentamente le due eliche originali, la successione delle basi è, per esempio, ATTGCAGGCC, a cui corrisponde sull'altra elica originale la successione di basi complementari TAACGTCCGG. Se ora guardiamo le due eliche nuove troveremo ugualmente la successione di basi complementari TAACGTCCGG e ATTGCAGGCC. Le due eliche originali complementari formavano una molecola di DNA; a queste si sono ora aggiunte due eliche nuove. Le quattro eliche formano due molecole di DNA, ciascuna contenente un'elica originale e una nuova, in cui la successione di basi è rimasta identica. Il messaggio del primo DNA è stato copiato in due DNA identici fra loro e al DNA originale.
Ogni doppia elica di DNA è l'informazione genetica per una cellula e quindi la copiatura ha portato alla costruzione di una informazione genetica identica alla precedente, necessaria alla formazione e alla funzione di un'altra cellula.
La duplicazione del DNA è necessaria per la riproduzione delle cellule ma anche per far nascere nuovi organismi viventi. L'informazione genetica della madre e quella del padre sono state copiate e le nuove copie si sono incontrate per formare il DNA del nuovo individuo, cioè di ognuno di noi.
Talvolta nel copiare sul foglietto la ricetta per la torta viene fatto un errore, per esempio 4 uova invece di 2. Se la torta è buona come l'originale, o più buona, continua a essere preparata e mangiata. Se invece la torta modificata non piace, non viene più fatta. Anche nel copiare il DNA vengono fatti errori, chiamati mutazioni. Se queste danno luogo a proteine sbagliate, l'organismo diventerà incapace di avere figli e il suo DNA morirà con lui. Ma talvolta il DNA mutato crea proteine più adatte ai figli di quelle originali, dando origine a una popolazione migliore, più evoluta. Le mutazioni del DNA sono quindi la causa originaria dell'evoluzione di tutti i viventi.
Espressione del gene. La ricetta della torta viene letta e interpretata (pesare gli ingredienti, mescolare, sbattere, versare, bollire, cuocere e così via). Ogni gene è la ricetta per una proteina e il suo messaggio genetico deve essere letto e interpretato per poter costruire quella proteina.
Le proteine sono molecole lunghe, un po' come gli acidi nucleici, ma invece di essere una successione di basi nucleotidiche, sono una successione di altre molecole chiamate amminoacidi. Questi sono di 20 tipi diversi e ogni proteina è diversa dall'altra per il tipo e il numero di amminoacidi che la compongono e per l'ordine con cui si susseguono. Ogni gene esprime la sua informazione formando la proteina che gli corrisponde. Si chiama appunto espressione del gene il procedimento di formazione di una proteina, in cui il numero e la successione di amminoacidi corrisponde all'informazione scritta nel gene.
Poiché basi nucleotidiche e amminoacidi non si riconoscono tra loro, come può una successione di basi nucleotidiche del DNA dare informazione per una successione di amminoacidi della proteina? In questo consiste il problema dell'espressione del gene e per risolverlo si passa attraverso le sue due fasi, la trascrizione e la traduzione, di cui cercheremo di capire la logica.
La prima fase: la trascrizione. Per aiutarci a capire useremo ancora la ricetta della torta, ma questa volta a livello industriale. La ricetta è brevettata e viene conservata nel segreto di un computer, nella direzione dell'industria. Ogni volta che deve iniziare la produzione della torta, il capocuoco accende il computer e trascrive la ricetta, stampandola su un foglio di carta e con quello esce dalla direzione e va nella fabbrica. Qui i diversi aiuto-cuochi si preparano prendendo ciascuno un preciso ingrediente (zucchero, farina, burro, uova e altri). Il capocuoco legge la ricetta e mette in fila gli aiuto-cuochi nell'ordine con cui servono gli ingredienti. A questo punto gli ingredienti vengono mescolati in una impastatrice automatica, formando un unico prodotto. A fine operazione il foglietto contenente la ricetta segreta viene distrutto.
Le molecole di RNA sono gli acidi nucleici protagonisti della costruzione delle proteine. Nella prima fase l'informazione genetica del DNA nucleare (la ricetta nel computer della direzione) viene trascritta nel messaggio contenuto in una molecola di RNA chiamato RNA messaggero o mRNA (la ricetta stampata in mano al capocuoco). Poiché la produzione di proteine avviene fuori dal nucleo, nel citoplasma della cellula (la fabbrica), l'RNA messaggero esce dal nucleo e va nel citoplasma (il capocuoco esce dalla direzione e va in fabbrica), dove la sua informazione viene interpretata per costruire la proteina. L'mRNA viene poi distrutto.
L'RNA messaggero si forma nel nucleo a seguito del processo di trascrizione, che copia la successione di basi nucleotidiche del DNA in una successione di basi nucleotidiche nell'RNA, usando lo stesso principio della complementarietà delle basi che abbiamo descritto per la replicazione del DNA per cui G e C si riconoscono a vicenda, T del DNA riconosce A dell'RNA, ma A del DNA riconosce l'uracile (U) dell'RNA. Anche in questo caso si apre la doppia elica del DNA, ma la copiatura avviene su una sola elica del DNA e si forma quindi una molecola di RNA a elica singola, perché il messaggio deve essere unico per ogni proteina.
La seconda fase: la traduzione. Una volta nel citoplasma, con il processo di traduzione la successione di basi dell'RNA messaggero viene interpretata e tradotta in un altro linguaggio chimico, quello della successione di amminoacidi. Questo procedimento utilizza un secondo tipo di RNA, gli RNA di trasporto o tRNA (gli aiuto-cuochi) e si basa su tre fatti: per tutti gli esseri viventi esiste uno stesso codice genetico, secondo il quale ogni gruppo di tre basi nucleotidiche, per esempio AAG, codifica uno dei venti amminoacidi, nel caso specifico lisina (alla parola 'farina' sulla ricetta corrisponde un ben preciso ingrediente ); ogni tRNA è in grado di legarsi a un solo amminoacido (ogni aiuto-cuoco trasporta un solo ingrediente), usando un'enzima come intermediario; il tRNA che ha legato un amminoacido, nell'esempio la lisina, contiene nella sua struttura tre basi nucleotidiche, nel nostro esempio UUC, chiamate anticodice, complementari al codice AAG della lisina dell'mRNA (l'aiuto-cuoco con la farina riconosce l'ordine "farina" fornito dal capocuoco).
L'interpretazione dell'informazione dell'RNA messaggero avviene nel citoplasma, utilizzando un terzo tipo di RNA, gli RNA ribosomiali contenuti nelle fabbriche delle proteine, chiamati ribosomi (le macchine impastatrici). Ognuno dei 20 amminoacidi si lega al suo tRNA corrispondente. I tRNA trasportano gli amminoacidi a riconoscere, mediante il loro anticodice, i codici allineati lungo gli mRNA. Infine gli amminoacidi in fila si legano fra loro l'uno dopo l'altro (gli ingredienti si mescolano a formare l'impasto della torta).
Dopo aver studiato a lungo il DNA, recentemente molti ricercatori sono passati a fare esperimenti con l'RNA e hanno scoperto un mondo inesplorato, che hanno chiamato appunto 'il mondo dell'RNA'. Si ritiene che le prime forme di vita sulla Terra, tre miliardi di anni fa, usassero RNA e non DNA come informazione genetica e si è scoperto che tante piccole molecole di RNA riconoscono e bloccano gli RNA messaggeri e quindi interferiscono nella produzione delle proteine (interferenza da RNA).