Acidi nucleici
Gli acidi nucleici sono molecole complesse di grandi dimensioni attraverso le quali avviene la trasmissione dell'informazione genetica. Essi sono presenti nelle cellule di tutti gli organismi (animali e vegetali), dai più semplici procarioti ai più complessi eucarioti, sotto forma di acido desossiribonucleico, DNA (dall'inglese Deoxyribonucleic acid) e di acido ribonucleico, RNA (dall'inglese Ribonucleic acid). Gli acidi nucleici presentano tutte le caratteristiche necessarie ad assicurare la continuità delle specie e lo svolgersi dei processi evolutivi. Il DNA è depositario di un'informazione biologicamente utile, mantenuta in una forma stabile che viene trasmessa da cellula a cellula e di generazione in generazione. L'informazione in esso codificata si esprime inoltre consentendo la produzione di molecole biologiche diverse da quelle di origine. Questa proprietà del materiale genetico, in apparente contraddizione con il requisito di un'informazione stabile, prevede che esso stesso possa variare. L'analisi delle caratteristiche chimiche e fisiche del DNA e dell'RNA ha permesso di comprendere la relazione tra la struttura e la funzione del materiale genetico. L'informazione genetica è contenuta nella sequenza delle basi puriniche e pirimidiniche lungo la catena polinucleotidica del DNA; la complementarità dei filamenti che costituiscono la molecola del DNA consente la sua fedele duplicazione, un processo alla fine del quale si ottengono due nuove doppie eliche, esatte repliche di quella originaria. Una data sequenza nucleotidica (gene) può essere tradotta nella sequenza polipeptidica di una proteina: i geni vengono dapprima trascritti in molecole di RNA con sequenze complementari al DNA di origine, il cosiddetto RNA messaggero, il quale a sua volta entrerà direttamente nel processo di sintesi proteica. I meccanismi che consentono di mantenere un certo grado di variabilità nel materiale genetico sono la mutazione e la ricombinazione, grazie alle quali vengono trasmesse alla progenie nuove combinazioni di geni su cui potrà agire la selezione naturale.
Il DNA fu isolato per la prima volta nel 1869 all'Università di Tubinga da un giovane fisico tedesco, F. Miescher, il quale isolò dal pus presente su bende chirurgiche usate, o meglio dai nuclei dei leucociti del pus, una sostanza bianca che chiamò nucleina. Le proprietà e la straordinaria funzione di questa molecola furono però comprese solo dopo che la sua struttura a doppia elica fu descritta da F. Crick e J. Watson nel 1953. L'esistenza di un 'principio trasformante' in grado di introdurre una nuova caratteristica in modo permanente, cioè ereditabile dalle generazioni successive, era stata dimostrata già nel 1928 da F. Griffith con un esperimento sul batterio della polmonite. Nel 1944 O. Avery e il suo gruppo avevano chiarito che tale principio era il DNA, che agiva quindi come depositario dell'informazione genetica. Il DNA è costituito da due lunghi filamenti formati dalla ripetizione di unità di base, i nucleotidi, avvolti insieme a formare una doppia elica. Ogni nucleotide consiste di uno zucchero, il D-2'-desossiribosio, a cui è legato in corrispondenza del carbonio 5' un gruppo fosforico, e una base azotata eterociclica, a sua volta legata all'atomo di carbonio 1' dello zucchero. La base azotata può appartenere al gruppo delle purine, adenina (A) e guanina (G), o a quello delle pirimidine, citosina (C) e timina (T): esistono dunque nel DNA quattro diversi desossi-nucleotidi, ognuno contenente una delle quattro basi. I nucleotidi di ciascun filamento sono legati tra loro da legami fosfodiesterei, che uniscono il carbonio 3' di uno zucchero con il carbonio 5' dello zucchero successivo, mentre i due filamenti sono tenuti insieme da legami idrogeno tra le basi, le quali sono complementari l'una all'altra: infatti a ciascuna adenina di un filamento corrisponde sempre nell'altro filamento una timina e a ciascuna guanina corrisponde una citosina. Queste coppie sono, tra tutte quelle possibili, le uniche in grado di formare legami idrogeno, due nella coppia A-T e tre in quella C-G, e di permettere la formazione di una doppia elica regolare. La successione dei nucleotidi di un filamento determina quindi la sequenza nucleotidica dell'altro filamento della doppia elica. Inoltre, per consentire il corretto allineamento delle basi, e quindi la formazione dei legami idrogeno, i due filamenti della doppia elica sono orientati in direzioni opposte, devono cioè essere antiparalleli. Si viene così a formare una doppia elica destrorsa con due scanalature, una stretta e una larga, che per ogni giro completo presenta circa 10 coppie di basi, ciascuna delle quali dista da quella adiacente 0,34 nm: questa è la struttura del DNA-B, la più rappresentata in natura. Esistono anche altre forme di DNA, per es. il DNA-A e il DNA-Z (doppia elica sinistrorsa), che possono venire generate in particolari condizioni fisiche o per particolari sequenze nucleotidiche.
La struttura a doppia elica del DNA-B è stabilizzata, oltre che dai legami idrogeno tra le basi complementari dei due filamenti, anche da forze idrofobiche tra le coppie di basi e da interazioni elettrostatiche con cationi mono- e bivalenti che neutralizzano le cariche negative dei gruppi fosfati. Il DNA ha un peso molecolare molto grande in confronto a tutte le altre macromolecole biologiche, quali le proteine e i polisaccaridi. Nelle cellule aploidi umane il DNA nucleare, che è distribuito in 23 cromosomi distinti, contiene 2,9 x 109 coppie di basi, con un peso molecolare complessivo di 1,9 x 1012: se tutto il DNA venisse esteso arriverebbe a misurare 99 cm. Date le sue dimensioni, si calcola che esso potrebbe codificare per 300.000 geni, ciascuno lungo 10.000 coppie di basi: in realtà il numero totale di geni espressi può venire stimato in 30.000-40.000, se si tiene conto che numerosi geni sono presenti in copie multiple (il significato di tale ridondanza rappresenta ancora oggi un problema irrisolto). È interessante paragonare le enormi dimensioni del DNA nucleare umano con quelle del DNA di un piccolo virus, per es. il polioma, che ha 5100 coppie di basi, un peso molecolare di 3,4 x 106, e una lunghezza, se esteso, di 0,0017 mm, o del batterio Escherichia coli, che ha 4 x 106 coppie di basi, un peso molecolare di 2,6 x 109 e una lunghezza, se fosse esteso, di 1,36 mm. Oltre al DNA nucleare nelle cellule eucariote esistono anche altri DNA più piccoli contenuti nei mitocondri e nei cloroplasti. Il DNA mitocondriale umano, per es., è una molecola circolare a doppia elica costituita da 16.569 coppie di basi.Sia nelle cellule eucariote che in quelle procariote il DNA si trova in una forma altamente condensata, cioè esso è ripiegato in modo assai complesso. Nelle cellule eucariote, in particolare, il DNA non è 'nudo', ma è legato a piccole proteine basiche, gli istoni, che consentono la formazione di unità ripetute, i nucleosomi. Ciascun nucleosoma è costituito da un tratto di DNA di circa 140 coppie di basi, avvolto intorno a un ottamero di istoni, mentre un'ulteriore molecola di istone funziona da 'legante' esterno. Nel loro insieme i nucleosomi, separati da tratti di DNA di circa 60 coppie di basi, costituiscono la cromatina, uno degli stati in cui può trovarsi il DNA.
La replicazione, o duplicazione, del DNA è il processo nel quale il DNA replica se stesso: ogni nuova molecola di DNA contiene uno dei due filamenti della molecola di DNA parentale e uno di nuova sintesi. Il processo fu inizialmente studiato da A. Kornberg che nel 1958 scoprì nel batterio Escherichia coli la DNA polimerasi I, un enzima in grado di catalizzare la sintesi di nuovo DNA; successivamente furono scoperti anche altri enzimi coinvolti nello stesso processo. Durante la replicazione, i due filamenti della doppia elica si svolgono localmente e si separano. Ciascuno di essi funziona da 'stampo' per la sintesi di un nuovo filamento a esso complementare: il modello della replicazione viene detto 'semiconservativo' per sottolineare che ciascuno dei due filamenti originali si conserva, avvolto a un filamento nuovo, in una delle due nuove doppie eliche. Per la sintesi di nuove molecole di DNA è necessaria la presenza, oltre ai due filamenti stampo, dei quattro desossi-ribonucleotidi 5'-trifosfato, di numerosi enzimi e ioni bivalenti, nonché di inneschi, costituiti da corte catene polinucleotidiche (in vivo, corte sequenze di acido ribonucleico) con estremità 3'-OH libere. Questi sono necessari per consentire la formazione del primo legame fosfodiestereo, dato che le DNA polimerasi sono solamente in grado di allungare un filamento già esistente con un gruppo 3'-OH.
Negli eucarioti la replicazione avviene durante la fase S del ciclo cellulare (v. cellula) e inizia contemporaneamente in molti siti, cosicché il DNA viene replicato per tutta la sua notevole lunghezza in un tempo sufficientemente breve (poche ore). In ogni sito di inizio della replicazione, la doppia elica del DNA parentale si svolge, formando la cosiddetta bolla di replicazione, e la sintesi procede contemporaneamente in ambedue le direzioni: i due siti di svolgimento del DNA parentale e di sintesi del nuovo DNA si chiamano forcelle di replicazione.Tutte le DNA polimerasi note sono in grado di allungare le catene polinucleotidiche soltanto in direzione 5'→3'. Ciò nonostante ambedue i filamenti di una doppia elica, che come già detto sono orientati in direzioni opposte, vengono allungati contemporaneamente. Sul filamento che si svolge nella direzione 3'→5' la sintesi della nuova catena, detta 'veloce', può realizzarsi in direzione 5'→3' in modo continuo e senza interruzioni; sul filamento che si svolge nella direzione 5'→3', invece, la nuova catena, detta 'lenta', sarà orientata in direzione 3'→5': essa viene sintetizzata in modo discontinuo, cioè vengono sintetizzati in direzione 5'→3' piccoli frammenti, detti di Okazaki dal nome del loro scopritore, che poi vengono uniti a opera di uno specifico enzima. Nel processo di replicazione del DNA, che è simile nei procarioti e negli eucarioti, nonostante la maggiore complessità di questi ultimi, intervengono inoltre numerosi enzimi, che svolgono funzioni diverse, quali lo svolgimento della doppia elica, la stabilizzazione dei singoli filamenti stampo, la formazione dei legami fosfodiesterei, la riparazione degli errori che si possono verificare durante la sintesi, la rimozione degli inneschi di acido ribonucleico e il completamento delle estremità lineari del DNA eucariotico.
In ogni cellula sono presenti diversi tipi di RNA, che differiscono per dimensioni e per funzione. Da un punto di vista chimico le principali differenze rispetto al DNA sono essenzialmente due: la presenza nell'RNA di D-ribosio al posto del D-2'-desossi-ribosio e dell'uracile, anch'esso una pirimidina, al posto della timina. Le molecole di RNA, come quelle del DNA, sono polimeri di unità nucleotidiche legate da ponti fosfodiesterici: esse però sono sempre a catena singola, in alcuni casi ripiegata a formare corti tratti a doppia elica, e presentano un peso molecolare di gran lunga inferiore a quello del DNA.Circa l'80% dell'RNA totale è costituito da RNA ribosomale (r-RNA), che costituisce parte integrante dei ribosomi, gli organelli ribonucleoproteici sui quali avviene la sintesi proteica; negli eucarioti si conoscono quattro specie diverse di r-RNA, costituite rispettivamente da 4700, 1870, 160 e 120 nucleotidi, ciascuna con una diversa costante di sedimentazione. L'RNA di trasporto, o t-RNA, rappresenta il 15% circa dell'RNA totale; esistono diverse molecole di t-RNA, in grado di legare in modo specifico uno dei 20 aminoacidi naturali in una reazione mediata da enzimi specifici detti aminoacil-t-RNA-sintetasi. I t-RNA sono molecole di piccole dimensioni, costituite da 75-95 nucleotidi con una caratteristica struttura a quadrifoglio e quattro corte zone a doppia elica. Altre caratteristiche comuni delle molecole di t-RNA sono: a) la presenza di una sequenza costante (-CCA) all'estremità 3' dove viene legato l'aminoacido da trasportare; b) la regione dell'anticodone, che contiene una tripletta di basi specifica per ciascun t-RNA e che si lega a livello del ribosoma a una tripletta complementare dell'RNA messaggero (v. oltre); c) la presenza di alcune basi diverse dalle quattro usuali, dette basi 'strane' o 'minori'; d) la caratteristica struttura tridimensionale a forma di L. Il terzo tipo di RNA, m-RNA o RNA messaggero, pur rappresentando solo il 5% circa del totale, costituisce (v. oltre) il vero e proprio intermediario chimico tra DNA e proteine. L'eterogeneità nelle dimensioni delle varie molecole di m-RNA presenti in un organismo riflette la diversità di lunghezza dei geni che codificano per le varie proteine.
Tutti i diversi tipi di RNA vengono sintetizzati nel processo di trascrizione di un DNA stampo. Negli eucarioti la trascrizione avviene nel nucleo, nel quale i vari RNA subiscono processi di maturazione prima di essere trasportati nel citoplasma, dove svolgeranno la loro funzione. La trascrizione avviene in modo simile alla replicazione: in entrambi i processi infatti sono necessari il DNA stampo, i quattro precursori, rappresentati dai ribonucleosidi 5'-trifosfato, ioni bivalenti ed enzimi specifici, che nel caso della trascrizione sono RNA polimerasi DNA-dipendenti. Tuttavia, una differenza significativa tra i due processi è che nella trascrizione non è necessario un innesco, in quanto le RNA polimerasi, a differenza delle DNA polimerasi, sono in grado di iniziare ex novo la sintesi di un filamento. Questi enzimi si legano inizialmente a zone del DNA, dette promotori, che si trovano a monte della regione da trascrivere e poi scorrono sulla doppia elica che progressivamente si apre, catalizzando la formazione dei legami fosfodiesterei tra le unità ribonucleotidiche dell'RNA nascente. È da notare che il filamento stampo che viene ogni volta trascritto è quello su cui la RNA polimerasi scorre in direzione 3'→5': anche l'RNA infatti viene sempre sintetizzato in direzione 5'→3'. La terminazione della trascrizione è regolata da proteine specifiche o da caratteristiche sequenze di terminazione sul DNA, che causano il distacco dell'RNA polimerasi. I prodotti della trascrizione vengono tagliati da ribonucleasi specifiche, generando in tal modo gli r-RNA e t-RNA maturi. Negli eucarioti gli m-RNA appena sintetizzati (hnRNA, heterogeneous nuclear RNA) subiscono modifiche significative prima di essere trasferiti dal nucleo al citoplasma. Tali modifiche consistono nella presenza all'estremità 5' di una o più basi metilate (il cappuccio), nella rimozione di alcuni tratti, gli introni, che vengono trascritti ma non tradotti, nell'aggiunta all'estremità 3' di un tratto di acido poliadenilico. La rimozione degli introni è stata scoperta intorno al 1980, quando fu possibile ottenere le prime sequenze di geni eucariotici e confrontarle con le corrispondenti sequenze proteiche: tali geni vennero quindi detti interrotti. I meccanismi che portano alla maturazione degli RNA sono molteplici e complessi e il loro studio ha portato alla scoperta di molecole di RNA capaci di catalizzare l'idrolisi o la formazione di legami fosfodiesterici (RNA catalitici o ribozimi); in precedenza si riteneva che solo le proteine fossero in grado di funzionare da enzimi.
La sintesi delle proteine, o traduzione, è il processo tramite il quale si realizza la conversione di una sequenza di nucleotidi dell'm-RNA nella sequenza degli aminoacidi di una proteina. La relazione tra la sequenza dell'RNA messaggero e quella della proteina corrispondente è basata su un codice, detto codice genetico, nel quale ciascuna tripletta di basi nell'm-RNA, il codone, corrisponde a un determinato aminoacido nella sequenza proteica. In realtà, di 64 possibili triplette che si possono ottenere dalle quattro basi nucleotidiche in tutte le possibili combinazioni (43=64), 61 codificano per i 20 aminoacidi naturali, mentre le altre tre costituiscono i segnali di terminazione della traduzione (v. oltre). La sintesi delle proteine ha luogo sui ribosomi, particelle costituite da RNA ribosomale e da numerose proteine, che in assenza di sintesi proteica sono separati in due subunità, una piccola e una grande.
La sintesi inizia con il legame della subunità piccola del ribosoma all'm-RNA e al primo aminoacil-t-RNA. Questo contiene sempre l'aminoacido metionina, che è formilata nei procarioti, e si lega con il suo anticodone al codone di inizio AUG dell'm-RNA: la metionina infatti è sempre il primo aminoacido a essere incorporato in un polipeptide e sarà eventualmente rimosso durante la fase di maturazione della proteina. Il complesso di inizio è completato con l'unione della subunità grande del ribosoma e con il legame del metionil-t-RNA al sito P, o sito polipeptidico, situato su di essa. Successivamente sul sito A, o sito aminoacidico, posto anch'esso sulla subunità grande del ribosoma, si inserisce l'aminoacil-t-RNA, il cui anticodone è complementare al codone che segue la tripletta di inizio dell'm-RNA. Il primo legame peptidico, catalizzato come i successivi dall'enzima peptidil-transferasi, si forma tra il gruppo carbossilico della metionina del metionil-t-RNA e il gruppo aminico del secondo aminoacil-t-RNA. Quest'ultimo, cui sono quindi legati due gruppi aminoacidici, per effetto della traslocazione con cui il ribosoma avanza di tre nucleotidi sull'RNA messaggero, va a occupare il sito P, dal quale si è staccato il t-RNA iniziatore ormai privo della metionina.
La sintesi procede quindi con l'inserimento nel sito A di un nuovo aminoacil-t-RNA, il cui anticodone è complementare alla successiva tripletta dell'm-RNA, e con la formazione del secondo legame peptidico. Tale processo viene poi ripetuto per ciascuno degli aminoacidi successivi. La sintesi della catena polipeptidica ha fine quando sull'RNA messaggero, a livello del sito A, viene a trovarsi una delle tre triplette di terminazione, UAA, UAG, UGA, a cui non corrisponde alcun anticodone. A questo punto il polipeptide viene rilasciato dall'ultimo t-RNA al quale era legato e sia l'm-RNA che il t-RNA si staccano dal ribosoma, che ritorna in uno stato inattivo dissociandosi nelle due subunità originarie. Numerose proteine, dette fattori, intervengono a favorire e a regolare l'inizio, l'allungamento e il rilascio della catena polipeptidica, mentre l'energia necessaria al processo viene fornita dall'idrolisi della guanosina trifosfato (GTP). Dopo la sintesi, le proteine subiscono di norma modifiche post-traduzionali necessarie per la struttura nativa e funzionale. La maggior parte delle modifiche riguardano specifici aminoacidi oppure i gruppi terminali del polipeptide e comprendono, tra le altre, l'acetilazione, la glicosilazione, la metilazione, la formazione di ponti disolfuro. Le proteine inoltre vengono spesso sintetizzate sotto forma di precursori e subiscono quindi processi di maturazione, che consistono nella rimozione delle sequenze segnale aminoterminali necessarie per l'attraversamento di membrane e di ulteriori pro-sequenze. Queste ultime hanno il ruolo di indirizzare le proteine negli organelli intracellulari in cui dovranno svolgere la loro funzione oppure, per le proteine che devono essere secrete, di favorirne il trasporto all'esterno della cellula attraverso la membrana plasmatica.
B. Alberts et al., Molecular biology of the cell, New York, Garland, 1994 (trad. it. Bologna, Zanichelli, 1996).
B. Lewin, Genes V, Oxford, Oxford University Press, 1994 (trad. it. della 4ª ed., Bologna, Zanichelli, 1992).
L. Stryer, Biochemistry, San Francisco, W.H. Freeman, 1995 (trad. it. Bologna, Zanichelli, 1996).
D. Voet, J.G. Voet, Biochemistry, New York, Wiley, 1990 (trad. it. Bologna, Zanichelli, 1993).