GENE
Storia e problematiche della ricerca. - La doppia elica del DNA. - La fase esplosiva nell'evoluzione del concetto di g. (v. anche codice genetico, in questa Appendice; genetica, XVI, p. 509; App. II, i, p. 1022; III, i, p. 716; IV, ii, p. 7; variabilità, XXXIV, p. 997; App. I, p. 1111; variabilit'a genetica, App. IV, iii, p. 792) prese l'avvio nel 1953, quando J. D. Watson e F. H. C. Crick proposero il celebre modello della struttura del DNA. Watson e Crick si basarono sui dati biochimici concernenti la composizione del DNA, in particolare sui rapporti equimolari fra adenina e timina e fra guanina e citosina, descritti da E. Chargaff. C'erano inoltre i dati ricavati mediante cristallografia a raggi X da M. Wilkins e R. Franklin, che indicavano che il DNA era formato da due catene elicoidali.
Watson e Crick suggerirono che la struttura del DNA consistesse in due catene di nucleotidi avvolte a elica l'una sull'altra a formare una sorta di scala a chiocciola. Un nucleotide è costituito da uno zucchero (il desossiribosio nel DNA), da una base azotata purinica o pirimidinica (A, G, T o C nel DNA) e da un gruppo fosforico. Queste unità nucleotidiche formano lunghe catene legandosi l'una all'altra tramite legami covalenti tra il radicale fosforico dell'una e lo zucchero della successiva. Le due catene di una molecola a doppia elica si formano e si appaiano in modo tale che le sequenze delle basi risultino complementari: a un'A di una catena è contrapposta una T nell'altra e viceversa; lo stesso vale per le due basi G e C. Le basi puriniche e pirimidiniche si appaiano all'interno della doppia elica quasi come i gradini di una scala a chiocciola, mentre i gruppi fosforici e le molecole di zucchero si uniscono a formare i montanti della scala.
Il modello di Watson e Crick influì immediatamente sulle idee dei genetisti, perché era evidente che la sequenza delle basi lungo la catena polinucleotidica poteva codificare l'informazione genetica e, inoltre, dal momento che le due catene sono complementari, il processo di replicazione può consistere nella separazione delle due catene e nella sintesi di due nuove catene formate sullo stampo delle precedenti e perciò a esse complementari. Questo processo di replicazione produce due molecole a doppia elica identiche, ognuna delle quali può essere trasmessa a una cellula figlia al momento della divisione cellulare.
Definizioni operative del gene ed effetto di posizione. - Nel frattempo la concezione del g., considerato dal punto di vista operativo, dovette subire una profonda revisione. Sulle prime, grazie al lavoro della scuola di T. H. Morgan, il g. era stato concepito come un'unità suscettibile di essere definita in termini di tre tipi di operazioni: la ricombinazione, la mutazione e la funzione. Dalla loro capacità di combinarsi con i g. vicini si era dedotto che i singoli g. fossero unità distinte disposte in ordine lineare all'interno del cromosoma. Il g. era anche considerato un'unità capace di mutare formando nuovi alleli; inoltre lo si concepiva come un'unità funzionale in grado di produrre un fenotipo specificando un enzima.
Per un certo periodo di tempo sembrò che le unità definite in termini delle summenzionate operazioni fossero coestensive; ma parecchie scoperte fatte nella prima metà del Novecento indussero i ricercatori a correggere questa opinione. In primo luogo la scoperta di un ''effetto di posizione'', fatta da A. H. Sturtevant nel 1925, dimostrò che la funzione di un g. è influenzata dalle regioni adiacenti del cromosoma. Sturtevant aveva studiato una mutazione che produce, in Drosophila, occhi a barra (bar). Nel 1936 C. B. Bridges e H. J. Muller, indipendentemente l'uno dall'altro, dimostrarono che la mutazione bar era dovuta a una duplicazione in tandem di un piccolo segmento del cromosoma X; lo stesso Sturtevant era giunto a questa conclusione basandosi su dati di ricombinazione genetica. Talvolta, quando due cromosomi contenenti la duplicazione si appaiano, i segmenti duplicati possono appaiarsi in maniera sfalsata, nel senso che il doppione destro di un cromosoma si appaia al doppione sinistro dell'altro. Quando il crossing-over si verifica in corrispondenza del segmento duplicato, ne risulta una triplicazione in un cromosoma e il ripristino della sequenza singola normale nell'altro. Il confronto, fatto da Sturtevant, fra femmine portatrici di duplicazioni in entrambi i cromosomi X e femmine portatrici di una triplicazione in un cromosoma e di una sequenza normale nell'altro mostrò che la seconda configurazione produce un fenotipo più accentuatamente anormale della prima, ancorché entrambe, complessivamente, contengano quattro repliche della sequenza.
Oggi si conoscono molti esempi di effetti di posizione in vari organismi e si suppone che in qualche modo i g. si influenzino reciprocamente e possano costituire livelli di organizzazione superiori, al di là della singola unità ricombinabile e mutabile che specifica un enzima.
Ricombinazione intragenica e saggio di complementazione. - Un altro evento che costrinse i genetisti a rimettere in discussione la presunta equivalenza delle unità definite da differenti operazioni fu l'osservazione fatta da C. P. Oliver, nel 1940, di una ricombinazione fra alleli di un g. in Drosophila. L'idea che il crossing-over potesse aver luogo all'interno di un g. era addirittura rivoluzionaria e diede l'avvio a una consistente serie di ricerche tese a individuare con esattezza l'unità minima di ricombinazione e i suoi rapporti con gli altri attributi del gene. Esperimenti fatti per classificare decine di migliaia di prodotti meiotici permisero di scoprire numerosi casi di ricombinazione intragenica in organismi superiori, come Drosophila e alcuni funghi. Comunque la soluzione definitiva del problema fu fornita da S. Benzer con i suoi studi riguardanti due g. contigui del batteriofago T4. Benzer individuò più di 2000 mutazioni nei g. rIIA e rIIB di questo virus; egli elaborò un metodo per mappare le mutazioni relative di un g. rispetto all'altro, che consisteva nell'infettare le cellule ospiti (di Escherichia coli) con due diversi ceppi mutanti di T4 e nell'identificare la progenie ricombinante non mutante. Dal momento che si poteva trattare contemporaneamente un altissimo numero di particelle virali, si poté ottenere una mappa ad alta risoluzione. Benzer stabilì le posizioni precise e le frequenze di ricombinazione di diverse coppie di mutanti e individuò più di 300 differenti siti mutazionali nei due g. adiacenti. Egli quindi confrontò le frequenze di ricombinazione con le misure fisiche della quantità di DNA contenuta nel genoma di T4 e giunse alla conclusione che mutazioni distanti appena due nucleotidi potessero ricombinarsi. Noi oggi sappiamo che è possibile anche la ricombinazione fra coppie di nucleotidi adiacenti.
Benzer decise di lavorare con i mutanti rII di T4, perché essi producono nelle colture del batterio su gelatina di agar una placca con una particolare morfologia; analizzandoli, Benzer fu in grado di scoprire che, benché tutti i mutanti possedessero fenotipi simili, esistevano in effetti delle variazioni nell'uno o nell'altro dei due geni. Egli poté giungere a questa conclusione applicando un saggio di complementazione elaborato sulla falsariga del classico test per l'allelismo usato nello studio degli eucarioti diploidi. Benzer osservò che un determinato ceppo di Escherichia coli non era in grado di sostenere la crescita di virus T4 mutanti, sia che si trattasse di virus di tipo rIIA, sia che si trattasse di virus di tipo rIIB; tuttavia, quando le cellule ospiti venivano infettate contemporaneamente da entrambi i tipi di virus, si sviluppavano virus maturi. In altre parole, rIIA e rIIB sono portatori di funzioni diverse che possono complementarsi reciprocamente nella cellula doppiamente infettata, in quanto il mutante rIIA produce una funzione rIIB normale e viceversa. È questo un tipico saggio cis/trans del genere descritto da E. B. Lewis per definire una unità genetica funzionale.
Prendendo in prestito dalla chimica la terminologia per definire la relazione spaziale fra siti mutazionali in cromosomi omologhi, si possono descrivere e confrontare le due seguenti configurazioni in cui sono coinvolte due mutazioni recessive, m1 ed m2: m1m2/++ (disposizione cis, in cui m1 ed m2 si trovano nello stesso cromosoma e le rispettive controparti normali [+] nell'altro) ed m1+/+m2 (disposizione trans, in cui ogni cromosoma contiene una mutazione). Lewis notò che, se le mutazioni sono alleliche, cioè contenute nella stessa unità funzionale, la disposizione trans risulta mutante, in quanto nessun omologo contiene un g. pienamente normale. La configurazione cis, invece, produce un fenotipo normale, poiché un cromosoma è completamente normale. D'altronde, se le mutazioni m1 ed m2 interessano geni diversi, entrambe le configurazioni risultano normali, perché anche in trans esiste una copia normale di ciascun gene.
Fu Benzer che, nell'adattare il test cis/trans allo studio del batteriofago mutante T4, coniò il termine cistrone per definire un'unità genetica funzionale. Oggi il cistrone, a parte poche eccezioni, è considerato equivalente al gene. Lo studio dei casi eccezionali che implicano complementazione fra alleli serve a perfezionare il concetto di g., poiché in alcuni g. la complementazione allelica fornisce indizi su come funzioni la regolazione del gene. Ciò che ora è chiaro è che il g. può mutare in corrispondenza di numerosi siti compresi fra le sue estremità e che ogni singolo sito può essere risolto per ricombinazione. La minima unità mutabile e ricombinabile è un singolo nucleotide, mentre il cistrone comprende vari nucleotidi, il cui numero varia a seconda della funzione del gene.
La questione della colinearità. - Intorno alla metà degli anni Cinquanta la struttura molecolare del g. divenne oggetto di approfondite indagini, suggerite dal modello del DNA di Watson e Crick e dalle previsioni che, sulla base di tale modello, potevano esser fatte circa la struttura e la funzione del gene. Secondo il modello, il codice genetico doveva essere costituito da una sequenza di nucleotidi di quattro tipi diversi. Per verificare questa ipotesi e decifrare il codice furono fatti esperimenti tesi a stabilire come l'informazione contenuta negli acidi nucleici potesse essere tradotta in specifici componenti cellulari. L. C. Pauling e i suoi collaboratori mostrarono, nel 1949, che un g. mutante, che provoca nell'uomo l'anemia falciforme, specifica una forma modificata di emoglobina. V. M. Ingram in seguito stabilì che la modificazione dell'emoglobina consisteva nella sostituzione di un amminoacido con un altro nella proteina. Da questa scoperta, unita a quanto si era appreso dalle ricerche sulle mutazioni che alterano il funzionamento degli enzimi, risultò evidente che, attraverso un qualche meccanismo, la sequenza degli amminoacidi di un polipeptide dovesse essere determinata dalla sequenza dei nucleotidi di un gene.
Una delle domande che allora ci si pose era se l'informazione contenuta nel g. fosse colineare con il polipeptide codificato dal gene. A questa domanda si rispose in due modi differenti: una prima risposta fu fornita dallo studio di una classe di mutazioni che colpiscono l'involucro proteico del virus T4.
A.S. Sarabhai e i suoi collaboratori selezionarono una sottoclasse di mutanti T4, denominati amber, nei quali la sintesi di una catena polipeptidica è interrotta precocemente. È noto che la catena polipeptidica che costituisce la proteina viene sintetizzata a partire dal gruppo amminico terminale verso quello carbossilico terminale per aggiunta successiva di un amminoacido alla volta; pertanto si pensò che mutanti amber localizzati in diverse posizioni in un g. avrebbero dato luogo a catene polipeptidiche di diversa lunghezza, a seconda della posizione del sito mutante entro il gene. In effetti, quando i mutanti furono mappati, risultò che la posizione di ognuno di essi corrispondeva alla lunghezza della rispettiva catena polipeptidica. Questo risultato indica in maniera molto convincente che esiste una correlazione lineare fra un g. e la proteina da esso codificata. Una prova ancora più precisa di questo fatto fu ottenuta da C. Yanofsky, il quale identificò una serie di mutanti di Escherichia coli, che presentavano un'alterazione della struttura dell'enzima triptofanosintetasi. Yanofsky e i suoi collaboratori (1967) dimostrarono che ogni mutante differiva dal normale per un solo amminoacido della catena polipeptidica e che la posizione dell'amminoacido sostituito corrispondeva esattamente alla posizione del sito di mutazione nel g. della triptofanosintetasi.
Meccanismi d'azione del gene. - Gli anni Sessanta videro notevoli progressi in due vaste aree di importanza fondamentale per la comprensione approfondita del gene. In primo luogo cominciò a svilupparsi la biochimica dei meccanismi d'azione del g., soprattutto attraverso l'analisi degli enzimi che catalizzano la sintesi degli acidi nucleici e delle proteine. Questi studi portarono a comprendere in termini generali i meccanismi di replicazione degli acidi nucleici e il modo in cui l'informazione è trasferita dagli acidi nucleici alle proteine, e condussero alla decifrazione del codice genetico, costituito da triplette di nucleotidi (codoni). Il secondo settore in cui si registrarono grandi progressi fu la genetica dei virus e dei Batteri, nel cui ambito iniziò la comprensione dei meccanismi di regolazione del gene.
Quanto alla prima area di ricerca non è necessario, in questa sede, esaminare in dettaglio i risultati della ricerca biochimica, ma è importante indicare in termini generali lo stato attuale delle conoscenze in questo campo, dominato in massima parte dalla biochimica e dalla biologia dell'RNA. Fin dalla metà degli anni Cinquanta era stato suggerito che l'RNA potesse essere un intermediario nel trasferimento dell'informazione dal DNA alle proteine, in quanto studi al riguardo dimostravano che l'RNA era coinvolto nella sintesi delle proteine.
Si scoprì che, in seguito a infezioni di cellule di Escherichia coli con un virus, veniva sintetizzata una specie di RNA caratterizzato da una vita media molto breve; tale RNA poteva in effetti formare molecole ibride col DNA virale. Questo fatto suggerì l'ipotesi che l'RNA a rapida degradazione contenesse sequenze complementari rispetto a quelle del DNA virale. La scoperta di un enzima, chiamato RNApolimerasi DNA-dipendente, in grado di catalizzare la sintesi di RNA soltanto in presenza di DNA, e la dimostrazione che, in effetti, l'RNA neosintetizzato possiede una sequenza di basi complementare a quella del DNA usato come stampo, fornirono una prova determinante del fatto che l'informazione codificata nel DNA può essere trascritta nell'RNA. A queste scoperte seguì la dimostrazione che l'RNA è trascritto a partire da uno solo dei due filamenti del DNA; ciò significa che un filamento codifica senso e l'altro antisenso. Dopo la trascrizione, l'RNA messaggero maturo viene trasportato attraverso la membrana nucleare e si associa strettamente ai ribosomi, che costituiscono il sito di sintesi delle proteine. Il concetto di trasferimento dell'informazione dal DNA alle molecole di RNA messaggero (mRNA), che a loro volta sono tradotte in sequenze di amminoacidi nelle proteine, divenne l'ipotesi di lavoro per le ricerche in questo campo.
L'elemento di collegamento che rende possibile l'accurata traduzione dei codoni dell'mRNA in sequenze di amminoacidi nelle proteine è un'altra specie di RNA, chiamato RNA di trasferimento (tRNA). Per ogni amminoacido esiste una specie di tRNA che si combina con esso, lo trasporta al ribosoma, riconosce il codone relativo, contenuto nell'mRNA, man mano che l'mRNA si sposta lungo il meccanismo di assemblaggio, e colloca l'amminoacido in prossimità della catena polipeptidica nascente, in modo che possano formarsi i necessari legami chimici. Tutto ciò avviene nel citoplasma della cellula.
L'analisi del codice genetico. - Dal 1961 al 1967, circa, il codice genetico fu completamente decifrato, per merito soprattutto delle ricerche di M. W. Nirenberg, S. Ochoa e G. H. Khorana. Il metodo adottato consisteva in sostanza nell'uso di un sistema in vitro per la sintesi proteica. Uno dei componenti fondamentali del sistema in vitro era l'RNA, che fungeva da stampo per specificare la sequenza degli amminoacidi della catena polipeptidica da sintetizzare. Usando RNA sintetico, costituito da una sequenza nota di nucleotidi, e osservando quali amminoacidi venivano inseriti nella catena polipeptidica nascente, fu possibile determinare il codone o i codoni relativi a ognuno dei venti amminoacidi presenti negli organismi. A queste ricerche fecero seguito numerosi esperimenti tesi a dimostrare che il codice è universale, cioè che in tutti gli organismi viventi si verifica la stessa corrispondenza fra codone e relativo amminoacido. Le uniche eccezioni a questo fatto sono rappresentate da alcuni codoni presenti nel DNA mitocondriale; recentemente si è poi scoperto che uno dei codoni che indicano il termine della traduzione nella maggioranza degli organismi in effetti codifica un amminoacido nei Ciliati.
Dal momento che esistono quattro tipi di nucleotidi (A, G, C, T) e che una sequenza di tre nucleotidi specifica un amminoacido, in totale esistono 64 codoni (43). Gli amminoacidi presenti negli organismi sono soltanto venti, quindi il codice genetico risulta alquanto ridondante: in diversi casi parecchi codoni specificano uno stesso amminoacido. Tre codoni fungono da segnali per il termine della traduzione dell'RNA messaggero in catene polipeptidiche. Uno di questi codoni è il segnale amber, che interviene in un tipo di mutazioni del virus T4 discusso in precedenza. In queste mutazioni un codone che normalmente indica un amminoacido è trasformato nella sequenza amber. Questi mutamenti, comunque, sono in grado di svilupparsi se la cellula ospite è portatrice di una mutazione che sopprime il codone amber (suppressor mutation); tale mutazione modifica uno dei g. dell'RNA di trasferimento, in modo che l'RNA in questione si accoppi al codone amber come se questo codificasse per un amminoacido. Gli altri codoni di terminazione sono chiamati ochre e opal; anche per questi codoni si conoscono mutazioni che li sopprimono.
Transcriptasi inversa. - La nostra conoscenza del dispositivo di espressione del g. si è andata approfondendo col passare del tempo, tanto che attualmente conosciamo molti dettagli dei segnali d'inizio e di terminazione della trascrizione dell'mRNA e della traduzione dell'mRNA in proteine; gli stessi enzimi che catalizzano le diverse reazioni sono piuttosto ben caratterizzati. Tuttavia solo nel 1970 si scoprì un altro aspetto veramente fondamentale della trasmissione dell'informazione genetica. In quell'anno D. Baltimore e H. M. Temin, indipendentemente l'uno dall'altro, dimostrarono l'esistenza di una DNA-polimerasi RNA-dipendente prodotta da virus oncogeni a RNA. Questo enzima, chiamato transcriptasi inversa, catalizza la sintesi di DNA usando come stampo una molecola di RNA. Risultò immediatamente chiaro che il flusso di informazione genetica non è rigorosamente unidirezionale dal DNA all'RNA e poi alla proteina. Questo fatto è particolarmente importante, perché significa che i virus a RNA sono capaci di costruire copie dei propri cromosomi fatte di DNA, che possono quindi essere integrate nei cromosomi della cellula ospite. Tramite questo meccanismo il cromosoma virale integrato viene replicato e trasmesso alle cellule figlie dall'ospite a ogni divisione cellulare. Nelle cellule germinali queste copie integrate del virus possono essere trasmesse alle generazioni successive. Noi ora sappiamo che l'integrazione e il distacco di queste sequenze virali possono determinare effetti importanti nell'ospite, producendo mutazioni e condizioni oncogene. Tutto ciò ha conseguenze molto importanti sull'architettura genetica dell'ospite (vedi oltre).
Regolazione genica nei Batteri e nei virus. - L'altro settore in cui, durante gli anni Sessanta, si registrarono rapidi progressi fu lo studio del controllo dell'attività genica nei Batteri e nei virus. Un'insolita caratteristica riguardante la disposizione dei g. fu scoperta nel batterio Salmonella typhimurium da M. Demerec, il quale notò che i g. implicati in passaggi successivi di una serie di reazioni metaboliche erano, nella maggior parte dei casi, raggruppati insieme. B. N. Ames e i suoi collaboratori scoprirono che questi gruppi di g. sono regolati coordinatamente come se costituissero una serie multifunzionale sotto il controllo di un singolo segnale.
Un notevole progresso nella comprensione del controllo coordinato dei g. fu determinato da un modello proposto nel 1961 da F. Jacob e J. Monod. Questi autori avevano studiato in Escherichia coli certe mutazioni che interferivano con le varie tappe del metabolismo del lattosio nel batterio. Già si sapeva che, quando le cellule crescono in un mezzo contenente lattosio, vengono prodotti gli enzimi necessari per l'utilizzazione di questo zucchero; in assenza di lattosio la sintesi di tali enzimi cessa. Jacob e Monod identificarono parecchie classi di mutazioni che inibivano in qualche modo la capacità della cellula di utilizzare il lattosio. Una classe di mutazioni modificava l'attività di questo o quell'enzima, lasciando immutati gli altri enzimi coinvolti nel processo metabolico. Un'altra classe di mutazioni interferiva con la capacità della cellula di reprimere la sintesi degli enzimi in assenza di lattosio. Jacob e Monod ipotizzarono che il controllo dei geni implicati in questo processo avvenisse al livello della trascrizione, cioè della sintesi dell'mRNA. Secondo il modello di Jacob e Monod, tutti i g. del gruppo, posti l'uno accanto all'altro nel cromosoma, sono trascritti in un'unica molecola di RNA messaggero; in assenza di lattosio una molecola speciale (repressore) si lega al cromosoma per impedire la trascrizione. Gli stessi autori ipotizzarono inoltre che il lattosio, se presente, si legasse alle molecole di repressore rimuovendole dal cromosoma, in modo che la trascrizione potesse aver luogo.
L'operone. - Jacob e Monod chiamarono operone (operon) l'intera serie di g. e di unità regolatrici; i g. che specificano le strutture degli enzimi furono chiamati g. ''strutturali''. I due ricercatori postularono l'esistenza di un g. ''repressore'', destinato a codificare la molecola di repressore, e di un g. ''operatore'', corrispondente al sito cui la molecola di repressore si lega per fermare la trascrizione.
Un'analisi approfondita delle classi di mutanti confermò l'esistenza del g. repressore, della sequenza operatore e dei g. strutturali. Inoltre, accanto all'operatore, si scoprì un sito promotore, cui l'RNA-polimerasi si lega per iniziare la trascrizione. Un tipo di mutazioni del g. repressore fa sì che le cellule producano grandi quantità di repressore. Sfruttando questo fatto, W. Gilbert e B. Müller-Hill isolarono e purificarono il repressore e confermarono che si trattava in effetti di una proteina, capace di legarsi direttamente a una specifica sequenza di DNA, in corrispondenza del sito operatore.
Anche la genetica e la biologia molecolare del batteriofago lambda (λ) contribuirono moltissimo alla comprensione dell'importanza della disposizione e dell'organizzazione dei g. nella regolazione delle loro funzioni. Il ciclo vitale del batteriofago lambda (λ) è piuttosto complesso, in quanto, nell'infettare una cellula ospite, il batteriofago deve ''decidere'' se percorrere il ciclo litico, replicando il proprio cromosoma, sintetizzando le proteine della capsula e assemblando particelle virali mature, oppure reprimere queste funzioni e integrarsi nel cromosoma dell'ospite. M. Ptashne isolò il repressore implicato in questi passaggi regolatori e poté dimostrare che si tratta di una proteina capace di riconoscere specifiche regioni del DNA a doppia elica del cromosoma virale e di legarsi a esse.
L'operone del lattosio è un sistema inducibile in cui l'attività genica è controllata mediante repressione: si tratta di un controllo negativo. Anche il sistema λ esercita in primo luogo un tipo di controllo negativo, ma possiede pure aspetti di controllo positivo, nel senso che la trascrizione di alcuni segmenti del cromosoma è accelerata dalla presenza di una particolare proteina. Si conoscono diversi operoni a controllo positivo nei Batteri: uno di questi è l'operone implicato nel metabolismo dell'arabinosio in Escherichia coli. In questo caso lo zucchero si combina con una proteina a formare un complesso regolatore attivo, che a sua volta si combina con una sequenza dell'operone per stimolare attivamente la trascrizione.
L'analisi molecolare e genetica dei g. virali e batterici ha portato a modificare sotto parecchi aspetti il concetto di gene. In primo luogo è risultato chiaro che spesso il controllo delle attività degli altri g. da parte dei g. regolatori avviene attraverso una proteina specifica codificata appunto dai g. regolatori, come nel caso del repressore per il lattosio; d'altra parte esistono alcune sequenze di nucleotidi nel DNA, che sono vitali pur non codificando per alcun polipeptide, come nei casi del promotore e dell'operatore per il lattosio. Un'altra caratteristica interessante è che, per funzionare adeguatamente, alcuni g. devono essere raggruppati in serie, chiamate operoni, che vengono trascritte coordinatamente. Se passiamo a esaminare l'organizzazione e la regolazione dei g. negli organismi eucarioti, il quadro cambia notevolmente. Di particolare rilevanza è la scoperta che raramente, se non mai, batterie di g. controllati coordinatamente sono organizzate come operoni; inoltre esse presentano una complessità inaspettata, per quel che riguarda l'organizzazione e la funzione.
Numero e dimensioni dei geni. - A mano a mano che si esaminavano sotto l'aspetto biochimico e genetico i genomi di organismi superiori, emersero alcuni fatti problematici. In primo luogo risultò chiaro che negli eucarioti le dimensioni del genoma variano ampiamente da specie a specie, e per di più non esiste quasi alcuna correlazione fra le dimensioni del genoma e la complessità di sviluppo dell'organismo. Per es., mentre gli esseri umani possiedono circa 3 × 109 paia di nucleotidi per assetto di cromosomi, alcuni anfibi ne posseggono ben più di 1011; Drosophila possiede circa 1,5 × 108 paia di nucleotidi, mentre un insetto molto simile a Drosophila, la zanzara, possiede una quantità di DNA circa sei volte superiore.
La seconda scoperta fu che porzioni piuttosto consistenti dei genomi degli eucarioti consistono di sequenze ripetute di DNA. Alcuni di questi segmenti sono ripetuti fino a un milione di volte per genoma, ma la maggior parte delle sequenze ripetitive, in quasi tutti gli organismi, si presentano in un numero di copie per genoma che oscilla da 100 a 10.000. La quantità di sequenze ripetute varia piuttosto ampiamente da specie a specie, ma le differenze non sono sufficienti a spiegare il paradosso della mancata correlazione fra dimensioni del genoma e complessità di sviluppo.
Il problema di quanti g. siano presenti nel genoma di un organismo è stato affrontato in vari modi per parecchio tempo. H.J. Muller studiò la questione in Drosophila, registrando le frequenze di mutazione in corrispondenza di diversi loci e applicando un test statistico, basato sul ripetersi di mutazioni in determinati loci, per calcolare il numero totale di loci. Comunque il metodo più diretto fu quello adottato da B. H. Judd e collaboratori, i quali tentarono di ottenere mutazioni in ogni g. compreso in un piccolo segmento di un cromosoma, accumulando un gran numero di mutazioni, tutte relative alla regione prescelta. L'analisi genetica e citologica della regione saturata di mutazioni mostrò una correlazione piuttosto buona fra il numero di g. e il numero di bande che appaiono nei cromosomi politenici giganti delle ghiandole salivari della larva. Quando si misura la quantità di DNA in queste bande, il contenuto medio di nucleotidi risulta di circa 25.000 paia, ovvero di 25 chilobasi (kb). B. Hochman pervenne più o meno allo stesso risultato studiando il minuscolo quarto cromosoma di Drosophila. Questi calcoli indicano che il numero totale di g. necessari per dirigere lo sviluppo e il funzionamento di Drosophila è inferiore a 10.000. Molto più importante è, comunque, il concetto che i g. degli eucarioti sono molto grandi e contengono una quantità di DNA molto maggiore di quella necessaria per codificare le proteine. A complicare il problema intervennero le osservazioni fatte dai biologi molecolari, secondo cui le copie di RNA isolate dai nuclei delle cellule sono considerevolmente più grandi degli mRNA maturi. Inoltre la maggior parte dell'RNA nucleare originale viene degradata rapidamente e non lascia mai il nucleo per raggiungere il citoplasma, ove possa associarsi ai ribosomi ed essere tradotta in polipeptidi. I tempi erano ormai maturi perché il concetto di g. subisse una sorprendente trasformazione.
Sezionamento genico e sezionamento differenziale. - Lo sviluppo, verificatosi nei primi anni Settanta, delle tecniche per inserire nuova informazione genetica nel DNA di virus o di plasmidi batterici permise di isolare e purificare g. specifici in quantità sufficienti a caratterizzarli dal punto di vista molecolare. Questi metodi di DNA ricombinante in un primo tempo si dimostrarono soprattutto utili nella manipolazione di g. virali e batterici, ma ben presto i progressi fatti in tale campo hanno permesso l'estensione di queste tecniche anche allo studio dei g. degli eucarioti.
Si studiarono con la massima attenzione le sequenze nucleotidiche della regione prossima al sito di inizio della trascrizione, in quanto si pensava che la regolazione dell'attività genica avvenisse principalmente al livello della trascrizione. Quando si confrontarono le sequenze presenti in un g. clonato molecolarmente a partire dal cromosoma con le sequenze rinvenute nel suo mRNA maturo, risultò evidente che in molti casi i due tipi di sequenze erano molto diversi. Tutte le sequenze di mRNA sono presenti nel DNA cromosomico, ma nel cromosoma esistono anche sequenze addizionali non rinvenibili nell'mRNA. Studiando i fenomeni che fanno seguito alla trascrizione si scoprì che in un primo tempo tutte le sequenze cromosomiche costitutive di un determinato g. sono trascritte, ma in un secondo momento l'RNA subisce un processo di sezionamento (splicing): alcuni segmenti della trascrizione originaria vengono estromessi dall'RNA, mentre le sequenze che codificano le proteine sono riunite insieme a formare l'mRNA maturo. I segmenti eliminati, chiamati introni, vengono degradati piuttosto rapidamente nel nucleoplasma; non si sa se essi svolgano una qualche funzione. I segmenti riuniti insieme a formare l'mRNA si chiamano esoni perché escono dal nucleo (e vengono tradotti). I g. sezionati e il sezionamento delle loro trascrizioni furono studiati originariamente usando copie di adenovirus tratte da cellule di mammifero infettate. I risultati così ottenuti furono estesi e si ebbe la conferma che gli introni esistono, virtualmente, in tutti i g. degli eucarioti anche se, negli eucarioti inferiori, come il lievito, si presentano con una frequenza molto più bassa.
La sorprendente complessità dei g. degli eucarioti, sopra descritta, non è stata ancora spiegata, ma ci sono interessanti indicazioni sul significato funzionale di tale organizzazione. Esistono prove sperimentali che in alcune proteine gli introni segnano i confini di domini funzionali. Ancora più importante è che il sezionamento differenziale in alcuni casi è utilizzato per produrre proteine differenti da uno stesso gene.
In Drosophila l'enzima alcooldeidrogenasi assume due forme diverse nella larva e nell'insetto adulto, prodotte entrambe dallo stesso g. utilizzando diversi schemi di sezionamento per congiungere diverse combinazioni di esoni nei due stadi del ciclo vitale. Un altro esempio riguarda l'ormone calcitonina, un peptide prodotto dalla ghiandola tiroide. Grandi quantità di mRNA per la calcitonina si rinvengono anche nell'ipotalamo, che però contiene ben poca calcitonina. Ma nell'ipotalamo è presente un'altra proteina, chiamata CalcitoninGene-Related-Product (CGRP). È possibile dimostrare che sia la calcitonina sia la CGRP sono prodotte a partire dalla stessa trascrizione primaria usando schemi di sezionamento alternativi. Ancora non si sa quale sia il fattore che controlla l'uso di questi schemi differenti nei diversi tessuti o nei diversi stadi della vita. Le ricerche miranti a chiarire i meccanismi di controllo della trascrizione e della traduzione si basano su tecniche di clonaggio molecolare e su tecniche di sequenza applicate ai nucleotidi situati nelle regioni poste alle due estremità dei geni. Si sono riscontrate delle somiglianze nelle sequenze di queste regioni appartenenti a g. diversi, ma allo stato attuale delle ricerche è possibile solo formulare congetture circa le loro funzioni.
Famiglie multigeniche. - Come è stato detto in precedenza, il raggruppamento di g. implicati in passaggi successivi di uno stesso percorso metabolico è un fatto che si verifica piuttosto comunemente nei procarioti. Negli eucarioti esistono alcuni gruppi di g. che costituiscono famiglie multigeniche, ma sono del tutto diversi dagli operoni. Certi g., come quelli che codificano gli istoni, presentano sequenze pressoché identiche, sono disposti in tandem, in successione, nel cromosoma e funzionano simultaneamente. Altri g., per es. quelli che codificano le globine, sono sì correlati, ma non identici, e funzionano in momenti diversi del ciclo di sviluppo. La globina embrionale viene prodotta molto precocemente nel corso dello sviluppo; fa poi seguito la sintesi delle catene di globina fetale, a loro volta sostituite dalle catene adulte dopo la nascita. I geni relativi presentano alcune omologie, ma sono attivati e disattivati singolarmente. Un fatto interessante è che questi g. sono disposti in gruppo nel cromosoma sostanzialmente nello stesso ordine in cui si esprimono durante lo sviluppo. Comprese nel gruppo vi sono alcune sequenze globino-simili non più funzionali, in quanto hanno subito delezioni che ne hanno rimosso segmenti essenziali. Queste sequenze si chiamano ''pseudogeni'' ed è possibile che rappresentino vestigia evolutive di g. un tempo funzionali, i cui ruoli siano stati assunti da altri membri del gruppo.
Riordinamento dei geni. - Un altro aspetto della multiforme natura del g. si ricava dallo studio dei g. che codificano le molecole di anticorpi (immunoglobuline). Si sa da molto tempo che possono esistere numerosissime molecole di anticorpi diverse, ciascuna con una sequenza particolare che le permette di riconoscere un antigene specifico e di legarsi a esso. Quel che si ignorava, fino a qualche tempo fa, era se ogni tipo di anticorpo fosse codificato da un g. diverso; se le cose stessero così, sarebbero necessari probabilmente milioni di g. differenti soltanto per la specificazione di anticorpi. Quando fu possibile ricorrere alle tecniche di clonaggio e di sequenza dei g., si ottenne un risultato stupefacente: durante la maturazione di una plasmacellula che produce un anticorpo, le sequenze di DNA che codificano le catene di immunoglobuline vanno incontro a un riordinamento fino a formare un'unica combinazione codificante. Pertanto ogni plasmacellula produce soltanto anticorpi costituiti da una determinata sequenza di amminoacidi.
La diversità fra tipi di anticorpi dipende dalla loro struttura: ogni molecola consiste di due catene polipeptidiche pesanti e di due catene polipeptidiche leggere, ognuna delle quali possiede una regione variabile e una regione più o meno costante. L'analisi molecolare mostra che nelle cellule embrionali esistono soltanto due g., appartenenti a cromosomi diversi, che codificano la parte costante della catena leggera (CL), mentre sono almeno 200 i g. che codificano la regione variabile (VL). Nel caso della catena pesante, esiste un gruppetto di circa otto g. che codificano la regione costante (CH) e circa 200 g. VH. La specificità di un anticorpo è determinata da quali componenti VL e CL, da una parte, e VH e CH, dall'altra, si uniscono a formare i due tipi di catene, oltre che, naturalmente, dalla particolare combinazione di catene leggere e pesanti. Questo sistema combinatorio consente la produzione di moltissimi tipi diversi di anticorpi. Il meccanismo di giunzione V-C e la sua regolazione restano tuttora misteriosi; è chiaro, comunque, che la giunzione è un evento variabile e implica numerose sequenze di giunzione (J), il che dà luogo a un ulteriore differenziamento dei tipi di anticorpi.
Elementi genetici mobili. - Per completare il quadro delle conoscenze attuali relative al g., dobbiamo prendere in considerazione una classe insolita di elementi genetici, capaci di muoversi all'interno del genoma. Questi elementi, noti come transposoni, sono stati rinvenuti praticamente in tutti gli organismi dai Batteri alle piante e agli animali superiori. La prima a descriverli fu B. McClintock, che li scoprì nel corso dei suoi esperimenti col mais. La McClintock notò che alcune delle mutazioni che stava studiando erano somaticamente instabili, nel senso che il g., nella pianta, veniva espresso in lembi di tessuto normale intercalati a tessuto mutante. Ella notò anche che questo stato instabile poteva essere trasmesso lungo la linea germinale, ma che il g. mutante instabile spesso andava incontro a ulteriori mutamenti, compreso il ritorno alla normalità. L'analisi genetica effettuata dalla McClintock mostrò che le instabilità erano dovute a elementi genetici, che ella chiamò ''elementi di controllo'' (controlling elements), i quali non avevano una posizione fissa nel cromosoma. Questi elementi mobili sono capaci di inserirsi all'interno o in prossimità di un g. ostacolandone il normale funzionamento. D'altra parte questi elementi sono anche suscettibili di venir rimossi e spesso la loro rimozione consente il ritorno a un funzionamento normale o pressoché normale.
Usando tecniche di DNA ricombinante divenne possibile clonare elementi mobili ed esaminarne le strutture molecolari. Fra i primi a essere esaminati sono stati gli elementi che provocano mutazioni nel batterio Escherichia coli: ne sono stati trovati quattro tipi principali, disseminati per tutto il cromosoma di Escherichia coli, ed è stato dato loro il nome di ''sequenze di inserimento'' (Insertion Sequences, IS). Le IS non solo possono muoversi, ma, se sono presenti a coppie, possono spostarsi come un'unità, trasportando con sé in una nuova posizione tutti i g. interposti fra esse.
L'esame dei siti cromosomici dove sono stati rinvenuti i transposoni mostra che questi elementi possono inserirsi in molte posizioni all'interno del cromosoma. Perché l'inserimento dei transposoni possa avvenire, le due catene di DNA del cromosoma si spezzano in punti leggermente diversi, alla distanza di 5÷8 nucleotidi. Questo taglio sfalsato fa sì che su entrambe le catene di DNA rimanga un breve segmento di catena singola. L'inserimento di 5÷8 nucleotidi mancanti su ogni catena, a opera di enzimi di riparazione, dà luogo a una duplicazione della sequenza di 5÷8 basi fra i punti di rottura, in corrispondenza delle giunzioni di inserimento. In alcuni casi si è visto che anche dopo rimozione i brevi segmenti duplicati restano, come fossero un'impronta lasciata dal transposone. Ora si sa che alcuni transposoni non hanno bisogno di essere rimossi per spostarsi in una nuova posizione, perché interviene il seguente meccanismo: il transposone viene trascritto in una copia a RNA, dopodiché avviene la sintesi di una copia a DNA, catalizzata dall'enzima transcriptasi inversa. La nuova copia a DNA viene duplicata e può quindi inserirsi, probabilmente grazie all'intervento di enzimi capaci di effettuare tagli sfalsati (staggered), nel sito bersaglio del DNA cromosomico.
Disgenesi ibrida. - Esistono molteplici indizi del fatto che gli elementi trasponibili svolgono un ruolo importante nel differenziamento genetico dei genomi dei diversi organismi. In Drosophila, per es., circa il 20% del genoma è costituito da DNA a sequenza ripetuta. Gli elementi trasponibili, che compongono parecchie famiglie differenti, rappresentano una grossa frazione di queste sequenze ripetute.
Un esempio di quanto drasticamente i transposoni possono cambiare i genomi è dato dal fenomeno chiamato disgenesi ibrida, che si riscontra in Drosophila. In tutti i ceppi di Drosophila Melanogaster provenienti da popolazioni selvatiche è presente un elemento mobile disperso, P, che invece non è presente nei ceppi allevati per anni in laboratorio. L'elemento P nei ceppi selvatici è molto stabile, ma, se si incrocia un maschio di tipo P con una femmina appartenente a un ceppo di laboratorio (di tipo M), la progenie ibrida mostra alti livelli di sterilità, tassi di mutazione da 100 a 1000 volte superiori alla norma, rottura e riordinamento cromosomici e alte frequenze di non disgiunzione cromosomica. L'analisi degli ibridi e della loro progenie mostra che gli elementi P vanno incontro a un'esplosione di replicazioni o di inserimenti in nuovi siti cromosomici nelle cellule germinali dell'ibrido P/M, dando luogo a cellule germinali non vitali e a frequenti mutazioni nelle cellule che sopravvivono. Si suppone che l'elemento P sia stabilizzato negli individui appartenenti al ceppo P dalla presenza di un repressore, probabilmente codificato da un g. dell'elemento P. Quando vengono introdotti in un individuo ibrido, dove non esiste repressore, perché il citoplasma dell'uovo è stato prodotto da una femmina M, gli elementi P non sono più repressi e si moltiplicano ad alta velocità nelle cellule germinali.
Retrotransposoni. - Una delle famiglie di elementi trasponibili comuni alla maggior parte degli eucarioti è costruita in base allo stesso schema secondo cui si moltiplicano i virus oncogeni a RNA dei Vertebrati, e in effetti presenta alcune analogie con questi ultimi. Come detto precedentemente, il virus oncogeno a RNA si replica in una copia a DNA, tramite la transcriptasi inversa, e quindi il DNA provirale può inserirsi in un cromosoma. Questi elementi di DNA provirale si comportano come le famiglie di transposoni chiamati retrotransposoni, scoperti in molti organismi, dal lievito e da Drosophila ai topi e agli esseri umani. I retrotransposoni, tuttavia, non sono in grado, a quanto si sa, di formare virus a RNA maturi, capaci di infettare altri organismi; in effetti vengono trasmessi solo verticalmente, alla progenie. Comunque, alla luce delle analogie evidenziate, è lecito chiedersi se i Retrovirus, che rappresentano un importante fattore tumorigeno nei Vertebrati, si siano evoluti da progenitori transposoni, o se, viceversa, i retrotransposoni siano retrovirus degenerati incapaci di dar luogo a particelle virali mature.
Trasposizione di geni durante lo sviluppo. - Il sistema usato dalle cellule di lievito per lo scambio (switch) dei tipi sessuali presenta alcune analogie col movimento dei transposoni, tanto da dar adito all'ipotesi che i g. mobili possano svolgere, nel processo di espressione del g. e nel processo di sviluppo, un ruolo ancora più importante di quanto risulti attualmente. Per quel che riguarda il tipo sessuale, le cellule aploidi di lievito sono o di tipo a o di tipo α; cellule a e α possono fondersi a formare uno zigote diploide. In alcuni ceppi di lievito le cellule slittano quasi a ogni generazione da un tipo sessuale all'altro. Il meccanismo con cui si realizza lo switch incominciò a essere compreso quando si scoprì che vicino al locus del tipo sessuale esistono g. a e α silenti. Apparentemente lo switch sessuale avviene quando una copia di un g. silente si inserisce nel locus del tipo sessuale e il g. che vi si trovava precedentemente viene spostato. A ogni divisione cellulare α sostituisce a o viceversa nel 90% dei casi; nel 5% delle cellule il g. è sostituito da un g. dello stesso tipo e nel rimanente 5% non si verifica alcuna sostituzione. La dimostrazione che lo switch si realizza attraverso questo rimpiazzamento ''a cassetta'' si è avuta quando i g. silenti furono clonati e trattati con tecniche di sequenza e quindi confrontati con le sequenze del locus del tipo sessuale seguendo particolari casi di switch.
La trasposizione di g. è anche il meccanismo tramite il quale i tripanosomi variano le loro glicoproteine di superficie per eludere la sorveglianza del sistema immunitario dell'ospite. Una grossa parte del genoma del tripanosoma consiste di g. che codificano glicoproteine di superficie varianti (Variant Surface Glycoproteins, VSG). Soltanto un g. VSG viene espresso in un determinato momento e si tratta del g. che, in quel momento, si trova in un sito specifico, chiamato locus di espressione. Un g. VSG può sostituirne un altro nel locus di espressione; ciò dà luogo alla comparsa di una nuova e diversa VSG sulla superficie del parassita. Questi switches avvengono, presumibilmente, per trasposizione; così ogni volta che un'ondata di nuovi parassiti fa la sua comparsa nel flusso sanguigno i parassiti in questione sono portatori di una nuova VSG. Dal momento che si genera una nuova ondata di parassiti ogni 7÷10 giorni circa, il sistema immunitario dell'ospite non è in grado di reagire sufficientemente in fretta da distruggere l'invasione dei parassiti.
Prospettive. - L'evoluzione del concetto di g. è veramente un prodotto della scienza del 20° secolo. Dai fattori unitari postulati da Mendel alle sequenze di DNA caratterizzate dal punto di vista molecolare, i progressi delle nostre conoscenze relative al g. sono stati spettacolari. Siamo entrati nell'era dell'ingegneria genetica a livello molecolare. Non solo possiamo clonare e sezionare g. specifici per scoprire da quali sequenze nucleotidiche siano composti, ma possiamo anche modificare le sequenze secondo schemi precisi e quindi analizzare come i g. così assemblati vengano espressi. Sono stati messi a punto vettori di vario genere che permetteranno la trasformazione di cellule con g. modificati. Alcuni di questi vettori sono stati costruiti a partire dalle sequenze mobili discusse in precedenza. Un esempio di questo tipo di vettori è dato dall'elemento P in Drosophila, che viene usato per trasferire un g. clonato in un embrione in via di sviluppo, onde determinare come il nuovo g. funzioni durante lo sviluppo. Un elemento P viene modificato rimuovendone alcune sequenze nucleotidiche interne e sostituendole con un g. di struttura nota. Questo elemento viene quindi mescolato con altri elementi P, che posseggono le normali sequenze interne, ma che sono stati privati delle estremità, in modo che non possano integrarsi. Questa miscela di DNA viene infine iniettata in embrioni di Drosophila, dove gli elementi P dotati di sequenze interne normali producono tutti gli enzimi necessari, mentre quello con estremità normali, che trasporta il g. da studiare, usa tali enzimi per integrarsi in un cromosoma dell'ospite. Il funzionamento del nuovo g. durante lo sviluppo dell'embrione può essere valutato in base alla sua capacità di esprimersi al momento opportuno e nel tessuto giusto.
Questo tipo di tecniche per il trasferimento artificiale di g. si trova ancora a uno stadio di sviluppo rudimentale. Si può effettuare la trasformazione di cellule di Mammiferi in coltura e, in effetti, sono stati riportati alcuni casi di g. trasformati introdotti in embrioni di topo. È possibile che in futuro si riesca a sostituire effettivamente g. difettosi con g. normali usando tecniche di trasformazione.
Benché si siano fatti rapidi progressi nella comprensione della struttura e del funzionamento del g., il numero dei quesiti che tuttora aspettano una risposta è veramente molto alto. I principali interrogativi ruotano soprattutto intorno alla questione dei meccanismi di regolazione del g. e di interazione fra geni. Restano pressoché sconosciuti i fenomeni che riguardano i livelli superiori dell'organizzazione del gene. Non sappiamo come i g. siano controllati coordinatamente durante lo sviluppo, né comprendiamo l'importanza del modo in cui gruppi di g. sono organizzati all'interno dei cromosomi, così come ignoriamo se le relazioni spaziali fra cromosomi nella matrice nucleare siano importanti per il funzionamento del gene. Siamo comunque in procinto di ottenere le risposte a questi e ad altri interessanti interrogativi.
Bibl.: A. H. Sturtevant, The linear arrangement of six sex-linked factors in Drosophila, as shown by their mode association, in Journal of experimental zoology, 14 (1913), pp. 43-59; H. J. Muller, Artificial transmutation of the gene, in Science, 46 (1927), pp. 84-87; E. B. Lewis, The phenomenon of position effect, in Advances in genetics, 3 (1950), pp. 73-115; B. McClintock, The origin and behavior of mutable loci in maize, in Proceedings of the National Academy of Science, 36 (1950), pp. 344-55; J. D. Watson, F. H. C. Crick, Molecular structure of nucleic acids, in Nature, 171 (1953), pp. 737-38; S. Benzer, Fine structure of a genetic region in bacteriophage, in Proceeding of the National Academy of Science, 41 (1955), pp. 344-54; F. H. C. Crick e altri, General nature of the genetic code for proteins, in Nature, 192 (1961), pp. 1227-32; F. Jacob, J. Monod, Genetic regulatory mechanisms in the synthesis of proteins, in Journal of molecular biology, 3 (1961), pp. 318-56; A. H. Sturtevant, A history of genetics, New York 1965; M. Nirenberg e altri, The RNA code and protein synthesis, in Cold Spring Harbor Symposia on quantitative biology, 31 (1966), pp. 11-24; C. Yanofsky e altri, The complete amino acid sequence of the tryptophan synthetase A protein (α subunit) and its colinear relationship with the genetic map of the A gene, in Proceedings of National Academy of Science, 62 (1967), pp. 296-98; B. H. Judd, M. W. Young, An examination of the one cistron: one chromomere concept, in Cold Spring Harbor Symposia on quantitative biology, 38 (1973), pp. 573-79.