GENETICA
(XVI, p. 509; App. II, I, p. 1022; III, I, p. 716; IV, II, p. 7)
L'inizio degli anni Quaranta segna la nascita della g. molecolare e registra i primi passi sulla via dell'identificazione fisica del gene. La nascita della g. molecolare può essere considerata la prova data da O. T. Avery, M. McCarty e C. M. MacLeod (1944), e confermata da A. D. Herschey e M. Chase (1952), che il DNA è il vettore dell'eredità biologica. Nello stesso decennio G. W. Beadle ed E. L. Tatum (1941) riaffermano, in seguito ai loro studi su Neurospora, la validità dell'ipotesi "un gene-un enzima" (che il medico inglese A. E. Garrod aveva formulato nel 1908 per spiegare l'eredità degli errori congeniti del metabolismo nell'uomo), mentre J. Lederberg e Tatum (1946), e in Italia L. Cavalli Sforza, dimostrano la sessualità (ovvero lo scambio d'informazione genetica) anche nei Batteri, da sempre ritenuti l'esempio classico della riproduzione asessuata.
Nei vent'anni successivi biologi molecolari e genetisti, lavorando principalmente su batteri e fagi, hanno chiarito come l'informazione genetica sia immagazzinata e replicata nel DNA e hanno cominciato a capire in dettaglio i meccanismi molecolari che permettono la sintesi del prodotto finale dei geni: le proteine che caratterizzano la struttura delle singole cellule e degli organismi. Diventa così chiaro che, nei Batteri, un segmento ininterrotto di DNA rappresenta sempre un gene strutturale, che racchiude l'informazione genetica necessaria per la sintesi di una singola catena polipeptidica. Ciò vuol dire che a una sequenza lineare di nucleotidi del DNA batterico corrisponde sempre una sequenza lineare di amminoacidi sintetizzata secondo le note regole del codice genetico (v. biologia molecolare; codice genetico; gene; ingegneria genetica, in questa Appendice). Sulle prime si era pensato che questo fenomeno di colinearità fosse comune a tutti gli organismi, ma negli ultimi dieci anni si è scoperto che questa conclusione non è del tutto vera. Si sapeva da tempo che le cellule degli organismi superiori contengono una quantità di DNA di gran lunga maggiore di quella contenuta nell'organismo unicellulare dei Batteri (fig. 1). Nell'uomo, per es., ci sono circa 3 × 109 coppie di nucleotidi per nucleo cellulare aploide distribuiti su un insieme di 23 cromosomi diversi. Pertanto, se tutto questo DNA fosse deputato, come nei Batteri, a codificare la sintesi di proteine, ci si dovrebbe attendere che il DNA presente in una cellula umana sia capace di specificare, potenzialmente, circa tre milioni di proteine diverse, assumendo che un gene comprenda, in media, un migliaio di nucleotidi. Si è stimato invece che il numero totale di proteine diverse nei Mammiferi è compreso fra 30.000 e 150.000.
Per un certo tempo è sembrato che questa discrepanza fosse dovuta esclusivamente alla presenza di sequenze DNA ripetitivo, detto anche ''DNA egoista'' perché non viene trascritto, quasi fosse un riempitivo per separare un gene strutturale dall'altro (fig. 2). Negli ultimissimi anni si è invece scoperto che il DNA egoista non è la sola differenza fondamentale tra il patrimonio genetico degli organismi eucarioti e procarioti. Per es., si sapeva da tempo che le molecole di RNA direttamente prodotte attraverso la ''trascrizione'' dell'informazione genetica codificata nel DNA vengono modificate nel nucleo prima di essere trasferite nel citoplasma per la ''traduzione'' del messaggio genetico nelle corrispondenti proteine. Tuttavia si pensava che questa modificazione consistesse essenzialmente nell'accorciamento della molecola di RNA nucleare che veniva troncata nella sua porzione terminale per dar luogo alla formazione dell'RNA messaggero maturo. Le nostre cognizioni su questo interessante problema di biologia molecolare del gene sono rimaste nebulose fino a che non è stato possibile affrontare direttamente l'analisi molecolare di geni fisicamente isolati dall'insieme del genoma o sintetizzati in laboratorio partendo dall'RNA messaggero da essi prodotto. Questo tipo di studi è stato reso possibile dalla scoperta degli enzimi di restrizione (W. Arber, 1962; D. Nathans e H. Smith, 1965) e della ligasi (M. Gellert, 1967) e dalle tecniche di clonaggio del DNA sviluppate nei laboratori di P. D. Boyer, S. Cohen e P. Berg (1972-73). L'isolamento fisico dei geni, effettuato con le tecniche del DNA ricombinante (v. ingegneria genetica, in questa Appendice), e la loro minuta analisi strutturale, resa possibile dall'impiego degli enzimi di restrizione, hanno chiaramente dimostrato che l'organizzazione del gene nei Mammiferi, Uccelli e Anfibi, è fondamentalmente diversa da quella dei Batteri, in quanto la maggior parte dei geni eucariotici contiene delle interruzioni note agli specialisti col nome di ''introni'' o ''sequenze intercalate''.
Per dare un'idea delle strategie sperimentali usate per arrivare a queste conclusioni è utile descrivere in dettaglio l'elegante lavoro condotto sulla sintesi dell'ovoalbumina del pollo dal gruppo di P. Chambon nel Laboratorio di g. molecolare degli eucarioti di Strasburgo (fig. 3). L'ovoalbumina è una proteina, costituita da 386 amminoacidi, che è sintetizzata dalle cellule ghiandolari dell'ovidutto della gallina al momento della deposizione delle uova. Il processo è controllato dagli ormoni sessuali femminili, in assenza dei quali il gene non è trascritto e la proteina non è sintetizzata.
Per comprendere il funzionamento di questo processo regolativo era necessario isolare il gene dell'ovoalbumina dalle cellule che la producono e confrontarlo con lo stesso gene derivato da altri tessuti che non la producono. Approfittando del fatto che l'RNA messaggero dell'ovoalbumina rappresenta il 50% dell'RNA prodotto dalle cellule dell'ovidutto della gallina, non fu difficile purificarlo in quantità adeguata. Si poté quindi stabilire che la molecola di RNA consta di una catena di 1872 nucleotidi dei quali 1158 includono l'informazione genetica necessaria per la sintesi dei 386 amminoacidi che compongono la proteina. A questo punto l'RNA messaggero dell'ovoalbumina fu convertito nella copia complementare di DNA (cDNA), attraverso la transcriptasi inversa (un enzima virale che è capace di trasferire l'informazione genetica dall'RNA al DNA) e successivamente il cDNA a singola catena fu convertito in DNA a doppia catena per mezzo dell'enzima DNA-polimerasi.
Questo gene artificiale creato in laboratorio fu poi inserito in un plasmide (un vettore di derivazione batterica) e quindi clonato in Escherichia coli per ottenere DNA in quantità sufficiente per studiarne la struttura con l'aiuto degli enzimi di restrizione. Il passo successivo consistette nel confrontare la struttura del DNA sintetizzato in laboratorio con quella del gene dell'ovoalbumina isolato dalle cellule del pollo (DNA genomico). Fu così che apparve evidente la fondamentale differenza tra i due DNA, nel senso che il DNA genomico era molto più lungo di quello ottenuto per sintesi in laboratorio.
L'esperimento ha dimostrato, in maniera molto chiara e inoppugnabile, che una gran parte del DNA che costituisce il gene dell'ovoalbumina non partecipa alla costruzione del prodotto finale del gene ovvero alla sintesi dell'ovoalbumina. Le porzioni di DNA che non sono rappresentate nel prodotto finale sono appunto gli introni, mentre quelle che vengono trascritte e tradotte sono denominate esoni: intendendo per esoni quelle sequenze di nucleotidi − o tratti di DNA − che, ''letti'' tre a tre (triplette codificanti), specificheranno la natura e la sequenza degli amminoacidi nella proteina che verrà sintetizzata (1158 nucleotidi nel DNA, letti in sequenze di tre, costituiscono infatti 386 triplette a cui corrispondono i 386 amminoacidi presenti nella proteina ovoalbumina).
Dettagliate ricerche sull'argomento hanno consentito di stabilire che il gene dell'ovoalbumina è costituito da 7700 basi, con 7 introni inframmezzati agli esoni. In effetti la molecola di RNA inizialmente prodotta ha dimensione analoga a quella del gene, ma per tappe successive (eliminazione prima di 5 introni e poi di altri 2) l'RNA messaggero si riduce fortemente, tanto che quello maturo consta solo di 1872 nucleotidi, di cui 1158 codificanti gli amminoacidi. Questo processo è noto con il nome di splicing dell'RNA messaggero immaturo, per ottenere la rimozione degli introni non codificanti (fig. 4).
Molte altre scoperte, di cui alcune molto recenti e rese note proprio in questi ultimi anni, hanno permesso di chiarire importanti interrogativi a proposito della natura e struttura del materiale ereditario, meccanismi alla base dell'azione dei geni nel determinare specifici caratteri (azione e regolazione dell'attività genica).
A proposito della struttura, le macromolecole di DNA ed RNA sono state analizzate e descritte sino ai più fini livelli molecolari: la doppia elica del DNA, che sino a pochi anni fa era stata definita ad avvolgimento destrorso (DNA-B), ha svelato tratti intercalari e piuttosto brevi ad andamento sinistrorso: si tratta del DNA-Z o DNA levogiro (fig. 5), di cui ancora non si è compreso bene il significato, ma che sembra svolgere un ruolo di regolazione per l'attività dei geni localizzati nei tratti destrorsi immediatamente adiacenti. Gli stessi cromosomi, materiale difficile da esaminare a livello ultramicroscopico o submicroscopico, hanno mostrato di possedere una struttura ''a collana di perline'', dove le perline sono elementi regolarmente ripetuti detti ''nucleosomi'' costituiti dal filamento cromatidico di DNA avvolto per due volte attorno a un ottamero di proteine istomiche (fig. 6). Anche per i cromosomi giganti dei ditteri, su cui originariamente è stata dimostrata la localizzazione fisica in sequenza dei vari geni (mappe citologiche), l'analisi strutturale ha permesso di meglio comprenderne la natura politenica (molte unità filamentose ripetute per endomitosi e tenute insieme per un'assenza di suddivisione della zona centromerica), in maniera che si sono dimostrati preziosi per studiare l'azione dei geni (produzione a livello dei puffs di RNA messaggero, fig. 7) o la localizzazione mediante ibridazione in situ di particolari geni di cui si sia riusciti a isolare, e marcare con opportuni radioisotopi, il corrispondente RNA messaggero sotto forma di sonde molecolari (fig. 8).
Sempre a proposito dei cromosomi si è accertato che l'ipotesi delle loro terminazioni con regioni particolari dette telomeri era corretta, e che la natura molecolare di queste regioni (DNA telomerico) riveste particolare interesse per comprendere i meccanismi di replicazione del DNA ivi localizzato, quelli della riparazione del danno da agenti clastogeni e, proprio in questi ultimi anni, ulteriori dettagli sui rapporti esistenti tra le topoisomerasi e altri enzimi attivi nella sintesi del DNA.
Altre conoscenze si sono aggiunte sulla natura molecolare e sulla struttura e funzione delle regioni centromeriche, sempre facenti parte dell'organizzazione cromosomica. Mai come a partire dagli anni Ottanta si è capito che le conoscenze di biologia molecolare non potranno portare a interpretazioni unitarie ed essenziali sui fenomeni relativi ai viventi, se non verranno integrate e associate con quelle derivanti dallo studio delle strutture e delle organizzazioni sopramolecolari (cromosomi, cellule, organismi, classificazione, ecc.). Lo studio dell'evoluzione a livello molecolare non può certo aumentare le nostre conoscenze, se le informazioni che ne derivano non vengono valutate sulla base di quelle derivanti dalla paleontologia, dalla biologia cellulare e persino, anche se con grave disappunto dei moderni biologi molecolari, da approfondite considerazioni di tassonomia e classificazione.
Anche lo studio sull'attività differenziale dei geni e della loro espressione è notevolmente progredito. Le conoscenze accumulate in questo settore cominciano a chiarire sempre più il quadro ancor oggi molto complesso del ''differenziamento'': dall'ipotesi dell'inattivazione casuale di uno dei due cromosomi X nelle cellule delle femmine dei mammiferi (ipotesi di M. Lyon: eterocromatina sessuale), si è giunti alle osservazioni sul fenomeno dell'imprinting genico, per cui alcuni geni funzionano o meno (sono cioè attivi o inattivi), a seconda che vengano trasmessi da uno o dall'altro dei due genitori.
L'analisi approfondita del funzionamento dei geni o fattori ereditari e dei loro rapporti con i caratteri espressi, ha anche permesso di giungere a nuove e importanti acquisizioni sui rapporti tra ereditarietà e tumori. L'insorgenza e la diffusione di cellule tumorali è ormai messa in rapporto a mutazioni verificatesi nei geni che controllano il processo di riproduzione cellulare: l'origine di un tumore è pertanto dovuta al verificarsi di una o due mutazioni a carico di altrettanti geni che, con le anomalie che ne derivano, comportano per la cellula la perdita del controllo sul processo di moltiplicazione.
Si è giunti così all'individuazione degli oncogeni, dei protoncogeni e, ultimi in ordine di scoperta, degli anti-oncogeni: questi sarebbero i geni in grado di contrastare e annullare l'azione ''cancerogena'' degli oncogeni (v. anche oncogeni, in questa Appendice).
I protoncogeni esistono in tutti i vertebrati, con una sorprendente omologia nelle sequenze nucleotidiche che li compongono, e recentemente è stato dimostrato che alcuni di essi codificano proteine che controllano la crescita di particolari tipi cellulari (fattori di crescita) e che vengono prodotte − come era da attendersi − in piccole quantità o in eccesso, a seconda che si tratti di tessuto normale o tumorale. Tra queste proteine specializzate vi sono il fattore di crescita delle piastrine (PDGF, Platelet Derived Growth Factor), analogo al prodotto dell'oncogene ''sis'', e il fattore di crescita dei tessuti ectodermici (EGF, Ectodermal Growth Factor), analogo all'oncogene ''erb''. A tutt'oggi sono state individuate oltre una ventina di sequenze nucleotidiche che corrispondono alla definizione di protoncogene per via della loro omologia molecolare con un oncogene virale. Ognuna di queste sequenze ha una localizzazione cromosomica precisa, che è spesso molto prossima, quando non sovrapponibile, alla posizione di siti cromosomici definiti ''fragili'' per la facilità con cui vanno incontro a rotture cromatidiche indotte da sostanze clastogene (fig. 9). Le circostanze descritte e le correlazioni trovate finora tra certi tipi di tumori e il riordinamento cromosomico o strutturale di specifici protoncogeni (per es. la traslocazione del protoncogene ''c-myc'' dal cromosoma 8 al 14 nel linfoma di Burkitt − fig. 10 − o dell'''abl'' dal cromosoma 9 al 22 nella leucemia mieloide cronica) sono alla base dell'ipotesi che la trasformazione cellulare abbia inizio con un evento molecolare abnorme verificatosi in un protoncogene (C. Croce e G. Klein, 1985). Resta tuttavia ancora da stabilire se queste correlazioni siano espressioni di eventi del tutto anormali o non piuttosto la deviazione patologica di un ruolo importante che i protoncogeni potrebbero avere nel normale meccanismo del differenziamento ontogenico. Se ciò fosse vero, sarebbe più appropriato parlare di ''ontogeni''.
I geni omeotici, poi, sono quelli in cui una parte dell'organismo assume le sembianze di un'altra parte in conseguenza di una loro singola mutazione. Classico esempio di questo tipo di mutazioni è la mutazione dominante antennapoedia (Ant), in Drosophila melanogaster, che trasforma le antenne in arti. A tutt'oggi sono state individuate diverse mutazioni omeotiche in Drosophila che si raggruppano nel complesso antennapoedia (Ant-C) e nel complesso bithorax (BX-C). Entro questi due complessi omeotici i loci Antp e Ubz controllano la morfogenesi di specifici segmenti, mentre un terzo locus, il locus ftz, ne controlla il numero. Una scoperta inattesa è che tutti questi geni omeotici contengono una sequenza nucleotidica di circa 180 basi, che è presente in almeno sette copie nel genoma di Drosophila e che è stata ritrovata in un ampio intervallo di specie di Invertebrati e Vertebrati (topo e uomo compresi) con un'omologia sorprendente. Queste sequenze di DNA, cui si è dato il nome di ''scatole omeotiche'' (homeoboxes), sembrano essere assenti nelle specie animali a organizzazione non metamerica, il che sembra suggerire un loro preminente ruolo nel programma di sviluppo degli organismi a struttura metamerica. Usando dei probes (o sonde) molecolari derivati da homeo-boxes di Drosophila sono state di recente identificate almeno due homeo-boxes nel topo (localizzate sul cromosoma 6) e nell'uomo (localizzate nel cromosoma 17), con una percentuale di omologia del 75% a livello delle sequenze nucleotidiche e di oltre l'85% a livello della struttura primaria delle proteine da esse codificate. La dimostrazione ottenuta in Drosophila dell'associazione diretta tra homeo-boxes e complessi di geni omeotici autorizza a speculare sulla possibilità di un loro analogo ruolo nello sviluppo dei Vertebrati superiori a organizzazione metamerica.
Ed è proprio di questi ultimi anni la messa in evidenza dello stretto rapporto tra organizzazione delle homeo-boxes negli Invertebrati e nei Vertebrati, uomo compreso: un'altra dimostrazione dei rapporti tra ontogenesi e filogenesi e un'altra prova, qualora fosse necessaria, che l'evoluzione è un processo veramente verificatosi, anche se ancora si discute sui meccanismi che lo hanno effettivamente determinato.
Del progetto ''genoma umano'', che consiste nell'organizzare un grande sforzo di ricercatori di tutto il mondo per arrivare a determinare le sequenze nucleotidiche delle migliaia di geni facenti parte del genoma umano, si parlerà in maniera più approfondita e dettagliata sotto progetto genoma, in questa Appendice. La sua importanza per il benessere umano è già notevolissima, in quanto costituisce la base delle conoscenze necessarie agli interventi di terapia genica, che rappresentano l'ultima e più promettente frontiera della medicina.
Bibl.: E.B. Lewis, A gene complex controlling segmentation in Drosophila, in Nature, 276 (1978), pp. 565-70; W.F. Doolittle, C. Sapienza, Selfish genes, the phenotype paradigm and genome evolution, ibid., 284 (1980), pp. 601-03; P. Chambon, Geni discontinui, in Le Scienze, 155 (1981), pp. 16-27; M. Siniscalco e altri, Combination of old and new strategies for the molecular mapping of the human X-chromosome, in Human genetics. Part A. The unfolding genome, New York 1982; Biologia, a cura di B. Nicoletti, G. Chieffi, B. Baccetti, Bologna 1984; T. Hunter, Le proteine degli oncogeni, in Le Scienze, 194 (1984), pp. 56-71; T.C. Kaufman, M. Abbott, Homeotic genes and the specification of segmental identity in the embryo and adult thorax of Drosophila melanogaster, in Molecular aspect of early development. Symposium of American Society of Zoology, New York 1984; C.M. Croce, G. Klein, Traslocazioni cromosomiche e cancro umano, in Le Scienze, 201 (1985), pp. 52-60; R.A. Weinberg, Le molecole della vita, ibid., 208 (1985), pp. 16-26; J.D. Watson e altri, Biologia molecolare del gene, trad. it., 2 voll., Bologna 1989; B. Alberts e altri, Molecular biology of the cell, New York 1989; J.E. Darnell e altri, Molecular cell biology, OxfordNew York 1990; C. Sapienza, Imprinting parentale nei geni, in Le Scienze, 268 (1990), pp. 20 ss.; I.M. Verma, Il trapianto dei geni, ibid., 269 (1991), pp. 34 ss.