Genetica
La genetica è quella parte della biologia che si occupa del materiale ereditario, cioè della sua struttura, del suo modo di funzionare, delle modalità della sua trasmissione, sia da una cellula alle sue discendenti (se si tratta di cellule dello stesso organismo si parla di genetica somatica) sia da una generazione all'altra di organismi pluricellulari, e della sua storia evolutiva.
La genetica può essere suddivisa secondo modalità differenti in base al criterio o, più frequentemente, alla combinazione di criteri adottata nei singoli casi. Sono illustrati qui di seguito tre criteri e le suddivisioni che ne derivano: il primo criterio è costituito dall'approccio e dal livello di analisi; il secondo dal fine; il terzo dal materiale biologico in esame
a) L'approccio e il livello di analisi
Le principali branche della genetica che possono essere individuate su questa base sono: la genetica formale, la citogenetica, la genetica biochimica, la genetica molecolare, la genetica delle popolazioni.
La genetica formale consiste essenzialmente nello studio delle proporzioni relative delle classi fenotipiche che si trovano nella progenie di determinati incroci, e anche, più recentemente, delle frequenze con cui sono assortiti non a caso, in singoli genomi, alleli di siti diversi, ma strettamente associati a formare i cosiddetti aplotipi (linkage disequilibrium). Questo approccio, che è quello con cui è nata la genetica, è stato da solo sufficiente a far scoprire che l'eredità di molti caratteri dipende da un singolo fattore (caratteri mendeliani unifattoriali), il quale può esistere in forme alternative diverse, dette alleli; questi, a seconda dei casi, si comportano l'uno rispetto all'altro come dominanti, o come codominanti o come recessivi. In molti casi si sono anche individuate relazioni non casuali tra le frequenze con cui 'segregano' gli alleli di un gene e quelle di un altro gene, ottenendo così la prova statistica che alcuni fattori (che nel frattempo avevano preso il nome di geni) sono associati fra loro più o meno strettamente. Questo approccio, combinato con quello citogenetico (relativo all'analisi di processi come la mitosi e la meiosi e, più tardi, rivolto allo studio dettagliato dei singoli cromosomi, soprattutto quelli giganti di Drosophila melanogaster, il moscerino del vino e della frutta), ha portato a una conoscenza esatta e rigorosa dei meccanismi della trasmissione dei caratteri ereditari e della sede materiale (i cromosomi) dei fattori che li determinano. Non ha, tuttavia, dato - né avrebbe potuto - alcuna notizia sulla natura di questi fattori (dimensioni, struttura chimica e modo di funzionare), né sui motivi per i quali certi alleli si comportano da dominanti, altri da codominanti e altri ancora da recessivi. Questo approccio è inoltre applicabile soltanto a geni che mostrino una certa variabilità fenotipica: i geni invarianti non solo non possono essere oggetto di studio, ma non se ne può nemmeno scoprire l'esistenza.
La citogenetica è la parte della genetica che indaga con approcci morfologici essenzialmente al microscopio ottico - e quindi su larga scala, ossia a bassissima risoluzione, come quando si guarda una città da un aereo - il materiale ereditario, cioè i cromosomi durante la mitosi e la meiosi e, in casi più rari, in interfase (cromosomi giganti). Quanto si è scoperto sul comportamento dei cromosomi in questi due tipi di divisione cellulare costituisce la perfetta spiegazione delle leggi della genetica formale e la prova conclusiva che i cromosomi sono la sede fisica dei geni. Lo studio di cromosomi particolari, come quelli giganti delle ghiandole salivari di Drosophila melanogaster, ha portato a costruire mappe citogenetiche (in cui numerosi geni sono stati allineati e localizzati lungo i rispettivi cromosomi), che si sono dimostrate colineari rispetto alle mappe formali ottenute stimando le frequenze di ricombinazione tra geni situati nello stesso cromosoma .
La genetica biochimica differisce dalla genetica formale dei primordi per il livello al quale viene effettuata l'analisi fenotipica. Nella genetica formale venivano esaminati gli aspetti morfologici (piselli gialli o verdi, oppure lisci o rugosi; drosofile con ali normali o con ali vestigiali, oppure con occhi rossi o con occhi bianchi; soggetti con pigmentazione normale, o soggetti albini ecc.), funzionali (individui con normale visione dei colori oppure daltonici; tasters, cioè individui che percepiscono come amara la feniltiocarbamide e non-tasters, per i quali questa sostanza è insapore ecc.), clinici (soggetti normali o emofilici; normali o con idiozia fenilpiruvica ecc.), sierologici (soggetti di gruppo 0, o A o B o AB; oppure Rh positivi o Rh negativi ecc.), cioè un insieme di caratteri a base biochimica ignota. Successivamente, mediante lo studio biochimico di determinati fenotipi collegabili in modo non soltanto formale al gene che ne era responsabile, si è passati all'esame dei caratteri proteici. Questo è stato il passo decisivo verso la nozione di gene strutturale (v. gene) e una delle tappe del percorso che ha portato alla corretta impostazione del problema del codice genetico. Si può quindi affermare che la genetica biochimica ha costituito - anzi costituisce tuttora per moltissimi fenotipi unifattoriali - il ponte tra la genetica formale e la genetica molecolare.
La genetica molecolare è quella parte della genetica che ha portato alla conoscenza della natura chimica e del modo di funzionare dei geni, o meglio del DNA nel suo complesso. In una prima fase, che potremmo chiamare 'proteica' (iniziata negli anni Quaranta del 20° secolo), queste informazioni si sono ottenute indirettamente, cioè per inferenza dalle proprietà delle catene polipeptidiche, sfruttando le relazioni biunivoche tra queste e i geni strutturali corrispondenti (n residui aminoacidici corrispondono a n triplette; un certo residuo aminoacidico in una certa posizione della sequenza della catena polipeptidica corrisponde a un certo codone, oppure a uno dei codoni che codificano per quell'aminoacido, nella posizione della sezione codificante del suo gene strutturale ecc.). In una seconda fase, iniziata negli anni Ottanta, il DNA è stato studiato direttamente a livello sia strutturale sia funzionale. La genetica delle popolazioni ha per oggetto di studio la popolazione, cioè un insieme di individui della stessa specie che, oltre a essere potenzialmente interfecondi (per definizione), si incrociano effettivamente tra loro (del tutto casualmente nelle popolazioni ideali dal punto di vista matematico, dette anche popolazioni mendeliane). La genetica delle popolazioni è la base della scienza che studia l'evoluzione genetica e, soprattutto, la speciazione o la microevoluzione. La parte di essa che si occupa della popolazione umana si è rivolta alla formulazione di ipotesi ragionevoli riguardo alla sede e all'età dell'origine dell'uomo, nonché alla sua successiva diversificazione in gruppi distinti, le cosiddette razze, e ha poi elaborato un drastico ridimensionamento dell'entità di questa diversificazione.
b) Il fine
Sulla base di questo criterio si possono distinguere due genetiche, la genetica applicata e la genetica di base. Scopo di quest'ultima è la conoscenza della natura chimica e dei modi con cui funziona, è trasmesso ed evolve il materiale ereditario, prescindendo completamente dall'eventuale utilizzabilità di questa conoscenza. Si tratta comunque di distinzioni spesso vaghe e sfumate, in quanto conoscenze di genetica applicata possono essere anche strumento di indagine in scienze di base, come per es. quando si utilizzano marcatori genetici come marcatori antropogenetici (cioè come marcatori atti a ricostruire l'origine della nostra specie e la sua successiva diversificazione in gruppi più o meno distinti, sotto l'azione delle mutazioni, del caso, della selezione e delle migrazioni). La distinzione ha tuttavia una sua validità sul piano concettuale, in quanto permette di individuare sezioni della genetica che, almeno in linea di principio, sono da considerare genetica applicata e sezioni che invece costituiscono una parte della genetica di base. Rientrano nel primo gruppo la genetica agraria, la genetica forense e varie parti della genetica medica (in particolare quelle che hanno lo scopo di migliorare l'efficienza della prevenzione delle malattie genetiche, per es. mediante procedimenti di consulenza genetica). Fanno parte dell'origine di base la genetica biochimica, la genetica molecolare, la genetica evoluzionistica e l'immunogenetica. In quest'ultimo ambito, il chiarimento della genesi dei geni delle immunoglobuline e dei T-cell receptors ha aperto un nuovo, e fondamentale, capitolo della genetica generale.
c) Il materiale biologico in esame
L'utilità di studiare organismi diversi varia a seconda dei molteplici problemi che si devono affrontare nel campo della biologia e particolarmente della genetica. Si sono così sviluppati rami differenti di questa disciplina, più o meno indipendenti l'uno dall'altro e riguardanti diversi tipi di organismi (insetti, funghi e batteri), come, per es., la genetica di Drosophila melanogaster, di Neurospora crassa, di Saccharomyces cerevisiae, di Escherichia coli e dei suoi fagi sia virulenti (della serie T) sia lisogeni (il fago λ), del mais, del topo e, in un secondo tempo e in misura sempre più accentuata, dell'uomo. Le peculiarità biologiche di questi organismi, che hanno costituito per decenni, e in molti casi costituiscono tuttora, i materiali di elezione della genetica, hanno determinato la scelta dei problemi di carattere generale da affrontare con ciascuno di essi. A questo si deve aggiungere che, più esteso e approfondito è l'insieme delle conoscenze su una determinata specie nel quale integrare i nuovi dati, tanto più essa diventa preferibile rispetto alle altre. Questo tipo di considerazioni è valido in particolar modo per l'uomo.
La brevità delle generazioni, la progenie numerosa, la facilità ed economicità dell'allevamento e del mantenimento delle linee hanno reso Drosophila melanogaster decisiva per il progresso della genetica formale. Le caratteristiche dei cromosomi giganti delle ghiandole salivari delle larve e quelle delle uova hanno permesso di chiarire alcune proprietà biologiche importanti. I cromosomi giganti, oltre a essere molto lunghi (DNA relativamente poco spiralizzato) e molto spessi (cromosomi politenici), presentano il fenomeno dell'appaiamento degli omologhi (sinapsi somatica tra i cromosomi 'fratelli') che rende particolarmente evidenti eventuali aberrazioni cromosomiche allo stato eterozigote. A causa di queste caratteristiche, a partire dagli anni Trenta del 20° secolo, si sono potuti localizzare i geni mediante mappe citogenetiche estremamente dettagliate, ed è stato possibile constatare la loro corrispondenza con quelle basate sulla frequenza di ricombinazione (mappe statistiche o formali) e comprendere la natura delle aberrazioni cromosomiche, quali le inversioni, le traslocazioni, le delezioni e le duplicazioni. Le grandi dimensioni delle uova rendono possibili manipolazioni in grado di fornire importanti informazioni riguardo alle prime fasi dello sviluppo embrionale e consentono anche la costruzione di animali transgenici. Si sono, inoltre, scoperte mutazioni con effetti su fasi anche precocissime della differenziazione embrionale che hanno chiarito la base genetica del controllo delle varie fasi dell'embriogenesi, comprese quelle pre- e postzigotica. Gli ascomiceti sono funghi, come quelli dei generi Neurospora e Saccharomyces, in cui i prodotti aploidi di ogni singolo evento meiotico (spore) rimangono racchiusi insieme in un unico involucro, detto asco. Nel caso di Neurospora crassa, inoltre, l'asco è un sacchetto oblungo al cui interno le 8 spore (i 4 prodotti della meiosi vanno ciascuno incontro a una divisione mitotica supplementare) si dispongono in modo ordinato, per cui è possibile non solo esaminare le singole meiosi separatamente l'una dall'altra, ma addirittura sapere in quale delle divisioni meiotiche si è verificato l'evento in esame (per es. un evento ricombinatorio). L'analisi delle singole meiosi ha portato alla scoperta di un fenomeno del tutto inatteso, la gene conversion, che costituisce un'eccezione alla segregazione mendeliana (nella quale metà delle spore derivate dalla divisione meiotica di una cellula diploide eterozigote A₁A₂ ha l'allele A₁ e l'altra metà ha l'allele A₂): in alcuni aschi, derivati da un diploide eterozigote, il numero delle spore con un allele è diverso da quello delle spore con l'altro allele (5 a 3 oppure 6 a 4). Questo fenomeno - raro (circa 1‰) per la maggior parte del genoma, ma molto frequente (fino a 50%) per alcuni marcatori genetici - è fondamentale per le sue numerose e generali implicazioni e non sarebbe mai stato scoperto in organismi di altre specie nelle quali i prodotti di meiosi diverse sono mescolati tutti assieme.
Fra le caratteristiche del batterio Escherichia coli e dei suoi batteriofagi, quella che si è rivelata più decisiva per la comprensione della struttura fine e del modo di funzionare e di evolvere del materiale genetico è la rapidità della loro moltiplicazione (conseguenza diretta della loro piccolezza e relativa semplicità); quindi, la grandezza dei numeri di elementi in gioco, associata alla facilità di individuare e di isolare, per selezione, fenotipi anche rarissimi (perfino dell'ordine di 10‒8-10‒9), ha reso possibile uno studio accurato di eventi così eccezionali da non essere scopribili, e tanto meno analizzabili, nella grande maggioranza degli altri sistemi biologici. Allo studio dei batteri e dei batteriofagi la genetica deve alcuni concetti fondamentali: 1) il materiale genetico è costituito dal DNA; 2) la sua replicazione è semiconservativa; 3) la regolazione dell'espressione dei geni per gli enzimi adattivi (inducibili o repressibili) è mediata da molecole diffusibili (repressori oppure attivatori) che, legandosi oppure staccandosi da una breve sequenza di DNA che costituisce il loro bersaglio specifico e che è detta operatore, inibiscono o promuovono, a seconda dei casi, la trascrizione dei geni strutturali a valle di quell'operatore (l'insieme di questi geni, dell'operatore e del promotore costituisce un cistrone regolativo, l'operone; attualmente le molecole diffusibili che regolano l'espressione dei geni sono chiamate fattori di trascrizione); 4) il concetto di replicone (segmento discreto di DNA che si replica come un'unità) nella replicazione appunto del DNA; 5) la struttura fine del gene e il concetto di cistrone, definiti a livello formale nei batteriofagi T di Escherichia coli; 6) la dimostrazione che agenti letali ad azione immediata (come i fagi virulenti T) non inducono in una coltura di batteri sensibili la comparsa di mutanti resistenti, ma si limitano a selezionare quelli già presenti casualmente nella coltura; 7) la dimostrazione che, invece, l'esposizione di batteri a condizioni non letali ma che non ne consentono la crescita (per es., la semina di batteri che richiedono triptofano e non sono in grado di utilizzare il lattosio in un terreno minimo contenente lattosio come unica fonte di carbonio organico) è seguita dopo tempi lunghi, cioè dopo molti giorni, dalla comparsa di mutanti evidentemente non pre-esistenti che formano colonie (o papille entro singole colonie), all'interno delle quali i doppi mutanti si formano nella coltura con una frequenza dello stesso ordine di grandezza di quella di una delle due mutazioni richieste per moltiplicarsi in quel terreno (invece che con una frequenza pari al prodotto delle due frequenze di mutazione: per es., con frequenza di 10‒9 invece che di 10‒16, che è come dire 0); 8) il ciclo integrazione-escissione del fago temperato come modello di ricombinazione illegittima, accompagnata o meno da trasduzione di sequenze di DNA batterico adiacenti al sito di integrazione del fago nel cromosoma batterico; 9) la coniugazione, cioè il passaggio da una cellula batterica donatrice, detta F+ o Hfr (High frequency of recombination), a una cellula ricevente, la F‒, di una porzione più o meno lunga di una copia del suo genoma a partire da un punto di inizio fisso, a seconda della frequenza rispettivamente bassa o molto alta di trasferimento; il genoma trasmesso per coniugazione è sintetizzato via via che viene trasferito nell'F‒ (dato che la cellula donatrice conserva il suo genoma, che resta separato dalla F‒, questo processo non è assimilabile alla formazione di uno zigote attraverso la fusione di due gameti); poiché il trasferimento è sequenziale e può essere interrotto in qualsiasi momento, questo sistema si presta a mappare i geni del cromosoma batterico registrando l'ordine temporale con cui essi vengono trasferiti nel batterio F‒ (si può cioè accertare quali geni vengono trasferiti per primi 1´, 2´, 3´ dopo l'inizio della coniugazione e quali in tempi successivi); 10) la trasformazione, cioè il passaggio di DNA 'nudo' dal mezzo di coltura fino all'interno della cellula batterica, seguito dalla sua integrazione nel genoma batterico. L'osservazione di tale fenomeno ha permesso di dimostrare che il materiale ereditario è costituito da acidi nucleici, constatando che i caratteri ereditari possono essere trasferiti con DNA puro. I cromosomi facilmente osservabili del mais e il gran numero di semi di ogni singola pannocchia hanno consentito a B. McClintock di integrare la genetica formale con la citogenetica in modo così geniale da portare alla scoperta degli elementi mobili (o trasposoni) già nel 1948, quando un simile concetto costituiva un'eresia. La genetica di quell'epoca era del tutto impreparata a recepire l'idea che alcuni tratti del genoma, lungi dall'avere una posizione fissa nel genoma stesso, abbandonassero frequentemente la loro sede iniziale e 'saltassero' in un altro punto integrandosi in un nuovo sito (a quell'epoca non si sarebbe ancora detto 'in una nuova sequenza di DNA'), influenzando infine l'espressione del gene adiacente. I dati di McClintock, essendo inoppugnabili, furono accettati, ma passò una ventina d'anni prima che i trasposoni, riscoperti in Escherichia coli, entrassero ufficialmente nella genetica ortodossa e se ne comprendesse appieno il significato funzionale nella 'ricombinazione illegittima', cioè nella ricombinazione che si verifica senza un appaiamento esteso tra sequenze omologhe. Il topo è, insieme all'uomo, l'unico mammifero, anzi l'unico vertebrato, tra gli organismi che hanno avuto un ruolo importante nello sviluppo della genetica, e ciò lo rende assolutamente insostituibile. Le caratteristiche che hanno fatto di questa specie un materiale biologico particolarmente adatto per la genetica risiedono nel fatto che i topi sono molto piccoli, molto prolifici e con tempi di generazione molto brevi (donde l'alto potere di risoluzione della loro genetica formale); il loro allevamento è, inoltre, facile ed economico. Alla genetica del topo si devono le conoscenze dell'immunogenetica, del fenomeno di Mary Lyon, dell'imprinting genomico. Inoltre i topi sono stati i primi fra i Vertebrati nei quali è stato possibile trasferire geni di altre specie per studiarne l'espressione (topi transgenici).
Uno degli aspetti essenziali dell'immunogenetica consiste nello studio della struttura della regione genetica responsabile della sintesi delle molecole MHC (Major histocompatibility complex), denominata regione H2 nel topo e regione HLA nell'uomo. Le molecole MHC si suddividono in due classi ben distinte tanto per struttura quanto per funzione: le MHC di classe I e le MHC di classe II. Mediante molecole MHC, le cellule esibiscono sulla loro superficie esterna, cioè accessibile alla sorveglianza immunologica, una serie di peptidi sia derivati dalla degradazione delle catene polipeptidiche sintetizzate nel loro citoplasma, sia formati nei lisosomi per degradazione di molecole peptidiche esogene (la presentazione dei due tipi di peptidi sulla superficie cellulare è svolta rispettivamente dalle MHC di classe I, che sono presenti in tutte le cellule dell'organismo, e dalle MHC di classe II, che sono presenti soltanto in determinate cellule, quali i macrofagi, le cellule dendritiche ecc.).
Il fenomeno di Mary Lyon, o 'compensazione (della differenza) di dosaggio genico', si riferisce a quei processi i quali fanno sì che nelle femmine di mammifero i geni presenti nel cromosoma X abbiano lo stesso livello di espressione rispetto ai maschi, malgrado le femmine possiedano due cromosomi X e quelli maschili uno solo. Questo fenomeno è dovuto al fatto che, in una fase molto precoce dello sviluppo degli embrioni di femmine di mammifero, in ognuna delle loro cellule somatiche viene inattivato a caso uno dei due cromosomi X, quello di origine paterna o quello di origine materna; la 'decisione' presa viene trasmessa inalterata a tutte le cellule discendenti, cioè si generano cloni nei quali tutte le cellule hanno come cromosoma X attivo quello paterno e cloni dove invece in tutte le cellule si esprime solo l'X materno.
L'imprinting genomico è una delle eccezioni più importanti ai profili di eredità mendeliana e consiste nella variazione nell'espressione di un gene o di un gruppo di geni, dipendente dal fatto che quel gene proviene dal genitore maschio o dal genitore femmina. Il fenomeno, estremamente interessante, è stato scoperto una quindicina di anni fa nel topo, osservando che l'instaurarsi di un fenotipo normale richiede non solo l'esistenza di due copie dello stesso gene, ma anche che una di esse sia di origine paterna e che l'altra sia di origine materna. Ciò implica che quelle regioni di DNA, prima di essere trasmesse, hanno nel contesto maschile un destino epigenetico (che lascia cioè intatta la sequenza nucleotidica) diverso da quello che ha luogo nel contesto femminile e che entrambe le regioni (sia quella di origine paterna sia quella di origine materna) sono necessarie per la formazione di un fenotipo normale. Sono ormai note molte malattie umane dovute al fatto che l'embrione deriva da uno zigote che presenta un tratto del genoma diploide solo paterno o solo materno. Da questo si può dedurre che molte regioni genomiche sono soggette a imprinting. Condizioni patologiche legate a questo fenomeno sono due tipi di triploidie, la mole idatiforme (neoformazione nella quale sono presenti due assetti cromosomici paterni e un assetto cromosomico materno) e i teratomi (che contengono due assetti materni e uno paterno). Esse, insieme ad altre evidenze, suggeriscono che il genoma paterno favorisca la differenziazione degli annessi embrionali a scapito dell'embrione vero e proprio e il genoma materno eserciti un'influenza di segno opposto.
I topi transgenici sono l'esempio di gran lunga più noto di trasferimento e integrazione di un gene di una specie nel genoma di un organismo di un'altra specie. Si tratta di un tipo di procedimento ormai classico di ingegneria genetica, dal quale si sono ottenute informazioni sulle conseguenze fenotipiche sia dell'introduzione nel genoma murino di determinati geni (in certi casi dopo averli opportunamente modificati in vitro, per es. con un sistema di mutagenesi sito specifica, site directed mutation), sia dell'inattivazione di quelli pre-esistenti (quando un gene viene sostituito da una sua forma inattiva introdotta per transgenizzazione, il topo viene chiamato knock-out per quel determinato gene).
La posizione dell'uomo tra questi esempi di materiali biologici che hanno avuto un ruolo decisivo nello sviluppo della genetica è del tutto speciale, perché l'uomo è l'unico (o quasi) organismo interessante in quanto tale: la grande attenzione che, a ragione, hanno suscitato e suscitano tuttora la genetica della drosofila e quella di Escherichia coli, due organismi di per sé quanto mai insignificanti (cioè non paragonabili, non solo all'uomo, ma nemmeno al cavallo, al bue, al gatto e a piante di grande interesse economico), non è certo dovuta al desiderio di comprendere a fondo la loro biologia, bensì a certe loro peculiarità che li hanno resi particolarmente adatti per chiarire problemi fondamentali della genetica generale, ma non di quelle specifiche della drosofila e di Escherichia coli. Tali specie di insetti e batteri sono state cioè gli strumenti piuttosto che il fine delle ricerche condotte su di esse. In altre parole, se i risultati di queste indagini fossero stati validi solo per la drosofila e per Escherichia coli, sicuramente esse non sarebbero state effettuate; e ancora meno la genetica avrebbe avuto tra i principali incentivi al suo sviluppo la prospettiva di migliorare il patrimonio genetico di queste due specie. La genetica umana, invece, è nata proprio con questo tipo di intento, come testimonia perfino il suo nome all'origine, 'Eugenica', ormai giustamente del tutto abbandonato. Fino alla fine degli anni Quaranta del 20° secolo, quando la genetica di base aveva già conosciuto uno sviluppo rigoglioso (soprattutto per i risultati ottenuti sulla drosofila), la genetica umana era concepita come una specie di scienza 'opportunista', dato che il suo obiettivo era quello di sfruttare al meglio in funzione umana (consulenza genetica e medicina forense) le conoscenze di genetica generale acquisite su altri organismi, scelti in quanto adatti per affrontare e risolvere i suoi problemi di fondo. Nessuno avrebbe immaginato a quell'epoca che lo studio della genetica dell'uomo avrebbe potuto dare un contributo rilevante al progresso della genetica di base, cioè che si sarebbe potuti passare a una situazione nella quale l'uomo non fosse il fine, ma diventasse invece uno strumento efficace per ricerche il cui fine fosse la genetica. A partire dagli anni Quaranta, quindi, la concezione della genetica umana come una scienza puramente applicativa è cambiata radicalmente, tanto che adesso si può ben dire che l'uomo costituisce uno dei materiali biologici fondamentali per la genetica di base, ben più interessante della genetica applicata. Il fatto che la genetica umana sia stata per quasi cinquant'anni considerata priva di prospettive nel campo della genetica di base è facilmente spiegabile: fino agli anni Quaranta la genetica, pur essendo una scienza matura e ricca di successi, era in sostanza solo genetica formale (la scienza degli incroci) e citogenetica. Per procedere lungo queste due direttrici, le uniche praticabili a quell'epoca, non sarebbe stata di grande aiuto una genetica nella quale, per l'aspetto formale dell'eredità, il materiale biologico in esame non consente di effettuare gli incroci informativi richiesti che, anche se trovati (e molto laboriosamente) tra quelli spontaneamente occorsi in natura, producono una progenie poco numerosa e solo ogni 20-30 anni; per ciò che riguardava l'aspetto citogenetico, l'ignoranza era assoluta in quanto nell'uomo non si conoscevano né il numero né la morfologia dei cromosomi mitotici.
Da questo si può dedurre che non c'era da aspettarsi un grande progresso nel campo formale o citogenetico, dato che l'uomo era così poco adatto rispetto alla drosofila per affrontare problemi di questo tipo. Ciò che in seguito ha reso l'uomo uno dei materiali biologici ottimali della genetica generale è la nascita di genetiche nuove, che si sono andate via via ad aggiungere (si badi bene, ad aggiungere, non a sostituire) alla genetica formale e alla citogenetica. Per la genetica biochimica e quella molecolare, che rappresentano i due nuovi indirizzi della genetica, l'uomo costituisce un eccellente materiale biologico di ricerca per una serie di motivi. Il principale è che la genetica biochimica - che, come si è detto precedentemente, ha costituito quasi sempre il ponte tra un fenotipo complesso e compreso solo a livello formale e la possibilità di affrontarne lo studio a livello di DNA - è nata e si è sviluppata partendo da malattie ereditarie. Gli errori congeniti del metabolismo (inborn errors of metabolism), studiati da A.E. Garrod fin dagli inizi del 20° secolo, vengono ora denominati genetici, invece che congeniti, perché, in una malattia ereditaria del metabolismo, ciò che è senza eccezioni congenito è il genotipo, non il fenotipo patologico che, in molte malattie ereditarie, si manifesta solo tardivamente.
L'approfondito studio biochimico di molte malattie ereditarie - studio che non sarebbe mai stato intrapreso se non nell'uomo - ha condotto alla scoperta della proteina alterata di ciascuna determinata malattia ereditaria, alla scoperta cioè di un fenotipo proteico, collegabile al genotipo corrispondente in termini molecolari e non più solo formali. In un primo momento, sulla base delle conoscenze delle relazioni tra sequenze aminoacidiche e sequenze nucleotidiche, si è potuto dedurre la natura chimica delle mutazioni in esame; successivamente, è stato possibile studiarle direttamente a livello di DNA. Non c'è da stupirsi se, divenute le malattie ereditarie il punto di partenza, l'uomo sia diventato un materiale biologico di elezione: si hanno molte più conoscenze a riguardo delle malattie umane che di quelle di tutte le altre specie messe assieme.
Il gene che più si presta a illustrare il nuovo ruolo assunto dall'uomo come strumento per lo sviluppo della genetica di base è quello dell'emoglobina, Hb (ora diremmo il gene della catena globinica β). Per la prima volta nella storia della biologia si era scoperto un fenotipo a livello molecolare, cioè una molecola proteica anormale che è stata chiamata HbS (i globuli rossi dei soggetti con l'allele anormale βS hanno una forma a falce ‒ in inglese sickle ‒ invece che la normale forma a disco biconcavo) e che è presente da sola negli omozigoti βSβS (i malati di anemia falciforme), oppure insieme alla HbA nei βAβS (i falcemici, che sono sani). Successivamente si è compresa la differenza tra la struttura della HbS e quella della HbA: il sesto residuo aminoacidico della catena βA è costituito dall'acido glutammico, mentre nella catena βS è costituito dalla valina. La scoperta della HbS ha segnato la nascita non solo della genetica molecolare, ma anche, più in generale, della biologia molecolare. La delucidazione dell'anatomia strutturale della HbS, avvenuta nel 1957, dopo meno di dieci anni dalla sua scoperta, ha dimostrato che i geni codificano la sequenza aminoacidica delle catene polipeptidiche aminoacido per aminoacido. A questo punto sorgeva il problema della decifrazione del codice genetico, che poteva ormai essere posto nella sua forma corretta: bisognava capire quali fossero le relazioni tra la sequenza nucleotidica del gene strutturale di una catena polipeptidica e la sequenza aminoacidica di quella catena polipeptidica; il problema sarebbe stato risolto nel 1966 (v. codice genetico).
Non è un caso che queste scoperte decisive siano avvenute nell'uomo: infatti, i punti di partenza sono stati una malattia (l'anemia falciforme) e un fenotipo eritrocitario alterato, anche se non patologico (la falcemia); entrambe le anomalie sarebbero state identificate e scoperte molto difficilmente se non avessero riguardato l'uomo.
In realtà, non è stata una coincidenza nemmeno il fatto che il primo gene per il quale si è scoperto un fenotipo anomalo a livello molecolare sia stato un gene dell'Hb: si tratta, infatti, della proteina maggiormente presente nel corpo umano, che da sola costituisce il 30% in peso dei globuli rossi (le cellule più abbondanti e più accessibili dell'organismo), per cui è stato tecnicamente possibile studiarne il comportamento elettroforetico direttamente, cioè senza dover ricorrere né alla sua purificazione né a metodi di amplificazione specifica che permettano di evidenziare quantità anche molto piccole di una determinata proteina (come un enzima del quale si sfrutta l'attività catalitica).
Lo studio dei geni della emoglobulina umana ha permesso inoltre di effettuare un'altra scoperta fondamentale per la genetica di base: le talassemie, anch'esse partite dallo studio di una malattia umana, il morbo di Cooley (o talassemia maior). L'indagine a livello molecolare dei geni talassemici ha portato a due importanti risultati: 1) è stata studiata e raccolta una serie di mutazioni tutte risultanti nella compromissione più o meno completa dell'espressione di un gene strutturale, anche se diverse fra loro per i meccanismi e i livelli di tale compromissione funzionale (per es., delezione parziale o totale del gene, oppure alterazione funzionale a livello della trascrizione o della maturazione del suo prodotto, da pre-mRNA a mRNA, mediante alterazioni dello splicing, e/o a livello della traduzione - frameshift mutations, comparsa di un codone di stop, allungamento della catena globinica ecc. - e/o a livello delle proprietà della globina prodotta dal gene talassemico); 2) HbS e talassemia costituiscono il modello di polimorfismo bilanciato meglio compreso, a livello molecolare, di tutta la biologia e rappresentano inoltre esempi di interazione tra le evoluzioni di due specie, quella di un organismo parassitato e quella del suo parassita (rispettivamente Homo sapiens e Plasmodium falciparum, l'agente eziologico delle forme più gravi di malaria). In molte delle popolazioni esposte a lungo a un'intensa endemia malarica si trova a frequenza elevata l'allele βthal (o il βS), cioè un allele letale recessivo (i βthal/βthal sono malati di morbo di Cooley), situazione assolutamente eccezionale perché gli alleli letali sono, di regola, rari. La frequenza elevata è dovuta alla particolare resistenza degli eterozigoti per la talassemia alla malaria: ciò costituisce, in un ambiente fortemente malarico, un vantaggio selettivo tale da rendere la loro idoneità biologica o fitness (valutata in base al numero medio di figli) maggiore di quella degli omozigoti per l'allele normale non talassemico. Polimorfismi come questi vengono detti bilanciati, perché sono mantenuti indefinitamente da un bilanciamento tra gli svantaggi dei due genotipi omozigoti rispetto al genotipo eterozigote, per cui nessuno dei due alleli, nemmeno quello letale, tende a scomparire dalla popolazione.
In questa sezione ci si limiterà a illustrare, esaminandoli soprattutto dal punto di vista storico, due fondamentali capitoli della genetica umana: il primo è relativo allo studio dell'anatomia del genoma umano, mentre il secondo è pertinente al modo di procedere seguito da questa disciplina nella delucidazione della base genetica dei caratteri unifattoriali.
a) Anatomia del genoma umano: dall'individuazione del numero dei suoi cromosomi al progetto del suo sequenziamento completo
Fino agli anni Cinquanta del 20° secolo e oltre, l'anatomia del genoma umano non era ancora in sostanza neppure agli albori: sul versante citogenetico non era nemmeno noto il numero dei cromosomi umani (si riteneva che il corredo diploide fosse di 48 cromosomi, mentre sono 46) e su quello formale (cioè di mappatura per ricombinazione) si erano individuate solo 3 coppie di geni associati: l'AB0, con la sindrome nail-patella; l'Rh, con un tipo di elliptocitosi; e il Lutheran, con il secretore ABH (come se della geografia dell'Asia si sapesse solo che da qualche parte ci sono, non lontane l'una dall'altra, Bombay e Nuova Delhi; che da qualche altra parte ci sono Pechino e Shangai e che da qualche altra parte ancora ci sono Islamabad e Kabul). La nascita della citogenetica umana si può datare al 1957, quando furono introdotte due innovazioni tecniche: l'uso della colchicina (che blocca le mitosi in metafase, facendone così aumentare il numero) e di soluzioni ipotoniche (che disperdono i cromosomi della piastra equatoriale metafasica, districandoli cioè l'uno dall'altro). È diventato così possibile ottenere molte metafasi con i cromosomi ben distinti l'uno dall'altro e, quindi, suscettibili di essere contati e suddivisi in gruppi diversi sulla base di caratteristiche morfologiche ben evidenti: lunghi e metacentrici, lunghi e submetacentrici ecc. (classificazione di Denver). I cromosomi di uno stesso gruppo sono rimasti, tuttavia, indistinguibili fra loro ancora per una quindicina d'anni. Subito dopo si è scoperto che la sindrome di Down è dovuta a una trisomia del cromosoma 21; in seguito si sono scoperte numerose altre anomalie di numero di cromosomi (X0, XYY, XXY, trisomia 13, trisomia 18 ecc.) o di struttura (delezione del braccio lungo del cromosoma 4 e varie altre). All'inizio degli anni Settanta la messa a punto di tecniche di bandeggio ha permesso di distinguere i singoli cromosomi, cioè anche quelli appartenenti allo stesso gruppo della classificazione di Denver.
Al 1968 risale l'invenzione del 'metodo degli ibridi somatici' per l'identificazione di geni situati sullo stesso cromosoma, detti sintenici (dal greco σύν, "con", e ταινία, "filamento"). Era già noto che, se si allestivano colture miste, costituite cioè da cellule diverse, talvolta derivate da specie diverse, era possibile, in condizioni sperimentali opportune, che alcune cellule si fondessero. Si formano così cellule eterocarionti, cioè con nuclei di origine diversa che successivamente si fondono a formarne uno solo. Durante la mitosi si può osservare che queste cellule ibride presentano i cromosomi di entrambe le cellule da cui sono derivate; nel corso delle generazioni cellulari, le cellule ibride derivate dall'uomo e dal topo tendono a perdere preferenzialmente i cromosomi umani. Sulla base di questo presupposto, è stata allestita, partendo da singole colture ibride uomo-topo una serie di sottocolture; in ciascuna si è studiato, un certo numero (qualche decina) di proteine (enzimi) che presentavano un comportamento elettroforetico diverso nell'uomo e nel topo. Ogni sottocoltura nella quale non si trovava un enzima umano doveva essere priva di entrambi i cromosomi umani con il gene che codificava quell'enzima. Questo sistema sperimentale metteva in grado di scoprire se i geni per due enzimi, X e Y, erano localizzati sullo stesso cromosoma (geni sintenici): si poteva concludere che erano sintenici se in tutte le colture in cui si trovava l'X umano si trovava anche l'Y umano e che, viceversa, in tutte quelle in cui fosse risultato assente l'X umano fosse mancato anche l'Y umano. In breve tempo si sono scoperte molte coppie, o addirittura gruppi, di geni sintenici. Con la messa a punto delle tecniche di bandeggio che hanno permesso di individuare singolarmente i cromosomi umani è diventato possibile assegnare i gruppi di geni sintenici ai rispettivi cromosomi. Si è trattato, semplicemente, di caratterizzare le sottocolture ibride in esame anche per i cromosomi: se un gruppo sintenico mostrava una concordanza perfetta di comportamento con un certo cromosoma umano era possibile assegnarlo a quel cromosoma.
Per quanto questo approccio abbia costituito una pietra miliare nella delucidazione della topografia dei geni umani, esso tuttavia aveva un limite molto grave derivante dal fatto che si poteva utilizzare solo per geni espressi e studiabili nelle cellule in coltura (si trattava quasi sempre, rispettivamente, di geni strutturali di enzimi e di fibroblasti). Anche questo limite è stato superato quando è diventato possibile identificare i geni non dai loro prodotti, ma direttamente, come sequenze di DNA, mediante sonde molecolari specifiche (probes). È stato possibile così accertare la presenza o meno di un determinato gene umano in una certa sottocoltura utilizzando un probe capace di identificare la sequenza di quel gene (in modo specifico rispetto non solo agli altri geni umani ma anche al corrispettivo gene murino). Questo metodo ha costituito un'innovazione significativa in quanto ha permesso il riconoscimento di numerosi gruppi sintenici, ognuno costituito da parecchi geni; esso però non è in grado di fornire alcuna informazione sulle distanze fisiche o di ricombinazione tra i geni di uno stesso gruppo sintenico (tornando al paragone con la geografia dell'Asia, si era passati dalla fase di tre coppie di città situate chissà dove all'individuazione di un certo numero di città assegnate all'India, a un altro gruppo localizzato in Giappone e così via, ma senza alcun dettaglio riguardo alla sede delle singole città all'interno delle rispettive nazioni).
Tappa successiva è stata la scoperta di centinaia di RFLP (Restriction fragment length polymorphisms). Gli RFLP sono polimorfismi diallelici che riguardano una sequenza di 4-7 coppie di basi che può corrispondere a quella di un sito riconosciuto da un enzima di restrizione, allele+, oppure non corrispondere a tale sito, allele‒. Fino agli inizi degli anni Ottanta, i limiti più seri nella costruzione di mappe di ricombinazione (dette anche mappe statistiche) del genoma umano sono stati rappresentati dal numero molto esiguo di marcatori genetici polimorfici noti e dal fatto che la maggioranza di essi fosse solo moderatamente polimorfica, cioè avesse un grado di eterozigosità (H) piuttosto piccolo. Un marcatore genetico è, infatti, un sito sul DNA identificato attraverso la sua variabilità nella popolazione: se questa variabilità è elevata, cioè se la frequenza H degli eterozigoti (o grado di eterozigosità) è almeno dell'1%, il marcatore è detto polimorfico. In una popolazione in stato di stabilità (equilibrio di Hardy-Weinberg) per un certo marcatore, condizione rispettata quasi senza eccezioni, la frequenza degli eterozigoti per quel marcatore è data dalla somma delle frequenze di tutti i possibili eterozigoti, essendo la frequenza di ogni eterozigote pari al doppio prodotto di quelle degli alleli di cui è costituito. L'informatività potenziale di un marcatore ai fini di una mappatura statistica è tanto maggiore quanto maggiore è H. La scarsezza di siti polimorfici rendeva molto difficile la mappatura statistica di un sito genetico rispetto a un altro, perché questo procedimento si basa necessariamente sull'analisi della progenie di individui eterozigoti per entrambi i siti. Fino agli inizi degli anni Sessanta, gli unici marcatori polimorfici (cioè gli unici utilizzabili come punto di riferimento per descrivere la topografia del genoma umano) sono stati i gruppi sanguigni che sono poco meno di una decina, cioè in media uno per ogni 2-3 autosomi: situazione che, senza alcuna esagerazione, era paragonabile a quella di un geografo che disponga di una decina di punti trigonometrici di altitudine per descrivere l'orografia di tutte le catene montuose del mondo. A partire dagli anni Sessanta, con la scoperta dei polimorfismi enzimatici, i punti di riferimento sono diventati circa 30, cioè la situazione, anche se migliorata, è rimasta pressoché immutata: il magro raccolto di geni associati che erano stati individuati fino alla fine degli anni Settanta consisteva solo di tre coppie di geni associati (v. sopra), senza tenere conto naturalmente dei geni di uno stesso gruppo, come quelli della famiglia genica delle globine. La vera scoperta determinante è stata quella degli RFLP: dai 30 punti di riferimento si è passati, nel breve volgere di pochi anni, a varie centinaia di marcatori polimorfici, molti dei quali sono stati assegnati prima al rispettivo cromosoma e successivamente localizzati in una sua parte specifica. A partire da quel momento per qualsiasi gene si volesse localizzare si poteva essere certi in partenza che nel genoma erano presenti vari marcatori noti, a esso strettamente associati; trovarli era un compito molto arduo, ma in linea di principio attuabile. È fin troppo evidente, inoltre, che in questo campo, più ancora che in altri, la raccolta delle conoscenze è fortemente autocatalitica; per es. fino a quando i marcatori polimorfici noti erano pochi, dispersi e localizzati in punti ignoti del genoma, per ogni gene che si volesse mappare era necessario esaminarne il comportamento rispetto a tutti i marcatori noti, al fine di accertare se qualcuno di essi mostrasse di segregare in modo non indipendente dal gene in esame. Invece, il disporre di un gran numero di gruppi di associazione (anziché di singoli geni) assegnati alle rispettive regioni cromosomiche ha reso possibile procedere a tappe: prima su larga scala, esplorando cioè il comportamento del gene in esame rispetto a un rappresentante qualsiasi di ogni gruppo, per passare poi a una scala via via più dettagliata valutando il suo comportamento in termini di segregazione solamente rispetto ai marcatori del gruppo con il quale questo gene avesse mostrato di essere associato e/o di essere sintenico.
Si era così giunti a disporre di varie centinaia di punti di riferimento, correttamente allineati e localizzati nei rispettivi cromosomi e separati l'uno dall'altro da distanze pari in media a una decina di centimorgan (un centimorgan corrisponde a una frequenza di ricombinazione dell'1% ed equivale in media a una megabase, cioè a un milione di coppie di desossiribonucleotidi). Sebbene solo meno di dieci anni prima nessuno avrebbe considerato attuabile un progresso così enorme, resta comunque il fatto che avendo un punto di riferimento ogni decina di megabasi e con la tecnologia dell'epoca non sarebbe stato nemmeno ipotizzabile il progetto di sequenziare l'intero genoma umano (circa tre miliardi di coppie di basi), progetto che è ora in corso e che si prevede sarà portato a termine entro il 2003-2004. La sua attuabilità pratica è diventata realistica grazie alla scoperta delle STR e all'invenzione di tre tecnologie, due delle quali (la PCR, Polymerase chain reaction, e le tecniche di sequenziamento del DNA) hanno letteralmente rivoluzionato la genetica (la terza tecnologia è quella degli YAC, Yeast artificial chromosomes). Le STR (Simple tandem repeats), dette anche SSR (Simple sequence repeats) o microsatelliti, sono brevi sequenze ripetute in tandem un numero n di volte, per es. (CAG)n. Il loro elevato grado di polimorfismo riguarda il numero di ripetizioni, per cui di ognuna delle regioni costituita da una successione di ripetizioni (repeats) esistono di regola non due alleli (come nel caso degli RFLP), ma molti alleli, per es. 5: (CAG)₆, (CAG)₇, (CAG)₈, (CAG)₉ e (CAG)₁₀. Esistono, sparsi nel genoma, moltissimi siti (CAG)n, moltissimi (CAT)n, (TGA)n ecc. È tuttavia possibile individuare ognuno di essi in modo specifico perché ciascuno è situato in un contesto proprio, cioè è fiancheggiato da due sequenze, una a monte e una a valle, che differiscono da quelle che fiancheggiano le altre STR dello stesso tipo. Per es. un certo sito (CAG)n, che denominiamo A, è fiancheggiato da due sequenze specifiche, 5´A e 3´A; un altro sito B, anch'esso del tipo (CAG)n, è fiancheggiato da due sequenze specifiche, 5´B e 3´B, diverse dalla 5´A e dalla 3´A e così via. Quindi, se in un esperimento di amplificazione mediante PCR effettuato sul DNA di un certo soggetto, si usano sonde (probes) complementari al 5´F e al 3´F, si amplificano specificamente i due alleli (CAG)nF di quel soggetto, che sono uguali oppure diversi fra loro per il numero n delle ripetizioni (CAG) a seconda che esso sia omo- o eterozigote per quel sito. Si possono così studiare separatamente l'una dall'altra tutte le STR. I polimorfismi per le STR sono estremamente più utili degli RFLP ai fini della mappatura statistica del genoma umano perché, oltre a essere molto numerosi, il loro grado medio di eterozigosità H è di gran lunga maggiore (perché, a differenza degli RFLP che sono in genere diallelici, gli alleli delle STR sono in genere più di due). In aggiunta a queste proprietà biologiche così favorevoli, si deve notare che sono tecnicamente molto più facili da studiare degli RFLP e quindi molto più economici (naturalmente queste considerazioni valgono anche per la loro utilizzazione nella medicina forense, tanto che sono diventati i marcatori medico-legali di elezione). Attualmente sono state localizzate lungo il genoma umano più di 5000 STR. Esse costituiscono la piattaforma di partenza del progetto del suo sequenziamento completo.
Una delle tecnologie più fruttuose dell'ingegneria genetica ai suoi albori è consistita nel clonaggio di una sequenza in esame in un plasmide, seguito dalla raccolta del DNA così amplificato. Un limite molto serio di questa tecnologia è la brevità della sequenza (dell'ordine di poche chilobasi, kb) che può essere incorporata in un genoma piccolo come quello di un plasmide. Con gli YAC la lunghezza della sequenza clonabile è stata aumentata di un fattore dell'ordine di 100, arrivando quindi alla megabase (pari cioè a un centesimo, o poco meno, di un cromosoma umano). Uno YAC è una sequenza, derivata per es. da un genoma umano, che è stata trasformata in una sorta di cromosoma di lievito con procedimenti ormai standardizzati di ingegneria genetica. È stata creata una genoteca costituita da molte migliaia di YAC e, dato che ciascuno di essi comprende una sequenza umana pari in media a una megabase e il genoma umano è costituito da circa 3000 megabasi, si suppone che tale genoteca sia completa, cioè che tutte le sequenze umane siano veicolate in almeno uno degli YAC della genoteca.
La PCR è certamente per la genetica molecolare, anzi per tutta la biologia molecolare, l'innovazione tecnica più importante e più utilizzata degli ultimi 10-15 anni. Essa permette di amplificare specificamente anche di milioni di volte una sequenza di DNA lunga fino a 1-2 kb (anche di più opportuni accorgimenti sperimentali) se si conosce la sequenza delle due regioni che la fiancheggiano. Negli ultimi anni sono stati messi a punto procedimenti sempre più rapidi (anche automatici), attendibili ed economici finalizzati al sequenziamento del DNA. La fase attuale ha avuto come punto di partenza la situazione presentata nella fig. 6, che mostra i 23 cromosomi del corredo aploide dell'uomo (22 autosomi + X; Y non è mostrato) con 2335 posizioni definite da 5264 marcatori (quasi tutti STR) localizzati lungo di essi. Il problema da risolvere è stato - ed è tuttora - il sequenziare i tratti interposti tra questi e 2335 posizioni. Lo si è affrontato creando una raccolta 'completa' di YAC allo scopo di individuare quelli che comprendono una sequenza complementare a una delle 2335 posizioni di riferimento e soprattutto di trovarne alcuni che si sovrappongano a due STR adiacenti. Tenendo conto del modo con cui gli YAC sono stati ottenuti (ognuno di essi ha una sezione centrale derivata da una sequenza continua del genoma umano fiancheggiata da due sequenze, una al suo 5´ e una al suo 3´, che le conferiscono proprietà di YAC) si può essere conseguentemente certi che in ogni YAC che comprende una sequenza a´ uguale a quella a di un marcatore, e un'altra b´ uguale a quella b di un altro marcatore adiacente al precedente, la sequenza interposta tra a´ e b´ corrisponde necessariamente alla sequenza interposta nel genoma umano tra le due STR in questione. Cosa si saprà dell'anatomia del genoma umano quando la sua intera sequenza sarà stata determinata? Rispondendo 'tutto', da un certo punto di vista si sarebbe nel giusto. Ma è facile rendersi conto che se tutto si riducesse alla sequenza dei suoi tre miliardi di coppie di basi, pur essendo questo senza dubbio un grandissimo risultato, si sarebbe ancora ben lontani dal sapere tutto quello che si vorrebbe sapere, anzi si saprebbe ancora ben poco. E questo perché un'anatomia (perché di anatomia, anche se molecolare, si tratta) è nota solo se si conoscono le relazioni tra le strutture in esame e il loro modo di funzionare, per cui si è in grado di prevedere cosa succederebbe se questa anatomia, invece di essere quella che è, fosse cambiata in certi modi definiti. Ci si accorge subito, allora, che l'avere individuato tutti i geni del genoma con le loro sequenze di inizio e di termine costituisce solo il primo passo per la comprensione dell'anatomia di un genoma qualsiasi. Sarebbe inoltre fondamentale chiarire il significato funzionale del DNA intergenico, il quale - è bene non dimenticarlo - costituisce la maggior parte del genoma. È necessario, inoltre, notare che la condizione di base (quella di saper prevedere se e come cambierebbe l'espressione di una determinata sequenza di DNA se la sua anatomia fosse diversa da quella che è effettivamente) è soddisfatta solo per poche e relativamente brevi regioni del DNA, cioè solo per quelle codificanti. Di esse, se si conosce la sequenza, possiamo dire di sapere tutto quello che c'è da sapere, in quanto conosciamo perfettamente le relazioni che intercorrono tra le sequenza del DNA e le sequenze degli aminoacidi del polipeptide codificato (per es., sappiamo che, contrariamente a quanto suggerirebbe il buon senso, è molto più grave perdere un nucleotide che perderne tre). Si sa molto, ma non tutto, anche riguardo alle relazioni tra struttura e funzione delle sequenze che fiancheggiano i geni strutturali e alla regolazione coordinata dei gruppi dei geni globinici. Ma, al di là di questo livello c'è, almeno per ora, un vuoto di conoscenze: non sappiamo se la disposizione topografica dei geni e dei gruppi di geni nei rispettivi cromosomi è una qualsiasi tra molte funzionalmente più o meno equivalenti, oppure è di gran lunga la migliore (o tra le migliori) possibile anche dal punto di vista evolutivo. Non c'è dubbio che questo problema costituisce uno dei più grandi misteri della genetica attuale.
b) Dal fenotipo al DNA, un passo alla volta oppure con un solo passo. Per una novantina d'anni, dei circa cento del suo sviluppo, la genetica ha proceduto risalendo, a ritroso e un passo alla volta, da un fenotipo unifattoriale verso il genotipo. Il problema che si è affrontato, e risolto con successo in migliaia di casi, è consistito quindi nell'individuare la natura molecolare della variazione genetica responsabile della variazione fenotipica, avendo come punto di partenza la certezza che la variazione genetica era trasmissibile come una singola entità secondo due possibili modalità: la prima come variazione di un singolo sito genetico (per es., la sostituzione di una singola coppia di basi con un'altra, oppure la variazione del numero di ripetizioni in una STR), la seconda come variazione di due o più siti così vicini da essere trasmessi in blocco, cioè senza mai ricombinare (se, per es., in una certa sequenza di DNA molto breve esistono due siti variabili A e B e un individuo ha il genotipo A1B2/A2B1, esso trasmette alla prole o A1B2 o A2B1; non trasmette mai, o quasi mai, A1B1 o A2B2: cioè queste due coppie di alleli, pur riguardando siti diversi, si comportano come un unico fattore mendeliano).
Come si mostra schematicamente nella fig. 8A nei casi più tipici si risaliva a ritroso fino al genotipo responsabile del fenotipo unifattoriale in esame (per es., una malattia del metabolismo): innanzitutto scoprendo, attraverso la genetica biochimica, che esso era da attribuire a una carenza di una determinata proteina (anzi, più precisamente, di una determinata catena polipeptidica), per es. dell'attività di un enzima; poi, scoprendo che questa carenza consisteva in una riduzione dell'attività specifica della molecola enzimatica; infine, individuando esattamente l'alterazione della struttura primaria della catena polipeptidica responsabile della riduzione della sua attività specifica come enzima. A questo punto si poteva dedurre l'alterazione genetica responsabile basandosi sulle conoscenze certe delle relazioni intercorrenti tra la sequenza aminoacidica di una catena polipeptidica e la sequenza nucleotidica che la codifica. Lo stesso tipo di procedimento può essere facilmente immaginato, mutatis mutandis, per i casi nei quali l'attività enzimatica era deficitaria perché le molecole di enzima erano troppo poche, e ciò, a sua volta, poteva dipendere da una bassa stabilità della molecola enzimatica.
Se alla base del fenotipo di una scarsa attività enzimatica non c'era un'alterazione strutturale della molecola dell'enzima, bensì una compromissione della sua sintesi, allora l'identificazione dell'alterazione genetica che ne era responsabile era risolvibile in modo altrettanto diretto solo in certi casi (per es. nelle mutazioni frameshift), mentre in altri casi la sua soluzione era più difficile, come, per es., per le mutazioni che compromettono la trascrizione del gene (per es. mutazioni del suo promotore), oppure la maturazione del suo prodotto, il pre-mRNA a mRNA, e/o la traduzione di quest'ultimo. Lo stesso tipo di processo è stato talora, e solo molto più di recente, compiuto in una sola tappa. Il punto di partenza è anche in questo caso il fatto di aver accertato, con metodi classici di genetica formale, che il fenotipo in esame ha una base genetica unifattoriale. Per alcuni fenotipi unifattoriali, tuttavia, la genetica biochimica non riesce a individuare la proteina la cui alterazione ha causato il fenotipo in esame, quindi non si può attuare il procedimento graduale a ritroso (dal fenotipo al genotipo) appena descritto. L'esempio più noto di una situazione di questo genere è quello della fibrosi cistica. In molti di questi casi l'identificazione molecolare del gene responsabile è ugualmente riuscita mediante un approccio alternativo. Esso consiste: 1) nel localizzare con estrema esattezza, mediante opportuni procedimenti di genetica formale (studi a livello degli aplotipi), la posizione occupata nel genoma dal gene responsabile del fenotipo; 2) nel clonare e sequenziare quella regione per individuarvi un gene/i strutturale/i; 3) infine, nell'accertare se uno di questi geni presenta un'alterazione strutturale nei soggetti con fenotipo anormale. Identificato il gene responsabile, dalla sequenza codificante si è risaliti alla sequenza aminoacidica della catena polipeptidica ricercata e da essa si è potuto spesso dedurre la sua localizzazione cellulare e alcuni aspetti del suo funzionamento. Nel caso paradigmatico della fibrosi cistica si è compreso che la proteina anomala è una proteina di membrana adibita al trasporto di ioni. Questo tipo di procedimento è stato indicato talora come reverse genetics (perché si è arrivati alla proteina deducendone la struttura da quella del suo gene codificante e non procedendo a ritroso come nella genetica classica) e talora come positional cloning (perché si è arrivati al gene 'clonando la posizione' del genoma nel quale è situato).
i. bianco silvestroni, Le talassemie, un problema medico-sociale: ieri e oggi, Roma, Istituto italiano di Medicina sociale, 1998.
l.l. cavalli-sforza, a. piazza, p. menozzi, The history and geography of human genes, Princeton, Princeton University Press, 1994 (trad. it. Milano, Adelphi, 1997).
b. dallapiccola, g. novelli, Genetica medica essenziale, Roma, Phoenix, 1998;
Genetica generale e umana, a cura di L. De Carli et al., 2 voll., Padova, Piccin-Nuova libraria, 1997.
b. lewin, Genes VI, Oxford-New York, Oxford University Press, 1997 (in it. v. Il gene IV, Bologna, Zanichelli, 19972).
e.h. mcconkey, Human genetics. The molecular revolution, Boston, Jones and Bartlett, 1993 (trad. it. Bologna, Zanichelli, 1997).
g. modiano, Razza, in Enciclopedia del Novecento, 5° vol., Roma, Istituto della Enciclopedia Italiana, 1980, pp. 1032-51; id.
Sangue: genetica, in Enciclopedia del Novecento, 6° vol., Roma, Istituto dell'Enciclopedia Italiana, 1982, pp. 262-308.
id., Uomo: razze umane, in Enciclopedia Italiana. Quinta Appendice, 5° vol., Roma, Istituto della Enciclopedia Italiana, 1995, pp. 665-73.
g. montalenti, Introduzione alla genetica, Torino, UTET, 19792.
g. morpurgo, Capire l'evoluzione, Torino, Boringhieri, 1975; id., La natura della vita, Bologna, Zanichelli, 1991.
id., La logica dei sistemi viventi, Torino, Bollati Boringhieri, 1997.
e.w. sinnott, l.c. dunn, t. dobzhansky, Principles of genetics, New York, McGraw-Hill, 1985.
a.m. srb, r.d. owen, r.s. edgar, General genetics, San Francisco, Freeman, 1965 (trad. it. Firenze, USES, 19692);
c. stern, Principles of human genetics, S. Francisco, Freeman, 1973 (trad. it. Bologna, Zanichelli, 1977).
t. strachan, a.p. read, Human molecular genetics, New York, Wiley, 1992.
f. vogel, a.g. motulsky, Human genetics. Problems and approaches, Berlin-New York, Springer, 1997.