gene e genoma
L'unità e l'insieme dell'informazione genetica
Il gene è l'unità elementare dell'informazione genetica e corrisponde al segmento di DNA, più raramente di RNA, in grado di produrre una proteina formata da una catena di amminoacidi. In quanto tale, il gene si replica, si trasferisce alla generazione successiva, si esprime, muta, si adatta all'ambiente ed evolve. L'insieme di tutti i geni di un organismo forma il genoma, che è tipico per ogni specie. Sono stati studiati i genomi di molte specie viventi e da qualche anno si conosce la struttura del genoma umano
Così come la fisica identifica nell'atomo il più piccolo oggetto che rappresenta tutte le proprietà della materia, e la biologia identifica nella cellula la struttura più piccola capace di compiere tutte le funzioni di un organismo, nello stesso modo la genetica, branca della biologia, identifica nel gene l'unità funzionale dell'ereditarietà biologica, ossia l'unità di informazione genetica, capace di replicarsi, mutare, trasferirsi da una generazione all'altra, esprimersi, adattarsi all'ambiente e partecipare al processo evolutivo.
A loro volta i geni si trovano, all'interno del nucleo della cellula, sui cromosomi, filamenti di natura proteica su cui poggia la molecola del DNA. L'insieme di tutti i geni presenti in un nucleo, e quindi in un intero organismo, costituisce il suo genoma.
Per tutti gli organismi viventi e per la maggior parte dei virus la sostanza che forma il gene è la molecola di DNA. È invece la molecola di RNA per alcuni virus, come quello dell'influenza e dell'HIV (AIDS). In entrambi i casi, si tratta di un'unità di informazione biologica scritta in molecole di nucleotidi (DNA e RNA). Quando vogliamo scrivere un'informazione su un preciso argomento utilizziamo le lettere dell'alfabeto. Analogamente, un gene, che contiene l'informazione completa per una funzione elementare, utilizza come lettere i nucleotidi del suo DNA.
Dalle cellule più piccole agli organismi più grandi, ogni singola funzione (respirazione, digestione, movimento, stimolo nervoso e così via) e ogni singola struttura (scheletro, muscoli, organi, pelle e capelli, e altri) sono dovute a una o più proteine. Per esempio, ogni molecola di emoglobina, la proteina che dà il colore rosso al sangue e che trasporta l'ossigeno dai polmoni ai tessuti, è un'unità funzionale fatta di quattro sottounità, chiamate globine, due di tipo α (alfa) e due di tipo β (beta). La formazione di ognuna di queste globine è diretta da uno specifico gene. Nell'uomo il gene per la globina α risiede nel cromosoma 16 e quello per la globina β nel cromosoma 11.
Il gene è quindi una sequenza di nucleotidi capace di produrre la catena di amminoacidi che costituisce una proteina. Nel caso dell'emoglobina, due geni diversi, localizzati in cromosomi diversi, ognuno contenente il codice per una catena amminoacidica diversa, cooperano a permettere la precisa funzione di legare l'ossigeno contenuto nell'aria che respiriamo per fornirlo alle cellule.
Il genoma umano è fatto da 23 coppie di cromosomi, che costituiscono la 'libreria' dell'informazione ereditaria, in cui ogni libro corrisponde a un cromosoma. I due geni dell'emoglobina alfa e beta sono quindi come due capitoli di due diversi libri (il 'libro-cromosoma 16' e il 'libro-cromosoma 11'). Il gene della globina α potrebbe essere il 'testo' che va, per esempio, da pagina 324 a 355 del 'libro-cromosoma 16', mentre il gene per la globina β il 'testo' che va da pagina 110 a 123 del 'libro-cromosoma 11'. La precisa localizzazione di ogni gene sul cromosoma viene definita locus (parola latina che significa "luogo").
I nostri geni, come quelli di tutti gli organismi superiori, derivano per metà dalla madre e per metà dal padre (fecondazione). Quelli che controllano un medesimo carattere (per esempio, il colore dei capelli) sono disposti sui cromosomi in loci (plurale di locus) identici. Così l'allele materno che porta al biondo i capelli del figlio e l'allele paterno che invece porta al nero formeranno insieme il gene per il colore dei capelli, situato sullo stesso locus. Tutti i geni degli organismi diploidi (cioè, con doppia serie di cromosomi) sono presenti in coppia. Le due parti della coppia sono gli alleli, parola derivata dal greco, con il significato di "altri": infatti derivano da due individui diversi (il padre e la madre) e, pur esercitando la stessa funzione (colore dei capelli), lo fanno in modo diverso (biondo l'uno, nero l'altro).
Per ogni gene possiamo distinguere diverse porzioni: innanzi tutto, ogni gene contiene l'informazione per la corrispondente catena amminoacidica da sintetizzare, scritta nel linguaggio del codice genetico: successioni di gruppi di tre nucleotidi del DNA codificano, cioè determinano, una successione di amminoacidi. Una proteina media è costituita da 500 amminoacidi e quindi la porzione del gene medio che codifica quella proteina è fatta di 1.500 nucleotidi.
Ogni gene contiene anche porzioni nucleotidiche che non codificano amminoacidi ma che contengono istruzioni su come l'informazione deve passare dal DNA all'RNA e quindi essere trasportata ai ribosomi dove viene prodotta la proteina. Questi nucleotidi circondano e anche inframezzano i 1.500 della porzione che codifica, e si arriva così a circa 7.500 nucleotidi. Infine, poiché le cellule dei diversi tessuti di un organismo contengono proteine diverse nelle varie fasi della loro vita, in ogni momento e in ogni cellula vengono espressi geni diversi. Inoltre, come le varie sezioni di un libretto di istruzioni di un elettrodomestico, anche i geni hanno un indice che permette di identificarli per decidere quando e come devono essere usati. Questo indice è una porzione di gene che si chiama promotore e comprende in media 2.500 nucleotidi. Complessivamente quindi ciascun gene di un organismo umano è fatto di 10.000 nucleotidi, di cui solo 1.500 contengono il codice per la proteina.
I genetisti hanno inventato il nome genoma per definire il DNA totale di ogni organismo, cioè il complesso delle informazioni genetiche necessarie a produrre un organismo nelle sue diverse funzioni, complesse e integrate. Ma quanti sono i geni che compongono un genoma come quello umano? Un modo facile per determinarne il numero potrebbe essere di dividere il numero complessivo di nucleotidi di cui è fatto il DNA del genoma umano (3.300 milioni) per 10.000, la dimensione del gene medio. Il risultato porta a circa 330.000 geni. Ma questo è un semplice calcolo aritmetico che non poteva lasciare soddisfatti gli scienziati: infatti il loro obiettivo era arrivare a conoscere quanti sono esattamente i geni che codificano le proteine e qual è la sequenza di nucleotidi dell'intero genoma umano.
Duecentoventi genetisti, di cui due italiani, hanno deciso nel 1988 che volevano sapere qual è la struttura nucleotidica e la funzione di ognuno dei geni umani. Poiché questa informazione sarebbe stata preziosa per sapere come funziona normalmente il corpo umano e come si ammala, hanno chiesto ai governi dei loro paesi di finanziare questo ambiziosissimo progetto, che ha preso proprio il nome di Progetto genoma umano, nonché il curioso nomignolo di HUGO, dall'inglese Human genome organisation. Come dovrebbe accadere per ogni progetto scientifico di così vasta importanza, fu anche annunciato che i risultati degli esperimenti sarebbero stati messi gratuitamente a disposizione di tutti i ricercatori del mondo, e così è stato.
Il lavoro cominciò nel 1990 e nel 2000 i due leader politici di Stati Uniti e Gran Bretagna, i paesi che più hanno contribuito al progetto, Bill Clinton e Tony Blair, hanno annunciato che era disponibile un primo schema della struttura del genoma umano. Solo tre anni dopo i dati sono comparsi con una qualche completezza, ma ancora oggi solo alcuni cromosomi sono stati descritti nella loro intera struttura, e per molti dei circa 30.000 geni che vi sono stati trovati non è stata ancora identificata una funzione certa. Il fatto che il genoma umano contenga circa 30.000 geni e non 330.000 ha una precisa ragione: solo circa 2% di esso contiene la codificazione per le proteine, mentre la maggior parte del DNA è apparentemente inutile, come se fossero parole ripetute e senza senso. Non risulta così, invece per le specie animali più semplici, che hanno un numero inferiore di geni e una quantità inferiore di DNA 'inutile'. Gli studiosi stanno cercando di dare un'interpretazione a questo strano fatto, apparentemente contrario all'economia della natura.