sequenziamento del DNA
Procedimento che consente di decifrare la sequenza delle basi in un determinato segmento di DNA. Viene eseguito per fini scientifici, come per es. per studi di genomica evolutiva o funzionale, o per fini biotecnologici e medici (produzione di sonde o di transgeni), o pratici (identificazione di persone, animali o altri organismi di interesse industriale, resti di interesse forense o archeologico).
Le prime metodologie di s. furono messe a punto a partire dalla fine degli anni Sessanta del secolo scorso. Le due strategie fondamentali furono presentate nel 1977 rispettivamente dai gruppi di F. Sanger e di W. Gilbert. Il s. enzimatico di Sanger prevedeva la copiatura del frammento da sequenziare tramite una DNA-polimerasi e l’uso di dideossi-nucleotidi terminatori di catena che, una volta mescolati ai deossi-nucleotidi, provocavano un blocco in corrispondenza delle basi A, G, C o T, a seconda del tipo di terminatore. Poiché il prodotto delle quattro reazioni (una per ogni terminatore di una specifica base) veniva sviluppato su una elettroforesi su gel, si poteva ricostruire la sequenza di frammenti lunghi fino a diverse centinaia di basi. Questo metodo fu perfezionato negli anni Novanta, quando si cominciarono a utilizzare nucleotidi terminatori di catena fluorescenti, che venivano incorporati e poi letti tramite apparati che accoppiavano l’elettroforesi alla lettura della fluorescenza eccitata da laser in linea durante la corsa elettroforetica. Il s. chimico di Gilbert e del suo collaboratore Allan Maxan era invece basato su quattro distinte reazioni chimiche che rompevano il frammento di DNA, marcato a una estremità, in corrispondenza delle diverse basi. Confrontando i profili ottenuti dalle reazioni risolte tramite elettroforesi si poteva risalire alla sequenza del DNA. Questa tipologia di s. e le sue molte varianti persero di importanza già alla fine degli anni Ottanta, rimanendo utili nei casi di sequenze anomale che non venivano ben risolte dal s. enzimatico. Recentemente sono state sviluppate nuove tecnologie che consentono di accoppiare l’amplificazione tramite reazione a catena della polimerasi (PCR), l’uso di fluorocromi e l’utilizzo di supporti solidi cui legare il DNA in serie ordinate, per sequenziare migliaia di diverse specie di DNA simultaneamente.
Il processo tecnologico è andato di pari passo con lo sviluppo di progetti che hanno prodotto il s. di interi genomi. Tra i molti genomi completati vi sono quello del batterio Haemophilus influentiae (1995); del lievito di birra Saccharomyces cerevisiae (1996); del moscerino della frutta Drosophila melanogaster (2000); della pianta Arabidopsis thaliana (2000) e soprattutto il genoma umano (2003) (➔ Progetto genoma umano). Oggi l’enorme mole di dati di sequenza prodotti da questi grandi progetti è custodita in apposite banche dati, che forniscono annotazioni classificatrici e funzionali e supporti informatici per confrontare le sequenze tra loro o per risalire a vari tipi di informazioni rilevanti.
Informazione genetica e medicina personalizzata
Con il completamento del Progetto genoma umano (2001-2004) è stata resa disponibile al pubblico l’intera sequenza di Homo sapiens. Questa nuova risorsa fornisce importanti informazioni di valore biologico e medico. La possibilità di conoscere nel dettaglio la costituzione genetica di ciascun individuo, a livello di genotipo e di espressione genica, ha segnato l’inizio di una nuova era: quella della medicina personalizzata, che studia tutte le informazioni contenute nel genoma umano per mettere a punto cure mediche ‘su misura’ per i singoli pazienti sulla base del loro caratteristiche genetiche. La più notevole applicazione derivante dal sequenziamento del genoma è l’opportunità di acquisire per ogni paziente un profilo genetico personale riguardante il suo stato di salute, comprendente la valutazione del rischio di predisposizione a specifiche malattie, la loro diagnosi precoce, e l’individuazione delle possibili risposte individuali a determinati farmaci.
Le informazioni ottenute dal sequenziamento del DNA consentono in alcuni casi di identificare la predisposizione a sviluppare una malattia su base genetica, mediante l’identificazione di fattori di suscettibilità, per poter prevenire o ritardare l’insorgenza della patologia, intervenendo con approcci terapeutici più razionali e meglio indirizzati, o con semplici mutamenti dello stile di vita. Mentre nel caso di molte malattie monogeniche sono noti sia il gene associato alla malattia che le mutazioni che ne sono la causa, la caratterizzazione di un genotipo per le malattie multifattoriali si basa sull’individuazione di determinanti genetici associati alla patologia, significativi dal punto di vista statistico. I fattori di suscettibilità possono essere polimorfismi localizzati sulle sequenze geniche, ma anche su regioni di DNA non codificante che hanno effetti su promotore, splicing o stabilità dell’mRNA. Per l’identificazione delle componenti genetiche della suscettibilità a patologie complesse si adottano varie strategie. Le più seguite sono l’analisi di segregazione per stimare il tipo e la frequenza degli alleli che danno suscettibilità, l’analisi di linkage, lo studio delle associazioni nella popolazione e l’analisi del locus di un carattere quantitativo (QTL). Esempi di analisi genetica di malattie complesse sono: lo studio del carcinoma della mammella (identificazione di mutazioni sui geni BRCA1 e 2, responsabili del 20% dell’insorgenza delle forme familiari); l’identificazione di un locus di suscettibilità per la malattia di Alzheimer con esordio tardivo (allele ApoE), e di un gene (CARD15) le cui mutazioni sono associate all’insorgenza del morbo di Crohn; lo studio di mutazioni sul gene PPAR (correlate a un aumento del rischio di contrarre il diabete insulino-resistente). È importante notare che, allo stato attuale delle conoscenze, i geni associati alle malattie multifattoriali giustificano solo una piccola percentuale dei casi, e il loro contributo alla valutazione del rischio di contrarre la malattia è davvero minimo. Ciò nonostante molte aziende private offrono al pubblico la possibilità di avere a pagamento la caratterizzazione del proprio genotipo personale, con il calcolo del rischio di contrarre alcune malattie tra le più diffuse.
L’introduzione nel mercato dei microarray permette di analizzare a costi contenuti sia un intero genoma individuale per la presenza di circa due milioni di varianti genetiche, sia il profilo di espressione genica del singolo paziente. Gli array di espressione vengono utilizzati soprattutto per la caratterizzazione dei tumori, per distinguerne il sottotipo, per effettuare la prognosi, e per stabilire la sensibilità ai farmaci antitumorali.
I singoli individui reagiscono in modo diverso ai farmaci. Ambiente, dieta, età, stile di vita e stato di salute possono influenzare l’efficacia dei medicinali; tuttavia per la maggior parte queste differenze individuali nella risposta dipendono da variazioni nell’assorbimento, nella distribuzione, nel metabolismo e nell’eliminazione dei farmaci, nonché dalla gamma dei recettori bersaglio. La base di questa variabilità risiede nelle combinazioni di polimorfismi presenti in un numero limitato di geni. La farmacogenetica (➔) studia proprio l’influenza dei geni o dei singoli alleli sul metabolismo di un farmaco o sulla sua efficacia, mentre la farmacogenomica (➔) si avvale di risorse genomiche (sequenze geniche, profili di espressione, ecc.) per identificare nuovi bersagli farmacologici.
La gamma dei farmaci oggi in commercio agisce sostanzialmente su circa 400 bersagli. Gli studi di genomica e proteomica hanno molto ampliato il numero di potenziali bersagli disponibili per la ricerca; dalle poche centinaia di dieci anni fa si è passati ai circa 50.000 odierni. Sono già noti diversi esempi di varianti genetiche che influenzano le risposte ai farmaci: per es., un paziente con una variante del gene del citocromo P450 a bassa attività metabolica, CYP2D6, può non avere alcun beneficio dalla somministrazione di un antidolorifico contenente codeina; mentre le varianti dello stesso gene ad alta attività metabolica richiedono dosi giornaliere ridotte fino a 50 volte di farmaci psichiatrici o cardiovascolari.
L’uso dell’informazione genetica individuale, anche se ha come scopo la salute, pone problemi etici e legislativi. I dati ricavati dall’analisi del proprio genoma dovrebbero essere considerati proprietà dell’individuo, noti solo a personale qualificato e resi pubblici solo in seguito a consenso informato. La diffusione di dati riguardanti la possibilità di contrarre malattie in futuro, per es., potrebbe avere gravi conseguenze per chi accede al mondo del lavoro.