BIOLOGIA MOLECOLARE
- Con l'espressione "b. molecolare" s'indica quella parte della scienza che si propone di studiare e interpretare a livello molecolare i fenomeni biologici, prendendo in considerazione la struttura, le proprietà e le reazioni delle molecole chimiche di cui gli organismi viventi sono composti. Questa nuova branca della b., pur discendendo direttamente dalle scienze biologiche classiche, dalla chimica e soprattutto dalla chimica biologica, simboleggia un indirizzo realmente nuovo, malgrado il suo contenuto possa variare con lo sviluppo della materia. Nella prospettiva più ampia, essa comprende infatti la biofisica, la biochimica, la genetica; è quindi una scienza composita che attua il suo programma nel tentativo di spiegare la funzione biologica con la struttura molecolare e le sue modificazioni. Nell'ambito di tale disciplina, sono stati raggiunti negli ultimi vent'anni quei risultati che hanno dato un volto nuovo a tutta la b.: la determinazione della struttura e della funzione delle grosse molecole che stanno alla base dei fenomeni vitali, quali le proteine e gli acidi nucleici. È stato infatti possibile stabilire qual è la disposizione delle varie migliaia di atomi che le compongono e quali sono le forze che li tengono insieme, nonché i rapporti tra la struttura di queste macromolecole e la loro specifica funzione biologica. Si è individuato in che modo gli enzimi controllano le reazioni chimiche che avvengono nella materia vivente; si è riusciti a capire in che modo il messaggio genetico viene trasmesso attraverso successive generazioni e ad individuare la base chimica delle mutazioni.
È sempre difficile stabilire in quale momento nasce una scienza nuova o un nuovo indirizzo scientifico: nel caso della b. m., la sua genesi va ricondotta all'esigenza, ormai matura dopo la seconda guerra mondiale, di guardare alla b. in termini quantitativi, secondo le leggi ormai stabilite sia della chimica che della fisica. La b. m. corrisponde al tentativo di unificare tutti i fenomeni biologici nell'ambito di leggi generali di valore universale. Tale unificazione, è ormai ovvio, può e deve avvenire soprattutto a livello molecolare, e questo rappresenta la naturale evoluzione e in un certo senso il superamento dell'idea cellulare che, sebbene su basi molto più empiriche, rappresenta il primo tentativo di dare ai fenomeni biologici una base comune.
L'espressione "b. molecolare" sembra aver avuto origine in relazione alle indagini strutturali sulle macromolecole biologiche condotte da cristallografi inglesi rappresentati, intorno al 1930-1940, soprattutto da W. T. Astbury e J.D. Bernal. Sembra che a usare per primo il termine, ufficialmente, sia stato Astbury nel 1939. Astbury stesso in una famosa "Harvey lecture" del 1950, intitolata Avventure in biologia molecolare, così dice a proposito dell'espressione: "Il termine 'biologia molecolare' sembra ora essere diventato di uso piuttosto comune ed io sono contento di ciò poiché, sebbene sia improbabile che io lo abbia inventato, a me piace e da tempo ho cercato di propagarlo. Esso implica non tanto una tecnica quanto un indirizzo, un indirizzo dal punto di vista delle cosiddette scienze di base con l'idea dominante di ricercare, al di sotto delle manifestazioni su larga scala della biologia classica, il corrispondente piano molecolare. Essa si occupa particolarmente delle forme delle molecole biologiche e dell'evoluzione e ramificazione di quelle forme nell'ascesa a livelli di organizzazione sempre più alti. La biologia molecolare è, in modo predominante, tridimensionale e strutturale - il che non significa, però, che è solo un raffinamento della morfologia. Essa deve necessariamente indagare allo stesso tempo sulla genesi e sulla funzione". La nascita, l'evoluzione e il contenuto attuale della b. m. coincidono, in gran parte, con il processo d'identificazione della struttura e della funzione delle proteine e degli acidi nucleici (v. acidi nucleici; genetica, in questa App.).
Cenni storici sulla struttura e la funzione delle proteine. - Il riconoscimento delle proteine come composti chimici tipici degli organismi viventi avvenne nella prima metà del sec. 19°, ma il concetto d'esse come entità chimiche ben definite, con strutture precisamente determinabili, si è fatto strada lentamente, con molta difficoltà ed è stato spesso sviato da false linee di pensiero.
Già nella seconda metà del secolo scorso esistevano indicazioni sperimentali che le proteine avessero una strtuttura chimica definita e che questa ne determinasse la funzione; l'importanza di queste indicazioni, però, sfuggì alla maggior parte dei ricercatori. In quell'epoca, infatti, parecchie proteine animali e vegetali furono preparate allo stato cristallino. Cristalli di emoglobina, per es., furono ottenuti da molte specie animali fin dal 1850 e furono descritte differenze tra cristalli ottenuti da emoglobine diverse. Per quanto riguarda la funzione delle proteine, è interessante notare che Stokes, nel 1864, riuscì a correlare gli spettri d'assorbimento della luce dei vari derivati dell'emoglobina con una funzione respiratoria della proteina: questa sembra potersi considerare la prima documentazione di una precisa attività biologica associata a una proteina. Intorno alla fine del secolo scorso e all'inizio di questo cominciò ad affiorare il concetto che le proteine fossero sostanze macromolecolari; misure di peso molecolare minimo e metodi fisici, quali la pressione osmotica, applicati ad alcune proteine più note, indicavano pesi molecolari nell'ordine di 104-108. Simultaneamente veniva stabilito che le proteine sono costituite da amminoacidi, composti già ampiamente noti, legati fra loro con legame peptidico a formare catene lineari. Nello stesso periodo veniva sviluppata la cosiddetta chimica dei colloidi che però, stranamente, portò a considerare in modo erroneo la natura delle macromolecole proteiche. Infatti, poiché i colloidi semplici allora conosciuti, d'origine inorganica e organica, erano prodotti dell'aggregazione di sostanze che potevano esistere anche in forme a basso peso molecolare, si pensava alle soluzioni colloidali di origine biologica, quali le proteine, in termini di aggregati aspecifici. Si supponeva cioè che esistesse uno stato colloidale della materia, tipico dei sistemi biologici, formato da aggregati di varie dimensioni costituenti un sistema eterogeneo, a cui le leggi della chimico-fisica delle soluzioni erano essenzialmente inapplicabili. È chiaro come un atteggiamento generale di questo tipo dovesse scoraggiare la tendenza a considerare le proteine come sostanze chimiche ben definite, aventi caratteristiche molecolari, forma e grandezza precise e identificabili.
Solo dopo il 1920 questo concetto iniziò progressivamente ad affermarsi per opera, per es., del lavoro di S. Sörensen sulla ovoalbumina, di Adair sull'emoglobina e soprattutto di T. Svedberg che, introducendo il metodo dell'ultracentrifugazione analitica, stabilì definitivamente che le proteine sono sostanze con peso molecolare elevato e ben definito. In quel periodo nasceva anche, soprattutto ad opera di H. Staudinger, la nozione di macromolecola come sostanza ad alto peso molecolare formata dall'unione, con legami primari, di unità simili tra loro. Dal 1920 in poi rivestirono sempre più importanza, nello studio delle proteine, i metodi fisici. L'introduzione della elettroforesi ad opera di A. Tiselius fu di enorme valore per la caratterizzazione delle proteine e per la valutazione della loro omogeneità. Vennero anche fatti i primi notevoli tentativi d'identificazione della struttura tridimensionale di proteine fibrose e globulari con l'uso della diffrazione dei raggi X. Dal punto di vista funzionale, dal 1920 in poi, con la cristallizzazione dell'ureasi, della pepsina e di altri enzimi, fu definitivamente accertato che gli enzimi sono proteine e iniziò lo studio quantitativo delle loro attività catalitiche. S'individuarono le strutture e il ruolo dei coenzimi per l'attività enzimatica.
Dopo la seconda guerra mondiale lo studio delle proteine è entrato nella fase contemporanea e forma una parte essenziale delle basi da cui emerge la b. m. come nuova disciplina.
Conoscenze attuali sulla struttura e la funzione delle proteine. - Le conoscenze attuali sulla struttura e sulla funzione delle proteine e degli acidi nucleici possono essere riassunte in una serie di principi generali, veri e propri dogmi, che rappresentano gli aspetti essenziali della b. molecolare.
Le proteine consistono di catene polipeptidiche, cioè di catene di amminoacidi legati tra loro con legame peptidico.
Gli amminoacidi che costituiscono le proteine sono circa 20; sono quasi tutti α-L-amminoacidi con formula generale:
In modo schematico, la catena polipeptidica si può rappresentare nel modo seguente:
È quindi una catena lineare con una estremità cosiddetta C-terminale corrispondente all'amminoacido con gruppo carbossilico libero, e una N-terminale, corrispondente all'amminoacido con gruppo amminico libero. Una distinzione importante degli amminoacidi per quanto riguarda la struttura delle proteine consiste nella maggiore o minore solubilità in acqua del residuo R: si distinguono così amminoacidi idrofobi e idrofili. Proteine diverse differiscono tra di loro per il numero e la disposizione degli amminoacidi, cioè per la loro sequenza, che costituisce la cosiddetta "struttura primaria". L'identità chimica delle proteine è data dalla sequenza rigorosamente costante per tutte le molecole di un determinato tipo di proteine nell'ambito della stessa specie. Il concetto stesso di specie è legato quindi, dal punto di vista chimico, a questo principio generale, che è una diretta conseguenza del fatto che la sequenza di amminoacidi in una proteina è l'espressione della struttura del materiale genetico, e riflette la sequenza di basi nell'acido nucleico. Proteine di uno stesso tipo, ma di specie diverse, generalmente differiscono nella sequenza in corrispondenza di uno o più residui: il numero di residui diversi è tanto più grande quanto più è grande la distanza zoologica tra le specie.
In vivo, a ogni proteina corrisponde una specifica struttura tridimensionale: gli atomi della catena polipeptidica assumono tra loro dei rapporti specifici per effetto di interazioni deboli, forze secondarie che si stabiliscono tra i vari residui, e che spesso danno luogo, in regioni limitate della molecola, a strutture regolari caratteristiche ("struttura secondaria"), per es. elicoidali ("α-elica"). Il ripiegamento della catena polipeptidica a formare una struttura tridimensionale specifica è detto "struttura terziaria". In alcune proteine la molecola intera è costituita dall'unione, con legami deboli, non covalenti, di varie subunità. Ogni subunità è costituita da una catena polipeptidica e queste possono essere identiche o diverse tra loro. La struttura in subunità di una proteina è detta anche "struttura quaternaria". Secondo una fondamentale legge generale, l'acquisizione di una specifica struttura tridimensionale da parte di una catena polipeptidica è un processo spontaneo e non ha bisogno di fattori esterni. Questo significa che la struttura è quella termodinamicamente più stabile e che le numerosissime possibili interazioni tra i vari segmenti di essa corrispondono a un minimo di energia per la specifica struttura esistente in vivo. È quindi la sequenza stessa che contiene in sé l'informazione per acquisire una specifica struttura tridimensionale. Il messaggio genetico, scritto nella sequenza di nucleotidi dell'acido nucleico, e trascritto nella sequenza di amminoacidi, contiene quindi anche l'informazione per ottenere l'appropriata conformazione della proteina. Anche il processo associativo delle diverse subunità in una proteina è spontaneo. Le subunità, pur se sintetizzate indipendentemente nella cellula, si uniscono in modo preciso e costante anche in presenza di numerosissimi altri componenti; questo implica un processo di riconoscimento specifico, anch'esso insito nella sequenza di amminoacidi. Da un punto di vista assolutamente generale si può quindi riconoscere nell'acquisizione spontanea della struttura tridimensionale delle proteine un aspetto importante dell'assenza del processo epigenetico.
La funzione più importante delle proteine è quella di catalizzare specifiche reazioni chimiche a carico di substrati provenienti dall'esterno. Questi processi (metabolismo) assicurano la produzione di energia necessaria all'organismo per mantenere la sua integrità e per riprodursi. Le proteine, soprattutto quelle fibrose, hanno anche compiti strutturali e meccanici, cioè mantenere la forma, assicurare il movimento muscolare, ecc. La funzione biologica delle proteine è strettamente legata alla loro specifica struttura tridimensionale. Quando questa viene alterata in modo notevole (il processo si chiama ("denaturazione") l'attività viene persa: il ripristino dell'una si accompagna al ripristino dell'altra. L'attività delle proteine, soprattutto degli enzimi, dipende da interazioni specifiche tra una parte della proteina (il "sito attivo") e altre molecole (il "substrato"); nell'ambito del sito attivo residui di alcuni amminoacidi e altri gruppi chimici (coenzimi, gruppi prostetici) acquistano, per effetto di appropriate condizioni stereochimiche, una grande versatilità chimica; possono così avvenire quelle numerosissime reazioni chimiche che sono alla base del metabolismo. Caratteristica della catalisi enzimatica è la specificità della reazione catalizzata da un tipo di enzima e la grande varietà delle reazioni corrispondente alla varietà degli enzimi. Sia la specificità che la varietà delle reazioni catalizzate da enzimi dipendono da relativamente pochi tipi diversi di gruppi chimici (essenzialmente dai gruppi chimici delle catene laterali degli amminoacidi e da alcuni metalli e cofattori); sono quindi spiegabili solo in virtù della particolare reattività che questi gruppi acquistano nello specifico microambiente fornito dalla struttura tridimensionale delle proteine e delle speciali situazioni geometriche (stereo-chimiche) che essa offre. Le reazioni delle proteine e la catalisi enzimatica sono descrivibili in base alle leggi della termodinamica e della cinetica chimica: la risoluzione nei singoli stadi delle reazioni delle proteine con metodi per l'osservazione di eventi chimici molto rapidi ha permesso di stabilire le modalità con cui esse operano. I risultati giustificano, per le proteine, il termine di macchine "molecolari".
Attraverso il controllo della funzione delle proteine si realizzano sistemi di regolazione a livello molecolare: infatti l'attività di alcuni enzimi che occupano posizioni chiave nel metabolismo viene modulata (cioè aumenta o diminuisce) da sostanze ("effettori") che si trovano a valle o a monte dello stadio metabolico in cui è coinvolto l'enzima stesso. Questi enzimi (chiamati "allosterici") hanno una struttura a più subunità, che può assumere conformazioni diverse, a ognuna delle quali corrisponde una diversa attività. L'effettore allosterico influisce sullo stato conformazionale della proteina, e quindi sull'attività, in rapporto a esigenze di regolazione biologica. L'esempio più chiaro di regolazione di una funzione biologica complessa a livello molecolare è fornito dall'emoglobina dei Mammiferi. La funzione respiratoria del sangue, cioè la capacità del sangue di trasportare ossigeno dall'ambiente esterno ai tessuti e diossido di carbonio in senso inverso, è direttamente correlata alle proprietà dell'emoglobina, la proteina rossa contenuta negli eritrociti, di reagire reversibilmente con l'ossigeno molecolare. Le modalità di questa reazione sono complesse e corrispondono all'esigenza di sopperire alle necessità fisiologiche dell'organismo: si è stabilito che esse dipendono da interazioni funzionali tra varie parti delle molecole associate a specifiche situazioni strutturali. In questo caso si è potuto quindi individuare il meccanismo molecolare di controllo che sta alla base della regolazione della funzione respiratoria del sangue.
La nascita della genetica molecolare. - La storia delle scoperte delle basi chimiche dell'ereditarietà e del significato dell'acido nucleico come materiale genetico, culminante con la decifrazione del codice genetico, mostra come il progresso sia stato lentissimo, ostacolato da difficoltà di ordine concettuale e tecnico. Sono stati impiegati più di cento anni per arrivare al concetto che il carattere di un organismo vivente è determinato dalla sequenza di amminoacidi nelle proteine che lo compongono e che questa a sua volta è determinata dalla sequenza di nucleotidi nell'acido nucleico che rappresenta il suo materiale genetico. Questa parte centrale della b. m. s'innestò, quindi, sulla genetica e sulla chimica biologica, ma senza però che, per molto tempo, vi fosse una connessione chiara tra i risultati ottenuti dalle due discipline. La convergenza di risultati genetici e biochimici che ha portato alla spiegazione, in termini chimici, del meccanismo di trasmissione dell'informazione genetica è avvenuta solo in tempi relativamente recenti e rappresenta forse una delle più importanti acquisizioni scientifiche di questo secolo. Gli acidi nucleici, sostanze formate dall'unione di basi azotate, zuccheri e acido fosforico, furono descritti nella seconda metà del secolo scorso da F. Miescher, ma la loro funzione genetica per molto tempo non fu riconosciuta. Per un lungo periodo l'interesse per gli acidi nucleici fu scarso e mentre la genetica faceva grandi progressi, la struttura e la funzione degli acidi nucleici rimasero oscure.
Intorno al 1930 era in auge la "ipotesi dei tetranucleotidi", che immaginava gli acidi nucleici come una sequenza ripetitiva di quattro nucleotidi disposti in un ordine prefissato; una pura e semplice ripetizione dei gruppi tetranucleotidici per formare lunghe catene. È chiaro come questo modello in un certo senso escludesse gli acidi nucleici quali portatori dell'informazione genetica: una simile struttura permette variazioni troppo piccole perché vi possa essere iscritto un adeguato codice genetico. È di questo periodo, infatti, l'ipotesi che indica le proteine quali probabili portatori dell'informazione genetica. In seguito, soprattutto per opera di E. Chargaff, l'ipotesi tetranucleotidica fu abbandonata con la dimostrazione che il contenuto di nucleotidi nell'acido nucleico non corrispondeva al rapporto 1:1:1:1 che tale ipotesi sosteneva. Si accumulavano intanto gl'indizi che gli acidi nucleici fossero in qualche modo connessi con la trasmissione dell'informazione genetica. La prima dimostrazione diretta, in tal senso, fu ottenuta con la scoperta che il "principio trasformante" era in realtà acido nucleico (O. T. Avery, C. M. Macleod e M. MacCarty, 1944). Nel 1952 venne definitivamente provato (A. D. Hershey e M. Chase) che l'acido nucleico rivale è l'unico componente di un virus che entra nella cellula ospite, e si dimostrò così come esso sia il portatore dell'informazione genetica nei virus. Intanto si erano contemporaneamente trovate altre dimostrazioni che indicavano chiaramente come gli acidi nucleici avessero questo stesso ruolo in tutti gli organismi. Una volta chiarito il ruolo degli acidi nucleici nell'ereditarietà, fu possibile dare una veste chimica e fisica al concetto, fino allora puramente genetico, di gene. Dopo il 1950 si sviluppò un enorme interesse per gli acidi nucleici e per i meccanismi chimici della trasmissione dei caratteri ereditari. Questi studi hanno portato rapidamente alla delucidazione della struttura e della funzione dei vari tipi di acido nucleico, all'identificazione del meccanismo della sintesi proteica e finalmente alla scoperta e alla decifrazione del codice genetico.
Il concetto fondamentale che sta alla base della genetica molecolare è che l'informazione genetica è contenuta nella sequenza di nucleotidi negli acidi nucleici e viene espressa nella sequenza di amminoacidi nelle proteine. Sia gli acidi nucleici che le proteine possono essere considerati come un testo formato da lettere rappresentate rispettivamente dai nucleotidi e dagli amminoacidi. La lettura, cioè la definizione della sequenza di un polimero dalla sequenza dell'altro, viene fatta sempre nella direzione acido nucleico → proteine (v. nucleici, acidi, in questa App.).
Bibl.: J. T. Edsall, Proteins as macromolecules. An essay on the development of the macromolecule concept and some of its vicissitudes, in Archives of biochemistry and biophysics, 1962, suppl. 1, pp. 12-20; id., Recent advances in protein research, in New perspectives in biology, a cura di M. Sela, vol. IV, Amsterdam 1964, pp. 1-17; J. C. Kendrew, Concluding remarks, ibid., pp. 278-80; R. F. Steiner, The chemical foundations of molecular biology, Princeton, N. J., 1965; S. S. Cohen, The molecular biology of viruses, New York 1967; W. Hayes, The molecular biology of viruses, in 18th Symposium of the society for general microbiology, Cambridge 1968, pp. 1-4; M. H. Jukes, Molecules and evolution, New York 1968; C. U. M. Smith, Molecular biology. A structural approach, Londra 1968 (trad. it. Milano 1971); W. M. Stanley, Molecular basis of virology, New York 1968; H. Fraenkel-Conrat, The chemistry and biology of viruses, ivi 1969; M. Ycas, The biological code, in Frontiers of biology, a cura di A. Neuberger ed E. L. Tatum, vol. XII, Amsterdam 1969; J. T. Edsall, History of biochemistry and molecular biology, in Science, 1970, vol. 170, pp. 349-51; E. L. Hess, Origins of molecular biology, ibid., 168, pp. 664-69; J. Monod, Le hasard et la nécessité. Essai sur la philosophie naturelle de la biologie moderne, Parigi 1970 (trad. it. Milano 19725); E. Antonini, M. Brunori, Hemoglobin and myoglobin in their reactions with ligands, in Frontiers of biology, a cura di A. Neuberger e E. L. Tatum, vol. XXI, Amsterdam 1971; M. Eigen, Selforganization of matter and the evolution of biological macromolecules, in Die Naturwissenschaften, 1971, vol. 58, pp. 465-523.