L’origine della collaborazione animale e umana
La cooperazione tra individui è un fenomeno comunemente osservato in differenti popolazioni animali che raggiunge forme di complessità particolare nelle società umane. Mentre sono evidenti i vantaggi della cooperazione una volta che le regole di interazione in un gruppo di individui si siano opportunamente strutturate, risulta spesso più difficile comprendere come i comportamenti collaborativi possano essersi evoluti e come una società di individui che collaborano possa difendersi dalla comparsa di cheaters («imbroglioni»), ossia individui che godono dei vantaggi dei comportamenti cooperativi degli altri ma nel contempo non contribuiscono al bene comune. Nel caso più semplice, si considera che individui collaborativi paghino un costo affinché altri individui ricevano un beneficio, ove costo e beneficio vengono considerati dal punto di vista darwiniano in termini di successo riproduttivo (fitness). Se partiamo da una popolazione di individui che collaborano, e in questa viene immessa anche una piccola percentuale di cheaters, per es. mutanti che hanno perso il comportamento collaborativo, osserveremo che il numero di questi ultimi tenderà ad aumentare in percentuale perché essi godono di un vantaggio riproduttivo. Con il passare delle generazioni, la percentuale di collaboratori diventerà trascurabile, con conseguente collasso della società, anche se ciò porta a una diminuita fitness della popolazione nel suo insieme. Visto che gli individui muoiono e si riproducono molto più velocemente di quanto non cambino le società in conseguenza del comportamento dei singoli, la forza della selezione che agisce a livello di popolazione è più debole di quella che opera a livello individuale. In altre parole, si può dire che la selezione naturale non fa previsioni, e quindi un vantaggio futuro rappresenta una forza selettiva debole di fronte a un diverso vantaggio immediato. Argomentazioni simili valgono anche per processi che portano all’istaurarsi di un comportamento collaborativo.
La teoria dei giochi propone un semplice problema, detto dilemma del prigioniero (prisoner’s dilemma, PD), formulato negli anni Cinquanta del 20° sec. da Albert Tucker e che ben si presta a descrivere possibili aspetti paradossali delle interazioni tra individui, per cui un comportamento non collaborativo, pur essendo svantaggioso rispetto a uno collaborativo, può rappresentare la scelta più razionale. In breve, due giocatori A e B hanno la scelta di accettare o respingere una collaborazione con le seguenti regole: se entrambi collaborano ciascuno ottiene un premio P; se entrambi decidono di non collaborare ciascuno guadagna un premio Q; se A decide di collaborare e B di non collaborare (o viceversa), A ottiene il premio R e B ottiene il premio S (o viceversa). I premi hanno il seguente valore: S>P>Q>R. La teoria dei giochi dimostra che, in assenza di possibilità di un accordo preventivo (o della possibilità di punire chi non mantenesse un accordo stipulato), la strategia vincente è di non collaborare. Infatti il premio maggiore lo si ottiene non collaborando e quello minore collaborando. Per fare un esempio più intuitivo, tra due nazioni la pace conviene rispetto alla guerra, ma la cessazione delle ostilità in modo unilaterale e senza condizioni non è perseguibile perché porta alla sconfitta di chi la attua e alla vittoria dell’avversario. Come verrà descritto di seguito, esistono situazioni di rapporti tra organismi descrivibili come esempi di PD. Nonostante quanto esposto sopra, la collaborazione tra individui costituisce in natura più la regola che l’eccezione. Quindi le teorie dell’evoluzione sociale devono spiegare quali sono le condizioni che permettono a strategie collaborative di risultare vincenti e quali quelle che rendono una società basata sulla collaborazione stabile e robusta, in grado di resistere alla presenza di cheaters.
La teoria dei giochi e le teorie economiche forniscono gli strumenti matematici e concettuali con cui studiare l’evoluzione sociale, mentre nei modelli di collaborazione nei microrganismi forniscono gli strumenti per studiare sperimentalmente fenomeni evoluzionistici in tempi brevi. Di fronte alla complessità delle società umane, questi approcci riduttivi rappresentano però solo il punto di partenza per formulare ipotesi semplificate. Le spiegazioni più esaustive richiedono l’utilizzo di strumenti aggiuntivi derivati dalla psicologia e dalla neurobiologia, e si basano anche su categorie concettuali inusuali in biologia, quali il senso etico e il disgusto. Il recente affermarsi di tecniche non invasive per misurare l’attività di singoli neuroni ha permesso negli ultimi anni di cominciare a delineare i circuiti neuronali che sottendono processi decisionali alla base di comportamenti sociali; tali metodologie costituiscono uno strumento importante al servizio della neurofisiologia per lo studio della cooperazione tra individui.
Microrganismi nello studio dell’evoluzione sociale
Il PD sopra descritto è stato considerato per lungo tempo semplicemente uno strumento concettuale derivato dalla teoria dei giochi, senza evidenze sperimentali in grado di attestare che nel mondo biologico vi fossero interazioni tra individui che ne seguono le regole. La prima dimostrazione stringente di interazioni che obbediscono alle regole del PD e di conseguenza si evolvono secondo le sue previsioni è stata fornita dalle interazioni del fago ϕ6 e del fago ϕH2, un mutante derivato dal primo, descritte da Paul E. Turner e Lin Chao (1999) in un lavoro sperimentale che ha avuto un forte impatto. I fagi, o batteriofagi, sono piccoli virus che infettano i batteri e che necessitano per potersi replicare sia di proteine codificate dal batterio ospite sia di altre proteine prodotte all’interno del batterio a partire dall’informazione genica codificata dei fagi stessi. Uno dei vantaggi che i fagi, come molti altri microrganismi, presentano come modello sperimentale è che la fitness di una popolazione è facilmente e direttamente misurabile grazie alla curva di crescita. Quando una popolazione di batteri viene infettata con alta molteplicità di infezione (multiplicity of infection, MOI), cioè quando numerose e differenti particelle virali possono entrare all’interno della stessa cellula batterica, e nel caso si adoperino fagi lievemente differenti tra loro, si crea una situazione di potenziale collaborazione tra essi. In particolare può accadere che, a partire dal genoma di fagi diversi, si producano quantità differenti delle proteine necessarie per la produzione di virioni maturi: il fago che produce in grande quantità tali proteine, può essere considerato un collaboratore (C), quello che ne usufruisce senza contribuire sostanzialmente alla loro sintesi svolge il ruolo di non collaboratore (NC). In uno studio preliminare al lavoro di Turner e Chao era stato osservato che, a partire da fagi ϕ6 propagati infettando batteri a elevato MOI, si registrava un iniziale aumento di fitness della popolazione seguito da una diminuzione, fino a raggiungere un livello di fitness inferiore a quello di partenza. Questo dato sperimentale era inaspettato (generalmente si suppone che le popolazioni evolvano sempre aumentando il loro successo riproduttivo). Dalle popolazioni risultanti dopo esperimenti ripetuti di infezione ad alto MOI a partire dal fago ϕ6, sono stati isolati dei cloni indipendenti, e gli esperimenti sono proseguiti con uno di questi chiamato ϕH2 (risultati simili sono stati confermati con altri cloni). I fagi ϕH2 hanno una fitness minore del ceppo originale perché producono una quantità minore di proteine necessarie alla loro replicazione nei batteri. Quando fagi ϕ6 e fagi ϕH2 sono usati per coinfettare gli stessi batteri a elevato MOI, si può considerare una possibile matrice di fitness come segue:
ϕ6 (C) ϕH2 (NC)
ϕ6 (C) 1 1−a
ϕH2 (NC) 1+b 1−c
dove il valore rappresenta la fitness del fago in ciascuna riga in presenza di un eccesso di fago in colonna. È importante che la misura sia ottenuta in condizioni in cui la fitness di ogni tipo di fago è valutata quando il fago di tipo diverso è in eccesso, perché la situazione di società collaborativa (o non collaborativa) corrisponde alla produzione di molte (o poche) proteine di uso comune. Ciò dipende ovviamente dal tipo di fago che costituisce la maggioranza all’interno di ogni singolo batterio. In particolare, a rappresenta la diminuzione in fitness di ϕ6 dovuta al fatto di avere un numero ridotto di risorse (a causa della presenza di molti fagi di tipo ϕH2), b il vantaggio di ϕH2 di avere più risorse (perché prodotte da ϕ6) e c lo svantaggio di ϕH2 per avere meno risorse di quante ne abbia ϕ6. Si sono fatte le seguenti osservazioni: alla fine dell’esperimento si aveva una popolazione composta solo da ϕH2 (quindi la strategia di non collaborazione è in questo caso vincente, anche se porta a una fitness totale inferiore) e la matrice di fitness aveva i seguenti valori numerici:
ϕ6 (C) ϕH2 (NC)
ϕ6 (C) 1 0,65
ϕH2 (NC) 1,99 0,83
L’ordine di questi valori è compatibile con l’evoluzione dei rapporti sociali tra i due fagi secondo le regole del PD, infatti 1+b>1>1−c>1−a corrisponde alla gerarchia di premi S>P>Q>R stabilita dal PD. Questo risultato non rappresenta l’unica possibile soluzione di un’interazione tra due popolazioni di fagi diversi; infatti, nel caso in cui si avesse 1−a>1−c, cioè quando il costo del non collaborare è molto alto, si può dimostrare che non si ottiene una popolazione omogenea ma al contrario i due tipi di fago coesistono. In altre parole, in questa situazione non esiste una strategia vincente. Il caso estremo è rappresentato da virus difettivi che hanno perso del tutto la loro capacità di produrre proteine necessarie per la loro replicazione e quindi necessitano di virus wild type per riprodursi. In questo caso la loro fitness da soli è 1−c=0. Proprio perché difettivi, questi fagi hanno un genoma più piccolo e quindi godono del vantaggio di avere un tempo di replicazione minore. Di conseguenza, i virus difettivi non sono mai eliminati completamente dalla popolazione. Una seconda osservazione viene dal fatto che questo modello di sviluppo secondo le regole del PD richiede che la MOI sia mantenuta elevata. In caso contrario, quando non più di una particella virale infetta in media una cellula di batterio, la popolazione di fagi prodotti da ciascun batterio è clonale, e un eventuale mutante di tipo non collaborativo che insorga per caso non riuscirà a dominare la popolazione totale. Infatti, nel successivo ciclo di infezione, il mutante inizialmente presente in singola copia nel batterio ospite si replicherà dando origine a genomi simili al suo e cioè con una fitness di 1−c, mentre in altri batteri sono presenti fagi wild type con una fitness di 1. In cicli ripetuti di infezione, questa popolazione wild type di fagi finirà quindi per predominare (in termini banali, uno sfruttatore può prosperare solo in presenza di individui sfruttabili). Questa osservazione ben si accorda con la teoria che una delle condizioni che favorisce l’istaurarsi di comportamenti collaborativi (o che impedisce l’imporsi di comportamenti non collaborativi) è la selezione su genomi simili, kin selection, che verrà spiegata più approfonditamente in seguito.
Il caso precedentemente descritto di virus difettivi che richiedono la presenza di virus wild type per la loro sopravvivenza e/o riproduzione introduce il concetto di comportamento sociale obbligato, fenomeno che si osserva spesso in natura. Tali comportamenti non sono limitati a individui della stessa specie, ma possono avvenire tra specie diverse. Possono essere di tipo parassitario, ma possono anche portare a un vantaggio reciproco, come nel caso, tipico, della simbiosi (esempio estremo di comportamento collaborativo obbligato è quello dei mitocondri all’interno di cellule animali). Questi comportamenti non sono limitati a microrganismi, ma si osservano anche in organismi complessi, come uccelli (per es., i cuculi) che richiedono uccelli diversi per la cova, o alcune specie di vespe che necessitano di lavoratori di altre specie di vespe per la crescita della loro prole. Nel caso di microrganismi, generalmente una condizione di parassitismo lungamente protratta porta a una sostanziale perdita o inattivazione di quei geni che non sono più necessari, in quanto la loro funzione è svolta da geni codificati dalla specie parassitata. Per questa ragione lo stato di un parassita obbligatorio è di solito difficilmente reversibile.
Un recente lavoro ha tuttavia dimostrato un caso di reversione da un comportamento di cheater obbligato a uno collaborativo in un microrganismo, il Myxococcus xanthus, che spesso viene utilizzato per studi di cooperazione tra individui (Fiegna, Yu, Kadam, Velicer 2006). Il Myxococcus è un batterio che ha un comportamento sociale piuttosto complesso. Questi batteri cacciano in gruppi secernendo sostanze tossiche e litiche con cui uccidono e metabolizzano altri organismi-prede, e in questo modo creano una risorsa di nutrimento comune. Inoltre, in condizioni di scarsezza di cibo le cellule di Myxococcus possono formare aggregati che si differenziano dando luogo a spore particolarmente resistenti a vari stress. Generalmente un gran numero di individui, circa 100.000, partecipa alla formazione di un numero limitato di spore. Quando si ricreano condizioni favorevoli alla replicazione, le spore producono nuove cellule di Myxococcus. Tale stile di vita rende questo batterio particolarmente suscettibile alla presenza di cheaters, individui che possono sfruttare il bene comune senza contribuirvi, sia nella fase di predazione sia al momento della formazione di spore. Un’altra caratteristica del Myxococcus è che individui con genomi differenti, che abbiano cioè accumulato un certo numero di mutazioni, possono contribuire al differenziamento e alla produzione di spore. In questo caso, il meccanismo di kin selection può non essere attivo.
L’esperimento descritto nel lavoro prima citato comincia con l’isolamento di diversi cloni di Myxococcus a partire da popolazioni cresciute per oltre 1000 generazioni in un medium liquido ricco di nutrienti. In queste condizioni di crescita la pressione selettiva per il mantenimento di comportamenti sociali è scarsa, e si possono produrre ceppi mutanti non più capaci di predazione coordinata e di formazione di spore. Mescolando individui wild type con individui derivati da questi cloni mutanti, si può osservare che alcuni di questi hanno assunto un comportamento da cheater. In particolare alcuni cloni mutanti denominati obligate cheaters (OC), pur non formando spore in isolamento, ne producono però più efficientemente del ceppo wild type iniziale. L’esperimento è continuato sottoponendo una popolazione mista (1% OC e 99% wild type) a cicli ripetuti di competizione, dove ogni ciclo comprendeva una fase di crescita in medium liquido seguita da una fase di differenziamento in condizioni di deprivazione di amminoacidi. Da un certo punto di vista, questo protocollo sperimentale somiglia alla situazione descritta precedentemente a proposito di virus difettivi, con la differenza principale che la formazione di un numero limitato di spore a partire da numerose cellule che partecipano al differenziamento introduce la possibilità di estinzione della popolazione in condizioni in cui la percentuale di individui collaboratori si sia ridotta sotto una certa soglia. E in effetti in ripetuti esperimenti è stata osservata l’estinzione della popolazione mista, in quello che può essere definito suicidio evolutivo dovuto al fatto che la selezione naturale favorisce in queste condizioni la strategia vincente su tempi brevi (quella dei cheaters) ma è controproducente su tempi lunghi. Il risultato interessante di questo lavoro è tuttavia il fatto che, in un caso di competizione tra wild type e OC, si è osservata la comparsa di un mutante non solo capace di un comportamento cooperativo, e quindi in grado di formare spore, ma anche più efficiente del wild type e dell’OC nella fase di crescita in terreno ricco. Il punto importante è che questo nuovo ceppo era derivato non da una mutazione dei batteri wild type, ma da una di batteri OC. Per questo è stato chiamato ceppo Fenice, dal nome del mitico uccello. Altrettanto interessante è il fatto che il ceppo Fenice non è causato dalla reversione di quelle mutazioni che avevano dato origine al ceppo OC, ma al contrario differisce da questo per un singolo gene diverso da tutti quelli precedentemente caratterizzati per codificare funzioni coinvolte nel comportamento sociale del Myxococcus. Il fatto che un singolo gene, sia pure di controllo della funzione di molti altri, sia sufficiente per tale transizione da un cheater obbligatorio a un cooperatore capace di resistere al cheater originario e con maggiore fitness del ceppo wild type, sottolinea che le transizioni di comportamenti sociali possono essere repentine. Questo lavoro evidenzia anche il fatto che dover resistere all’effetto negativo di un comportamento asociale può rappresentare una forte spinta evolutiva verso un nuovo comportamento sociale.
La teoria dei giochi e l’evoluzionedella cooperazione
In un recente lavoro, Martin A. Nowak (2006) descrive cinque possibili meccanismi attraverso cui comportamenti di collaborazione possono essere favoriti dal punto di vista evolutivo. Per chiarire i termini definiremo come individuo altruistico o collaborativo quello che è disposto a pagare un costo, c, affinché un altro individuo riceva un beneficio, b, e assumeremo che b›c; viene invece definito come non collaborativo, e indicato con la parola inglese defector, un individuo che non paga alcun prezzo e non distribuisce alcun beneficio (o in altre parole, in una società strutturata, non partecipa alla produzione di beni collettivi pur godendone dei vantaggi). Resta quindi valido il principio che in assenza di uno di questi meccanismi i defectors hanno un vantaggio selettivo rispetto ai collaboratori e in una popolazione mista finiscono per prevalere numericamente. Qui di seguito sono brevemente discussi i cinque possibili meccanismi.
Kin selection
La prima condizione che può promuovere l’affermarsi di un comportamento di collaborazione è quella, già menzionata precedentemente, della parentela tra individui (kin selection). Considerando che il processo evolutivo agisce su un corredo genico o genoma, la collaborazione tra individui con lo stesso patrimonio genico, o comunque un genoma simile, può essere una condizione favorevole nel caso che, come abbiamo assunto, il beneficio b sia maggiore del costo c. Formalmente si può dimostrare che una strategia di collaborazione è favorita a patto che c/b (il rapporto tra il costo e il beneficio di un’azione altruistica) sia minore di r, un coefficiente che misura il grado di parentela tra due individui. In termini semplici questo concetto è riassunto dalla celebre frase del genetista John B.S. Haldane (1892-1964) sulla disponibilità al sacrificio per salvare due fratelli oppure otto cugini. Ovviamente il caso più eclatante di comportamento altruistico che si evolve sulla base della kin selection è l’insieme delle cure parentali.
Direct reciprocity
Anche società composte da individui non strettamente imparentati sono capaci di comportamenti collaborativi, quindi il meccanismo della kin selection può giustificare solo un numero limitato di casi di evoluzione di un comportamento cooperativo. Per comprendere il secondo meccanismo che permette l’evoluzione di comportamenti altruistici, definito della reciprocità diretta (direct reciprocity), conviene introdurre il concetto di ‘supergioco’ o dei giochi ripetuti (si veda il discorso tenuto da Robert J. Aumann in occasione del premio Nobel per l’economia attribuitogli nel 2005: Aumann 2006). Supponiamo di giocare lo stesso gioco, per es. il PD (vedi sopra), con un numero non infinito di giocatori anno dopo anno: questo si può quindi definire un supergioco la cui regola è di giocare il PD ripetutamente. È possibile dimostrare, in questo caso, che esistono strategie collaborative vantaggiose rispetto alla non collaborazione (defezione). La prima a essere dimostrata è stata quella detta del tit for tat, per cui un giocatore comincia con una risposta collaborativa e poi nei turni successivi fa all’altro quello che l’altro giocatore ha fatto a lui nel turno precedente (collabora in caso di una risposta altruistica, non collabora in caso di una risposta non collaborativa). La semplice strategia del tit for tat non è però una strategia robusta, nel senso che non sopravvive se si creano delle perturbazioni nella sua applicazione. Per es., si può dimostrare che in caso di un errore, per cui si è risposto non collaborando a un precedente turno in cui l’altro giocatore aveva collaborato, si può instaurare una serie di rappresaglie che portano al decadimento della strategia collaborativa. Sono stati descritti miglioramenti della strategia del tit for tat: per es., il tit for tat generoso (che consiste nell’applicare questo sistema, ma occasionalmente collaborare anche in risposta a una defezione) e il win-stay/lose-shift, che consiste nel ripetere a ogni incontro la risposta data in quello precedente se si è guadagnato, e nel cambiare risposta se invece si è perso. Il trattamento matematico delle varie strategie per il supergioco del PD è piuttosto complesso ma, con buona approssimazione, emerge la semplice regola seguente: un comportamento collaborativo può evolversi ogni qual volta si abbia w>c/b, dove w è la probabilità che gli stessi due individui si incontrino in successivi turni del PD. È infatti evidente che quanto maggiore è la probabilità che due individui si incontrino ripetutamente tanto maggiori sono le possibilità che assumano un atteggiamento collaborativo basato sul reciproco vantaggio.
Un gioco che meglio si presta a descrivere l’evoluzione di comportamenti collaborativi sulla base di una strategia di reciprocità diretta è quello detto dell’ultimatum o ultimatum game (UG). L’UG di recente ha sostituito il PD in molte analisi, anche perché ha interessanti implicazioni etiche (basate sul concetto di ‘giusto’) che lo rendono particolarmente interessante nello studio dei comportamenti umani reali. L’UG viene giocato da due individui che devono dividersi una certa somma di denaro. Il primo decide come fare la partizione, il secondo può solamente accettare o non accettare. Nel primo caso la somma viene divisa come da proposta, nel secondo caso nessuno prende nulla. È evidente che, nel caso di due giocatori razionali, il secondo ha interesse ad accettare qualunque offerta (poco è meglio di niente) e di conseguenza il primo ha interesse a fare un’offerta ‘ingiusta’, in cui la somma viene divisa in maniera poco equilibrata: la maggior parte per sé e il minimo per l’altro. È anche vero che sperimentalmente si osserva come la maggioranza delle persone si comporti, in un UG, in modo non razionale, per cui raramente si fanno offerte sbilanciate e, se fatte, raramente vengono accettate.
In un recente studio, per es., sono state prese in considerazione quindici diverse popolazioni umane in cinque diversi continenti, con differenti stili di vita: popolazioni sedentarie o nomadi, urbane o rurali, con economie primitive o avanzate. Nella totalità dei casi, seppure in misura differente, si è osservato che il comportamento di giocatori dell’UG risponde più a una scelta basata sul senso del giusto che su una puramente razionale (Henrich, McElreath, Barr et al. 2006). Non sorprende che test neurologici abbiano mostrato che quando si riceve un’offerta ingiusta vengono fortemente attivate aree cerebrali collegate alle risposte emotive. Tuttavia, quando la stessa proposta viene fatta da un computer, invece che da un giocatore umano, l’attivazione delle stesse aree cerebrali è significativamente ridotta. È forse interessante sapere che, al contrario degli esseri umani, gli scimpanzé, i nostri parenti più prossimi, sono giocatori razionali dell’UG, come è stato dimostrato sperimentalmente (Jensen, Call, Tomasello 2007).
Consideriamo che due giocatori A e B siano impegnati in un singolo incontro dell’UG e che il primo possa decidere tra il dividere 50 a 50 oppure 90 a 10. Le soluzioni del gioco possono essere rappresentate nella seguente matrice dei guadagni:
Accetto Respingo
Divido equamente A 50 0
B 50 0
Divido iniquamente A 90 0
B 10 0
Il risultato divido equamente/accetto è un risultato di collaborazione, e comunque nessuno dei due giocatori può garantirsi un risultato migliore; tuttavia, come nel caso del PD, la collaborazione non è la soluzione che viene scelta da due giocatori razionali (coscienti del fatto che anche l’altro risponderà in modo razionale). La scelta razionale è quella descritta nella casella divido iniquamente/accetto. Si potrebbe ottenere una collaborazione se si potesse stipulare un contratto vincolante, attraverso un meccanismo di punizione per chi non lo applica. Quando due giocatori razionali si incontrano in un ‘super UG’, la possibilità che B ha di respingere un’offerta non equa fa sì che esista un modo per punire A e che tale punizione possa esercitare un effetto sul risultato di incontri successivi. In queste condizioni, ad A conviene proporre la divisione 50 a 50, e la ripetizione del gioco ha un effetto simile alla stipula di un contratto. In effetti, si può dimostrare che in un super UG la strategia ottimale (razionale) per A è di dividere sempre equamente e quella di B è di accettare finché A divide equamente e di respingere per sempre a partire dalla volta in cui A dividesse iniquamente. In un certo senso, questo risultato ricorda la strategia in auge durante la guerra fredda, chiamata MAD (Mutually Assured Destruction), o equilibrio del terrore, secondo la quale un comportamento virtuoso è mantenuto dalla minaccia di una rappresaglia, anche se costosa per chi la esegue. Più in generale, nella teoria dei giochi si può dimostrare il seguente teorema (che riassume quanto descritto per l’UG): in qualunque gioco, il risultato collaborativo (inteso nel senso che nessun giocatore può garantirsi con assoluta certezza un risultato più conveniente), corrisponde alla strategia razionalmente ottimale nel corrispettivo supergioco. È importante notare che il raggiungimento della soluzione ottimale nel super UG, come in tutti i supergiochi, richiede la capacità di avere una prospettiva temporale. In altre parole, occorre che la spinta ad avere un vantaggio immediato possa essere superata dalla prospettiva di un maggiore vantaggio in futuro. Ciò richiede capacità cognitive evolute, forse non presenti in specie animali differenti da quella umana.
Indirect reciprocity
La reciprocità diretta si basa sull’assunto di interazioni tra individui in condizioni in cui ciascuno è in grado di pagare un costo per ricevere un beneficio. Nella realtà, nelle società umane queste condizioni in molte circostanze non sono realizzate, e spesso noi aiutiamo anche persone che non sono in grado di ricambiare direttamente il favore ricevuto. Per di più, in società numerose, le interazioni tra persone che non si sono incontrate precedentemente possono essere anche più numerose rispetto agli incontri ripetuti tra gli stessi individui. Bisogna quindi immaginare meccanismi attraverso cui strategie collaborative risultino convenienti anche in assenza di una stretta reciprocità. Il meccanismo della indirect reciprocity, o reciprocità indiretta, si basa sul fatto che una forma di collaborazione si può instaurare se un individuo A si comporta nei confronti di un altro individuo B non a seconda del comportamento che quest’ultimo ha avuto con lui precedentemente, ma a seconda del comportamento che B ha avuto in precedenza nei riguardi di C, D, E e così via. Un secondo modo di reciprocità indiretta è che B si comporti nei confronti di C nello stesso modo in cui A si è precedentemente comportato con B. Questo meccanismo, che ha chiari esempi nella vita di tutti i giorni, per cui se abbiamo ricevuto un beneficio siamo più propensi all’altruismo e se abbiamo ricevuto un torto abbiamo una maggiore aggressività verso terzi, è stato tuttavia meno analizzato negli studi sull’evoluzione della cooperazione.
Anche se esempi di reciprocità indiretta possono essere trovati tra gli animali, questo è un meccanismo che si applica soprattutto nel caso delle società umane, anche perché richiede una sostanziale capacità cognitiva e lo sviluppo di sistemi di comunicazione articolati, come il linguaggio. In effetti, dal momento che è impossibile che ogni individuo possa conoscere per osservazione diretta quale sia stato il comportamento di altri individui in scambi intercorsi precedentemente con terzi, affinché una strategia di indirect reciprocity si sviluppi occorre che ogni individuo si crei una ‘reputazione’ che descrive lo stato dei suoi precedenti rapporti interpersonali. Da semplice strumento da utilizzare per decidere il proprio comportamento verso un altro, la reputazione tende ad assumere un valore di tipo ‘etico’, il che sottolinea come lo sviluppo di una cooperazione tra individui possa avere, al di là di considerazioni economiche di convenienza, anche basi di tipo morale. Al di là delle teorie sull’evoluzione della collaborazione, il meccanismo della reciprocità indiretta interessa economisti e studiosi dei rapporti sociali, soprattutto in tempi di mercato globale e di commercio elettronico, in cui sempre più frequenti sono le interazioni tra individui che non si conoscono e con cui non si avranno più rapporti in futuro. Come nel caso della reciprocità diretta, anche nel caso di quella indiretta il meccanismo che permette di sviluppare un comportamento collaborativo è la deterrenza, cioè la previsione che un comportamento di defezione verrà punito in un round successivo del gioco. La differenza è nel fatto che nell’esempio dell’UG la punizione è a carico del singolo giocatore interessato alla mutua interazione, mentre nel caso della reciprocità indiretta la punizione è a carico degli altri giocatori. La teoria della reciprocità indiretta presenta notevoli complicazioni; per es., si possono creare dilemmi ‘morali’ del tipo: se A non collabora con B perché la reputazione di B è bassa, cosa succede della reputazione di A? Diminuisce perché non si è mostrato collaborativo o aumenta perché ha punito un individuo non collaborativo? In effetti, collaborare con un defector destabilizza la collaborazione. È stato proposto che le complessità inerenti alle strategie di reciprocità indiretta abbiano spinto fortemente per lo sviluppo dell’intelligenza e del linguaggio umano. Nonostante le difficoltà di una trattazione matematica, anche nel caso della reciprocità indiretta si può stabilire una semplice regola: si instaurerà un comportamento di cooperazione a patto che q>c/b, dove q è la probabilità di conoscere la reputazione di un giocatore.
Network reciprocity
L’osservazione che una società di collaboratori viene soppiantata da un numero limitato di defectors grazie alla loro maggior fitness presuppone l’esistenza di una popolazione omogenea in cui gli incontri tra gli individui avvengano con uguale probabilità. Questo assunto però non è valido nella maggioranza dei casi reali e, al contrario, per varie ragioni, come vicinanza fisica o ruoli condivisi, singoli individui tendono a interagire più frequentemente con un sottoinsieme della popolazione totale. Si può dimostrare che i collaboratori possono prevalere in una società mista se tendono a formare gruppi compatti da cui escludere i defectors. Chi partecipa a questi network di collaboratori ha una fitness maggiore poiché l’insieme dei benefici ottenuti è maggiore dei costi sostenuti (questo perché, minimizzando l’interazione con i defectors, sono pochi gli eventi in cui a un costo non corrisponda un beneficio). In qualche modo la network reciprocity somiglia a una strategia di kin selection, in cui alla parentela viene sostituita l’appartenenza a un sottoinsieme. La regola che descrive le condizioni in cui la reciprocità di network può risultare nell’evoluzione di una società collaborativa è che b/c>k, dove k è il numero medio di persone con cui ciascun individuo interagisce frequentemente.
Group selection
La possibilità che la selezione agisca non sui singoli individui, ma sulle società, è un concetto a lungo dibattuto e che, nonostante varie perplessità da parte di alcuni ricercatori, si è andato sempre più rafforzando negli ultimi tempi tra quanti studiano l’evoluzione della cooperazione. Per fare un semplice modello di come agisce la group selection consideriamo le seguenti regole: a) una popolazione è divisa in gruppi; b) i gruppi possono avere una composizione sia pura (solo collaboratori o solo defectors) sia mista (individui di entrambi i tipi); c) i cooperatori hanno un atteggiamento altruistico soltanto nei confronti di altri membri del gruppo; d) gli individui si riproducono in modo proporzionale al loro guadagno nelle relazioni con gli altri; e) la prole viene a far parte del gruppo dei genitori; f) se un gruppo raggiunge una certa dimensione-soglia si divide in due gruppi separati; g) in questo caso un altro gruppo si estingue. In queste condizioni la selezione può agire a due diversi livelli: all’interno di un singolo gruppo i defectors sono avvantaggiati (stiamo assumendo che non vi siano strategie di collaborazione all’interno dei gruppi, quindi un defector ha il vantaggio di non incorrere in costi, ma di godere di benefici); a un secondo livello, nella competizione tra gruppi differenti vengono avvantaggiati quelli composti da collaboratori. Si può dimostrare, a patto di fare le due ipotesi aggiuntive che la forza selettiva sia debole e la divisione in due di un gruppo sia un evento raro, che il sistema evolve verso uno stato di cooperazione quando b/c>1+n/m, dove n è il numero massimo di individui in un gruppo e m è il numero dei gruppi.
La punizione altruistica
Come si è visto, in molte strategie che portano a un comportamento collaborativo la punizione o almeno la minaccia di una punizione svolge un ruolo importante. Nell’UG la possibilità che ha il secondo giocatore di non accettare una ripartizione considerata ingiusta e nel PD la strategia del tit for tat sono esempi evidenti della funzione di deterrenza esercitata dalla punizione di un comportamento non collaborativo. Una caratteristica tipica che ha la punizione in condizioni di reciprocità diretta oppure indiretta è di avere un costo per chi la applica. D’altra parte, poiché la punizione può contribuire alla formazione di una società collaborativa e certamente contribuisce a mantenerla una volta che questa si sia formata, la punizione esercitata da un individuo crea un beneficio per tutta la collettività.
Nelle varie teorie sulla collaborazione si parla quindi di punizione altruistica (altruistic punishment o AP). Il valore della AP nell’evoluzione delle società collaborative è riconosciuto dalla maggioranza delle teorie sociali, ma benché il concetto sia stato definito da tempo, non tutte le sue implicazioni sono state fino a ora esaminate. Per es., come tutti i comportamenti altruistici, la AP è suscettibile di sfruttamento da parte di individui che ne godono i benefici senza pagarne il costo; si devono quindi trovare meccanismi per trattare con defectors di ‘secondo grado’, ossia collaboratori nelle transazioni interpersonali, ma non nel sopportare il costo dell’AP. In un recente lavoro (Hauert, Traulsen, Brandt et al. 2007), per es., si prospetta un modello per spiegare come, innanzi tutto, un comportamento di AP possa prima evolversi e poi affermarsi. In una società in cui la maggioranza delle persone sia disposta a esercitare AP (persone per questo definite punishers, «coloro che puniscono»), i defectors vanno incontro a un costo, così che i cooperatori sono favoriti; ma in una società in cui i punishers sono una minoranza e i defectors sono numerosi, il costo della punizione per ciascun punisher diviene così alto che la sua fitness ne è compromessa. Di conseguenza il numero dei punishers diminuisce. Per ridefinire il concetto diciamo che strategie basate sulla AP sono stabili quando chi le applica è la maggioranza, ma una minoranza di punishers non può invadere (soppiantare) una popolazione di defectors.
Nel lavoro prima citato viene introdotto un nuovo tipo di comportamento: accanto ai defectors e ai punishers si postula la presenza di non partecipanti, individui che non contribuiscono al bene comune ma nel contempo non ne godono dei benefici. Viene fatta l’ipotesi che la fitness di un non partecipante sia maggiore di quella di un defector nel caso in cui non vi siano individui collaborativi da sfruttare. Per chiarire questo assunto con un esempio, si immagini una società primitiva di cacciatori in cui la caccia richiede uno sforzo collettivo. Collaboratori e defectors partecipano alla battuta di caccia; questi ultimi non si assumono i rischi relativi, però dividono la preda. I non collaboratori non partecipano alla battuta di caccia e svolgono un’attività privata, per es. coltivare il proprio orto. Se i defectors sono la maggioranza, lo sforzo collettivo non avrà risultato e non ci sarà un beneficio da dividere. In queste condizioni i non partecipanti avranno il vantaggio del frutto del loro sforzo individuale, mentre i defectors avranno guadagno zero. Con questa assunzione, ossia che conviene non partecipare a uno sforzo comune se non c’è un numero sufficiente di collaboratori, un numero ristretto di non partecipanti può prendere il sopravvento su una popolazione fatta da soli defectors. Dato che i collaboratori che fanno uno sforzo comune hanno una fitness maggiore dei non partecipanti, a loro volta nella società dei non partecipanti possono prendere il sopravvento pochi collaboratori. Quando la società sarà composta prevalentemente da collaboratori, essa diventerà aperta all’ingresso di defectors. In questo modo si forma un andamento ciclico in cui le tre popolazioni oscillano assumendo di volta in volta la maggioranza numerica. Il punto cruciale del lavoro prima citato consiste nel fatto che esiste una fase del ciclo in cui il numero dei defectors è fortemente ridotto. Ciò permette a una popolazione di punishers di essere presente senza subire una selezione negativa. Una volta che il numero di punishers abbia raggiunto, in maniera stocastica, una certa soglia, l’invasione di cheaters è scongiurata. Ogni qual volta la partecipazione a un’azione comune si poggia su base volontaria (ed esiste quindi l’opzione di non partecipare), un comportamento collaborativo rafforzato dalla possibilità di sanzioni sembra più probabile rispetto al caso in cui la partecipazione sia coatta.
L’articolo citato segna una tappa importante perché, per la prima volta, si descrive un meccanismo secondo il quale l’AP potrebbe affermarsi. Tuttavia un certo numero di assunti ne riducono la generalità. Per es., la figura di non partecipante implica che vi siano beni prodotti dallo sforzo collettivo che possono essere non accettati, come accade nelle società primitive dove chi volontariamente non partecipa a una battuta di caccia non corre i rischi associati e non ne divide la preda. Ma vi sono circostanze in cui il bene prodotto da uno sforzo comune non è rifiutabile. Per es., se i guerrieri hanno difeso il villaggio da un esercito nemico, il beneficio ricade su tutti i componenti della tribù e questo trasforma il non partecipante in un defector. Per di più, nell’articolo viene assunto che il beneficio di uno sforzo collettivo non dipende dal numero di partecipanti, per cui la scelta di non partecipare non ha un costo sugli altri componenti della società. Tuttavia nella vita reale vi sono parecchie circostanze in cui il bene comune può essere prodotto solo se all’impresa partecipa un numero cospicuo di individui.
A sottolineare il fatto che vi sono sfaccettature nel concetto di AP non ancora chiarite, vi è un recente articolo (Dreber, Rand, Fudenberg, Nowak 2008) in cui si dimostra che, nonostante l’AP sia un forte promotore di comportamenti cooperativi, il suo costo può essere tale che il vantaggio totale per la collettività, inteso come la somma dei vantaggi per tutti gli individui che la compongono, può risultare nullo. Gli autori hanno introdotto una nuova versione di PD in cui alle due scelte collaboro/non collaboro viene aggiunta l’opzione di una punizione a costo non zero per colui che la infligge. In questo modo vi è una gradazione nella risposta a un defector: una punizione blanda per una reciproca risposta non collaborativa, e una punizione maggiore che infligge una penalità anche se questo contempla un costo. Paragonando il risultato di questo PD a un PD classico, si è osservato che un comportamento collaborativo si instaura con più probabilità, ma il bilancio netto tra costi e benefici di tutti i partecipanti è lo stesso nei due casi. Infatti gli unici a ottenere un sostanziale beneficio sono i collaboratori che non puniscono, ma il loro guadagno viene bilanciato dal maggior costo sia per i defectors sia per i punishers. Mentre resta possibile che l’AP porti a chi la esercita un beneficio non apparente nella schematizzazione di un gioco (potrebbe in certe circostanze portare a una migliore reputazione, con conseguente ricompensa in altre situazioni), è evidente che le dinamiche sociali in presenza di AP sono ancora in parte da esplorare.
Comportamenti collaborativi in una società di individui razionali e non
In molti modelli di sviluppo delle relazioni sociali si fanno le due seguenti ipotesi: si assume che gli individui si creino un quadro oggettivo degli eventi che li circondano, in particolare riguardo alle scelte degli altri; si ipotizza che gli individui scelgano di compiere quelle azioni che ottimizzano il loro beneficio. Si suppone, in altre parole, che gli individui siano razionali e non diano un valore intrinseco a un’azione compiuta da loro stessi o dagli altri, ma la giudichino solo nei termini delle conseguenze che essa può avere per sé stessi (individui di questo tipo possono essere definiti amorali o egoisti). Come esemplificato dall’AP, tuttavia, spesso nelle società umane scelte di comportamento sono fatte sulla base di preferenze di tipo etico, e vi sono individui che valutano le azioni proprie e degli altri di per sé, in termini di giusto e non giusto, e non solo per le conseguenze in termini di beneficio. Questi individui tendono a essere dei forti ‘reciprocatori’, nel senso che hanno una predisposizione a remunerare gli altri per un comportamento collaborativo e nello stesso tempo a esercitare AP nei confronti di quanti violino le convenzioni sociali. Sembrerebbe a priori che la presenza di questi tipi differenti di individui debba avere una forte influenza sullo sviluppo della struttura sociale, portando a comportamenti la cui analisi sia particolarmente complessa. Sorprendentemente, però, si può dimostrare che, in determinate condizioni, minoranze di un certo tipo possono far sì che il comportamento della maggioranza si adegui al proprio stile di vita. Per es., una minoranza di individui egoisti può indurre un comportamento egoista in una maggioranza di convinti reciprocatori, così come, all’opposto, una minoranza di reciprocatori può creare incentivi tali che la maggioranza di egoisti si comporti in modo collaborativo.
Consideriamo, per es., un gioco di PD ridefinito in termini di mercato. Le regole sono le seguenti: due individui A e B hanno un bene commerciabile. Ciascuno valuta 10 il bene in suo possesso e nello stesso tempo valuta 20 il bene dell’altro. In queste condizioni, in assenza di un contratto vincolante, si crea una situazione di PD: a entrambi converrebbe (soggettivamente) uno scambio, ma tra individui amorali la situazione più razionale è di non inviare il proprio bene perché indipendentemente dalla risposta dell’altro questa è la soluzione più vantaggiosa. Se la transazione viene fatta tra reciprocatori, al contrario, sia A sia B sanno che se loro inviano il proprio bene, l’altro farà lo stesso e di conseguenza lo scambio viene fatto. La situazione diventa più complessa nel caso in cui uno dei due sia un amorale (per es., A) e l’altro (B) sia un reciprocatore, ed entrambi conoscano le propensioni dell’altro. Nelle condizioni di scambio contemporaneo della merce la transazione non avviene perché B sa che A tratterrà presso di sé il suo bene e di conseguenza non manda il proprio. Se però la transazione viene fatta sequenzialmente, A, egoisticamente, manderà la sua merce perché sa che in questo modo B replicherà mandando la propria. In questa condizione, quindi, l’esistenza stessa di un reciprocatore induce un comportamento collaborativo in un individuo egoista, non perché vi sia una minaccia di punizione, ma perché si crea un incentivo economico alla cooperazione. L’esistenza di reciprocatori può indurre un comportamento di collaborazione anche tra individui amorali, a patto che essi non conoscano l’atteggiamento della persona con cui fanno lo scambio, ma sappiano che la probabilità p di incontrare un reciprocatore è superiore al 50%. Infatti, un amorale A sa che se non manda la sua merce a B questi a sua volta non la invierà, sia che si tratti di un amorale sia che si tratti di un reciprocatore. Se invece invia la sua merce il suo guadagno finale sarà di 20×p, ossia maggiore di 10. In altre parole, A collabora per guadagnarsi una reputazione di reciprocatore perché ciò rientra nella sua convenienza. In questo esempio lo sviluppo di un comportamento cooperativo richiede la presenza di più del 50% di reciprocatori, ma si può dimostrare che, introducendo l’opzione di una punizione, la presenza di una minoranza di reciprocatori è sufficiente per rendere conveniente a individui amorali un comportamento cooperativo. Con considerazioni simili si può dimostrare come anche nell’UG la presenza di una percentuale di reciprocatori induce individui amorali a fare offerte eque (cioè crea l’effetto di un super UG). È interessante notare però come la struttura delle transazioni possa fortemente influenzare la risposta collaborativa in società composte da individui sia amorali sia reciprocatori. Se nell’UG si introduce un elemento di concorrenza, cioè se a seguito di una ripartizione, comunque essa sia, sono più persone a poter decidere se accettare o no, la propensione all’equità crolla anche in individui con forte senso ‘etico’. Questo perché la probabilità che tra quanti sono chiamati ad accettare la proposta vi siano individui amorali (ossia disposti ad accettare una qualunque ripartizione anche se ingiusta) fa sì che la funzione punitiva di un rifiuto venga a mancare. In questo caso, quindi, la presenza di una minoranza di individui amorali rende improponibile una risposta etica anche dei reciprocatori.
Il ruolo dell’etica nella cooperazionetra individui
Al di là delle semplificazioni schematiche della teoria dei giochi, è evidente come sia difficile comprendere l’emergere di società come quelle umane, che sono fortemente strutturate e nel contempo sono costituite da individui con capacità decisionale indipendente, se non si introduce il concetto di moralità. In effetti gli studi moderni sulla cooperazione tra individui sono strettamente correlati con gli studi sulla psicologia e l’origine dei concetti etici che, fino a prova contraria, sembrano costituire una peculiarità specifica del genere umano. E molte teorie moderne sull’evoluzione del cervello dell’uomo ipotizzano che lo sviluppo di capacità cognitive sia più legato alla complessità della struttura sociale emergente che allo sviluppo di capacità tecniche per la risoluzione di problemi relativi alla sopravvivenza, come il procurarsi cibo ed evitare pericoli. Per es., in un recente studio sperimentale su scimpanzé, orangutan e bambini di due anni e mezzo, è stato dimostrato che i bambini e gli scimpanzé hanno capacità cognitive simili per quanto riguarda la risoluzione di problemi pratici, ma i bambini sono più abili nell’affrontare dilemmi sociali (Hermann, Call, Hernández-Lloreda et al. 2007).
È forse interessante notare che gli oggetti principali delle problematiche etiche sono l’altruismo e la cura per il prossimo, il discriminare tra giusto e non giusto e il rispetto dell’autorità (o volontà divina nel caso delle religioni). Non sfugge a un attento osservatore che queste problematiche possono in parte corrispondere a cure per il prossimo, ossia kin selection (generalmente la quantità di empatia e la nostra propensione a fare del bene agli altri sono correlati con il grado di parentela che ci lega); giusto/non giusto, ovvero direct (o indirect) reciprocity (è giusto che le persone siano trattate allo stesso modo e quindi che ricevano quello che hanno dato, in altre parole fare agli altri quello che gli altri fanno a te o a un terzo); rispetto dell’autorità, della nazione o della divinità, ossia group selection intesa come discriminazione tra noi (chi conosce le regole) e gli altri (chi non le conosce) e attribuzione di un valore in sé alla collettività, un valore aggiunto rispetto alla somma degli individui. In un recente articolo (Haidt 2007), che per ovvi motivi ha suscitato molte polemiche, è stata addirittura messa in relazione la preferenza di tipo politico (liberale contro conservatore) con la scelta di privilegiare atteggiamenti etici corrispondenti ai vari meccanismi che promuovono la cooperazione tra individui (in un’indagine tra cittadini statunitensi i liberali si sono rivelati più sensibili al senso dell’altruismo e del giusto e i conservatori al senso del sacro).
Bibliografia
P.E. Turner, L. Chao, Prisoner’s dilemma in an RNA virus, «Nature», 1999, 398, 6726, pp. 441-43.
R.J. Aumann, War and peace, «PNAS. Proceedings of the National academy of sciences of the USA», 2006, 103, 46, pp. 17.075-78.
F. Fiegna, Y.-T.N. Yu, S.V. Kadam, G.J. Velicer, Evolution of an obligate social cheater to a superior cooperator, «Nature», 2006, 441, 7091, pp. 310-14.
J. Henrich, R. McElreath, A. Barr et al., Costly punishment across human societies, «Science», 2006, 312, 5781, pp. 1767-70.
M.A. Nowak, Five rules for the evolution of cooperation, «Science», 2006, 314, 5805, pp. 1560-63.
J. Haidt, The new synthesis in moral psychology, «Science», 2007, 316, 5827, pp. 998-1002.
C. Hauert, A. Traulsen, H. Brandt et al., Via freedom to coercion. The emergence of costly punishment, «Science», 2007, 316, 5833, pp. 1905-07.
E. Hermann, J. Call, M.V. Hernández-Loreda et al., Human have evolved specialized skills of social cognition. The cultural intelligence hypothesis, «Science», 2007, 317, 5843, pp. 1360-66.
K. Jensen, J. Call, M. Tomasello, Chimpanzees are rational maximizers in an ultimatum game, «Science», 2007, 318, 5847, pp. 107-09.
A. Dreber, D.G. Rand, D. Fudenberg, M.A. Nowak, Winners don’t punish, «Nature», 2008, 452, 7185, pp. 348-51.