giochi dinamici, teoria dei
Indirizzo di ricerca che studia una particolare categoria di g., che trovano ampia applicazione nello studio di vari problemi di economia industriale, g. di entrata potenziale, modelli di leadership di quantità o di prezzo (➔ Stackelberg, equilibrio di), di segnalazione e di screening (➔). Questi g. trovano rappresentazione in forma estesa nell’albero del gioco. Vengono in tal modo decscritte la successione temporale delle mosse – per es., in un gioco di entrata, le azioni del potenziale entrante e le possibili reazioni dell’incombente – l’informazione dei giocatori e le congetture sulle possibili scelte degli altri giocatori. La soluzione sfrutta l’idea di razionalità dei giocatori, attribuendo agli stessi la capacità di valutare le possibili mosse dei rivali attraverso un processo di induzione sia a ritroso sia in avanti. Nel caso di induzione a ritroso, ogni giocatore suppone che le decisioni dei giocatori nelle fasi successive del g. siano rigorosamente razionali e determina pertanto la convenienza delle proprie alternative su tale ipotesi (backward induction). Così, nel g. di entrata, se la scelta dell’incombente di adottare una strategia aggressiva di ostacolo all’entrata ha un pay off (➔) inferiore a quello della strategia alternativa di consentire l’entrata, il potenziale entrante si regolerà nella scelta fra entrare o non entrare sull’ipotesi che l’incombente sceglierà la strategia di accomodare l’entrata. Gli equilibri risultanti sono stati chiamati da R. Selten (1965) equilibri di Nash perfetti nei sottogiochi. Nel caso di induzione in avanti, si suppone, invece, che ogni giocatore che si trovi in una fase successiva del g. attribuisca a chi è chiamato a giocare prima di lui scelte razionali (forward induction). n
giochi ripetuti
I g. ripetuti un numero finito o indefinito di volte sono una categoria dei giochi dinamici.
La soluzione del g. del dilemma del prigioniero (➔ prigioniero, dilemma del) è un equilibrio in strategia dominante (‘confessare’, ‘confessare’) paretianamente inferiore rispetto ai pay off (➔) del profilo di strategie (‘negare’, ‘negare’). Ci si può chiedere se passando da un g. una tantum a un g. ripetuto possa sorgere dalla conoscenza della storia del g., ossia delle azioni precedentemente adottate dai giocatori, l’incentivo a una soluzione collaborativa. Per rispondere a questo quesito si veda la descrizione del g. sottoposto da R. Axelrod (1982) all’attenzione di alcuni colleghi per analizzare la nascita della cooperazione in un mondo di egoisti, i prigionieri del dilemma.
In questo g. si confrontano due azioni dal significato più generale: ‘cooperare’ e ‘non cooperare’, che corrispondono rispettivamente alle azioni ‘negare’ e ‘confessare’ del dilemma del prigioniero. Anche nel caso del g. di Axelrod, l’equilibrio in strategia dominante (‘non cooperare’, ‘non cooperare’) con pay off (2,2) è inferiore in senso paretiano ai pay off (3,3) del profilo di strategie (‘cooperare’, ‘cooperare’), come risulta dalla matrice del g. di seguito riprodotta. Si consideri ora la possibilità di ripetizione del g. e si supponga che all’inizio di ogni nuova fase i giocatori (1 e 2) conoscano la precedente storia del g., cioè se hanno scelto ‘cooperare’ o ‘non cooperare’. Le modalità della ripetizione del g. diventano cruciali per la soluzione.
In questo caso, l’unica strategia di equilibrio è la ripetizione del profilo di azioni di equilibrio del g. statico. La spiegazione è la seguente. Procedendo a ritroso – backward induction – dall’ultima fase a quella iniziale, si osserva che nell’ultima fase nessun giocatore ha motivo di adottare la scelta ‘cooperare’, dato che la risposta dell’altro giocatore non potrebbe che essere ‘non cooperare’ con pay off (1,4). Ma se non vi è motivo di cooperare nell’ultima fase del g., non vi è motivo di farlo neppure in quella che la precede poiché, in ogni caso, nella fase successiva entrambi i giocatori sceglieranno di non cooperare. Si può così risalire all’indietro fino alla fase iniziale e concludere che l’unica soluzione razionale è non cooperare mai per entrambi i giocatori. Questa soluzione, che è un equilibrio di Nash perfetto nei sottogiochi, suscita critiche e perplessità in considerazione del fatto che l’orizzonte temporale del g., ancorché finito, può essere molto esteso.
Più ricca e interessante è la gamma delle possibili soluzioni del g. ripetuto un numero infinito, o indefinito, di volte. L’assenza di un termine preclude la possibilità di ricorrere al processo di induzione a ritroso e impone quindi di considerare strategie alternative in funzione della storia del gioco. L’idea centrale si fonda sul principio della punizione del giocatore che devia dalla cooperazione, punizione che consiste nel passare, in risposta, alla strategia di non cooperazione. La teoria mostra che la scelta fra continuare la cooperazione o passare a una strategia di deviazione, con un immediato vantaggio per chi devia, ma con la perdita derivante dalla successiva punizione, permanente o temporanea, dipende dal fattore di sconto dei pay off a orizzonte infinito. Questo risultato, noto come teorema di Folk, mostra come la cooperazione, per es. in un regime di oligopolio, possa essere il risultato di una scelta indipendente dei giocatori e non il frutto di un accordo collusivo, vietato dalla normativa antitrust. Il teorema pone in evidenza, peraltro, che gli equilibri del g. sono molteplici e dipendono dalla specifica strategia di cooperazione che nei diversi g. può essere adottata dai giocatori e dal corrispondente valore del fattore di sconto (➔ sconto).