Appunti Matematici 33

Page 1

Patrizio Gravano

APPUNTI MATEMATICI

SINTESI INTRODUTTIVA ALLA TEORIA MATEMATICA DEI GIOCHI numero 33 - settembre 2017



INTRODUZIONE

Il numero di settembre 2017 dei miei Appunti matematici e’ dedicato alla teoria matematica dei giochi.

La copertina – e non poteva essere altrimenti – e’ dedicata al matematico americano John Forbs Nash, uno dei grandi realizzatori di questa teoria, sempre piu’ utilizzata in campo scientifico, dalla fisica all’economia…

Ovviamente si tratta di un testo introduttivo.

Spero possa essere comunque utile a qualcuno…

Essa presuppone nozioni matematiche ben note, specie se si e’ studiata la teoria delle funzioni, un minimo di probabilita’ e di statistica e la ricerca operativa.

In effetti, questa ultima puo’ offrire un utile strumento risolutivo.

Ho deciso di articolare l’elaborato in due distinte sezioni.

La prima di esse contiene una elencazione di concetti basici della materia, mentre la seconda scende in qualche dettaglio studiando i giochi (statici e dinamici) in relazione alla completezza dell’informazione (o meno).

Trattandosi di un elaborato sintetico anche la bibiliografia e’ scarna ma autorevole.


Uno dei testi poi contiene una aticolatissima bibliografia, molto utile per chi volesse approfondire.

Va infine osservato che il testo del prof. Gibbons della Cornell University di New York e’ pregevole, oltre che per la linearita’ espositiva anche per gli esempi applicativi contenuti nel testo, che in questa sede introduttiva non ho sviluppato.

Questi dimostrano la potenza della teoria in oggetto.

Resta da ricordare che nel 1994 il matematico americano John Forbes Nash per i suoi fondamentali contributi alla teoria matematica dei giochi ottenne il Premio Nobel per le scienze economiche.

Patrizio Gravano

patrizio.gravano@libero.it


Sintesi introduttiva alla Teoria matematica dei giochi

INDICE SOMMARIO

1. Le nozioni fondamentali della teoria matematica dei giochi. 1.1.

Nozione di gioco.

1.2.

Il concetto di strategia.

1.3.

La matrice dei pagamenti.

1.4.

Strategia mista.

1.5.

Strategia specificata da un vettore di probabilita’.

1.6.

Strategia del minimax.

1.7.

Dominazione.

2. Le varie tiopologie di giochi. 2.1.

I giochi statici con informazione completa.

2.2.

I giochi dinamici con informazione completa.

2.3.

I giochi statici con informazione incompleta.

2.4. I giochi dinamici con informazione incompleta.


1.

Le nozioni fondamentali della teoria matematica dei giochi

1.1

Nozione di gioco

Il gioco e’ una competizione tra n individui, detti giocatori, che si snoda secondo condotte decisionali (mosse) che avvengono in successione (sequenzialmente, quindi…) poste in essere dai vari giocatori, nel rispetto delle regole codificate del gioco.

Mossa puo’ essere inteso come sinonimo di attivita’ elementari dei singoli giocatori.

Ogni giocatore e’ libero di, in ogni momento, scegiere la mossa che gradisce, tra quelle che gli sono consentite.

Va pero’ osservato che le mosse possibili sono note a tutti i giocatori e che ogni giocatore, quando adotta una mossa, pone in essere una ed una soltanto delle mosse possibili come predefinite e come note a tutti i giocatori.

Ad ogni mossa corrisponde un pagamento noto a priori, detto payoff.

Solitamente si considerano giochi con due soli giocatori.

Nel novero dei giochi a due giocatori vanno considerati i giochi a somma nulla.

Un gioco a somma nulla tra due giocatori e’ un gioco per il quale il guadano di una parte corrisponde alla perdita eguale dell’altra parte.


Giochi a somma nulla con due soli giocatori sono detti giochi a matrice.

1.2

Il concetto di strategia

Una strategia pura e’ un piano che definisce la sequenza delle mosse e delle contromosse che ogni singolo giocatore compira’ durante il gioco.

Solitamente le strategie pure sono un numero finito anche abbastanza elevato.

Ciascun giocatore conosce il pattern delle possibili scelte dell’avversario, anche se non puo’ prevedere quale mossa sara’ adottata in un dato istante.

1.3

La matrice dei pagamenti

Per studiare in modo completo i giochi e’ necessario conoscere la cosiddetta matrice dei pagamenti, detta matrice dei payoff.

Infatti, un termine inglese particolarmente usato per pagamento e’ payoff, che verra’ usato anche in questo elaborato.


La matrice dei pagamenti e’ di per se’ adeguata a caraterizzare completamente il gioco che si esamina.

La matrice dei pagamenti ha sostanzialmente la caratterizzazione di una tabella a doppia entrata dove i valori đ?‘”đ?‘–đ?‘˜ indicano i guadagni del giocatore I quando egli attua la strategia đ??´đ?‘– e il rivale (il secondo giocatore, denotato con II) attua la strategia đ??ľđ?‘— .

Allorquando si si ragiona in termini di gioco a somma zero, quello che guadagna I viene perso da II (e viceversa).

In definiva la matrice per il giocatore II potrebbe essere costituita da perdite −đ?‘”đ?‘–đ?‘˜ . Nei casi piu’ usuali si ammette che i due contendenti abbiano a disposizione le medesime strategie. Ma tale assunzione non e’ vera in generale.

E’ possibile esemplificare con il caso di due giocatori I e II che hanno a disposizione tre strategie eguali, tali che đ??´đ?‘– = đ??ľđ?‘— quando 1 ≤ đ?‘– = đ?‘— ≤ 3.

Si consideri assegnata la matrice dei payoff.


Sia dato questo dato concreto. đ??ľ1

đ??ľ2

đ??ľ3

đ??´1

−1

6

9

đ??´2

−5

7

−2

đ??´3

2

8

−1

Le strategie A afferiscono al giocatore I mentre le B afferiscono al giocatore II.

Essa si interpeta immediatamente come segue.

Ad esempio, se il giocatore I decide la mossa đ??´3 avra’ guadagni 1 e 9 quando il giocatore II risponde con le mosse đ??ľ1đ?‘’ đ??ľ2 , rispettivamente. Se invece la reazione di II conduce alla scelta decisionale đ??ľ3 allora il guadano di I sara’ negativo (una perdita) di valore −1.

1.4

Strategia mista

Esiste una sorta di best practice della teoria dei giochi, ovvero “determinare la strategia “migliore� per un dato giocatore nell’ipotesi che l’avversario sia razionale ed effettui contromosse intelligenti�.


Non si puo’ quindi operare con schemi fissi, con una successione prevedibile di mosse

Andranno quindi introdotte riflesisoni di natura probabilistica.

1.5

Strategia specificata da un vettore di probabilita’

Ecco perche’ viene introdotta una strategia mista intendibile come una strategia specificata da un vettore di probabilita’.

Ad ogni strategia possibile viene associate una probabilita’ di adozione da parte del singolo giocatore.

Le distribuzioni di probabilita’ per i due giocatori sono rispettivamente:

per il giocatore I

X = ⌋đ?‘Ľ1 , đ?‘Ľ2 , ‌ . đ?‘Ľđ?‘› âŚŒđ?‘‡

per il giocatore II

Y = ⌋đ?‘Ś1 , đ?‘Ś2 , ‌ . đ?‘Śđ?‘› âŚŒđ?‘‡

Il significato formale di detti vettori trasposti e’ imemdiato. Ad esempio đ?‘Ľđ?‘˜â‰¤đ?‘› indica la probabilita’ che il giocatore I adotti la strategia k-esima. Trattandosi di probabilita’ risulta che 0 < đ?‘Ľđ?‘˜â‰¤đ?‘› < 1 con il vincolo che ∑ đ?‘Ľđ?‘˜â‰¤đ?‘› = 1. Analogamente per le đ?‘Śđ?‘˜â‰¤đ?‘› .


1.6

Strategia del minimax

Si riconsideri la matrice dei payoff introdotta in precedenza, ovvero la seguente: đ??ľ1

đ??ľ2

đ??ľ3

đ??´1

−1

6

9

đ??´2

−5

7

−2

đ??´3

2

9

−1

Nella prospettiva del giocatore I si consideri il valore massimo del minimo guadagno possibile. Cin riferimento alla tabella il max min che va considerato e’ – 1 in quanto − 1 e’ il max (− 1, −2, −5).

Quindi il giocatore 1 gioca la riga 3.

Con riferimento al giocatore II si considera ail valore minimo della perdita massima per il giocatore II.

E’ ben evidente che la massima perdita di II corrisponde al massimo guadagno di I (dovendo ricordare che il gioco e’ a somma zero).


La piu’ piccola perdita per il giocatore II e’ 1 che e’ il piu’ piccolo valore della massima perdita per il giocatore II.

Le possibili perdite per II, con riferimento alla matrice assegnata, sono ( - 2, - 6, - 9, -2, - 7, -9) e il minimo della perdita e’ giusto – 2. Quindi il giocatore II adotta la strategia đ??ľ1 Il maxmin per I viene solitamente indicato come đ?‘šđ??ź mentre il minmax per II (ovvero la minima massima perdita di II) si indica con đ?‘šđ??źđ??ź . Risulta che e’ sempre verificata la condizione: đ?‘šđ??ź ≤ đ?‘šđ??źđ??ź

1.7

Dominazione

Il termine dominazione e’ riferito al caso di strategia strettamente dominata.

Una strategia e’ strettamente dominata (per un dato giocatore) se essa comparativamente peggiora la posizione del giocatore piu’ ampiamente di ogni altra strategia con riferimento a tutte le possibili strategie degli altri giocatori.


Il giocatore che evidenzia che per lui una strategia e’ strettamente dominata, agendo razionalmente evita di giocarla e gli altri giocatori, pure essi razionali, ne hanno contezza.

Non e’ necessariamente vero che in un ogni gioco esista comunque una (o piu’) strategia strettamente dominata per uno o piu’ giocatori. Il problema della conoscenza comune e’ complesso e la letteratura ⦋ Gibbons⦌ ne ha evidenziato i profili critici.

Tanto premesso, si considerera’ il caso concreto e il metodo di “eliminazione iterata” di strategie strettamente dominate all’uopo utilizzando la bimatrice dei giochi (vedi infra).


2.

Le varie tipologie di giochi

2.1

I giochi statici con informazione completa

Nei giochi statici con informazione completa le strategie dei giocatori sono scelte autonomamente e simultaneamente (o comunque in modo che ogni giocatore non conosce le decisioni degli altri giocatori (le carte vanno scoperte simultaneamente! anche se le scelte personali possono non essere simultanee).

La combinazione delle decisioni determina il payoff effettivo, noto a priori ai vari giocatori.

Ogni giocatore cioe’ conosce il payoff corrispondente alla combinazione delle strategie effettivamente realizzate.

Si opera in un contesto di informazione completa, nel senso che tutti sanno quello che e’ necessario sapere per decidere razionalmente.

Tutti pensano che devono operare razionalmente e che tutti gli altri operatori saranno razionali e conosceranno tutto quello che devono sapere per decidere secondo razionalita’.

Nella realta’ si considerano giochi ai quali partecipano n giocatori.


Relativamente ad ogni giocatore (giocatore i-esimo) viene introdotto un insieme, solitamente indicato come đ?‘†đ?‘–≤đ?‘› , i cui elementi sono le possibili strategie utilizzabili, solitamente indicate come đ?‘ đ?‘–≤đ?‘› . Formalmente si scrive đ?‘†đ?‘– = { đ?‘ đ?‘– ,1 , đ?‘ đ?‘–,2 , ‌ . . , đ?‘ đ?‘–,đ?‘› }.

In esso ho introdotto un piccolo ma credo utile appesantimento.

Le varie strategie sono riferite al giocatore i-esimo mentre il secondo indice indica il numero d’ordine della strategia. Va preliminarmente osservato che non necessariamente per un distinto giocatore j ≠� si ha che �� = �� . Neppure in generale |�� | = |�� |.

Viene poi introdotta una funzione detta payoff del giocatore i. Essa si indica come đ?‘˘đ?‘– e si scrive đ?‘˘đ?‘– = đ?‘˘đ?‘– (đ?‘†đ?‘– , đ?‘†đ?‘— ∀đ?‘— ≠đ?‘–).

Ho ritenuto opportuno conservare detta funzione in modalita’ compatta.

Vorrei pero’ esemplificare quanto intendo.


Si consideri un caso concreto di gioco nel quale sono presenti 3 giocatori razionali, A, B e C. Per i tre giocatori sono a disposizione tre distinte strategie dette đ?‘ 1 , đ?‘ 2 đ?‘’ đ?‘ 3. Si ammetta che nella scelta simultanea le decisioni assunte siano đ?‘ 2 , đ?‘ 2 đ?‘’ đ?‘ 1 per i giocatori A, B e C, rispettivamente.

La funzione di payoff del giocatore A e’ esprimibile come segue. đ?‘˘đ??´ = đ?‘˘đ??´ (đ?‘ đ??´ , đ?‘ đ??ľ , đ?‘ đ?‘? ). Quando in concreto vengono adottate đ?‘ 2 , đ?‘ 2 đ?‘’ đ?‘ 1 per i giocatori A, B e C, rispettivamente si otttiene il corrispondente payoff (quindi un valore numerico) avendosi che: đ?‘”đ??´ = đ?‘˘đ??´ (đ?‘ 2 , đ?‘ 2 , đ?‘ 1) Da questa posizione si possono agevolmente ottenere đ?‘”đ??ľ = đ?‘˘đ??ľ (đ?‘ 2 , đ?‘ 2 , đ?‘ 1) e đ?‘”đ??ś = đ?‘˘đ??ś (đ?‘ 2 , đ?‘ 2 , đ?‘ 1 ) Se il gioco e’ a somma zero deve potersi scrivere che: đ?‘”đ??´ + đ?‘”đ??ľ + đ?‘”đ??ś = 0. I giocatori A, B e C non possono in alcun modo ritenersi intercambiabili.


Si potrebbe ad esempio porre il seguente quesito:

I payoff dei vari giocatori si conservano quando e’ assegnata l’ipotesi alternativa data in forma verbale come segue: A mantiene la strategia đ?‘ 1 B adotta la strategia đ?‘ 2 in luogo di đ?‘ 1 C adotta la strategia đ?‘ 1 in luogo di đ?‘ 2 In un gioco a somma zero con due giocatori cio’ non e’ necessariamente vero. Ho infatti considerato un gioco a somma nulla con due soli giocatori detti A e B per i quali sono a disposizione le strategie đ?‘Ž1 , đ?‘Ž2 đ?‘’ đ?‘Ž3 . Alla scrittura đ?‘”đ??´ (đ?‘Ž2 , đ?‘Ž1 ) va dato il seguente significato: trattasi del payoff di competenza del giocatore A, quando A ha adottato la scelta đ?‘Ž2 mentre B ha adottato la scelta đ?‘Ž1 . Trattandosi di un gioco a somma nulla allora deve imporsi sia đ?‘”đ??´ (đ?‘Ž2 , đ?‘Ž1 ) = − đ?‘”đ??ľ (đ?‘Ž2 , đ?‘Ž1 ). I due player sono intecambiabili quando risulta vero che:


đ?‘”đ??´ (đ?‘Ž2 , đ?‘Ž1 ) =đ?‘”đ??´ (đ?‘Ž1 , đ?‘Ž2 ) In termini di matrici dei payoff i giocatori sono intercambiabili se: đ?‘”đ?‘–,đ?‘˜ = đ?‘”đ?‘˜,đ?‘– per ogni coppia (i , k).

Cio’ e’ vero per ogni giocatore ammesso al gioco.

Se non e’ verificata questa condizione i giocatori sono da intendersi distinti.

Deve essere ora data la definizione di equilibrio di Nash.

Sia dato un gioco G definito nella sua forma normale con n giocatori. Il gioco G e’ formalmente definito come G ={ đ?‘†1 , đ?‘†2 , ‌ . , đ?‘†đ?‘› , ‌ . . , đ?‘˘1, đ?‘˘2 ‌ . , đ?‘˘đ?‘› }. ∗ ∗ Le strategie đ?‘ đ?‘–≤đ?‘› definiscono un equilibrio di Nash se ∀ đ?‘– | đ?‘– ≤ đ?‘› ∃ đ?‘ đ?‘–≤đ?‘› tale che siano

adottate da parte dei rimanenti (n −1) giocatori le strategie đ?‘ đ?‘˜âˆ— ≤đ?‘›| đ?‘˜â‰ đ?‘› se quando i (al variare di i, ovvero per ogni i) se risulta vera la seguente relazione: đ?‘˘đ?‘– ( đ?‘ 1∗ , đ?‘ 2∗ , ‌.. đ?‘ đ?‘–∗ , ‌.., đ?‘ đ?‘›âˆ— ) ≼ đ?‘˘đ?‘– ( đ?‘ 1∗ , đ?‘ 2∗ , ‌.. đ?‘ đ?‘– , ‌.., đ?‘ đ?‘›âˆ— ) In buona sostanza đ?‘˘đ?‘– ( đ?‘ 1∗ , đ?‘ 2∗ , ‌.. đ?‘ đ?‘–∗ , ‌.., đ?‘ đ?‘›âˆ— ) e’ un massimo.


Se n player possono utilizzare k distinte strategie il numero delle possibili combinazioni e’ đ?‘˜ đ?‘› .

Ad esempio se i giocatori sono due e le strategie sono tre la matrice delle combinazioni sara’ la seguente, ove la prima componente indica la strategia del giocatore di riga e la seconda componente indica la strategia del giocatore di colonna.

đ?‘Ž1

đ?‘Ž2

đ?‘Ž3

đ?‘Ž1

đ?‘Ž1 đ?‘Ž1

đ?‘Ž1 đ?‘Ž2

đ?‘Ž1 đ?‘Ž3

đ?‘Ž2

đ?‘Ž2 đ?‘Ž1

đ?‘Ž2 đ?‘Ž2

đ?‘Ž2 đ?‘Ž3

đ?‘Ž3

đ?‘Ž3 đ?‘Ž1

đ?‘Ž3 đ?‘Ž2

đ?‘Ž3 đ?‘Ž3

Nella scarna documentazione in mio possesso non ho rinveuto questa matrice che ho introdotto per una mera funzione chiarificatrice delle idee di una materia che non avevo mai considerato compiutamente se non per fugaci riferimenti applicativi derivati dall’economia.


Gia’ dalle prime considerazioni la manualistica piu’ nota ⦋Gibbons⦌ introduce la nozione operative di bimatrice.

Quando si parla di bimatrice ci si riferisce ad una matrice i cui elementi sono payoff.

Vorrei chiarire il concetto con un esempio banale di gioco con due player che hanno a disposizione due strategie.

La bimatrice contiene i payoff dei giocatori in relazione alle possibili combinaizoni di strategie.

I giocatori sono A e B. Essi sono detti rispettivamente giocatore di riga e giocatore di colonna.

Con quanto detto finora e’ immediato comprendere il significato, tenendo conto che il payoff di A (giocatore di riga) precede sempre il payoff del giocatore di colonna, ovvero B.

Ho scientemente chiamato le strategie dei giocatori con lettere diverse, in quanto non necessariamente i due giocatori, ragionando in modo generale e astratto, potrebbero avere a disposizione opzioni assolutamente, o parzialmente, distinte.


La bimatrice proposta e’ la seguente: đ?‘?1

đ?‘?2

đ?‘Ž1

đ?‘”đ??´ (đ?‘Ž1 , đ?‘?1 )

đ?‘”đ??ľ (đ?‘Ž1 , đ?‘?1 )

đ?‘”đ??´ (đ?‘Ž1 , đ?‘?2 )

đ?‘”đ??ľ (đ?‘Ž1 , đ?‘?2 )

đ?‘Ž2

đ?‘”đ??´ (đ?‘Ž2 , đ?‘?1 )

đ?‘”đ??ľ (đ?‘Ž2 , đ?‘?1 )

đ?‘”đ??´ (đ?‘Ž2 , đ?‘?2 )

đ?‘”đ??ľ (đ?‘Ž2 , đ?‘?2 )

Le strategie đ?‘Ž1 đ?‘’ đ?‘Ž2 sono ascrivibili al giocatore A, mentre le strategie đ?‘?1 đ?‘’ đ?‘?2 sono le opzioni decisionali a disposizione di B. Scritture apparentemente complesse quali đ?‘”đ??ľ (đ?‘Ž2 , đ?‘?1 ) sono immediatamente intelligibili in quanto indicano, come nel caso di specie il guadagno (payoff) attribuito al giocatore B (lettera a deponente) quando il giocatore A ha giocato la strategia đ?‘Ž2 e, contestualmente, il giocatore B ha adottato la strategia , đ?‘?1 .

L’interpretazione dei contenuti formali della bimatrice e’ quindi immediato. E’ il caso di osservare che potrebbe essere che đ?‘Ž1 ≥ đ?‘?1 e đ?‘Ž2 ≥ đ?‘?2 .

Questo formalismo si interpreta nel senso che scrivere đ?‘Žđ?‘– ≥ đ?‘?đ?‘– significa che le due strategie sono la medesima strategia.


Nei giochi reali e’ possibile (come ho constatato dagli esercizi proposti) che risulti đ?‘Žđ?‘– ≢ đ?‘?đ?‘– per almeno un i. Con riferimento alla bimatrice, e quindi al gioco considerato in precedenza la seguente bimatrice si riferisce al caso che il gioco sia a somma zero.

đ?‘?1

đ?‘?2

đ?‘Ž1

đ?‘”đ??´ (đ?‘Ž1 , đ?‘?1 )

− đ?‘”đ??´ (đ?‘Ž1 , đ?‘?1 )

đ?‘”đ??´ (đ?‘Ž1 , đ?‘?2 )

− đ?‘”đ??´ (đ?‘Ž1 , đ?‘?2 )

đ?‘Ž2

đ?‘”đ??´ (đ?‘Ž2 , đ?‘?1 )

− đ?‘”đ??´ (đ?‘Ž2 , đ?‘?1 )

đ?‘”đ??´ (đ?‘Ž2 , đ?‘?2 )

− đ?‘”đ??´ (đ?‘Ž2 , đ?‘?2 )

I valori con i segni meno sono formalmente associati ad A come riferisce il deponente ma sostanzialmente attengono a valori ascribibili a B, come vuole la “logica� delle bimatrici.

Essi sono l’espressione di un gioco a somma zero in quanto si puo’ scrivere che:


đ?‘”đ??´ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) = − đ?‘”đ??ľ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) per ogni coppia (i, j) di strategie possibili, la prima riferita al giocatore di riga e la seconda al giocatore di colonna. Vorrei, incidentamente osservare che non necessariamente − đ?‘”đ??ľ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) < 0. Infatti da đ?‘”đ??´ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) < 0 si ha − đ?‘”đ??ľ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) > 0.

In un gioco a somma zero (per definizione) si ha: đ?‘”đ??´ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) + đ?‘”đ??ľ (đ?‘Žđ?‘– , đ?‘?đ?‘— ) = 0

Questa definizione e’ estensibile al caso di n giocatori con k strategie disponibili.

Va ora considerato, con riferimento ai giochi statici con informazione completa, il caso di esistenza, per un dato giocatore, una strategia strettamente dominata.

Noto il significato contenutistico della bimatrice si consideri il caso del gioco seguente ove i giocatori A (giocatore di riga) e B (giocatore di colonna) hanno, rispettivamente, a disposizione le strategie đ?‘Ž1 đ?‘’ đ?‘Ž2 per il giocatore A e đ?‘?1 , đ?‘?2 đ?‘’ đ?‘?3 a disposizione di B.


I due giocatori hanno contezza delle strategie disponibili e dei payoff associati univocamente alle possibili combinazioni di strategie, che nel caso di speciesono 3*2 = 6.

In prima battuta almeno il problema e’ risolvibile con la condizione che tutti sanno che tutti sanno tutti e che sono tutti razionali e che tutti devono attendersi comportamenti sempre razionali.

La bimatrice che ho costruito e’ assolutamente astratta anche se limitata al caso di due giocatori che hanno comunque a disposizione un numero distinto di possibili strategie. đ?‘?1

đ?‘?2

đ?‘?3

đ?‘Ž1

a

b

e

f

i l

đ?‘Ž2

c

d

g h

m n

I payoff di B sono stati indicati in rosso.

I ragionamenti che portano a dichiarare che una data strategia e’ strattamente dominata per un dato giocatore e che quindi questi, che si compota come un attore razionale, non la utilizzara’ mai nei corso del gioco (circostanza questo ache deve intendersi nota agli


altri giocatori) sono abbastanza intuitive e attengono alla comparazione tra payoff alternativi.

Il significato delle lettere (si tratta di payoff) della bimatrice e’ quello ordinario. Ad esempio g indica il payoff di A quando A gioca la strategia đ?‘Ž2 e B gioca đ?‘?2 . Ed anche si puo’ dire che l indica il payoff di B quando A gioca đ?‘Ž1 e B gioca đ?‘?3 .

Una strategia e’ strettamente dominata per un dato giocatore quando, al variare delle possibili combinazioni delle strategie degli altri giocatori (in generale (n – 1) giocatori), esiste almeno una strategia disponibile al dato giocatore per il quale egli possa constatare che i payoff di quella strategia che non dichiareremo strettamente dominata sono strettamente inferiori ai payoff di almeno una distinta strategia disponibile per esso.

Ad esempio con riferimento al gioco considerato e ai corrispondenti payoff si puo’ affermare che la strategia đ?‘?2 e’ strattamente dominata se risulta vera la seguente coppia di relazioni d’ordine: f<đ?‘™ h<n


Quando B osserva questo stato di cose (noto pure ad A‌.) allora decidera’ di non utilizzare in alcun caso la strategia đ?‘?2 . Il giocatore B prendera’ la sua decisione razionalmente in quanto fara’ la seguente argomentazione: posso adottare đ?‘?3 in luogo di đ?‘?2 perche’ cosi’ facendo qualunque decisione assuma A, che ha, nel caso concreto in esame, le possibili alternative đ?‘Ž1 đ?‘’ đ?‘Ž2 avro’ un guadagno comunque maggiore o una perdita minore di quella che avrei ottenuto con la strategia đ?‘?2 . Simmetriamente A, nella sua razionalita’, assume che B, che a giudizio di A si comporta come un attore razionale, escluda đ?‘?2 dalle sue possibili strategie. Non vorrei debordare da teorie considerate ma possiamo ampliare la condizione di eliminabilita’ di una strategia quando sono simultaneamente verificati i seguenti due sistemi di disequazioni: f<đ?‘™ <đ?‘? h<đ?‘› <đ?‘‘

In questo caso in un solo colpo, per cosi’ dire, si ottiene la condizione di ottima scelta per B, costituita dalla strategia đ?‘?1 che determina per B la massima profittabilita’ (o la


minima perdita) b quando A gioca la strategia đ?‘Ž1 , ovvero il payoff d quando A gioca la strategia đ?‘Ž2 . Il sistema di diseguaglianze date offre lo spunto per una ulteriore riflesione.

Si puo’ infatti affermare che se e’ vera almeno una coppie di diseguaglianze considerate allora đ?‘?2 e’ strattamente dominata. In definitiva la questione puo’ essere considerate come segue: la strategia đ?‘?2 e’ strettamente dominata se e’ verificato almeno uno dei due seguenti sistemi di disequazioni: f< đ?‘™,h< đ?‘› f< đ?‘?,h< đ?‘‘

Ammettiamo (per ipotesi, o meglio per i dati del problema, ovvero i payoff) che la strategia đ?‘?2 sia dominate da đ?‘?2 ovvero sia vera vero solo il primo sistema di diseguaglianze ovvero sia vero che: f< đ?‘™,h< đ?‘›


L’originario gioco e’ ricondotto al seguente. đ?‘?1

đ?‘?3

đ?‘Ž1

a b

i l

đ?‘Ž2

c d

m n

Al solito i payoff di B (giocatore di colonna) sono indicate in rosso.

A questo punto ci si chiede se questo gioco e’ ulteriormente semplificabile (mi si passi questo termine‌).

La risposta e’: astrattamente sÏ.

Il gioco e’ ulteriormente riducibile.

Il concetto di strategia strettamente dominata e’ riferito al singolo giocatore.

Poiche’ nel corso delle riflessioni si era detto che solamente una coppia di disequazioni era valida non si poteva, per conseguenza, ridurre ad uno il numero delle alternative per B. Se ad esempio dovesse risultare che per le strategie đ?‘?1 đ?‘’ đ?‘?3 sono vere le seguenti disequazioni


b<đ?‘™ d>đ?‘›

non si puo’ dire che una delle due rimanenti strategie e’ dominata dall’altra, nel senso introdotto.

Le uniche speranze ricadano su A. Relativamente a questo giocatore si puo’ dire che la strategia đ?‘Ž1 e’ dominata dalla strategia đ?‘Ž2 quando risulta vero che: c>a m>i A fronte di questi dati il giocatore A decide di optare per la strategia đ?‘Ž2 in luogo della ipotesi alternative data dalla scelta đ?‘Ž1 . In questo caso si dice che la strategia đ?‘Ž1 e’ dominata. Il gioco originario diviene il seguente. đ?‘?1 đ?‘Ž2

c

đ?‘?3 d

m n


A e’, per cosi’ dire, in balia di B. B adotta la strategia đ?‘?1 quando d > n, mentre adotta la strategia đ?‘?1 quando e’ vero il contrario ovvero se n > d. Per certi aspetti si puo’ introdurre una condizione di indifferenza che si ha per d = n.

Ed eccoci ora alla definizione dell’equilibrio di Nash per giochi statici con informazione completa.

Occorre preliminarmente osservare che un gioco non necessariamente ha un solo equilibrio di Nash.

La qual cosa sara’ considerate piu’ a fondo quanto verranno prese in considerazione le strategie miste. Assegnato un gioco in forma normale G = { đ?‘†đ?‘–≤đ?‘› , đ?‘˘đ?‘–≤đ?‘› } . Se per ogni giocatore i l’eliminazione iterate delle strategie a sua disposizione comporta ∗ la esistenza di unica strategia đ?‘ đ?‘–≤đ?‘› non dominate allora il vettore (đ?‘ 1∗ , đ?‘ 2∗ , ‌ .., đ?‘ đ?‘›âˆ— )

definisce l’unico equilibrio di Nash del gioco. D’altro canto se (đ?‘ 1∗ , đ?‘ 2∗ , ‌ .., đ?‘ đ?‘›âˆ— ) sono un equilibrio di Nash allora le strategie che lo definisconto, riferite ai singoli player, sopravvivono, nessuna esclusa, alla eliminazione iterate delle strategie strettamente dominate.


A questo punto e’ possibile la nozione di strategia mista.

Per ogni giocatore i viene introdotta una dostribuzione di probabilita’, riferita alle single strategie disponibili per il giocatore i-esimo.

Mosse possibili deve intendersi quale sinonimo di strategia pura. Relativamente al giocatore i-esimo l’insieme đ?‘†đ?‘– = { đ?‘ 1 , đ?‘ 2 ‌., đ?‘ đ?‘› }. Gli elementi di đ?‘†đ?‘– ovvero i vari đ?‘ đ?‘– sono le strategie pure. Le strategie miste, come noto, definiscono le probabilita’ đ?‘?đ?‘– associate alle strategie pure đ?‘ đ?‘– . Per esse, ovviamente, valgono condizioni standard, ovvero ∑ đ?‘?đ?‘– = 1 e 0 ≤ đ?‘?đ?‘– ≤ 1.

Ad esempio se le strategie pure del giocatore A sono solo due e sono indicate come đ?‘ đ??´,1 e đ?‘ đ??´,2 allora si puo’ scrivere che đ?‘?đ??´,1 (đ?‘ đ??´,1 ) + đ?‘?đ??´,2 (đ?‘ đ??´,2) = 1.

Se si vuole ragionare in termini di matrici quadrate per esempio del terzo ordine quando B ha ha disposizione tre strategie pure (contro le due di A) allora si puo’ scrivere:

đ?‘?đ??´,1 (đ?‘ đ??´,1 ) + đ?‘?đ??´,2 (đ?‘ đ??´,2 ) + đ?‘?đ??´,3 (đ?‘ đ??´,3 ) = 1, sotto la condizione đ?‘?đ??´,3 (đ?‘ đ??´,3 ) = 0.


In questo caso in termini concise la strategia mista per il player A sarebbe quella del vettore (p, q, 0) sotto la condizione p + đ?‘ž = 1. Sia assegnato un gioco in forma normale, ovvero G = { đ?‘†đ?‘–≤đ?‘› , đ?‘˘đ?‘–≤đ?‘› } . Si supponga che il giocatore i-esimo abbia a disposizione k distinte strategie. Sia đ?‘†đ?‘– ={đ?‘ đ?‘–,1 , đ?‘ đ?‘–,2 , ‌ . , đ?‘ đ?‘–,đ?‘˜ }

La strategia mista del giocatore i-esimo e’ il seguente vettore a k componenti (a volte messo come trasposta, quindi come vettore colonna): đ?‘ƒđ?‘– ={đ?‘?đ?‘–,1 , đ?‘?đ?‘–,2 , ‌ . , đ?‘?đ?‘–,đ?‘˜ } Va osservato che deve risultare 0 ≤, đ?‘?đ?‘–,đ?‘— < 1. Per esempio se fosse đ?‘?đ?‘–,3 = 0 vuol dire che la strategia đ?‘ đ?‘–,3 ∉ đ?‘†đ?‘– Vale ovviamente la condizione ∑đ?‘˜đ?‘—=1, đ?‘?đ?‘–,đ?‘— = 1.

E’ utile fare una breve sintesi e qualche ampliamento sui giochi statici con informazione completa.


E’ infatti stato fatto osservare che la combinazione delle straregie ( đ?‘ 1∗ , đ?‘ 2∗ , ‌ . , đ?‘ đ?‘–∗ , ‌ . , đ?‘ đ?‘›âˆ— ) e’ un equilibrio di Nash se per ogni giocatore i la scelta đ?‘ đ?‘–∗ e’ la migliore risposta del giocatore i quando gli altri (n −1) giocatori hanno adottato la loro scelta. Tale asserzione e’ vera per ogni giocatore, ovvero per ogni i ≤ đ?‘›.

In termini sintetici e formali si e’ scritto che: đ?‘˘đ?‘– ( đ?‘ 1∗ , đ?‘ 2∗ , ‌ . , đ?‘ đ?‘–∗ , ‌ . , đ?‘ đ?‘›âˆ— ) ≼ đ?‘˘đ?‘– ( đ?‘ 1∗ , đ?‘ 2∗ , ‌ đ?‘ đ?‘– . , đ?‘ đ?‘›âˆ— ) Detta relazione e’ vera - assegnato i - quando si considerano la varie scelte a disposizione di i, e definite come elementi di đ?‘†đ?‘– . Ma detta relazione e’ vera al variare di i, ovvero per ognuno dei player del gioco G assegnato. E’ stato poi ricordato ⌋GibbonsâŚŒ che si sono giochi un cui un partecipante desidera “battere in anticipo l’avversarioâ€?.

In questi casi non e’ utilizzabile la nozione di equilibrio di Nash nella forma gia’ data.

L’ampliamento della teoria avviene introducendo una riflessione probabilistica basata sul concetto di strategia mista.


Ogni giocatore partecipante ad un dato gioco G ha una incertezza sulla scelta che sara’ adottata da ogni altro giocatore o da almeno un rivale.

La nozione di equilibrio di Nash che ne consegue e’ applicabile anche in ambito militare.

Quanto alla terminologia e’ utile ribadire che nei giochi statici con informazione completa vi e’ assoluta coincidenza tra la nozione di azione e di strategia a disposizione del giocatore i.

Credo utile, giunti a questo punto, ribadire alcuni aspetti con quale esemplificazione formale.

Sia dato un gioco G e due giocatori A e B.

Siano dati gli spazi delle azioni dei due giocatori. Essi sono: đ?‘†đ??´ = {đ?‘ đ??´1 , đ?‘ đ??´2 , đ?‘ đ??´3 } e đ?‘†đ??ľ = {đ?‘ đ??ľ1 , đ?‘ đ??ľ2 } Essi definiscono altrattante strategie pure per i due giocatori. Ad esempio đ?‘ đ??´1 , đ?‘ đ??´2 , đ?‘’ đ?‘ đ??´3 sono altrettante strategie pure a disposizione del giocatore A.


Le strategie pure a disposizione del player B sono đ?‘ đ??ľ1 đ?‘’ đ?‘ đ??ľ2 . Le strategia miste per i giocatori A e B sono definite formalmente con i vettori: đ?‘?đ??´ = ( p, q, 1 −(đ?‘? + đ?‘ž)) đ?‘?đ??ľ = ( p’, q’). sotto le condizioni: p + q +(1 −(đ?‘? + đ?‘ž)) = 1 p’ + q’ = 1

Le strategie pure di A e di B possono essere inquadrate anche portando ad uno la probabilita’ nei vettori delle strategie miste, quindi (0, o, 1), (o, 1, 0) e (1, 0, o) per il giocatore A e (1, 0) e (0 , 1) per il giocatore B.

Con queste premesse si puo’ ora introdurre una descrizione dell’equilibrio di Nash in strategie miste.

Il piu’ semplice modello possibile e’ costituito da un gioco G con due soli giocatori, nel quale va studiata la risposta del giocatore i alla strategia mista del giocatore j.

I giocatori sono etichettati come 1 e 2.


Il giocatore 1 ha a disposizione K strategie possibili date dall’insieme delle scelte, formalizzato come đ?‘†1 = {đ?‘ 1,1 , đ?‘ 1,2 , ‌ . , đ?‘ 1đ??ž }

Il giocatore 2 ha a disposizione J strategie possibili date dall’insieme delle scelte, formalizzato, in questo caso, come đ?‘†2 = {đ?‘ 2,1 , đ?‘ 2,2 , ‌ . , đ?‘ 2đ??˝ } . Non necessariamente e’ K = J. Il vettore (đ?‘?2,1 , đ?‘?2,2 , ‌ . , đ?‘?2,đ??ž ) eprime le credenze del giocatore 1 circa il comportamento del giocatore 2. Ad esempio đ?‘?2,5 definisce la misura della credenza che il giocatore 1 ha circa la possibilita’ che il giocatore 2 adotti la strategia đ?‘ 2đ??˝ ∈ đ?‘†2 . Va quindi definto il payoff del giocatore 1 quando questi adotti la strategia j ≤ đ??˝. đ?‘˘1 (đ?‘ đ?‘—≤đ??˝ ) = ∑đ??ž đ?‘˜=1 đ?‘?2,đ?‘˜ đ?‘˘1 (đ?‘ 1,đ?‘— , đ?‘ 2,đ?‘˜ ).

Si tratta di un valore atteso. In questa ipotesi il player 1 ha giocato la strategia pura đ?‘ đ?‘—≤đ??˝ .

Va ora considerato il payoff atteso del giocatore 1 quando questi giochi la strategia mista come definita dal seguente vettore đ?‘?1 = (đ?‘?11 , đ?‘?12 , ‌ . , đ?‘?1đ??˝ ).


Detto payoff assume la forma seguente nella quale e’ presente una doppia sommatoria. đ?‘Ł1 (đ?‘?1 , đ?‘?2 ) = ∑đ??˝đ?‘—=1 ∑đ??ž đ?‘˜=1 đ?‘?1,đ?‘— đ?‘?2,đ?‘˜ đ?‘˘1 (đ?‘ 1,đ?‘— , đ?‘ 2,đ?‘˜ )

Va notato che

đ?‘?1,đ?‘— đ?‘?2,đ?‘˜ e’ il prodotto della probabilita’ (eventi indipendenti) che il

giocatore 1 giochi la j-esima strategia a disposizione e e il giocatore 2 giochi la strategia k-esima tra quelle a sua disposizione. Detto valore atteso altro non e’ che la media ponderata di đ?‘˘1 (đ?‘ đ?‘—≤đ??˝ ) riferita al caso che il giocatore 1 giochi la strategia pura j ≤ đ??˝.

In altri termini si puo’ scrivere che: đ?‘Ł1 (đ?‘?1 , đ?‘?2 ) = ∑đ??˝đ?‘—=1 đ?‘?1,đ?‘— đ?‘˘1 (đ?‘ đ?‘— ) Se si ammette che il giocatore 2 adotta una strategia mista đ?‘?2 . Va assegnata la condizione per la quale đ?‘?1 sia la risposta ottima a đ?‘?2 . In altri termini deve essere verificata la relazione: đ??ž ∑đ??ž đ?‘˜ = đ?‘?2,đ?‘˜ đ?‘˘1 (đ?‘ 1,đ?‘— , đ?‘ 2,đ?‘˜ ) ≼ ∑đ?‘˜ = đ?‘?2,đ?‘˜ đ?‘˘1 (đ?‘ 1,đ?‘—′ , đ?‘ 2,đ?‘˜ )

Tale relazione deve risultare vera per ogni j’ = �.


Se anche đ?‘?1,đ?‘— ∈ (0 , 1) allora si afferma che đ?‘?1 = (đ?‘?11 , đ?‘?12 , ‌ . , đ?‘?1đ??˝ ) e’ una risposta ottima di 1 alla strategia mista di 2.

Una strategia đ?‘ 1,đ?‘— ottima e’ equivalente alla strategia mista definita dal vettore (0 , o, 0 , ‌., đ?‘?1,đ?‘— = 1, ‌ . . , 0). Per j = 3 il corrispondente vettore sarebbe (0, o, 1, 0, ‌, 0).

Ci si puo’ porre dal punto di vista di B.

A questo punto divengono rilevanti le credenze di 2 circa le decisioni di 1, quantificate da un opportuno vettore di probabilita’.

Si ammette che il giocatore 2 ipotizzi che il player 1 giochi le strategie possibili con le seguenti probabilita: đ?‘?1 = (đ?‘?11 , đ?‘?12 , ‌ . , đ?‘?1đ??˝ ) che verifica la condizione ∑đ??˝đ?‘—=1 đ?‘?1,đ?‘— = 1. Si ipotizza che il giocatore 2 adotti la strategia đ?‘?2 = (đ?‘?21 , đ?‘?22 , ‌ . , đ?‘?2đ??ž ) Il payoff corrispondente e’ il seguente: đ?‘Ł2 (đ?‘?1 , đ?‘?2 ) = ∑đ??˝đ?‘—=1 ∑đ??ž đ?‘˜=1 đ?‘?1,đ?‘— đ?‘?2,đ?‘˜ đ?‘˘1 (đ?‘ 1,đ?‘— , đ?‘ 2,đ?‘˜ )


Si perviene, quindi, alla nozione di equilibrio di Nash in strategie miste. Due strategie (đ?‘?1∗ , đ?‘?2∗ ) definiscono un equilibrio di Nash se sono verificate le seguenti condizioni: đ?‘Ł1 (đ?‘?1∗ , đ?‘?2∗) ≼ đ?‘Ł1 (đ?‘?1 , đ?‘?2∗ ) đ?‘Ł2 (đ?‘?1∗ , đ?‘?2∗) ≼ đ?‘Ł1 ( đ?‘?1∗ đ?‘?2 ) In queste relazioni đ?‘?1 e đ?‘?2 sono tutte le possibili assegnazioni di probabilita’ riferite alle strategie pure disponibili.

Questi esiti sono estensibili al caso di n giocatori. Tale risultato e’ dovuto a John F. Nash (1950).

2.2

I giochi dinamici con informazione completa

Va introdotto un altro aggettivo a qualificare l’informazione.

Essa deve essere perfetta.

Si intende dire che in ogni istante il giocatore che compie una certa mossa e’ a conoscenza della cosiddetta “storia del gioco� fino a quell momento, intesa come piena conoscenza delle singole mosse realizzate da tutti i giocatori fino a quell momento.


Nei giochi dinamici centrale e’ il ruolo giocato dalla credibilita’.

La minaccia deve essere credibile!

Si puo’ partire dal caso di giochi dinamici con informazione complete e perfetta.

Si puo’ utilmente considerare il caso di due giocatori, detti giocatore 1 e giocatore 2.

La sequenza degli eventi e’ la seguente: Al tempo t = 1 il giocatore 1 sceglie una azione, detta đ?‘Žđ?‘˜ , tra quelle possibili ovvero tra quelle di đ??´1, insieme delle scelte del giocatore 1. Al tempo t = 2 il giocatore 2 sceglie una azione, detta đ?‘?đ?‘— , tra quelle possibili ovvero tra quelle di đ??ľ2, insieme delle scelte del giocatore 2.

Ovviamente la scelta del giocatore 2 tiene conto della scelta del giocatore 1 adottata al tempo t = 1.

Va rilevato che i payoff dei due giocatori sono rispettivamente: đ?‘˘1 (đ?‘Žđ?‘˜ , đ?‘?đ?‘— ), đ?‘˘2 (đ?‘Žđ?‘˜ , đ?‘?đ?‘— ).

Ovviamente le decisioni di 2 sono dipendenti da quelle assunte da 1 al tempo immediatamente precedente.


Ricalcando il formalismo bayesiano si potrebbe dire che đ?‘?đ?‘— = đ?‘?đ?‘— |đ?‘Žđ?‘˜ da intendersi che la mossa di 2 tiene conto che 1 ha adottato, nel tempo immeditamente precedente, una data mossa. Alternativamente di potrebbe scrivere đ?‘?đ?‘— = đ?‘?đ?‘— (đ?‘Žđ?‘˜ ).

Si devono puntualizzare alcuni aspetti. Si ha una successione di mosse. Infatti đ?‘?đ?‘— = đ?‘?đ?‘— (đ?‘Žđ?‘˜ ) e’ una mossa di 2, quando questi ha preso atto della mossa di 1.

Tutte le mosse temporalmente precedenti sono note a tutti i giocatori.

I payoff dei giocatori sono una “conoscenza commune�.

La soluzione del problema presuppone l’applicazione del principio di induzione a ritroso.

In particolare il giocatore 2 sceglie una mossa che soddisfa una condizione di massimo, ovvero per la quale sia:

đ?‘˘2 ( đ?‘Žđ?‘˜ , đ?‘?đ?‘— ) = max đ?‘˘2 Dal punto di vista di 2 e’ vero quindi che, per data đ?‘Žđ?‘˜ , e’ vero che:


đ?‘˘2 ( đ?‘Žđ?‘˜ , đ?‘?đ?‘— ) ≼ đ?‘˘2 ( đ?‘Žđ?‘˜ , đ?‘?đ?‘Ľâ‰ đ?‘— ) ∀x.

Questo e’ vero per k dato ove k ∈ đ??ź1 ={1, 2, ‌ . , đ?‘›}, ove n indica il numero delle possibili mosse a disposizione di 1.

In altri termini qualunque sia la scelta del player 1 si ha che: ∀ đ?‘Žđ?‘˜ | đ?‘Žđ?‘˜ ∈ đ??´1 ∃! đ?‘?đ?‘— = đ?‘?đ?‘— (đ?‘Žđ?‘˜ ) | đ?‘˘2 ( đ?‘Žđ?‘˜ , đ?‘?đ?‘— ) ≼ đ?‘˘2 ( đ?‘Žđ?‘˜ , đ?‘?đ?‘Ľâ‰ đ?‘— ) ∀x | x ∈ đ??ź2 Si postula la unicita’ di đ?‘?đ?‘— = đ?‘?đ?‘— (đ?‘Žđ?‘˜ ) che massimizza il payoff del giocatore 2. La soluzione unica viene anche indicate come đ?‘…2 (đ?‘Žđ?‘˜ ) = đ?‘?đ?‘— (đ?‘Žđ?‘˜ ).

La lettera maiuscola R sta per reeazione. đ?‘…2 (đ?‘Žđ?‘˜ ) e’ detta risposta ottima. Le condizioni informative del gioco consentono di affermare che il giocatore 1 quando adotta la strategia đ?‘Žđ?‘˜ entra nella conoscenza della reazione massimizzante di 2.

Quindi 1 decidendo di adottare la mossa đ?‘Žđ?‘˜ sa (i payoff sono una conoscenza comune) che il giocatore 2 reagira’ con una data mossa massimizzante.


Ma questa riflessione e’ estensibile ad ogni possibile mossa di 1, cui corrisponde una sola (unica) mossa, detta reazione, di 2. Dal punto di vista del giocatore 1 ho deciso di formalizzare, riferendomi al tempo t = 1, la condizione per il giocatore 1 come: max đ?‘˘1 ( đ?‘Žđ?‘˜ , đ?‘…2 (đ?‘Žđ?‘– )) Un ulteriore esempio di gioco con informazione complete e imperfetta e’ il seguente.

Il gioco si articola su due stadi in succesisone. In ogni stadio di gioco sono ammesse mosse simultanee (contestuali o in un ∆t nel quale i giocatori non conoscono la mossa del rivale). Al tempo t = 0 i giocatori 1 e 2 scelgono simultaneamente le azioni đ?‘Ž1,đ?‘– đ?‘’ đ?‘Ž2,đ?‘— dei rispettivi insiemi delle scelte. Al tempo t = 1 i giocatori 3 e 4 scelgono simultaneamente le azioni đ?‘Ž3,đ?‘Ľ đ?‘’ đ?‘Ž4,đ?‘Ś dei rispettivi insiemi delle scelte.

Gli indici i, j, x ed y sono elementi degli insiemi đ??ź1 , đ??ź2 , đ??ź3 đ?‘’ đ??ź4 .


Detti insiemi sono in corrispodenza con gli insiemi đ?‘†1 , đ?‘†2 , đ?‘†3 đ?‘’ đ?‘†4 (insiemi delle scelte dei giocatori 1, 2, 3 e 4). Per ogni esito del primo turno, ovvero per ogni (đ?‘Žđ?‘– , đ?‘?đ?‘— ) , le scelte dei giocatori 3 e 4 conducono ad un unico equlibrio di Nash. L’equilibrio di Nash e’ posto nella forma (đ?‘Ž3∗ (đ?‘Žđ?‘– , đ?‘?đ?‘— )), đ?‘Ž4∗ (đ?‘Žđ?‘– , đ?‘?đ?‘— )).

Questo equilibrio di Nash e’ anticipato dai giocatori 1 e 2 (che operano le loro scelte simultaneamente).

I relativi payoff sono: đ?‘˘đ?‘˜ = (đ?‘Žđ?‘– , đ?‘?đ?‘— , đ?‘Ž3∗ (đ?‘Žđ?‘– , đ?‘?đ?‘— ), đ?‘Ž4∗ (đ?‘Žđ?‘– , đ?‘?đ?‘— )) ove k assume i valori 1 e 2. Per i giocatori 1 e 2 sia dato un unico equilibrio di Nash (đ?‘Žâˆ— , đ?‘? ∗ ). Il vettore (đ?‘Žâˆ— , đ?‘? ∗ , đ?‘Ž3∗ (đ?‘Žâˆ— , đ?‘? ∗ ), đ?‘Ž4∗ (đ?‘Žâˆ— , đ?‘? ∗ )). Il formalismo đ?‘Ž3∗ (đ?‘Žâˆ— , đ?‘? ∗ ) e’ intuitive in quanto đ?‘Ž3∗ indica la risposta ottima di 3 prevista da 1 e 2, quando, appunto 1 e 2 hanno realizzato una condizione di equilibrio di Nash.


L’equilibrio di Nash creato dai due player tiene conto della ipotesi che pure 3 e 4 siano attori razionali. Il vettore (đ?‘Žâˆ— , đ?‘? ∗ , đ?‘Ž3∗ (đ?‘Žâˆ— , đ?‘? ∗ ), đ?‘Ž4∗ (đ?‘Žâˆ— , đ?‘? ∗ )) e’ detto esito perfetto nei sottogiochi di un gioco a due stadi.

I giochi dinamici con informazione complete e imperfetta possono essere rappresentati in forma estesa.

Le condizioni formali per le quali sia assegnato un gioco in forma estesa sono le seguenti:

1) sono noti i giocatori; 2) e’ stabilito quando i giocatori hanno diritto alla mossa; 3) sono note le conoscenze possedute dal giocatore al momento della scelta; 4) sono note le ipotesi decisionali alternative disponibili; 5) sono noti i payoff corrispondenti alle varie combinazioni disponibili per i vari giocatori.

Per i giochi e’ possibile dare una rappresentazione grafica detta albero del gioco.


Nella impostazione dell’albero del gioco si hanno rappresentazioni come quella seguente.

I giocatori possono essere indicate con le cifre 1, 2, ‌ , N.

Limitiamoci al caso di tre soli giocatori 1, 2, e 3 che per nostra comodita’ hanno a disposizione solo due scelte a e b. Ad esempio đ?‘Ž1 indica la scelta a adottata dal player 1, mentre đ?‘?3 indica la scelta b adottata dal giocatore 3.

La struttura del gioco viene, in questo caso, formalizzata come segue.

I nodi decisionali si hanno in corrispondenza dei punti 1, 2 e 3.

Un insieme informative e’ costituito da nodi decisionali.


I tre sistemi informativi del gioco considerate sono individuati dalle linee orizzontali rosse. Vi sono 23 possibili alternative ad ognuna delle quali e’ associata, per ogni singolo giocatore, un corrispondente payoff. Per esempio per la combinazione di scelte (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ) si hanno i seguenti payoff: đ?‘˘1 (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ) đ?‘˘2 (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ) đ?‘˘3 (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ). I punti numerati, riferiti ai vari giocatori, sono detti, come gia’ detto, nodi decisionali.

Anche graficamente si comprende che al giocatore 1 spetta la prima mossa.

Si considera, infatti, dapprima il caso del gioco dinamico con informazione completa e imperfetta.

Il giocatore 1 ha solo due strategie disponibili corrispondenti alle mosse (azioni) possibili.

Per il giocatore 1 vi e’ coincidenza tra lo spazio delle strategie e lo spazio delle azioni, definto come đ?‘†1 = {đ?‘Ž1 , đ?‘?1}.


Per il giocatore 2 le possibili strategie sono: (đ?‘Ž1 , đ?‘Ž2 ), (đ?‘Ž1 , đ?‘?2 ), (đ?‘?1 , đ?‘Ž2 ), (đ?‘?1 , đ?‘?2 ), Esse sono 4 e lo spazio delle strategie del giocatore 2 e’: đ?‘†2 = {(đ?‘Ž1 , đ?‘Ž2 ), (đ?‘Ž1 , đ?‘?2), (đ?‘?1 , đ?‘Ž2 ), (đ?‘?1 , đ?‘?2 )}. In modo del tutto analogo si possono definire le strategie del player 3, definite dall’insieme đ?‘†3 = {(đ?‘Ž1 , đ?‘Ž2 , đ?‘Ž3 ), (đ?‘Ž1 , đ?‘Ž2 , đ?‘?3), (đ?‘Ž1 , đ?‘?2 , đ?‘Ž3 ), (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ), (đ?‘?1 , đ?‘Ž2, , đ?‘Ž3 ), (đ?‘?1 , đ?‘Ž2 , đ?‘?3 ), (đ?‘?1 , đ?‘?2 , đ?‘Ž3 ) (đ?‘?1 , đ?‘?2 , đ?‘?3 , ) }. La formalizzazione dei payoff tiene conto della sequenza delle azioni.

Uno dei possibili payoff del giocatore 1 potrebbe essere il seguente: đ?‘˘1 = (đ?‘Ž1 , (đ?‘Ž1 , đ?‘?2 ) , (đ?‘Ž1 , đ?‘?2 , đ?‘?3 ) ). Questo formalismo va inteso come il payoff del giocatore 1 quando la sequenza delle scelte dei giocatori e’ a, b, b, riferita ai giocatori 1, 2 e 3.

Questa notazione potrebbe essere compattata come segue: đ?‘˘1 = (đ?‘?3 | đ?‘?2 | đ?‘Ž1 ) .


In esso le sbarrette verticali | denotano la circostanza che il giocatore 3 adotta la mossa b dopo che ha preso atto che i giocatori 2 e 1 hanno adottato le scelte b ed a rispettivamente.

La scelta di 2 e’ adottata dopo che egli ha preso atto della mossa del giocatore 1.

Va rilevato che astrattamente gli alberi del gioco sono astrattamente utilizzabili per la decrizione dei giochi statici, nei quali le decisioni sono simultanee, nel senso dato alla simultaneita’ nella teoria dei giochi.

A questo punto e’ possibile considerare un tipo particolare di gioco dinamico con informazione completa e la sua descrizione con un albero del gioco pertinente. Nel primo stadio il giocatore A sceglie una delle due strategie a sua disposizione, đ?‘Ž1 e đ?‘Ž2 . Si ipotizzi che il giocatore A scelga la mossa đ?‘Ž1 . In questo caso il gioco termina e i payoff corrispodenti sono đ?‘˘1 (đ?‘Ž1 ) = đ?‘˜ e đ?‘˘2 (đ?‘Ž2 ) = â„Ž.


Se il giocatore A sceglie la mossa đ?‘Ž2 il giocatore B puo’ scegliere tra le azioni đ?‘?1 e đ?‘?2 . Se il giocatore B sceglie la strategia đ?‘?1 il gioco si conclude e si hanno le seguenti assegnazioni: đ?‘˘1 (đ?‘?1 |đ?‘Ž2 ) = đ?‘˘2 (đ?‘?1 |đ?‘Ž2 ) = đ?‘Ľ Ho utilizzato la notazione đ?‘˘2 (đ?‘?1 |đ?‘Ž2 ) per indicare il payoff del giocatore 2 che gioca la mossa đ?‘?1 data la mossa precedente đ?‘Ž2 del giocatore A. Il gioco non si interrompe se B adotta la mossa đ?‘?2 . In definitive, per le regole imposte, il gioco con si interrompe se la sequenza temporale degli eventi e’:

A adotta la scelta đ?‘Ž2 (al tempo t) e B risponde con la scelta đ?‘?2 al tempo (t +1). A questo punto il giocatore A, ricordando le mosse precedenti (sia le proprie che quelle del giocatore B) puo’ adottare ognuna delle mosse a sua disposizione con i seguenti payoff: đ?‘˘1 (đ?‘Ž1 |đ?‘?2 |đ?‘Ž2 ) = đ?‘Ž đ?‘˘2 (đ?‘Ž1 |đ?‘?2 |đ?‘Ž2 ) = đ?‘Žâ€˛


đ?‘˘1 (đ?‘Ž2 |đ?‘?2 |đ?‘Ž2 ) = đ?‘Žâ€˛â€˛ đ?‘˘2 (đ?‘Ž2 |đ?‘?2 |đ?‘Ž2 ) = đ?‘Žâ€˛â€˛â€˛â€˛. đ??żđ?‘’ sbarrette verticali | sono immediatamente interpretabili nel senso di “datoâ€?. Per esempio đ?‘˘1 (đ?‘Ž2 |đ?‘?2 |đ?‘Ž2 ) definisce il payoff del giocatore 1 quando le mosse a ritrosi sono state đ?‘Ž2 , đ?‘?2 đ?‘’ đ?‘Ž2 . A questo punto e’ forse utile dare una rappresentazione grafica del gioco nella sua articolazione in stadi.

Detta rappresentazione e’ comumemente detta albero del gioco.

Relativamente al gioco definito piu’ sopra la rappresentaizone e’ la seguente.


Ad ogni punto cerchiato in arancione corrispondono i due payoff per i due giocatori.

E’ ora il momento di considerare i giochi ripetuti.

Il comportamento corrente puo’ essere influenzato da minacce o da promesse riferibili al comportamento futuro ⌋GibbonsâŚŒ.

Si consideri, per esempio, il caso di un gioco definito dalla seguente bimatrice. đ?‘?1

đ?‘?2

đ?‘Ž1

a , a

x , y

đ?‘Ž2

y, x

c , c

In questo caso c > đ?‘Ž e la strategia (đ?‘Ž2 , đ?‘?2 ) e’ quella cooperativa. Sia (đ?‘Ž1 , đ?‘?1 ) l’unico equilibrio di Nash, ottenuto con la modalita’ nota. Il gioco al tempo đ?‘Ą2 e’ definita dalla seguente bimatrice. đ?‘?1

đ?‘?2

đ?‘Ž1

a+đ?‘Ž , a+đ?‘Ž

x+đ?‘Ž , y+đ?‘Ž

đ?‘Ž2

y+đ?‘Ž , x+đ?‘Ž

c+đ?‘Ž , c+đ?‘Ž


L’equilibrio di Nash e’ (đ?‘Ž1 , đ?‘?1 ). I payoff corrispondenti, come banalmente si evince dalla seconda bimatrice, sono la somma dei payoff.

Ad esempio il payoff finale del giocatore 1 viene formalizzato come segue: đ?‘˘1 ((đ?‘Ž1 , đ?‘?1 |đ?‘Ž1 , đ?‘?1 ) = 2đ?‘˘1 (đ?‘Ž1 , đ?‘?1 ). đ??ťđ?‘œ utilizzato la sbarretta verticale | per indicare che la scelta del periodo đ?‘Ą2 tiene conto della scelta assunta nel periodo đ?‘Ą1 .

Le due bimatrici definiscono due sottogiochi in un contest nel quale l’esito del secondo sottogioco e’ influenzato dall’esito del primo sottogioco.

Si osservi che non si perviene all’esito cooperative che nelle bimatrici proposte e’ dato dalla strategia (đ?‘Ž2 , đ?‘?2 ) .

Il gioco descritto dalle due sottomatrici ha solo due periodi e quindi tecnicamente si dice che ha due ripetizioni.


Si deve rilevare che i periodi possono essere piu’ di due e in generale si ammette siano T. Il singolo stadio del gioco viene formalizzato classicamente come G = { đ??´đ?‘–≤đ?‘› , đ?‘˘đ?‘–≤đ?‘› }. Esso e’ comunemente detto gioco costituente.

G(T) indica il gioco ripetuto T volte.

I vari giocatori conoscono gli esiti del periodi precedenti.

Con riferimento a casi come quello descritto della bimatrice precedente l’equilibrio di Nash e’ determinabile dati i payoff del T = 1, quando vi e’ un unico equilibrio di Nash.

Una prima complicazione nasce quando vi sono piu’ equilibri di Nash possibili in un gioco costituente.

Si complica leggermente il gioco definite dalla precedente bimatrice introducendo due nuove strategie đ?‘Ž3 , đ?‘?3 a disposizione del giocatore A e del giocatore B rispettivamente. đ?‘?1

đ?‘?2

đ?‘?3

đ?‘Ž1

a,a

x,y

r,s

đ?‘Ž2

y,x

c,c

r,s

đ?‘Ž3

r,s

r,s

k,k


Si pone s ≤ đ?‘&#x; < đ?‘˜ < đ?‘?.

Per opportuni valori dei payoff si ammette che questo gioco abbia due distinti equilibri di Nash, ovvero (đ?‘Ž1 , đ?‘?1 ) e (đ?‘Ž3 , đ?‘?3). Questo e’ un gioco costituente che viene iterato due volte nel quale i giocatori conoscono l’esito del primo periodo.

Una ipotesi ammissibile e’ che i giocatori ipotizzino che a esiti differenti nel periodo 1 (in quanto sono esistenti due distinti equilibri di Nash) corrispondano esiti diversi nel tempo 2. In sintesi, i giocatori possono dichiarare che l’esito del gioco e’ (đ?‘Ž2 , đ?‘?2 ) se l’esito del primo stadio e’ stato (đ?‘Ž2 , đ?‘?1 ) mentre (đ?‘Ž1 , đ?‘?1) sara’ l’esito del gioco se in T = 1 si ottennero le altre combinazioni di strategie possibili.

I payoff, anche in questo caso, si definiscono per somma.

Ci si riferisca la giocatore A. I payoff corrispondenti alle ipotesi possibili sono i seguenti: đ?‘˘đ??´ (đ?‘Ž2 , đ?‘?2 | đ?‘Ž2 , đ?‘?1 ) = đ?‘˘đ??´ (đ?‘Ž2 , đ?‘?2 ) + đ?‘˘đ??´ (đ?‘Ž2 , đ?‘?1 ) = đ?‘? + y


Per il giocatore B il payoff corrispondente e’: đ?‘˘đ??ľ (đ?‘Ž2 , đ?‘?2 | đ?‘Ž2 , đ?‘?1 ) = đ?‘˘đ??ľ (đ?‘Ž2 , đ?‘?2 ) + đ?‘˘đ??ľ (đ?‘Ž2 , đ?‘?1 ) = đ?‘? + x I payoff dei due giocatori vengono definiti come segue quando l’esito del gioco e’ la strategia (đ?‘Ž1 , đ?‘?1 ) essendo la combinazione delle strategie (đ?‘Žâ‰ 2 , đ?‘?≠1 ). Il formalismo definisce ogni combinazione di strategie tali che đ?‘Žđ?‘– ≠đ?‘Ž2 e đ?‘?đ?‘— ≠đ?‘?1 .

I payoff corrispondenti alle ipotesi possibili sono i seguenti: đ?‘˘đ??´ (đ?‘Ž1 , đ?‘?1| đ?‘Žâ‰ 2 , đ?‘?≠1 ) = đ?‘˘đ??´ (đ?‘Ž1 , đ?‘?1 ) + đ?‘˘đ??´ (đ?‘Žâ‰ 2 , đ?‘?≠1 ) = a + â‹Ż Per il giocatore B il payoff corrispondente e’: đ?‘˘đ??ľ (đ?‘Ž1 , đ?‘?1| đ?‘Žâ‰ 2 , đ?‘?≠1 ) = đ?‘˘đ??ľ (đ?‘Ž1 , đ?‘?1 ) + đ?‘˘đ??ľ (đ?‘Žâ‰ 2 , đ?‘?≠1) = a + â‹Ż A questo punto e’ possibile costruire la bimatrice tenendo conto delle relazioni algebriche suindicate. đ?‘?1

đ?‘?2

đ?‘?3

đ?‘Ž1

a+đ?‘Ž , a+đ?‘Ž

x+đ?‘Ž , y+đ?‘Ž

r+đ?‘Ž , s+đ?‘Ž

đ?‘Ž2

y+đ?‘Ž , x +đ?‘Ž

đ?‘? + y , c+ x

r+đ?‘Ž , s+đ?‘Ž

đ?‘Ž3

r+đ?‘Ž , s+đ?‘Ž

r+đ?‘Ž , s+đ?‘Ž

k+đ?‘Ž , k+đ?‘Ž


A questo punto il problema si riduce alla ricerca degli equilibri di Nash.

Possiamo ora considerare il caso dei giochi ripetuti indefinitamente.

Anche in questo caso si puo’ osservare che il comportamento degli attori e’ influenzato da minacce e promesse credibili, riferite a comportamenti futuri.

Si ritorni al caso del gioco descritto dalla bimatrice seguente.

đ?‘?1

đ?‘?2

đ?‘Ž1

a,a

x,y

đ?‘Ž2

y,x

c,c

Si ammette c > đ?‘Ž.

A prescindere dai valori dei payoff della matrice le successioni di essi sono in ogni caso costituite da valori infiniti.

Diviene rilevante la nozione economica di fattore di sconto.


Il fattore di sconto � e’ definito dalla seguente formula: 1

đ?›ż = 1+đ?‘&#x; đ?‘„uesta nozione deriva da quella di interesse e dalla formula che quantifica il valore di un capitale C investito al tempo t, indicato con đ??śđ?‘Ą , al tasso di interesse r. Il capitale al tempo (t +1) , ovvero đ??śđ?‘Ą+1 , e’ dato dalla formula seguente: đ??śđ?‘Ą+1 = đ??śđ?‘Ą + đ??śđ?‘Ą đ?‘&#x; = đ??śđ?‘Ą ( 1 + đ?‘&#x;) . Da questa formula si ottiene: đ??ś

đ??śđ?‘Ą =1đ?‘Ą+1 +đ?‘&#x; Posto đ??śđ?‘Ą+1 = 1 la grandezza đ??śđ?‘Ą < 1 indica la quantita’ che bisogna investire al tempo t al tasso r per avere al tempo ( t +1) un capitale unitario. 1

La quantita’ đ?›ż = 1 +đ?‘&#x; e’, come gia’ detto, fattore di sconto.

Con riferimento a questi giochi va quindi attualizzato il valore dei payoff futuri. I payoff dei vari periodi vengono indicati con il simbolo đ?œ‹đ?‘Ą e i loro valori attuali, ovvero i loro valori riferiti al tempo t = 1, sono del tipo đ?›ż đ?‘Ąâˆ’1 đ?œ‹đ?‘Ą .


đ?‘Ąâˆ’1 Il valore attuale dei payoff futuri e’ ∑∞ đ?œ‹đ?‘Ą . đ?‘Ą=1 đ?›ż

Si definisce quindi la probabilita’ che un gioco possa finire dopo un dato numero di ripetizioni con probabilita’ 0 < p < 1 mentre ( 1 −đ?‘?) indica la probabilita’ che il gioco arrivato alla ripetizione x prosegua fino almeno alla ripetizione successiva, x +1.

Il payoff ricevibile al tempo (i +1) vale đ?œ‹đ?‘–

1−đ?‘? 1+đ?‘&#x;

.

I payoff attualizzati e riferiti a periodi successivi sono contemplate dalla seguente sommatoria:

∑∞ đ?‘Ą=1 đ?œ‹đ?‘Ą (

1−đ?‘? đ?‘Ąâˆ’1 ) 1+đ?‘&#x;

Il fattore di sconto che tiene conto anche del rischio che il gioco si interrompa dopo un certo numero di ripetizioni e’:

đ?›żđ?‘&#x;,đ?‘? =

1−đ?‘? 1+đ?‘&#x;

In questa particolare casistica viene utilizzata la cosiddetta trigger strategy.

Riferito al caso di due giocatori 1 e 2 si ammette infatti che il giocatore 1 cooperi fino a che il giocatore 2 non devii dalla strategia cooperativa.


Da questo momento le scelte dei giocatori non sono piu’ riconducibili alla combinazione delle strategie cooperative.

Fino a che da parte di 2 non vi sia deviazione dalla strategia cooperative in ogni gioco costituente verra’ giocata la combinazione cooperative che nel modello ipotizzato, come certo si ricordera’, era la combinazione (đ?‘Ž2 , đ?‘?2 ) . Se 1 adotta la trigger strategy si dimostra che per đ?›ż ≈ 1 la trigger strategy e’ la scelta ottima anche per 2. Il gioco ripetuto infinitamente volte e’ formalizzato come G (∞, đ?›ż).

Gli esiti precedenti sono noti a tutti i players. I relativi payoff sono costituiti dai valori attuali dei payoff dei vari periodi.

A qusto punto viene definita la nozione di strategia nei giochi dinamici.

Un primo approccio puo’ essere fatto riferendosi al gioco nei due stadi della precedente bimatrice considerata.


La strategia di A e’ costituita dall’azione del primo stadio e dale azioni possiibli del secondo, solitamente condizionate dalla combinazione delle azioni adottate dai giocatori nel primo stadio.

Quindi, la strategia contiene, in primis, l’azione del primo stadio che ho formalizzato come đ?‘Žđ??´,1,đ?‘˜ .

Ho introdotto tre pedici, il primo riferito al giocatore, il secondo allo stadio e il terzo riferito alla k-esima azione.

Vanno poi inserite le azioni possibili del secondo stadio. Va tenuto conto che le mosse di A nel secondo stadio sono dipendenti dall’esito (in termini di combinazioni di azioni del primo stadio).

Ho quindi deciso di dare una formalizzazione della strategia come segue: ( đ?‘Žđ??´,1,đ?‘˜0 , đ?‘Žđ??´,2,đ?‘˜ |( đ?‘Žđ??´,1,đ?‘˜ , đ?‘?đ??ľ,1,đ?‘— )

Si osservi incidentalmente che puo’ essere , đ?‘Žđ??´,2,đ?‘˜0 anche per distinti , đ?‘?đ??ľ,1,đ?‘— .


Una modalita’ usuale ⌋GibbonsâŚŒ per definire la storia del gioco G(∞, đ?›ż) fino allo stadio t e’ la seguente: (đ?‘Ž11 ‌ ‌ . đ?‘Žđ?‘›1 ). Il primo indice riguarda l’azione e il secondo lo stadio. A volte l’azione viene indicata come đ?‘Žđ?‘–đ?‘ ove il primo indice riguarda il giocatore i e il secondo indice s riguarda lo stadio. A questo punto puo’ essere definite la nozione di strategia riferita ad un gioco G(∞, đ?›ż) intesa come specificazione dell’azione “che il giocatore adottera’ in ogni stadio per ogni possibile storia del gioco fino allo stadio precedenteâ€? ⌋GibbonsâŚŒ.

In questo particolare contesto diviene relativamente agevole formulare la nozione di sottogioco.


Per sottogioco si intende la porzione di gioco che rimane da giocare riferita ad un istante iniziale rispetto al quale tutti i giocatori conoscono la storia del gioco fino a quell momento.

Con riferimento particolare della bimatrice riferita al precedente gioco a due stadi si hanno quattro possibili sottogiochi.

Ogni possibile sottogioco attiene ai possibili esiti del primo step.

I possibili esiti del primo stadio sono: (đ?‘Ž1 , đ?‘?1 ) = đ??´1 , (đ?‘Ž1 , đ?‘?2 ) = đ??ľ1, (đ?‘Ž2 , đ?‘?1 ) = đ??ś1 , (đ?‘Ž1 , đ?‘?2 ) = đ??ˇ1 . Si tenga conto che il deponente 1 indica che si e’ nello stadio 1.

Il numero dei possibili sottogiochi e’ dipendente dale decisioni che vengono assunte nel tempo 2.

Ho deciso di formalizzarli come segue: g(G) = { (đ?‘Žđ?‘–2 , đ?‘?đ?‘—2 ) | (đ?‘Žđ?‘–1 , đ?‘?đ?‘—1 )}

Le lettere afferiscono ai giocatori A e B, il primo deponente attiene alla azione e il secondo deponente allo stadio t = 1, 2, ‌ .


Se ∀(đ?‘Žđ?‘–1 , đ?‘?đ?‘—1 ) e quindi al variare di i e di j ∃! (đ?‘Žđ?‘–2 , đ?‘?đ?‘—2 ) allora i sottogiochi saranno solo 4.

Il massimo numero possibile di sottogiochi, che nel caso di specie e’ 16, e’ formalizzabile come segue.

Se a distinti esiti del primo step corrispondono distinti esiti del secondo step il numero dei possiibili sottogiochi in questo esempio particolare vale 12. Se l’esito del primo step e’ đ??´1 allora il numero dei possibili sottogiochi e’ 4, essendo essi đ??´2 |đ??´1 , đ??ľ2 |đ??´1, đ??ś2 |đ??´1 , đ??ˇ2 |đ??´1 (come nel caso del dilemma dei prigionieri ripetuto due volte).

Poiche’ i players conoscono la storia del gioco dale ipotesi astratte occorre scendere alla concretezza e introducendo un terzo stadio si avrebbe questa situazione quando la storia del gioco si fosse arricchita dell’esito del secondo stadio, ora noto ad entrambi i giocatori.


Nella porzione deliminata dalla curva chiusa color senape sono definiti i sottogiochi che si avviano nel periodo 3.

A questo punto va formulata la seguente nozione di sottogioco Un sottogioco puo’ iniziare al tempo (t +1) e viene giocato (T − đ?‘Ą ) volte. Va citata la definizione di sottogioco ⌋GibbonsâŚŒ inteso come “la parte che rimane da giocare cominciando da un punto qualsiasi in corrispondenza del quale la storia completa del gioco fino aquel momento e’ conoscenza commune dei giocatoriâ€?.

Con riferimento al caso della introduzione di un terzo periodo nel gioco precedente i sottogiochi sono forrmalizzabili come segue: đ??´3 |đ??ś2 |đ??´1 , đ??ľ3 |đ??ś2 |đ??´1 , đ??ś3 |đ??ś2 |đ??´1, đ??ˇ3 |đ??ś2 |đ??´1 .


Si osservi che questo formalismo riconduce a quello di storia del gioco e le varie lettere maiuscole con il relativo indice temporale ben sono estensibili al caso di un numero qualunque di players.

Per questa via si perviene alla nozione di equilibrio di Nash perfetto nei sottogiochi.

Se si ammette che il gioco considerato si esaurisca nello stadio 3 allora i sottogiochi rilevanti sono quelli definiti dalla storia đ??´1 e đ??ś2 |đ??´1 . Se risulta che (đ?‘Ž1 , đ?‘?1 ) = đ??´1 e’ un equilibrio di Nash e se risulta che đ??ś2 |đ??´1 e’ un equilibrio di Nash allora si ha un equilibrio di Nash perfetto nei sottogiochi.

In definitiva si ha un equilibrio di Nash perfetto nei sottogiochi quando si ha un equilibrio di Nash in ogni sottogioco del gioco dato.

Per i giochi G(∞ , đ?›ż) si utilizza un teorema detto di Friedman.


Ci si soffermi sempre sul gioco a doppia matrice introdotto nella prima parte del paragrafo e costitutito dalla strategie pure (a , a), (c, c) e (0, y) , (x, 0).

Si utilizza ampiamente una rapprsentazione cartesiana ponendo sui due assi i payoff dei due giocatori A e B.

I payoff ammissiibli sono tutti e soli quelli definiti come combinazioni convesse di strategie pure.

La rappresentazione grafica e’ la seguente.

A questo punto occorre dare la nozione di payoff medio della sequenza infinita di đ?œ‹đ?‘Ąâ‰¤âˆž . Il payoff medio della sequenza infinita e’: đ?‘Ąâˆ’1 ( 1 −đ?›ż ) ∑∞ đ?œ‹đ?‘Ą đ?‘Ą=1 đ?›ż


La formulazione del teorema di Friedman e’ sostanzialmente la seguente.

Dato un gioco G finito, statico, e con informazione completa.

Sia (đ?‘’đ?‘–≤đ?‘› ) il vettore dei payoff corrispondenti ad un equilibrio di Nash. Sia (đ?‘Ľđ?‘–≤đ?‘› ) ogni altro vettore per il quale sia đ?‘’đ?‘–≤đ?‘› < đ?‘Ľđ?‘–≤đ?‘› per ogni giocatore e sia đ?›ż ≈ 1. Verificate queste condizioni esiste un equilibrio di Nash nei sottogiochi del gioco G = (∞, đ?›ż) per il quale il payoff (đ?‘Ľđ?‘–≤đ?‘› ) e’ il payoff medio.

Va rimarcata l’importanza della nozione di sistema informativo. Si ammette ⌋ Gibbons âŚŒ che i nodi decisionali costituiscono un sistema informativo se in corrispodenza di ogni nodo il giocatore che ha diritto alla mossa non sa quele nodo e’ stato raggiunto (o non raggiunto).


Dato il seguente albero

Quando B nuove sa solo che A ha mosso ma non sa se A ha scelto đ?‘Ž1 đ?‘œ đ?‘Ž 2 . B puo’ solo congetturare o avere delle credenze circa quale mossa sara’ stata decisa da A.

Esempio di gioco dinamico con tre giocatori 1, 2 e 3.

Gli insiemi delle scelte di essi sono: đ??´1 = ⌋đ?‘Ž1 , ‌ . , đ?‘Žđ?‘– , ‌ . . , đ?‘Žđ?‘› âŚŒ đ??´2 = ⌋đ?‘?1 , ‌ . , đ?‘Žđ?‘˜ , ‌ . . , đ?‘Žđ?‘&#x; âŚŒ đ??´3 = ⌋đ?‘?1 , ‌ . , đ?‘?đ?‘— , ‌ . . , đ?‘Žđ?‘ âŚŒ

Per semplicita’ si puo’ ipotizzare che i tre giocatori abbiano a disposizione tre sole strategie quandi sia n = r = s = 3.


La regola di questo gioco e’ la seguente:

Il giocatore 3 muove solo dopo che si e’ verificata una particolare condizione. Sia questa condizione quella costituita dalla mossa đ?‘Ž2 per il giocatore 1 e dalla mossa đ?‘?1 per il giocatore 2. Verificata questa condizione il giocatore 3 adotta la strategia đ?‘?∗ che massimizza il payoff.

Si puo’ scrivere che đ?‘˘3 ( đ?‘Ž2 , đ?‘?1 đ?‘?∗ (đ?‘Ž2 , đ?‘?1 ) ) ≼ đ?‘˘3 ( đ?‘Ž2 , đ?‘?1 đ?‘?đ?‘— (đ?‘Ž2 , đ?‘?1 ) ) ∀đ?‘—.

Il seguente albero descrive il gioco e evidenzia, cerchiati in verde, i nodi corrispondenti alla condizione di informazione perfetta, intesa come piena conoscenza della storia del gioco fino a quell momento (cioe’ conoscenza del giocatore che muove delle scelte operate dagl ialtri player fino a quell momento).


Si puo’ ora introdurre la nozione di sottogioco, riferita ad un gioco.

Si parla quindi di sottogioco nel contesto di un gioco definito.

Il sottogioco ha avvio da un nodo decisionale insieme informativo distinto da quello di avvio del gioco.

Il sottogioco comprende tutti i nodi decisionali successivi, ivi compresi quelli terminali.

Il sottogioco non spezza acun sistema informativo.

Oltre alla definizione formale si sottogioco di un gioco si hanno le seguenti condizioni.

Solo il giocatore N al nodo n conosce la storia del gioco, cioe’ solo esso e’ a conoscenza delle scelte adottate fino a quel momento da parte degli N −1 giocatori che hanno gia’ mosso.

Se n’ e’ riferito ad un insieme informativo costituito da piu’ nodi allora ogni nodo di n’ e’ successivo ad n.


Viene solitamente data una definizione di equilibrio di Nash di un sottogioco.

Si tratta del cosiddetto teorema di Salten.

L’enunciato e’ il seguente:

Un equilibrio di Nash e’ perfetto nei sottogiochi se le strategie dei giocatori costituiscono un equilibrio di Nash in ogni sottogioco.

Prima di procedere e’ forse utile ricordare il significato di alcune nozioni.

Per strategia si intende un piano d’azione, non necessariamente e non tanto identificato con una singola mossa.

Un insieme di strategie conduce ad un equilibrio.

Per esito si intende cio’ che ci si aspetta si verifichi in relazione alle varie alternative.

Il gioco a due stadi studiato con il metodo della induzione retrograda chiarifica ampiamente la distinzione tra azione (mossa) e strategia.


La reazione (del giocatore 2 alla mossa del giocatore 1) che avevamo formalizzato come đ?‘…2 (đ?‘Žđ?‘–∗ ) e’ una scelta ma non e’ intendibile come una strategia. La strategia potrebbe essere ben formalizzata da un insieme nel quale si evidenzia che le mosse possibili del giocatore 2 sono dipendenti dalle scelte operate dal player 1. Si potrebbe scrivere {đ?‘?đ?‘— = đ?‘?đ?‘— (đ?‘Žđ?‘– ) ∀đ?‘– | đ?‘– ∈ đ??ź1 }

Esso e’ dunque intendibile come l’insieme delle possibili scelte di 2 al variare delle scelte di 1.

In questo caso il sottogioco e’ identificabile come la mossa di 2.

In generale vi sono k sottogiochi ove k sono le possibili scelte di 1. L’equilibrio di Nash nel sottogioco e’ (đ?‘Žâˆ— , đ?‘…2 (đ?‘Žđ?‘– )

Il termine sottogioco e’ sinonimo di problema decisionale riferito ad un singolo giocatore.

La risposta di 2, ovviamente, deve essere ottima in ognuno dei possibili sottogiochi.


Ho fatto qualche ricamo in un gioco proposto nella migliore manualistica ⌋ Gibbons âŚŒ con il caso di un giocatore 1 che ha tre possibili scelte e il giocatore 2 che ha una reazione limitata a due sole scelte.

La reazione di 2 deve essere che il payoff sia un massimo, ovvero si verifichi la condizione: max �2 (�� �2 (�� )). La reazione deve essere un massimo in ognuno dei sottogiochi.

Gli insiemi delle scelte di 1 e 2 sono rispettivamente đ??´1 =⌋đ?‘Ž1 , đ?‘Ž2 , đ?‘Ž3 âŚŒ e đ??´2 =⌋đ?‘?1 , đ?‘?2 âŚŒ .

Si ha questo albero.

In termini formali la regola del gioco proposto impone che la scelta di 2 sia đ?‘?∗ tale che sia vero che đ?‘˘2 (đ?‘Žđ?‘– đ?‘?∗,đ?‘— ) ≼ đ?‘˘2 (đ?‘Žđ?‘– đ?‘? đ?‘— )


Sara’ bene chiarificare con un esempio concreto. Se il giocatore 1 ha scelto đ?‘Ž1 allora il giocatore 2 scegliera’ đ?‘?1 oppure đ?‘?2 a seconda che sia đ?‘˘2 (đ?‘Ž1 đ?‘?1 ) ≼ đ?‘˘2 (đ?‘Ž1 đ?‘?2 ) oppure đ?‘˘2 (đ?‘Ž1 đ?‘?1 ) ≤ đ?‘˘2 (đ?‘Ž1 đ?‘?2 ). Queste osservazioni sono estensibili al variare della strategia di 1.

Si afferma infatti che l’azione di 2, meglio la sua reazione, deve essere ottima in ogni sottogioco.

2.3

I giochi statici con informazione incompleta

I giochi statici con informazione incompleta sono comunemente detti anche giochi bayesiani.

In questo tipo di giochi almeno un player (quindi uno o piu’ di un giocatore‌) e’ incerto sui payoff degli altri giocatori.

L’aggettivo “staticoâ€? riferito ad essi attiene, come ben noto, alla circostanza che le mosses ono adottate simultaneamente (o comunque con un decalage temporale ma senza che esse siano note agli altri giocatori, almeno per un certo ∆đ?‘Ą).

Si avra’ modo di vedere che i payoff dei vari giocatori contengono una variabile addizionale detta tipo del giocatore.


Gli elementi đ?‘Ąđ?‘– sono elementi di un insieme detto spazio dei tipi. La đ?‘Ąđ?‘– va intesa come una variaible indipendente dale strategie degli altri n −1 giocatori. A distinti đ?‘Ąđ?‘– corrispondono payoff distinti. In definitiva se al giocatore i-esimo fossero associate due distinti tipi, detti rispettivamente đ?‘Ąđ?‘– đ?‘’ đ?‘Ąđ?‘— allora si avrebbero i seguenti distinti payoff per il giocatore iesimo.

đ?‘˘đ?‘– (|đ?‘Ąđ?‘– ) = (đ?‘Žđ?‘– , đ?‘?đ?‘— , đ?‘?đ?‘˜ | đ?‘Ąđ?‘– ) đ?‘˘đ?‘– (|đ?‘Ąđ?‘— ) = (đ?‘Žđ?‘– , đ?‘?đ?‘— , đ?‘?đ?‘˜ | đ?‘Ąđ?‘— ) risultando đ?‘˘đ?‘– (|đ?‘Ąđ?‘– ) ≠đ?‘˘đ?‘– (|đ?‘Ąđ?‘— ) . Per esempio se i tre giocatori 1, 2 e 3 fanno le mosse đ?‘Ž3 , đ?‘?2 , đ?‘?1 allora si avrebbero i seguenti payoff per il giocaore 1 come segue: đ?‘˘đ?‘– (|đ?‘Ąđ?‘– ) = (đ?‘Ž3 , đ?‘?2 , đ?‘?1 | đ?‘Ąđ?‘– ) đ?‘˘đ?‘– (|đ?‘Ąđ?‘— ) = (đ?‘Ž3 , đ?‘?2 , đ?‘?1 | đ?‘Ąđ?‘— ) risultando đ?‘˘đ?‘– (|đ?‘Ąđ?‘– ) ≠đ?‘˘đ?‘– (|đ?‘Ąđ?‘— ) . E’ possibile ⌋GibbonsâŚŒ che uno stesso giocatore abbia piu’ tipi.


Essi sono elementi di un insieme detto insieme dei tipi indicato come �� . Se il giocatore 1 e’ compatibile con due tipi allora si puo’ scrivere che �� = {��,1 , ��,2} .

Gli elementi di esso sono muniti di due indici. Il primo indice denota il player mente il secondo afferisce specificatamente al tipo.

Dalla introduzione dei tipi si perviene alla probabilita’. Si puo’ ad esempio ammettere che per il giocatore 1 sia {đ?‘Ž1 , đ?‘Ž2 , đ?‘Ž3 } l’insieme delle azioni ammissibili cui sia associata la probabilita’ 0 < q < 1 e sia {đ?‘Ž1 , đ?‘Ž2} cui corrisponde la probabilita’ (1 −đ?‘ž). Detto in altri termini i tipi đ?‘Ąđ?‘–,1 , đ?‘Ąđ?‘–,2 sono compatibili con il giocatore 1 con probabilita’ q e (1 −đ?‘ž).

La conoscenza dei payoff da parte del giocatore 1 equivale alla consocenza del tipo.

Anche per questo tipo di giochi viene data una rappresentazione in forma normale.


Nel caso piu’ generale si ha un gioco con n distinti giocatori ad ognuno dei quali corrisponde un insieme di azioni ammissibili, indicato con đ??´đ?‘–≤đ?‘› ed uno spazio dei tipi đ?‘‡đ?‘–≤đ?‘› . Per ogni giocatore i ≤ n e’ introdotto un sistema di credenze đ?‘?đ?‘– relativo ai tipi degli altri giocatori.

Si ammette che il tipo del giocatore sia noto al solo giocatore e non sia una informazione comune. Il giocatore i-esimo non conosce quindi i �≠� . Con questo formalismo ci si intende riferire ai tipi dei giocatori distinti da i.

Ora e’ quindi possibile scrivere la funzione dei payoff per il giocatore i.

Essa viene scritta nel modo seguente: đ?‘˘đ?‘– = (đ?‘Žđ?‘¤ , đ?‘?đ?‘— , đ?‘?đ?‘˜ |đ?‘Ąđ?‘– )

Piuttosto che seguire la manualistica ho preferito limitare la spiegazione al caso di tre soli giocatori, 1, 2 e 3.


Il deponente w riferito alle azioni di 1 e’ stato introdotto per distinguere un indice quale i, riferito ai giocatori, dall’indice riferito alle possibili azioni di 1, che sono cardđ??´1 . In ogni caso il formalismo e quanto sotteso da esso sono facilmente estensibili al caso generale di n players. La scrittura đ?‘?đ?‘– (đ?‘Ąâ‰ đ?‘– |đ?‘Ąđ?‘– ) denota, con riferimento al player i, la incercezza o credenza circa l’essere di un dato tipo dei vari altri giocatori. La sbarretta verticale va intesa nel senso di “dato il tipo đ?‘Ąđ?‘– del giocatore i. Il gioco viene formalizzato come segue: G = {đ??´đ?‘–≤đ?‘› , đ?‘‡đ?‘–≤đ?‘› , đ?‘?đ?‘–≤đ?‘› , đ?‘˘đ?‘–≤đ?‘› } Sono ampiamente riportati ⌋GibbonsâŚŒ i contenuti delle ricerche e dei contributi di Harsanyi per il quale la natura estrae a sorte il vettore dei tipi da un insieme di possibili tipi đ?‘‡đ?‘– che rivela solo al giocatore i-esimo e a nessun altro giocatore, nel senso che gli altri giocatori non hanno informazioni sul tipo del giocatore i-esimo.

Le azioni dei giocatori sono adottate simultaneamente e i giocatori conoscono i loro payoff.


L’informazione e’ imperfetta in quanto il giocatore cui spetta la mossa non conosce la storia completa del gioco fino a quell momento.

In caso di gioco a piu’ stadi il giocatore che nuove in stadi successive non conosce la storia del gioco.

Il giocatore che nuove allo stadio 3 quando si e’ nello stadio 2 non ha una funzione di payoff in quanto non conosce il proprio tipo đ?‘Ąđ?‘˜ . Non mancano comunque giochi in cui un giocatore i ha conoscenza dei payoff di un altro giocatore k ≠đ?‘–.

Nel caso di specie la funzione di payoff di i sarebbe: đ?‘˘đ?‘– = (đ?‘Ž1đ?‘— , đ?‘Ž2đ?‘š , ‌ . ., đ?‘Žđ?‘›đ?‘ , ‌ ‌ , đ?‘Ą1 , đ?‘Ą2 , ‌ . đ?‘Ąđ?‘› )

Per le azioni degli n giocatori sono stati utilizzati due indici. Il primo deponente indica il numero d’ordine dei giocatori, mentre il secondo definisce una delle possibili azioni del dato giocatore. Pertanto, ad esempio, đ?‘Ž13 indica l’azione 3 del giocatore 1. In generale đ?‘Ž1đ?‘— indica la j-esima azione del giocatore 1, ove j ∈ đ??ź1 ={1, 2, ‌, đ?‘›1 } quando il giocatore 1 ha a disposizione đ?‘›1 mosse.


Per esempio đ?‘Ž2đ?‘š indica una delle possibili azioni del giocatore 2. Il valore m e’ un elemento di đ??ź2 ={1, 2, ‌, đ?‘›2 }. Non necessariamente e’ đ?‘›1 = đ?‘›2 . I vari valori đ?‘Ąđ?‘– definiscono i vari tipi dei giocatori. A questo punto entrano in gioco le logiche bayesiane.

E’ ben nota la relazione di Bayes per la quale si da un senso alla scrittura P(A|B).

Essa ha un significato semplice. Infatti, essa definisce la probabilita’ che si verifichi un evento A quando sis a che si e’ gia’ verificato un evento B.

I due eventi non possono essere incompatibili.

L’incompatibilita’ di eventi deve essere intesa nel senso che il verificarsi di A (o di B) preclude il verificarsi di B (o di A).

La relazione fondamntale e’ la seguente: đ?‘ƒ(đ??´âˆŠđ??ľ)

P(A|B) =

đ?‘ƒ(đ??ľ)

Nel caso di eventi incompatibili risulta essere đ?‘ƒ(đ??´ ∊ đ??ľ) = 0 in quanto đ??´ ∊ đ??ľ = ∅. Da cio’ si ricava che P(∅) = 0 (e’ uno degli assiomi di probabilita’ di Kolmogorov).


In generale la formula contiene numeratore e denominatore diversi da zero. L’evento B deve essere possibile e assegnato con probabilita’ 0 <P(B)< 1.

E’ assegnata una probabilita’ a priori p(t) e si ammette, come gia’ anticipato, che i tipi dei giocatori siano assegnati casualmente. Il giocatore i, nella peggiore delle ipotesi, conosce �� , ovvero il proprio tipo. Queste argomentazioni consentono di dare una spiegazione ad una nota relazione, cioe’:

đ?‘?đ?‘– (đ?‘Ąâ‰ đ?‘– |đ?‘Ąđ?‘– ) =

đ?‘?(đ?‘Ąâ‰ đ?‘– ,đ?‘Ąđ?‘– ) đ?‘?(đ?‘Ąđ?‘– )

In genere i tipi dei giocatori non sono indipendenti.

Nei termini piu’ generali due eventi A e B sono indipendenti se la probabilita’ del verificarsi (o del non verificarsi) di uno di essi non dipende dal verificarsi (o dal non verificarsi) di un altro. Nella statistica bayesiana due eventi A e B sono indipendenti quando P(A|B) = P(A) e P(B|A) =P(B).


In particolare dire che i tipi dei giocatori sono indipendenti sarebbe equivalso a scrivere che đ?‘?đ?‘– (đ?‘Ąâ‰ đ?‘– |đ?‘Ąđ?‘– ) =đ?‘?đ?‘– (đ?‘Ąâ‰ đ?‘– ). Nella accezione basica questi modelli consentono di affermare che quando il giocatore i conosce il suo tipo, indicato come đ?‘Ąđ?‘– , egli (cioe’ il giocatore i) e’ in grado di calcolare la probabilita’ che gli altri player abbiano un dato tipo, che, nel formalismo di questa impostazione, e’ indicato come đ?‘Ąâ‰ đ?‘– . La probabilita’ che il giocatore i assegna ai tipi degli altri giocatori e’ đ?‘?đ?‘– (đ?‘Ąâ‰ đ?‘– |đ?‘Ąđ?‘– ). Dette probabilita’ sono sostanzalmente delle credenze. Esse sono una misura della credenza che si e’ fatta il giocatore i in ordine al tipo đ?‘Ąđ?‘˜ del giocatore k ≠i. Il formalismo p(đ?‘Ąđ?‘— , đ?‘Ąđ?‘– ) indica invece la probabilita’ dell’evento “il tipo di j ≠i e’ đ?‘Ąđ?‘— " ∊ “il tipo di i e’ đ?‘Ąđ?‘– ".

Si e’ rimarcato il fatto che in generale i tipi dei giocatori non sono indipendenti.

Quando i tipi dei giocatori sono indipendenti le credenze di i non dipendono dal tipo che la natura ha assegnato al giocatore i.


Il denominatore della frazione definisce, come gia’ osservato, la probabilita’ che il giocatore i abbia un dato tipo, ovvero đ?‘Ąđ?‘– . Si puo’ scrivere che: p(đ?‘Ąđ?‘– ) = ∑đ?‘—≠đ?‘– đ?‘?(đ?‘Ąđ?‘— , đ?‘Ąđ?‘– )

Si osservi che nella ipotesi di indipedenza dei tipi si avrebbe: đ?‘?đ?‘– (đ?‘Ąđ?‘—≠đ?‘– |đ?‘Ąđ?‘– ) = đ?‘?đ?‘– (đ?‘Ąđ?‘—≠đ?‘– )

2.4

I giochi dinamici con informazione incompleta

A questo punto viene definito un equilibrio detto bayesiano perfetto.

Si tratta di una modalita’ alternativa all’equilibrio di Nash nei sottogiochi.

Esso presuppone alcuni requisiti.

Il primo di essi e’ che il giocatore che deve muovere deve avere una credenza sul nodo dell’insieme informative su cui si e’ .

Se vi sono piu’ nodi allora deve intendersi una funzione di distribuzione di probabilita’ ovvero deve essere data la probabilita’ per ogni singolo nodo. Se i nodi sono due si avranno le probabilita’ p e (1 − đ?‘?).


Il successive requisito riguarda le strategie dei giocatori che devono essere “sequenzialmente razionali” ⦋Gibbons⦌. In ogni sistema informativo la scelta e la strategia successive devono essere ottime, data la credenza del giocatore in quell dato sistema informativo (quindi con riferimento alla funzione di distribuzione di probabilita’ riferita ai nodi del sistema, o stadio, che si considera).

L’ottimalita’ deve essere riferita anche alle strategie successive degli altri giocatori.

Il ragionamento rispetto ai giocatori e’ speculare, nel senso che ritenere che si sia su un dato nodo del sistema informativo equivale, nella sostanza, a congetturare quale sia stata la pregressa mossa del giocatore avversario.

La probabilita’ e’ una quantificazione della credenza del giocatore a che l’avversario abbia giocato una certa azione nello stadio precedente.

Lo step logico di tutti questi ragionamenti e’ quello di calcolare i payoff attesi, assegnate le probabilita’.

Il confronto tra i payoff consente di stabilire la scelta ottima.

Un esempio elementare puo’ aiutare a comprendere la questione.

Si consideri un gioco G con due giocatori 1 e 2 e due azioni per ciasun player.


Il sistema informativo rilevante e’ costituito da due nodi X ed Y.

Si ammette che il giocatore 2 ipotizzi che ci si trovi sul nodo Y con probabilita’ p e sul nodo Y con probabilita’ ( 1 − đ?‘?).

Questo modo di intendere equivale a far ritenere (da parte di 2) che il giocatore 1 abbia fatto la mossa đ?‘Ž1 con probabilita’ p e che abbia potato per la scelta đ?‘?1 con probabilita’ ( 1 − đ?‘?).

Per procedere devono essere noti i payoff di 2.

Essi siano i seguenti: đ?‘˘2 (đ?‘Ž1 , đ?‘Ž2 ) = 1 đ?‘˘2 (đ?‘Ž1 , đ?‘?2 ) = 0 đ?‘˘2 (đ?‘?1 , đ?‘Ž2 ) = 2


đ?‘˘2 (đ?‘?1 , đ?‘Ž2 ) = 1 Entrano in campo le credenze di 2, quantificate dalle probabilita’ assegnate da 2 alle mosse di 1.

Vanno qundi utilizzati i payoff attesi.

In buona sostanza il giocatore 2 compara i benefici. Sia đ?‘˘Ěƒ2 (a) il payoff atteso quando 2 adotta la scelta a. Risulta che đ?‘˘Ěƒ2 (a) = 1*p + 2(1 −đ?‘?) = p + 2 −2đ?‘? =2 − đ?‘?. Va ora considerato il caso che il player 2 decida di optare per la scelta b. Sia đ?‘˘Ěƒ2 (b) il payoff atteso quando 2 adotta la scelta b. In questo caso possiamo scrivere che đ?‘˘Ěƒ2 (b) = 0*p + 1(1 −đ?‘?) = 0 +1 − đ?‘? = 1 − đ?‘?. Si osservi che tra i due payoff sussiste la relazione đ?‘˘Ěƒ2 (a)> đ?‘˘Ěƒ2 (b). Quindi si deve concludere che 2 preferira’ la scelta a alla scelta b.

La teoria non si e’ limitata a cio’ ma ha imposto la definizione di “credenza plausibile�.


Al riguardo si distingue un sistema informativo sul sentiero di equilibrio da uno che e’ fuori dal sentiero di equilibrio ⦋Gibbons⦌.

Un sistema informavivo e’ fuori dal sentiero di equilibrio se con probabilita’ unitaria esso non verra’ raggiunto quando il gioco e’ posto in essere in base alle strategie di equilibrio.

Un sistema informativo, per contro, e’ sul sentiero di equilibrio se con probabilita’ positiva (anche se non con certezza) potra’ essere raggiunto quando il gioco e’ posto in essere in base alle strategie di equilibrio.

Da cio’ consegue l’ulteriore requisito in ragione del quale nei sistemi informativi posti sul sentiero di equilibrio le credenze sono determinate dalla regola di Bayes e dale strategie di equilibrio dei giocatori. Si osserva ⦋Gibbons⦌ che anche nei sistemi informativi fuori dal sentiero di equilibrio “le credenze sono determinate, dove cio’ e’ possibile, dalla regola di Bayes e dale strategie di equilibrio dei giocatori”.

Verificati i requisiti enunciati si ha un equilibrio bayesiano perfetto.

Va chiarito quando un sistema informativo riferito ad un dato giocatore e’ fuori dal sentiero di equilibrio.


Un sistema informativo per un dato giocatore puo’ essere fuori dal sentiero di equilibrio se esiste almeno un ulteriore equilibrio di Nash che pone fine al gioco prima che il dato giocatore (cui e’ associate il dato sistema informativo considerato) possa fare la sua azione.

In altri termini, “I giocatori non possono minacciare di giocare strategie che sono strettamente dominate a partire da qualsiasi insieme informativo fuori dal sentiero di equilibriâ€? ⌋GibbonsâŚŒ.

Simmetricamente gli altri giocatori saranno indotti a ritenere che il giocatore non giochera’ tali strategie e quantificheranno in p = 0 (evento impossibile) tali strategie.

E’ possibile un ulteriore affinamento della teoria considerando il caso di una azione strettamente dominata tra quelle a disposizione del giocatore 1. Sia D una azione per la quale đ?‘˘1 (đ?‘Ž2 | D) < đ?‘˘1 (đ?‘Ž2 | đ?‘Ž1 ≠đ??ˇ) allora la credenza di 2 che 1 giochi D e’ đ?‘?đ??ˇ = 0. Se il Sistema informativo si compone di due soli nodi allora risultera’ che đ?‘?đ?‘Ž2 ≠đ??ˇ = 1.


Quindi ogni altro equilibrio di Nash non appartemente al sistema informativo di 2 e’ spiazzato.

Questo stato di cose giustifica la ulteriore proprieta’ degli equilibri bayesiani perfetti, ovvero l’assegnazione di probabilita’ zero ai nodi che sono raggiunti “soltanto se un altro giocatore gioca una strategia che e’ strttamente dominata a partire da qualche sistema informativo” ⦋Gibbons⦌.


BIBLIOGRAFIA

Bronson, Ricerca operativa, McGraw-Hill, 1994

Gibbons, Teoria dei giochi, Il Mulino, 1994


ANTICIPAZIONE

Il numero di ottobre sara’ dedicato allo studio delle funzioni di una o piu’ variabili reali.


PROPRIETA’ LETTERARIA

Questo saggio non ha finalita’ commerciali o lucrative. Ne e’ autorizzata la divulgazione, anche totale, a condizione che essa non abbia finalita’ commerciali o lucrative purche’ essa avvenga con la citazione dell’autore e del soggetto diffusore dell’opera.