Laboratorio virtuale > Rosso e nero > [1] 2 3 4 5

1. Introduzione


In questo capitolo analizzeremo uno dei modelli di gioco più semplici. Nonostante la sua semplicità, l'analisi formale porta a risultati interessanti e a volte sorprendenti che trovano applicazione ben oltre il gioco d'azzardo.

Assunzioni

La situazione iniziale è la seguente: il giocatore inizia con una somma (non casuale) di denaro. Può puntare su una prova semplice con due esiti: vincita o perdita. Se vince, riceve quanto ha puntato; se perde deve pagare quanto ha puntato. Il gioco quindi è alla pari.

Proviamo a formulare questo esperimento in termini formali e precisiamo alcune assunzioni sulle variabili casuali di base. In primo luogo, assumiamo che le prove siano indipendenti e che le probabilità di vincita e perdita restino costanti da prova a prova. Abbiamo quindi una sequenza di prove Bernoulliane:

Se p = 0, il giocatore perde sempre e se p = 1 vince sempre. Tali casi triviali non sono interessanti, per cui assumiamo 0 < p < 1. Ovviamente, nelle case da gioco reali, p < 1/2 (cioè le prove sono sfavorevoli per il giocatore), per cui siamo particolarmente interessati a questo caso.

Processi casuali

La ricchezza del giocatore nel corso del tempo è il processo di interesse: sia

X0 = la ricchezza iniziale, Xi = la ricchezza dopo i prove.

La strategia del giocatore è formata dalla decisioni su quanto puntare a ciascuna prova e quando abbandonare il gioco. Sia

Yi = l'ammontare dell'i-esima puntata.

e sia N il numero di prove giocate. Se vogliamo possiamo anche assumere che le prove durino all'infinito, ma assumendo che il giocatore punti 0 a ciascuna prova successiva alla N. Con queste considerazioni, l'esito della prova, la ricchezza e la puntata sono definiti per ogni i.

Esercizio teorico 1. Mostra che il processo della ricchezza è legato al processo delle puntate dalla relazione seguente:

Xj = Xj - 1 + (2Ij - 1)Yj per j = 1, 2, ...

Strategie

La strategia del giocatore può essere molto complessa. Per esempio, la puntata alla prova n (Yn) o la decisione di smettere dopo n - 1 prove ({N = n - 1}) può essere basata sull'intera storia passata del processo, fino al tempo n:

Hn = (X0, Y1, I1, Y2, I2, ..., Yn - 1, In - 1).

Inoltre, vi possono essere ulteriori fonti di casualità. Per esempio, un giocatore di roulette può basare le sue puntate basandosi sul lancio di un dado fortunato che tiene in tasca. Tuttavia il giocatore non può leggere il futuro (sfortunatamente, dal suo punto di vista), per cui possiamo assumere almeno che

Yn e {N = n - 1} siano indipendenti da In, In + 1, In + 2 ...

Mostreremo ora che, almeno in termini di valore atteso, ogni strategia di gioco è futile se le prove sono sfavorevoli.

Esercizio teorico 2. Usa il risultato dell'esercizio 1 e l'assunzione di non prescienza per mostrare che

E(Xi) = E(Xi - 1) + (2p - 1)E(Yi ) per i = 1, 2, ...

Esercizio teorico 3. Supponi che il giocatore abbia probabilità positiva di puntare alla prova i. Usa il risultato dell'esercizio 2 per mostrare che

  1. E(Xi) < E(Xi - 1) se p < 1 / 2
  2. E(Xi) = E(Xi - 1) se p > 1 / 2
  3. E(Xi) = E(Xi - 1) se p = 1 / 2

L'esercizio 3 mostra che, per ogni prova in cui il giocatore punta, la sua ricchezza attesa decresce strettamente se le prove sono sfavorevoli, resta la stessa se le prove sono alla pari e cresce strettamente se le prove sono favorevoli.

Come già notato in precedenza, una strategia generale può dipendere dal passato e può essere casualizzata. Tuttavia, poiché le prove Bernoulliane sottostanti sono indipendenti, si può supporre che tali complesse strategie non siano migliori di strategie semplici in cui l'ammontare della puntata e la decisione di smettere sono basate solo sulla ricchezza corrente del giocatore. Tali strategie semplici hanno un ruolo fondamentale e sono dette strategie stazionarie e deterministiche. Tali strategie possono essere descritte da una funzione di puntata S dallo spazio delle ricchezze allo spazio delle puntate possibili, per cui S(x) è la cifra che il giocatore punta quando la sua ricchezza attuale è x.

Rosso e nero

Da ora in poi, assumeremo che la regola di arresto del giocatore sia molte semplice e standard: punterà su tutte le prove finché avrà perso tutto o avrà raggiunto una ricchezza prefissata a:

N = min{n = 0, 1, 2, ...: Xn = 0 or Xn = a}.

Questo tipo di gioco è detto rosso e nero e prende nome dal gioco della roulette.

Se vogliamo, possiamo pensare alla differenza tra la ricchezza obiettivo e la ricchezza iniziale come alla ricchezza del banco. Con questa interpretazione, il giocatore e il banco assumono ruoli simmetrici: il gioco continua fino il giocatore o il banco sono rovinati. Siamo interessati principalmente alla ricchezza finale XN del giocatore. Nota che tale variabile assume solo due valori: 0 e a.

Esercizio teorico 4. Mostra che media e varianza della ricchezza finale sono date da

  1. E(XN) = aP(XN = a)
  2. var(XN) = a2 P(XN = a) [1 - P(XN = a)]

Dall'esercizio 1, il giocatore vuole massimizzare la probabilità di raggiungere la ricchezza obiettivo. È meglio puntare poco o puntare molto, o non è rilevante? Quanto dipende la strategia ottimale, se ne esiste una, dalla ricchezza iniziale, dalla ricchezza obiettivo e dalle probabilità di vittoria? Analizzeremo e confronteremo due strategie in un certo senso opposte:

La strategia di gioco prudente è detta anche rovina del giocatore, forse perché, come vedremo, è una pessima strategia nelle case da gioco reali.

Simulazioni

Simulazione 5. Nel gioco del rosso e nero poni la ricchezza iniziale a 8, la ricchezza obiettivo a 16 e la probabilità di vincita a 0.5. Gioca 10 turni con ciascuna delle seguenti strategie. Osserva il comportamento della ricchezza finale e il numero di prove e, in particolare, osserva quale strategia sembra funzionare meglio.

  1. Gioco prudente.
  2. Gioco aggressivo.
  3. Puntare 4 ad ogni giocata.

Simulazione 6. Nel gioco del rosso e nero poni la ricchezza iniziale a 8, la ricchezza obiettivo a 16 e la probabilità di vincita a 0.45. Gioca 10 turni con ciascuna delle seguenti strategie. Osserva il comportamento della ricchezza finale e il numero di prove e, in particolare, osserva quale strategia sembra funzionare meglio.

  1. Gioco prudente.
  2. Gioco aggressivo.
  3. Puntare 4 ad ogni giocata.

Simulazione 7. Nel gioco del rosso e nero poni la ricchezza iniziale a 8, la ricchezza obiettivo a 16 e la probabilità di vincita a 0.55. Gioca 10 turni con ciascuna delle seguenti strategie. Osserva il comportamento della ricchezza finale e il numero di prove e, in particolare, osserva quale strategia sembra funzionare meglio.

  1. Gioco prudente.
  2. Gioco aggressivo.
  3. Puntare 4 ad ogni giocata.