Laboratorio virtuale > Giochi di fortuna > 1 2 3 4 5 [6] 7 8

6. Il problema di Monty Hall


Termini del problema

Il problema di Monty Hall riguarda una situazione di gioco classica e prende nome da Monty Hall, conduttore per lunghi anni della trasmissione TV Let's Make a Deal. Si hanno tre porte indicate con numeri da 1 a 3. Dietro una delle porte c'è un'automobile, dietro le altre delle capre:

Automobile Prima capra Seconda capra

Le regole sono le seguenti:

  1. Il giocatore sceglie una porta.
  2. Il conduttore sceglie una porta diversa e la apre.
  3. Il conduttore dà al giocatore la possibilità di cambiare la porta con quella che resta.
  4. La porta che il giocatore alla fine sceglie viene aperta e il giocatore vince o perde.

Il problema di Monty Hall ha generato molte controversie a causa di alcuni articoli di Marilyn Vos Savant nella rubrica Ask Marilyn del Parade magazine, un popolare supplemento domenicale al giornale. La controversia ebbe inizio quando un lettore pose il problema nei seguenti termini:

Supponi di essere alla trasmissione e di dover scegliere tra tre porte. Ne sceglie una, ad esempio la prima, e il conduttore, che sa che che c'è dietro le porte, ne apre un'altra, ad esempio la terza, dietro alla quale c'è la capra. Poi ti chiede “Vuoi cambiare e scegliere la seconda porta?” Ti conviene cambiare la scelta?

Marilyn rispose che il concorrente deve cambiare, affermando che c'è una possibilità di 1/3 che l'automobile sia dietro la porta 1 e di 2/3 che sia dietro la 2. Nelle rubriche seguenti, Marilyn pubblicò diverse risposte, alcune di accademici, che affermavano in toni arrabbiati o sarcastici che era in errore e che ci sono uguali probabilità che la capra sia dietro ciascuna delle porte. Marilyn rimase della sua opinione e presentò ulteriori argomenti, non formali.

Esercizio teorico 1. Pensa al problema. Concordi con Marilyn o pensi che nessuna delle due soluzioni sia esatta?

Simulazione 2. Nel gioco di Monty Hall, poni la strategia del conduttore a standard (il significato di tale strategia sarà spiegato più avanti). Esegui il gioco 50 volte utilizzando le seguenti strategie. Hai cambiato idea sulla risposta all'esercizio 1?

  1. Cambia sempre
  2. Non cambiare mai

Simulazione 2. Nel gioco di Monty Hall, poni la strategia del conduttore a cieco (il significato di tale strategia sarà spiegato più avanti). Esegui il gioco 50 volte utilizzando le seguenti strategie. Hai cambiato idea sulla risposta all'esercizio 1?

  1. Cambia sempre
  2. Non cambiare mai

Modellare il problema

Quando si inizia a riflettere sul problema di Monty Hall, si capisce che i termini posti dal lettore a Marilyn sono così vaghi che è impossibile una discussione sensata senza assunzioni chiarificatrici sulle strategie del conduttore e del giocatore. Vedremo che, di fatto, fraintendimenti su tali strategie sono la causa della controversia.

Proviamo a formalizzare il problema. In genere le decisioni di conduttore e concorrente possono variare da gioco a gioco, ma se abbiamo un esperimento casuale nel senso classico del termine, dobbiamo assumere che le stesse distribuzioni di probabilità regolino il comportamento di conduttore e giocatore in ciascuna partita, e che quest'ultime siano tra di loro indipendenti.

Ci sono quattro variabili casuali in ogni partita:

  1. U: il numero della porta che contiene l'automobile.
  2. X: il numero della prima porta scelta dal concorrente.
  3. V: il numero della porta aperta dal conduttore.
  4. Y: il numero della seconda porta scelta dal concorrente.

Ciascuna di queste variabili casuali assume i valori possibili 1, 2 e 3. In ogni caso, per le regole del gioco, il conduttore non può aprire la porta scelta dal giocatore:

V <> X, V <> Y.

Ammettiamo la possibilità che V = U, cioè che il conduttore apra la porta con dietro l'automobile. Se ciò sia ragionevole è la fonte della controversia.

Ci sono tre eventi di interesse. Indicheremo con W la variabile indicatore dell'evento che il concorrente vinca:

W = 1 se Y = U; W = 0 altrimenti.

Indicheremo con S la variabile indicatore dell'evento che il concorrente cambi porta:

S = 1 se Y <> X; S = 0 altrimenti.

Infine, indicheremo con G la variabile indicatore dell'evento che il conduttore apra una porta con dietro la capra:

G = 1 se V <> U; G = 0 altrimenti.

L'esperimento di Monty Hall sarà definito formalmente una volta individuata la distribuzione congiunta delle variabili indicate. Tale distribuzione dipende dalle strategie di conduttore e concorrente, che consideremo in seguito.

Strategie del conduttore

Nell'esperimento di Monty Hall, nota che il conduttore determina la funzione di densità della porta con l'automobile:

P(U = i) per i = 1, 2, 3.

La scelta più ovvia è quella di assegnare a caso l'automobile a una delle porte. Ciò porta ad avere una distribuzione uniforme, e se non specificato diversamente, assumeremo che U abbia la distribuzione:

P(U = i) = 1/3 per i = 1, 2, 3.

Il conduttore determina inoltre la funzione di densità condizionata della porta che apre, data la conoscenza della porta che nasconde l'automobile e della prima porta scelta dal giocatore:

P(V = k | U = i, X = j) per i, j, k = 1, 2, 3.

Ricorda che, poiché il conduttore non può aprire la porta scelta dal giocatore, tale probabilità dev'essere 0 per k = j. La distribuzione di U e la distribuzione condizionata di V costituiscono la strategia del conduttore.

Nella maggior parte dei giochi reali, il conduttore aprirà sempre una porta con la capra dietro. Se la prima decisione del giocatore è sbagliata, allora il conduttore non ha scelta: non può aprire la porta con l'automobile o quella scelta dal giocatore e deve quindi aprire solo la porta restante. D'altra parte, se la prima decisione del giocatore è corretta, allora il conduttore può aprire una qualcunque delle due porte restanti, poiché entrambe nascondono la capra. Quindi può sceglierne una a caso.

Esercizio teorico 4. Mostra che questa strategia porta alla seguente distribuzione condizionata:

  1. P(V = k | U = i, X = j) = 1 se i, j, k sono distinti
  2. P(V = k | U = i, X = j) = 1/2 se i = j e k <> i
  3. P(V = k | U = i, X = j) = 0 se k = i o k = j

La distribuzione dell'esercizio 4 accoppiata alla distribuzione uniforme di U, saranno indicate come startegia standard del conduttore.

Simulazione 5. Nel gioco di Monty Hall, poni la strategia del conduttore a standard. Esegui il gioco 50 volte utilizzando le seguenti strategie. Quale funziona meglio?

  1. Cambia sempre
  2. Non cambiare mai

Un'altra possibile strategia del conduttore è quella di aprire una porta scelta comunque a caso tra le due restanti, per cui può aprire anche la porta con dietro l'automobile.

Esercizio teorico 6. Mostra che questa strategia porta alla seguente distribuzione condizionata:

  1. P(V = k | U = i, X = j) = 1/2 se k <> j
  2. P(V = k | U = i, X = j) = 0 se k = i

La distribuzione dell'esercizio 6 accoppiata alla distribuzione uniforme di U, è detta strategia cieca del conduttore. La strategia cieca può sembrare strana, ma la confusione tra le due strategie sta alla base della controversia su questo problema.

Simulazione 7. Nel gioco di Monty Hall, poni la strategia del conduttore a cieco. Esegui il gioco 50 volte utilizzando le seguenti strategie. Quale funziona meglio?

  1. Cambia sempre
  2. Non cambiare mai

Strategie del giocatore

Il giocatore, per parte sua, determina la funzione di densità della sua prima scelta:

P(X = j) per j = 1, 2, 3.

La strategia ovvia è quella di scegliere una porta a caso, poiché a questo punto del gioco non ha informazioni. Ciò porta alla distribuzione uniforme:

P(X = j) = 1/3 per j = 1, 2, 3.

Il giocatore determina inoltre la funzione di densità condizionata della sua seconda scelta, conoscendo la prima e la porta aperta dal conduttore:

P(Y = l | X = j, V = k) per j, k, l = 1, 2, 3 con j <> k.

Ricorda che, poiché il giocatore non può scegliere la porta aperta dal conduttore, tale probabilità deve valere 0 per l = k. La distribuzione di X e la distribuzione condizionata di Y costituiscono la strategia del giocatore.

Esercizio teorico 8. Supponi che il giocatore cambi la porta con probabilità p. Mostra che ciò porta alla seguente distribuzione condizionata

  1. P(Y = l | X = j, V = k) = p se j, k, l sono distinti
  2. P(Y = l | X = j, V = k) = 1 - p se j <> k e l = j
  3. P(Y = l | X = j, V = k) = 0 se j = k o l = k

In particolare, se p = 1, il giocatore cambia sempre, mentre se p = 0, il giocatore non cambia mai.

Indipendenza

Dobbiamo fare alcune assunzioni di indipendenza per tener conto della mancanza di informazioni che il giocatore e il conduttore hanno sul comportamento l'uno dell'altro. In primo luogo, il giocatore non conosce la porta che nascondo l'auto, per cui assumiamo che U e X siano indipendenti. Inoltre, l'unica informazione sulla posizione dell'auto che il giocatore ha al momento di fare la seconda scelta è l'informazione (se ce n'è) contenuta nella sua prima scelta e nella conseguente decisione del conduttore. Formalmente, ciò significa che Y è condizionalmente indipendente da U dati X e V.

Le strategia del conduttore e del giocatore costituiscono i dati di base del problema di Monty Hall. Grazie alle assunzioni di indipendenza, la distribuzione congiunta delle variabili casuali di base è completamente individuata da tali strategie.

Esercizio teorico 9. Usa la regola del prodotto della probabilità condizionata per mostrare che, per ogni i, j, k e l,

P(U = i, X = j, V = k, Y = l) = P(U = i)P(X = j)P(V = k | U = i, X = j)P(Y = l | X = j, V = k)

La probabilità di un evento definito in termini del problema di Monty Hall può essere calcolata sommando la densità congiunta per i valori appropriati di i, j, k e l.

Esercizio teorico 10. Prova che con ciascuna delle strategie di base del conduttore, V è distribuita uniformemente su {1, 2, 3}.

Esercizio teorico 11. Supponi che il giocatore cambi porta con probabilità p. Prova che con ciascuna delle strategie di base del conduttore, Y è distribuita uniformemente su {1, 2, 3}.

Simulazione 12. Nell'esperimento di Monty Hall, poni la strategia del conduttore a standard. Per ciascuno dei seguenti valori di p, simula 1000 replicazioni, aggiornando ogni 10. Basandoti sulla frequenza relativa, quale strategia funziona meglio?

  1. p = 0 (non cambiare mai)
  2. p = 0.3
  3. p = 0.5
  4. p = 0.7
  5. p = 1 (cambiare sempre)

Simulazione 13. Nell'esperimento di Monty Hall, poni la strategia del conduttore a cieco. Per ciascuno dei seguenti valori di p, simula 1000 replicazioni, aggiornando ogni 10. Basandoti sulla frequenza relativa, quale strategia funziona meglio?

  1. p = 0 (non cambiare mai)
  2. p = 0.3
  3. p = 0.5
  4. p = 0.7
  5. p = 1 (cambiare sempre)

La probabilità di vittoria

L'evento in cui il giocatore vince è {W = 1} = {Y = U}. Calcoliamo ora la probabilità di tale evento con le due strategie del conduttore che abbiamo proposto.

Esercizio teorico 14. Supponi che il conduttore segua la strategia standard e che il giocatore cambi porta con probabilità p. Mostra che la probabilità di vittoria del giocatore è

P(Y = U) = 1/3(1 + p).

In particolare, se il giocatore cambia sempre, la probabilità di vittoria è 2/3, mentre se non cambia la probabilità è 1/3.

Simulazione 15. Nell'esperimento di Monty Hall, poni la strategia del conduttore a standard. Per ciascuno dei seguenti valori di p, simula 1000 replicazioni, aggiornando ogni 10. In ciascun caso, osserva la convergenza della frequenza relativa di vittorie alla probabilità di vittoria.

  1. p = 0 (non cambiare mai)
  2. p = 0.3
  3. p = 0.5
  4. p = 0.7
  5. p = 1 (cambiare sempre)

Esercizio teorico 16. Supponi che il conduttore segua la strategia cieca. Mostra che per qualsiasi strategia del giocatore (non solo le standard),

P(Y = U) = 1/3.

Simulazione 17. Nell'esperimento di Monty Hall, poni la strategia del conduttore a cieco. Per ciascuno dei seguenti valori di p, simula 1000 replicazioni, aggiornando ogni 10. In ciascun caso, osserva la convergenza della frequenza relativa di vittorie alla probabilità di vittoria.

  1. p = 0 (non cambiare mai)
  2. p = 0.3
  3. p = 0.5
  4. p = 0.7
  5. p = 1 (cambiare sempre)

Per una soluzione completa al problema di Monty Hall, dobbiamo calcolate la probabilità condizionata che il giocatore vinca, sapendo che il conduttore apre una porta con dietro una capra:

P(Y = U | V <> U) = P(Y = U) / P(V <> U).

Attraverso le strategie del giocatore e del conduttore abbiamo definito il numeratore, ovvero la probabilità di vittoria. Ora dobbiamo considerare il denominatore, ovvero la probabilità che il conduttore apra una porta con la capra.

Se facciamo affidamento sulla strategia standard, la probabilità condizionata di vittoria è uguale alla probabilità condizionata, indipendentemente dalla strategia del giocatore. Se il giocatore cambia porta con probabilità p, allora, per l'esercizio 1,

P(Y = U | V <> U) = 1/3(1 + p).

Esercizio teorico 18. Prova che se il conduttore segue la strategia cieca, allora per qualunque strategia del giocatore,

P(V <> U) = 2/3 e quindi P(Y = U | V <> U) = 1/2.

Simulazione 19. Nell'esperimento di Monty Hall, poni la strategia del conduttore a cieco. Per ciascuno dei seguenti valori di p, simula 500 replicazioni, aggiornando ogni volta. In ciascun caso, calcola la frequenza relativa di vittorie, sapendo che il conduttore apre la porta con la capra, e confrontala con la risposta teorica all'esercizio 18.

  1. p = 0 (non cambiare mai)
  2. p = 0.3
  3. p = 0.5
  4. p = 0.7
  5. p = 1 (cambiare sempre)

La confusione tra la probabilità condizionata di vittoria per queste due strategie è stata la fonte delle controversie circa questo problema. Marilyn pensava probabilmente alla strategia standard per il conduttore, mentre alcuni dei suoi critici si riferivano alla strategia cieca. Questo problema sottolinea l'importanza di una modellazione attenta e di un'espressione precisa delle assunzioni. Marilyn ha ragione se il conduttore segue la strategia standard, i cirtici hanno ragione se il conduttore segue la strategia cieca, ogni altra risposta può essere corretta se il conduttore segue altre strategie.

La rappresentazione matematica che abbiamo utilizzato è praticamente la più completa possibile. In ogni caso, se vogliamo semplicemente risolvere il problema di Marilyn, esiste una via molto più semplice (che forse hai trovato da solo). Supponiamo che il conduttore apra sempre una porta con la capra. Se la prima porta scelta dal giocatore è sbagliata (cioè nasconde una capra), allora il conduttore non ha scelta e deve aprire per forza l'altra porta con la capra. Quindi se il giocatore cambia porta vince. D'altra parte, se la prima porta che il giocatore sceglie è la giusta e poi cambia, allora ovviamente perde. Si vede quindi che se il giocatore cambia sempre porta vince se e solo se la sua prima scelta era sbagliata, evento che ha ovviamente probabilità 2/3. Se il giocatore non cambia mai, allora vince se e solo se la sua prima scelta è corretta, e tale evento ha probabilità 1/3.