Laboratorio virtuale > Prove Bernoulliane > 1 2 3 4 [5] 6 7

5. La distribuzione binomiale negativa


Supponiamo ancora una volta che il nostro esperimento casuale consista nell'eseguire delle prove Bernoulliane I1, I2, ... In questo paragrafo studieremo la variabile casuale Yk che indica il numero di prove necessario per il k-esimo successo. Notiamo che Y1 è il numero di prove necessarie per avere il primo successo, che abbiamo indicato con distribuzione geometrica. Ricordiamo inoltre che Xn, il numero di successi nelle prime n prove, ha distribuzione binomiale con parametri n e p.

La funzione di densità

Esercizio teorico 1. Mostra che Yk = n se e solo se In = 1 e Xn-1 = k - 1.

Esercizio teorico 2. Usa l'esercizio 1, l'indipendenza e la distribuzione binomiale per provare che

P(Yk = n) = C(n - 1, k - 1)pk(1 - p)n - k for n = k, k + 1, k + 2, ...

La distribuzione definita dalla funzione di densità dell'esercizio 2 è detta distribuzione binomiale negativa; ha due parametri: il numero di successi k e la probabilità di successo p.

Simulazione 3. Nell'esperimento della binomiale negativa, modifica k e p con le barre a scorrimento e osserva la forma della funzione di densità. Poni k = 2 e p = 0.4 ed esegui l'esperimento aggiornando ogni 10 replicazioni. Osserva la convergenza delle frequenze relative ai loro valori teorici.

Esercizio teorico 4. Prova che le sequenze binomiale e binomiale negativa sono l'una l'inversa dell'altra nel senso che

Xn k se e solo se Yk n

Quindi ogni evento che può essere rappresentato in termini della binomiale negativa può anche essere espresso in termini della distribuzione binomiale.

Esercizio teorico 5. Prova che

P(Yk = n) > P(Yk = n - 1) se e solo se n < (k - 1 + p) / p.

Quindi la funzione di densità prima cresce e poi decresce, raggiungendo il massimo per l'intero maggiore in (k - 1 + p) / p. Tale intero è la moda della distribuzione, per cui la distribuzione binomiale negativa è unimodale.

Esercizio teorico 6. Si lancia un dado bilanciato finché non escono 3 uno. Trova la probabilità che servano almeno 15 lanci.

Somma di variabili geometriche indipendenti

Definiamo le variabili casuali che indicano il numero di prove tra i successi consecutivi:

Z1 = Y1 e Zk = Yk - Yk-1 per k = 2, 3, ...

Esercizio teorico 7. Dimostra che tali variabili sono indipendenti e hanno ciascuna distribuzione geometrica con parametro p. Inoltre,

Yk = Z1 + Z2 + ··· + Zk.

La media, varianza e la funzione generatrice di probabilità di Yk seguono facilmente dai risultati sulla distribuzione geometrica.

Esercizio teorico 8. Dimostra che E(Yk) = k / p.

Esercizio teorico 9. Prova che var(Yk) = k(1 - p) / p2.

Esercizio teorico 10. Mostra che E(tYk) = [pt / (1 - t + tp)]k per |t| < 1 / (1 - p).

Esercizio teorico 11. Supponi che U e V siano variabili casuali indipendenti relative a un certo esperimento, che U abbia distribuzione binomiale negativa con parametri j e p e che V abbia distribuzione binomiale negativa con parametri k e p. Prova che U + V ha distribuzione binomiale negativa con parametri j + k e p.

  1. Dai una dimostrazione probabilistica, basandoti sulle prove Bernoulliane.
  2. Dai una dimostrazione basata sulla funzione generatrice dei momenti.

Simulazione 12. Nell'esperimento della binomiale negativa, modifica k e p con le barre a scorrimento e osserva la posizione e la dimensione della barra media/deviazione standard. Poni k = 3 e p = 0.25 ed esegui l'esperimento aggiornando ogni 10 replicazioni. Osserva la convergenza di media e deviazione standard campionarie ai loro valori teorici.

Esercizio teorico 13. Un certo tipo di missile ha probabilità di fallimento 0.02. Trova media e deviazione standard del numero di lanci per il quarto fallimento.

Approssimazione alla normale

Simulazione 14. Nell'esperimento della binomiale negativa, inizia con p = 0.5 e k = 1. Incrementa k di 1 e osserva ogni volta la forma della funzione di densità. Ripeti per p = 0.3 e p = 0.8.

Anche se siamo limitati a k = 5, possiamo comunque vedere la caratteristica forma campanulare. Ciò è conseguenza del teorema del limite centrale, poiché la variabile casuale binomiale negativa può essere scritta come somma di k variabili casuali (geometriche) indipendenti e identicamente distribuite.

Esercizio teorico 15. Prova che la distribuzione della variabile standardizzata tende alla distribuzione normale standardizzata al crescere di k.

(Yk - k / p) / [k(1 - p) / p]1/2 = (pYk - k) / [k(1 - p)]1/2.

Simulazione 16. Nell'esperimento della binomiale negativa, inizia con p = 0.5 e k = 5. Simula 1000 replicazioni, aggiornando ogni 100, e calcola e confronta i seguenti valori:

  1. P(8 Y5 15)
  2. La frequenza relativa dell'evento {8 Y5 15}.
  3. L'approssimazione normale a P(8 Y5 15).

Esercizio teorico 17. Si lancia una moneta finché non esce la cinquantesima testa.

  1. Assumendo che la moneta sia bilanciata, trova l'approssimazione normale alla probabilità che la moneta debba essere lanciata almeno 125 volte.
  2. Supponi di eseguire l'esperimento e che siano necessari 125 lanci. Credi che la moneta sia equilibrata?

Il problema dei fiammiferi di Banach

Supponiamo che un professore distratto (ce ne sono di non distratti?) abbia N fiammiferi nella tasca destra e N fiammiferi nella tasca sinistra. Quando ha bisogno di un fiammifero per accendersi la pipa, pesca con uguale probabilità da una tasca o dall'altra. Vogliamo calcolare la funzione di densità della variabile casuale W che indica il numero di fiammiferi che restano quando il professore si accorge che una delle sue tasche è vuota. Questo problema è detto problema dei fiammiferi di Banach, in onore del matematico Stefan Banach, che evidentemente si comportava in questo modo.

Possiamo riformulare il problema utilizzando la distribuzione binomiale. Chiaramente, la scelta dei fiammiferi forma una sequenza di prove Bernoulliane con paramatro p = 1/2. Più precisamente, possiamo considerare un fiammifero preso dalla tasca destra come vittoria del giocatore R e uno preso dalla tasca sinistra come vittoria del giocatore L. In un'ipotetica sequenza infinita di prove, sia Y il numero di prove necessarie affinché R vinca N + 1 prove e Z il numero di prove necessarie affinché L vinca N + 1 prove. Notiamo che sia Y che Z hanno distribuzione binomiale negativa con parametri N + 1 e p.

Esercizio teorico 18. Per k = 0, 1, ..., N, prova che

  1. L vince N - k prove nel momento in cui R vince N + 1 prove se e solo se Y = 2N - k + 1
  2. {Y = 2N - k + 1} è equivalente all'evento in cui il professore scopre che la tasca di destra è vuota e nella sinistra restano k fiammiferi
  3. P(Y = 2N - k + 1) = C(2N - k, N)(1/2)2N - k + 1.

Esercizio teorico 19. Per k = 0, 1, ..., N, prova che

  1. R vince N - k prove nel momento in cui L vince N + 1 prove se e solo se Z = 2N - k + 1
  2. {Z = 2N - k + 1} è equivalente all'evento in cui il professore scopre che la tasca di sinistra è vuota e nella destra restanok fiammiferi
  3. P(Z = 2N - k + 1) = C(2N - k, N)(1/2)2N - k + 1.

Esercizio teorico 20. Combina i risultati dei due esercizi precedeti per concludere che

P(W = k) = C(2N - k, N) (1/2)2N - k per k = 0, 1, ..., N.

Col metodo proposto si può risolvere anche il problema dei fiammiferi di Banach non simmetrico. Supponiamo che il professore cerchi nella tasca destra con probabilità p e nella sinistra con probabilità 1 - p, dove 0 < p < 1. Ciò che cambia nell'analisi è che Y ha distribuzione binomiale negativa con parametri N + 1 e p, mentre Z ha distribuzione binomiale negativa con parametri N + 1 e 1 - p.

Esercizio teorico 21. Prova che

P(W = k) = C(2N - k, N)[pN + 1 (1 - p)N - k + (1 - p)N pN - k] per k = 0, 1, ..., N.

Il problema dei punti

Supponi che due squadre (o due individui) A e B giochino una sequenza di prove Bernoulliane, dove p è la probabilità che il giocatore A vinca una prova. Per due interi non negativi n e m, sia Fn,m(p) la probabilità che A faccia n punti prima che B ne faccia m. Il calcolo di Fn,m(p) è un problema storico noto come problema dei punti, che fu risolto da Pierre de Fermat e Blaise Pascal.

Esercizio teorico 22. Commenta la validità dell'assunzione di prove Bernoulliane (indipendenza delle prove e probabilità di successo costante) per i giochi sportivi che presentano una componente di abilità oltre a quella casuale.

La soluzione al problema dei punti è semplice utilizzando la distribuzione binomiale (fu questa la soluzione proposta da Pascal). Assumiamo ce si giochino n + m - 1 partite, indipendentemente dagli esiti, e sia Xn + m - 1 il numero di prove in cui A vince. Per definizione Xn + m - 1 ha distribuzione binomiale con parametri n + m - 1 e p.

Esercizio teorico 23. Mostra che A vince n partite prima che B ne vinca m se e solo se

Xn + m - 1 >= n.

Esercizio teorico 24. Usa il risultato dell'esercizio precedente per mostrare che

Fn,m(p) = sommatoriak = n, ..., n + m -1 C(n + m - 1, k) pk(1 - p)n + m - 1 - k.

Simulazione 25. Nell'esperimento del problema dei punti, modifica i parametri n, m e p, e osserva come variano le probabilità. Con n = 10, m = 5 e p = 0.5, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esiste un'altra soluzione al problema che ricorre all'uso della distribuzione binomiale negativa. Ciò si spiega bene se si ricorda l'equivalenza tra distribuzione binomiale e distribuzione binomiale negativa. Assumiamo in primo luogo che il gioco continui all'infinito, indipendentemente dagli esiti, e sia Yn il numero di partite necessarie perché A vinca n volte. Per definizione, Yn ha distribuzione binomiale negativa con parametri n e p.

Esercizio teorico 26. Prova che A vince n partite prima che B ne vinca m se e solo se

Yn n + m -1

Esercizio teorico 27. Usa il risultato dell'esercizio precedente per mostrare che

Fn,m(p) = sommatoriaj = n, ..., n + m - 1 C(j - 1, n - 1) pn(1 - p)j - n.

Simulazione 28. Nell'esperimento del problema dei punti, modifica i parametri j, k e p e osserva come variano le probabilità. Con n = 10, m = 10 e p = 0.7, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esercizio teorico 29. Prova che, per dati n e m, Fn,m(p) aumenta da 0 a 1 per p che cresce da 0 e 1.

Simulazione 30. Nell'esperimento del problema dei punti, modifica i parametri n, m e p, e osserva come variano le probabilità. Con n = 5, m = 10 e p = 0.3, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esercizio teorico 31. Prova che Fn,m(p) decresce al crescere di n per dati m e p, e che Fn,m(p) cresce al crescere di m per dati n e p.

Simulazione 32. Nell'esperimento del problema dei punti, modifica i parametri n, m e p, e osserva come variano le probabilità. Con n = 10, m = 15 e p = 0.3, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esercizio teorico 33. Condiziona all'esito della prima prova per derivare la seguente relazione ricursiva e le condizioni di limite (questa è la soluzione che propose Fermat):

  1. Fn,m(p) = pFn - 1,m(p) + (1 - p)Fn,m - 1(p), per n, m = 1, 2, ...
  2. Fn,0(p) = 0, F0,m(p) = 1.

Serie di giochi

Il caso particolare n = m è importante poiché Fn,n(p) è la probabilità che A vinca almeno n di 2n - 1 partite. Tali serie, specialmente con n = 2, 3 o 4 sono spesso utilizzate nei tornei.

Esercizio teorico 34. Poni p = 0.6. Calcola la probabilità che la squadra A vinca

  1. Almeno 3 di 5 partite (n = 3).
  2. Almeno 4 di 7 partite (n = 4).

Simulazione 35. Nell'esperimento del problema dei punti, modifica i parametri n, m e p (tenendo n = m), e osserva come variano le probabilità. Simula un gioco 3 di 5 ponendo n = m = 3, p = 0.6. Simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esercizio teorico 36. Prova che Fn,n(1 - p) = 1 - Fn,n(p) per ogni n e p.

  1. Prova a dare una spiegazione probabilistica e una analitica.
  2. Mostra che tale condizione implica che il grafico di Fn,n sia simmetrico rispetto a p = 1/2.
  3. Mostra che tale condizione implica che Fn,n(1/2) = 1/2.

Simulazione 37. Nell'esperimento del problema dei punti, modifica i parametri n, m e p (tenendo n = m), e osserva come variano le probabilità. Simula un gioco 4 di 7 ponendo n = m = 4, p = 0.45. Simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla probabilità.

Esercizio teorico 38. Sia n > m. Prova che Fn,n(p) > Fm,m(p) se e solo se p > 1/2. Interpreta il risultato.

Divisione delle puntate

Il problema dei punti nacque da una domanda posta dal Chevalier de Mere, che era interessato alla corretta divisione delle puntate quando un gioco viene interrotto. Specificamente, supponiamo che i giocatori A e B giochino ciascuno C unità monetarie, e poi esegui prove Bernoulliane finché uno di loro non vince un numero fissato di prove. Il vincitore si prende l'intero piatto 2C.

Esercizio teorico 39. Se il gioco si interrompe quando A deve vincere ancora n partite e B ne deve vincere altre m, dimostra che il piatto dev'essere diviso tra A e B, rispettivamente, come segue:

  1. 2C Fn,m(p) per A,
  2. 2C[1 - Fn,m(p)] per B.

Esercizio teorico 40. Supponi che i giocatori A e B giochino 50$ ciascuno. I giocatori lanciano una moneta finché uno di loro vince 10 volte; il vincitore si prende il piatto. Supponi che il gioco venga interrotto dalla guardia di finanza quando A ha vinto 5 volte e B 3 volte. Come si deve dividere il piatto?