Laboratorio virtuale > Prove Bernoulliane > 1 [2] 3 4 5 6 7

2. La distribuzione binomiale


Supponiamo che il nostro esperimento casuale consista nell'eseguire prove Bernoulliane I1, I2, .... In questo paragrafo analizzeremo la variabile casuale Xn che indica il numero di successi nelle prime n prove. Tale variabile ha un'espressione semplice in termini delle variabili indicatore:

Esercizio teorico 1. Mostra che Xn = I1 + I2 + ··· + In.

La funzione di densità

Esercizio teorico 2. Supponi che K N = {1, 2, ..., n} and #(K) = k. Usa le assunzioni sulle prove Bernoulliane per mostrare che

P(Ij = 1 per j K e Ij = 0 per j N - K) = pk(1 - p)n -k.

Ricorda che il numero di sottinsiemi di dimensione k da un insieme di dimensione n è il coefficiente binomiale

C(n, k). = n!/[k!(n - k)!}

Esercizio teorico 3. Usa l'esercizio 2 e le proprietà fondamentali della probabilità per mostrare che

P(Xn = k) = C(n, k)pk(1 - p)n-k per k = 0, 1, ..., n.

La distribuzione con questa funzione di densità è detta distribuzione binomiale con parametri n e p. La famiglia binomiale è una delle più importanti in probabilità.

Simulazione 4. Nell'esperimento binomiale della moneta, modifica n e p con le barre a scorrimento e osserva forma e posizione della funzione di densità. Con n = 10 e p = 0.7, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della frequenza relativa alla funzione di densità.

Esercizio teorico 5. Per 5 lanci di un dado bilanciato, trova esplicitamente la funzione di densità del numero di uno.

Esercizio teorico 6. Uno studente esegue un test a scelta multipla con 10 domande, ciascuna con 4 possibilità. Se lo studente tira a indovinare, trova la probabilità di indovinare almeno 5 domande.

Esercizio teorico 7. Usa il teorema binoniale per mostrare che la funzione di densità binomiale è effettivamente una funzione di densità di probabilità (discreta).

Esercizio teorico 8. Mostra che

  1. P(Xn = k) > P(Xn = k - 1) se e solo se k < (n + 1)p.
  2. P(Xn = k) = P(Xn = k - 1) se e solo se (n + 1)p è un intero tra 1 e n, e k = (n + 1)p

Quindi la funzione di densità prima cresce e poi decresce, raggiungendo il massimo a floor[(n + 1)p]; tale intero è la moda della distribuzione. (Ricorda che floor(x) è il maggiore intero minore di x). Nel caso in cui m = (n + 1)p è un intero tra 1 e n, ci sono due mode consecutive, a m - 1 e m. In ciascuno degli eventi, la forma della distribuzione binomiale è unimodale.

Esercizio teorico 9. Supponi che U sia una variabile casuale con distribuzione binomiale con parametri n e p. Mostra che n - U ha distribuzione binomiale con parametri n e 1 - p.

  1. Dai una dimostrazione probabilistica basata sulle prove di Bernoulli
  2. Dai una dimostrazione analitica basata sulle funzioni di densità

Problemi famosi

Nel 1693, Samuel Pepys chiese a Isaac Newton se è più probabile avere almeno un uno in 6 lanci di un dado o almeno due uno in 12 lanci di un dado. Tale problema è noto come problema di Pepys; ovviamente Pepys si riferiva a dadi bilanciati.

Simulazione 10. Prova a rispondere al problema di Pepys basandoti sui dati empirici. Con un dato equilibrato e n = 6, simula l'esperimento del dado 500 volte e calcola la frequenza relativa di almeno un uno. Con n = 12, simula 500 replicazioni e calcola la frequenza relativa di almeno due uno. Confronta i risultati.

Esercizio teorico 11. Risolvi il problema di Pepys utilizzando la distribuzione binomiale.

Esercizio teorico 12. Cos'è più probabile: almeno un uno su 4 lanci di un dado equilibrato o almeno un doppio uno in 24 lanci di due dadi equilibrati? Questo è noto come problema di DeMere in onore del Chevalier De Mere

Momenti

Vediamo ora come calcolare media e varianza della distribuzione binomiale in vari modi diversi. Il metodo che utilizza le variabili indicatore è il migliore.

Esercizio teorico 13. Usa l'esercizio 1 e le proprietà del valore atteso per mostrare che

E(Xn) = np.

Ciò ha senso a livello intuitivo, poiché p dev'essere approssimativamente la proporzione di successi in un numero elevato di prove.

Esercizio teorico 14. Calcola la media utilizzando la funzione di densità.

Esercizio teorico 15. Usa l'esercizio 1 e le proprietà della varianza per mostrare che

var(Xn) = np(1 - p)

Esercizio teorico 16. Disegna il grafico della varianza in funzione di p. Nota in particolare che la varianza è massima quando p = 1/2 e minima quando p = 0 o p = 1.

Esercizio teorico 17. Calcola la varianza utilizzando la funzione di densità.

Esercizio teorico 18. Prova che la funzione generatrice di probabilià è data da

E(tXn) = (1 - p + pt)n per t appartenente a R

Esercizio teorico 19. Usa la funzione generatrice di probabilità dell'esercizio 18 per calcolare media e varianza.

Esercizio teorico 20. Usa l'identità jC(n, j) = nC(n - 1, j - 1) per n, j = 1, 2, ... per mostrare che

E(Xnk) = npE[(Xn - 1 + 1)k - 1] per n, k = 1, 2, ...

Esercizio teorico 21. Usa il risultato ricursivo dell'esericizio 20 per ricavare in un altro modo media e varianza.

Simulazione 22. Nell' esperimento binomiale della moneta, modifica n e p con le barre a scorrimento e osserva posizione e dimensione della barra media/deviazione standard. Con p = 0.7, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza di media e deviazione standard ai loro valori teorici.

Esercizio teorico 23. Un certo tipo di missile ha probabilità di fallimento 0.02. Calcola media e deviazione standard del numero di fallimenti in 50 lanci.

Esercizio teorico 24. Si lancia 1000 volte un dado bilanciato. Trova media e deviazione standard del numero di "uno".

La tavola di Galton

La tavola di Galton è una matrice triangolare di chiodi. Le righe sono numerate 0, 1, ... da cima a fondo. La riga n ha n + 1 chiodi, numerati da 0 a n da sinistra a destra. Ciascun chiodo, quindi, può essere identificato dalla coppia ordinata (n, k) dove n è il numero di riga e k è il numero del chiodo in tale riga. La tavola di Galton prende il nome da Francis Galton.

Supponiamo ora di far cadere una pallina sul primo chiodo (0, 0). Ogni volta che la pallina cade su un chiodo, cade alla sua destra con probabilità p e alla sua sinistra con probabilità 1 - p, indipendentemente da volta a volta.

Esercizio teorico 25. Prova che il numero di chiodi su cui la pallina cade nella riga n ha distribuzione binomiale con parametri n e p.

Simulazione 26. Nell'esperimento della tavola di Galton, poni n = 10 e p = 0.1. Clicca su step diverse volte e osserva le palline cadere tra i chiodi. Ripeti per p = 0.3, 0.5, 0.7, e 0.9.

Simulazione 27. Nell'esperimento della tavola di Galton, poni n = 15 e p = 0.1. Esegui 100 replicazioni, aggiornando ogni volta. Osserva la forma generale dei sentieri di caduta. Ripeti per p = 0.3, 0.5, 0.7, e 0.9.

Somme di variabili binomiali indipendenti

Introduciamo ora un'importante proprietà di invarianza per la distribuzione binomiale.

Esercizio teorico 28. Usa la rappresentazione in termini delle variabili indicatore per mostrare che se m e n sono interi positivi allora

  1. Xm+n - Xm ha la stessa distribuzione di Xn (binomiale con parametri n e p).
  2. Xm+n - Xm e Xm sono indipendenti.

Pertanto, il processo stocastico Xn, n = 1, 2, ... ha incrementi indipendenti e stazionari.

Esercizio teorico 29. Prova che, se U e V sono variabili indipendenti relative a un esperimento, U ha distribuzione binomiale con parametri m e p e V ha distribuzione binomiale con parametri n e p, allora U + V ha distribuzione binomiale con parametri m + n e p.

  1. Fornire una dimostrazione probabilistica, usando l'esercizio 28.
  2. Fornire una dimostrazione analitica, utilizzando le funzioni di densità.
  3. Fornire una dimostrazione analitica, utilizzando le funzioni generatrici di probabilità.

Rapporto con la distribuzione ipergeometrica

Esercizio teorico 30. Supponi che m < n. Prova che

P(Xm = j | Xn = k) = C(m, j) C(n - m, k - j) / C(n, k) per j = 0, 1, ..., m.

È interessante notare che la distribuzione dell'esercizio 30 è indipendente da p. Si tratta della distribuzione ipergeometrica con parametri n, m e k. Prova a interpretare questo risultato in termini probabilistici.

Esercizio teorico 31. Si lancia una moneta 100 volte e si ottengono 30 teste. Trova la funzione di densità del numero di teste nei primi 20 lanci.

Approssimazione normale

Simulazione 32. Nell'esperimento binomiale temporale, poni p = 0.1. Inizia con n = 1 e aumenta ogni volta n di 1. Osserva la forma della funzione di densità. Con n = 100, simula 1000 replicazioni, aggiornando ogni 10. Ripeti per p = 0.3, 0.5, 0.7 e 0.9.

La caratteristica forma a campana che dovresti osservare dall'esercizio 32 costituisce una buona esemplificazione del teorema limite centrale, poiché la variabile binomiale può essere scritta come somma di n variabili casuali indipendenti e identicamente distribuite (le variabili indicatore).

Esercizio teorico 33. Prova che la distribuzione della variabile standardizzata riportata converge alla distribuzione normale standardizzata al crescere di n

(Xn - np) / [np(1 - p)]1/2.

Questa versione del teorema limite centrale è nota come teorema di DeMoivre-Laplace, e prende nome da Abraham DeMoivre e Simeon Laplace. Dal punto di vista pratico, l'esercizio 33 significa che, per n sufficientemente grande, la distribuzione di Xn è approssimatamente normale, con media np e varianza np(1 - p). Quanto grande n dev'essere perché l'approssimazione sia accettabile dipende dal valore di p. La regola empirica è che np e n(1 - p) devono valere almeno 5.

Simulazione 34. Nell'esperimento binomiale temporale, poni p = 0.5 e n = 15. Simula 1000 replicazioni, aggiornando ogni 100. Calcola e confronta i seguenti:

  1. P(5 X15 10)
  2. La frequenza relativa dell'evento {5 X15 10}
  3. L'approssimazione normale a P(5 X15 10)

Simulazione 35. Nell'esperimento binomiale temporale, poni p = 0.3 e n = 20. Simula 1000 replicazioni, aggiornando ogni 100. Calcola e confronta i seguenti:

  1. P(5 X20 10)
  2. La frequenza relativa dell'evento {5 X20 10}
  3. L'approssimazione normale a P(5 X20 10)

Simulazione 36. Nell'esperimento binomiale temporale, poni p = 0.8 e n = 30. Simula 1000 replicazioni, aggiornando ogni 100. Calcola e confronta i seguenti:

  1. P(22 X30 27)
  2. La frequenza relativa dell'evento {22 X30 27}
  3. L'approssimazione normale a P(22 X30 27)

Esercizio teorico 37. Supponi che in un certo comune, il 40% degli elettori preferiscano il candidato A. Si estrae un campione di 50 elettori.

  1. Trova media e varianza del numero di elettori del campione che preferiscono A.
  2. Trova la probabilità che meno di 19 soggetti del campione preferiscano A.
  3. Calcola l'approssimazione normale alla probabilità di (b).

Affidabilità

La distribuzione binomiale si presenta spesso negli studi di affidabilità. Supponiamo che un sistema sia formato da n componenti che funzionano indipendentemente l'una dall'altra. Ciascuna componente può essere funzionante, con probabilità p, o difettosa, con probabiloità 1 - p. Le componenti rappresentano quindi prove Bernoulliane. Supponiamo ora che il sistema, nel suo complesso, funzioni se e solo se almeno k delle n componenti funzionano. In termini di affidabilità un sistema di questo tipo è detto, a buona ragione, sistema k di n. La probabilità che il sistema funzioni correttamente è detta affidabilità del sistema.

Esercizio teorico 38. Commenta la ragionevolezza dell'assunzione che le componenti si comportino in modo Bernoulliano.

Esercizio teorico 39. Prova che l'affidabilità di un sistema k di n è Rn,k(p) = P(X >= k) dove X ha distribuzione binomiale con parametri n e p.

Esercizio teorico 40. Mostra che Rn,n(p) = pn. Un sistema n di n è detto sistema in serie.

Esercizio teorico 41. Mostra che Rn,1(p) = 1 - (1 - p)n. Un sistema 1 di n è detto sistema parallelo.

Simulazione 42. Nell'esperimento binomiale della moneta, poni n= 10 e p = 0.9 e simula 1000 replicazioni, aggiornando ogni 100. Calcola l'affidabilità empirica e confrontala col suo valore teorico in ciascuno dei casi seguenti:

  1. Sistema 10 di 10 (in serie).
  2. Sistema 1 di 10 (parallelo).
  3. Sistema 4 di 10.

Esercizio teorico 43. Considera un sistema formato da n = 4 componenti. Disegna il grafico di R4,1, R4,2, R4,3 e R4,4 sullo stesso piano cartesiano.

Esercizio teorico 44. Un sistema n di 2n - 1 è detto sistema a maggioranza.

  1. Calcola l'affidabilità di un sistema 2 di 3.
  2. Calcola l'affidabilità di un sistema 3 di 5.
  3. Per quali valori di p il sistema 3 di 5 è più affidabile di quello 2 di 3?
  4. Disegna i grafici di R3,2 e R5,3 sullo stesso piano cartesiano.

Simulazione 45. Nell'esperimento binomiale della moneta, calcola l'affidabilità empirica, basandoti su 100 replicazioni, in ciascuno dei seguenti casi. Confronta i valori ottenuti con quelli teorici.

  1. Sistema 2 di 3 con p = 0.3
  2. Sistema 3 di 5 con p = 0.3
  3. Sistema 2 di 3 con p = 0.8
  4. Sistema 3 di 5 con p = 0.8

Esercizio teorico 46. Prova che R2n - 1, n(1/2) = 1/2.