Laboratorio virtuale > Prove Bernoulliane > 1 2 [3] 4 5 6 7

3. La proporzione di successi


Supponiamo di nuovo che il nostro esperimento casuale consista nell'eseguire prove Bernoulliane I1, I2, ... Ricordiamo che il numero di successi nelle prime n prove, Xn, ha distribuzione binomiale con parametri n e p. In questo paragrafo studieremo la variabile casuale che indica la proporzione di successi nelle prime n prove:

Mn = Xn / n = (I1 + I2 + ··· + In) / n.

Notiamo che Mn assume i valori k / n dove k = 0, 1, ..., n.

La funzione di densità

È facile esprimere la funzione di densità della proporzione di successi Mn in termini della funzione di densità del numero di successi Xn:

Esercizio teorico 1. Prova che

P(Mn = k / n) = C(n, k) pk (1 - p)n-k per k = 0, 1, ..., n.

Simulazione 2. Nell'esperimento binomiale della moneta, seleziona la proporzione di teste. Modifica n e p con le barre a scorrimento e osserva la forma della funzione di densità. Poni n = 20 e p = 0.3 ed esegui l'esperimento aggiornando ogni 10 replicazioni. Osserva la convergenza delle frequenza relative alla funzione di densità.

Proprietà

La proporzione di successi può essere pensata anche come valore medio delle variabili indicatore. In termini statistici, le variabili indicatore formano un campione casuale, poiché sono indipendenti e identicamente distribuite, e in questo contesto Mn è un caso particolare di media campionaria. La proporzione di successi Mn è spesso utilizzata per stimare la probabilità di successo p quando essa è ignota. È insito al concetto stesso di probabilità che, quando il numero delle prove è elevato, Mn sia prossimo a p. La formulazione matematica di questo concetto è un caso particolare della legge dei grandi numeri.

Esercizio teorico 3. Usa le proprietà fondamentali del valore atteso per mostrare che per ogni n,

E(Mn) = p.

In termini statistici, ciò significa che Mn è uno stimatore corretto per p.

Esercizio teorico 4. Usa le proprietà fondamentali della varianza per dimostrare che

var(Mn) = p(1 - p) / n.

Notiamo che, per dato p, var(Mn) tende a 0 al crescere a infinito del numero delle prove. Ciò significa che la stima migliora al crescere di n; in termini statistici, ciò è noto come consistenza.

Simulazione 5. Nell' esperimento binomiale della moneta, seleziona la proporzione di teste. Modifica n e p con la barra a scorrimento e osserva la forma della funzione di densità. Nota che al variare di n e p, la distribuzione di Mn è centrata in p, ma al crescere di n diventa più concentrata attorno a p. Poni n = 50 e p = 0.5 ed esegui l'esperimento aggiornando ogni 10 replicazioni. Osserva la convergenza della frequenza relativa alla funzione di densità.

Simulazione 6. Nell' esperimento binomiale della moneta, seleziona la proporzione di teste. Poni n = 10 e p = 0.4. Simula 100 replicazioni, aggiornando ogni volta. Calcola la radice quadrata dell'errore quadratico medio per tutte le replicazioni, nel caso in cui Mn sia usato per stimare p. Tale numero è misura della qualità della stima.

Simulazione 7. Nell' esperimento binomiale della moneta, seleziona la proporzione di teste. Poni n = 10 e p = 0.4. Simula 100 replicazioni, aggiornando ogni volta. Calcola la radice quadrata dell'errore quadratico medio per tutte le replicazioni, nel caso in cui Mn sia usato per stimare p. Confronta i risultati con quelli dell'esercizio precedente.

Esercizio numerico 8. Sui dati sulla cicala, calcola la proporzione di femmine nel campione e la proporzione di femmine per ciascuna specie del campione. Pensi che queste proporzioni campionarie siano buone stime delle corrispondenti proporzioni nella popolazione?

Esercizio numerico 9. Sui dati M&M, raggruppa i pacchetti per creare un campione ampio di M&Ms. Calcola la proporzione di M&Ms rosse. Pensi che questa proporzione campionaria sia una buona stima della proporzione vera della popolazione?

Confronta il capitolo sulla stima intervallare per un diverso approccio al problema della stima di p.

Approssimazione normale

Il teorema limite centrale si applica alla proporzione di successi esattamente come al numero di successi.

Esercizio teorico 10. Mostra che la distribuzione della variabile standardizzata

(Mn - p) / [p(1 - p) / n]1/2.

converge alla distribuzione normale standardizzata al crescere del numero delle prove

Simulazione 11. Nell'esperimento binomiale della moneta, seleziona la proporzione di teste. Poni n = 30, p = 0.6. Simula 1000 replicazioni, aggiornando ogni 100. Calcola e confronta i seguenti valori:

  1. P(0.5 M30 0.7)
  2. La frequenza relativa dell'evento {0.5 M30 0.7}
  3. L'approssimazione normale a P(0.5 M30 0.7)

Un test d'ipotesi

A volta non siamo interessati a stimare p, ma a determinare se p è un certo valore o appartiene a un certo intervallo. In termini generici, prendiamo la decisione eseguendo n prove Bernoulliane, osservando il numero di successi e confrontando questa osservazione con quanto ci si sarebbe aspettati dalla distribuzione binomiale, date le assunzioni su p. In termini statistici, eseguiamo un test di ipotesi.

Per esempio, supponiamo di essere interessati a sapere se una moneta è bilanciata o no. Prenderemo la decisione basandoci su 10 lanci della moneta.

Esercizio teorico 12. Mostra che 10 lanci della moneta produrranno tra 3 e 7 teste l'89% delle volte.

Pertanto possiamo decidere di definire la moneta bilanciata se il numero di teste è tra 3 e 7. Se la moneta è davvero bilanciata, il test ci farà prendere la decisione corretta l'89% delle volte. L'11% delle volte concluderemo erroneamente che la moneta è sbilanciata; in termini statistici, si tratta di un errore di prima specie.

Esercizio teorico 13. Supponi che la moneta abbia probabilità di testa p riportata qui sotto. Col test appena specificato, trova la probabilità di concludere correttamente che la moneta è sbilanciata. Trova inoltre la probabilità di concludere erroneamente che la moneta è bilanciata; in termini statistici, si parla di errore di seconda specie.

  1. p = 0.6
  2. p = 0.7
  3. p = 0.8
  4. p = 0.9

Simulazione 14. Nell'esperimento della moneta binomiale, poni n = 10. Per ciascuno dei seguenti valori di p, simula 100 replicazioni, aggiornando ogni volta. A ciascuna esecuzione, esegui il test di ipotesi. Calcola la frequenza relativa delle decisioni corrette e degli errori:

  1. p = 0.5
  2. p = 0.6
  3. p = 0.7
  4. p = 0.7
  5. p = 0.9.

Esercizio teorico 15. Un candidato a una carica pubblica afferma di essere il preferito dal 40% degli elettori. Su un sondaggio di 100 elettori, però, solo 30 sono a favore del candidato. Credi all'affermazione del candidato? Calcola l'approssimazione normale alla probabilità che una variabile binomiale con n = 100 e p = 0.4 produca 30 o meno successi.