Laboratorio virtuale > Stima intervallare > 1 2 3 [4] 5 6

4.Stima del modello di Bernoulli


Concetti preliminari

Supponi che I1, I2, ..., In sia un campione casuale estratto da una distribuzione di Bernoulli con parametro ignoto p appartenente a (0, 1). Si tratta quindi di variabili casuali indipendenti che assumono valore 1 e 0, rispettivamente con probabilità p e 1 - p. Di solito, questo modello si presenta in una delle seguenti situazioni:

  1. Abbiamo un evento d'interesse con probabilità ignota p nel contesto di un esperimento semplice. Replichiamo l'esperimento n volte e poniamo Ii = 1 se e solo se l'evento si è verificato nell'i-esima prova.
  2. Abbiamo una popolazione di unità di tipo diverso; p è la proporzione (ignota) di unità di un particolare tipo. Estraiamo n unità dalla popolazione e poniamo Ii = 1 se e solo se l'i-esima unità è del tipo d'interesse. Se il campionamento è con reinserimento, queste variabili costituiscono un campione della distribuzione di Bernoulli. Se invece il campionamento avviene senza ripetizione, le varibili sono dipendenti, ma il modello di Bernoulli può essere comunque un'approssimazione. Per ulteriori dettagli su questi punti, vedi l'esperimento dell'urna.

In questo paragrafo, costruiremo intervalli di confidenza per p. Una trattazione parallela dei test nel modello di Bernoulli si trova nel capitolo sul test di ipotesi.

Intervalli di confidenza per p

Ricorda che media e varianza della distribuzione di Bernoulli valgono

E(I) = p, var(I) = p(1 - p).

Nota che la media campionaria M è la proporzione di unità (calcolata sul campione) del tipo di interesse. Per il teorema limite cenrale,

Z = (M - p) / [M(1 - M) / n]1/2

ha approssimativamente distribuzione normale standardizzata ed è quindi (approssimativamente) un elemento pivotale per p.

Esercizio teorico 1. Usa la variabile pivot Z per mostrare che intervallo di confidenza al livello 1 - r e limite di confidenza inferiore e superiore per p sono:

  1. [M - z1 - r/2 [M(1 - M) / n]1/2, M + z1 - r/2 [M(1 - M) / n]1/2].
  2. M + z1 - r [M(1 - M) / n]1/2.
  3. M - z1 - r [M(1 - M) / n]1/2.

La distribuzione di Z è prossima alla normale quando p è circa 1/2 e differisce dalla normale quando p è prossimo a 0 o 1 (cioè gli estremi).

Simulazione 2. Usa la simulazione dell'esperimento di stima della proporzione per impratichirti con questa procedura. Selexione diversi valori di p, livelli di confidenza, numerosità campionarie e tipi di intervallo. Per ciascuna configurazione, simula 1000 replicazioni aggiornando ogni 10. Osserva che l'intervallo di confidenza cattura con successo la deviazione standard se e solo se il valore della variabile pivot giace tra i quantili. Nota la dimensione e la posizione degli intervalli di confidenza e quanto bene la proporzione di intervalli "riusciti" approssima il livello di confidenza teorico.

Esercizio teorico 3. Prova che la varianza della distribuzione di Bernoulli è massima per p = 1/2, per cui la varianza massima è 1/4.

Esercizio teorico 4. Usa il risultato dell'esercizio precedente per mostrare che un intervallo di confidenza conservativo a livello 1 - r e limite di confidenza inferiore e superiore per p sono:

  1. [M - z1 - r/2 / (2n1/2), M + z1 - r/2 / (2n1/2)].
  2. M + z1 - r / (2n1/2).
  3. M - z1 - r / (2n1/2).

Pertanto gli intervalli di confidenza conservativi sono più grandi di quelli che si ottengono utilizzando la prima procedura. La stima conservativa può essere utilizzata per il disegno dell'esperimento.

Esercizio teorico 5. Supponiamo che p debba essere stimato con margine d'errore E e con confidenza 1 - r. Mostra che una stima conservativa della dimensione campionaria è

n = ceil[(z / 2E)2]

dove z = z1 - r/2 per un intervallo bilaterale e z = z1 - r per un intervallo unilaterale.

Esercizio teorico 6. Su un campione di 1000 votanti in un certo collegio, 427 preferiscono il candidato X. Costruisci l'intervallo di confidenza bilaterale al 95% per la proporzione degli elettori che preferiscono X.

Esercizio teorico 7. Si lancia una moneta 500 volte e si ottengono 302 teste. Costruisci un intervallo di confidenza al 95% per la probabilità della testa. Credi che la moneta sia equilibrata?

Esercizio teorico 8. Si testa un campione di 400 chip di memoria da una certa linea produttiva, e 30 risultano difettosi. Costruisci l'intervallo di confidenza bilaterale conservativo al 90% per la proporzione di chip difettosi.

Esercizio teorico 9. Un'industria farmaceutica vuole stimare la proporzione di soggetti che manifesteranno effetti collaterali assumendo un nuovo farmaco. La società vuole un intervallo bilaterale con margine d'errore 0.03 e confidenza del 95%. Quanto dovrebbe essere grande il campione?

Esercizio teorico 10. Un'agenzia pubblicitaria vuole trovare il limite di confidenza inferiore, al 99%, per la proporzione di dentisti che consigliano una certa marca di dentifricio. Il margine d'errore desiderato è 0.02. Quanto dev'essere grande il campione?