Laboratorio virtuale > Stima intervallare > 1 2 [3] 4 5 6

3. Stima della varianza nel modello normale


Concetti preliminari

Supponiamo che X1, X2, ..., Xn sia un campione casuale della distribuzione normale con media µ e varianza d2. In questo paragrafo impareremo a costruire intervalli di confidenza per d2; è questo uno dei casi più rilevanti di stima intervallare. Una trattazione parallela, relativa ai test per la varianza nel modello normale si trova nel capitolo sul test di ipotesi .

Al solito, costruiremo gli intervalli di confidenza cercando elementi pivotali per d2. Il metodo di costruzione dipende dal fatto che la media µ sia nota oppure no; µ è pertanto un termine di disturbo ai fini della stima di d2. Ricordiamo inoltre che la famiglia normale è una famiglia di posizione e scala.

Intervalli di confidenza per d2 con µ noto

Supponiamo, per iniziare, che µ sia noto, anche se questa assunzione è di solito irrealistica nelle applicazioni pratiche. Ricorda che, in questo caso, lo stimatore naturale di d2 is

W2 =(1 / n) sommatoriai = 1, ..., n (Xi - µ)2.

Ricorda inoltre che V = nW2 / d2 ha distribuzione chi-quadro con n gradi di libertà, ed è pertanto variabile pivot per d2. Per k > 0 e p appartenente a (0, 1), sia vk, p il quantile di ordine p di una distribuzione chi-quadro con k gradi di libertà. Per valori dati di k, p e n, vk, p può essere ricavato dalla tavola della distribuzione chi-quadro o dall'applet quantile.

Esercizio teorico 1. Usa la variabile pivot V per mostrare che intervallo di confidenza al livello 1 - r e limite di confidenza inferiore e superiore per d2 sono:

  1. [nW2 / vn, 1 - r/2, nW2 / vn, r/2].
  2. nW2 / vn, r.
  3. nW2 / vn, 1 - r.

Osserva che abbiamo usato code bilanciate nella costruzione dell'intervallo bidirezionale, ma l'intervallo non è simmetrico rispetto alla varianza campionaria W2 (a differenza degli intervalli di confidenza per µ, che sono sempre simmetrici rispetto alla media campionaria M).

Intervalli di confidenza per d2 con µ ignoto

Consideriamo ora il caso, più realistico, in cui µ e d2 sono entrambi ignoti. In questo caso, la varianza campionaria è

S2 = [1 / (n - 1)] sommatoriai = 1, ..., n (Xi - M)2.

dove M = (1 / n) sommatoriai = 1, ..., n Xi è la media campionaria. Ricorda che

V = (n - 1)S2 / d2

ha distribuzione chi-quadro con n - 1 gradi di libertà, ed è quindi variabile pivot per d2.

Esercizio teorico 2. Usa la variabile pivot V per mostrare che intervallo di confidenza al livello 1 - r e limite di confidenza inferiore e superiore per d2 sono:

  1. [(n - 1)S2 / vn-1, 1 - r/2, (n - 1)S2 / vn-1, r/2].
  2. (n - 1)S2 / vn-1, r.
  3. (n - 1)S2 / vn-1, 1 - r.

Simulazione 3. Usa l' esperimento di stima della varianza per impratichirti con l'argomento. Seleziona la distribuzione normale. Usa diversi valori dei parametri, livelli di confidenza, numerosità campionarie e tipi di intervallo. Per ciascuna configurazione, simula 1000 replicazioni aggiornando ogni 10. Osserva che l'intervallo di confidenza cattura con successo la deviazione standard se e solo se il valore della variabile pivot giace tra i quantili. Nota la dimensione e la posizione degli intervalli di confidenza e quanto bene la proporzione di intervalli "riusciti" approssima il livello di confidenza teorico.

Distribuzioni non-normali

Una delle assunzioni fondamentali che abbiamo fatto finora è che la distribuzione sottostante sia normale. Ovviamente, nelle applicazioni pratiche, non possiamo sapere granché della distribuzione che genera i dati. Tuttavia, le procedure presentate possono essere utilizzate comunque per costruire intervalli di confidenza approssimati per la varianza. Vedrai, nelle simulazioni seguenti, che questa procedura non è così robusta come quella ricavata per la media. Comunque, se la distribuzione non è troppo diversa dalla normale, di solito si ottengono risultati soddisfacenti.

Simulazione 4. Nell'esperimento di stima della varianza, seleziona la distribuzione gamma. Usa diversi valori dei parametri, livelli di confidenza, numerosità campionarie e tipi di intervallo. Per ciascuna configurazione, simula 1000 replicazioni aggiornando ogni 10. Nota la dimensione e la posizione degli intervalli di confidenza e quanto bene la proporzione di intervalli "riusciti" approssima il livello di confidenza teorico.

Simulazione 5. Nell'esperimento di stima della varianza, seleziona la distribuzione uniforme. Usa diversi valori dei parametri, livelli di confidenza, numerosità campionarie e tipi di intervallo. Per ciascuna configurazione, simula 1000 replicazioni aggiornando ogni 10. Nota la dimensione e la posizione degli intervalli di confidenza e quanto bene la proporzione di intervalli "riusciti" approssima il livello di confidenza teorico.

Esercizi numerici

Esercizio teorico 6. Mostra che, per entrambe le procedure, intervallo di confidenza a livello 1 - a e limiti superiore e inferiore per d si possono ottenere prendendo la radice quadrata dei corrispondenti valori per d2.

Esercizio teorico 7. Supponi che il peso di un pacchetto di patatine (in grammi) sia una variabile casuale con media µ e varianza d2, entrambe ignote. Un campione di 75 pacchetti ha media 250 e deviazione standard 10. Costruisci un intervallo di confidenza al 90% per d.

Esercizio teorico 8. In un'azienda di telemarketing, la durata di una telefonata (in secondi) è una variabile casuale con media µ e varianza d2, entrambe ignote. Un campione di 50 telefonatè ha durata media 300 e deviazione standard 30. Costruisci l'intervallo di confidenza monodirezionale superiore (al 95%) per d.

Esercizio numerico 9. Utilizzando i dati di Michelson, costruisci l'intervallo di confidenza bidirezionale al 95%, e quelli monodirezionali inferiore e superiore per la deviazione standard della velocità della luce. Assumi che il "valore vero" sia la media nota.

Esercizio numerico 10. Utilizzando i dati di Cavendish, costruisci l'intervallo di confidenza bidirezionale al 95%, e quelli monodirezionali inferiore e superiore per la deviazione standard della densità della terra. Assumi che il "valore vero" sia la media nota.

Esercizio numerico 11. Utilizzando i dati di Short, costruisci l'intervallo di confidenza bidirezionale al 95%, e quelli monodirezionali inferiore e superiore per la deviazione standard della parallasse del sole. Assumi che il "valore vero" sia la media nota.

Esercizio numerico 12. Per la lunghezza dei petali di Setosa, sui dati di Fisher sugli iris, costruisci l'intervallo di confidenza al 90% per d.