Test per la varianza nel modello normale

3. Test per la varianza nel modello normale

Concetti preliminari

Supponiamo che X₁, X₂, ..., X_n sia un campione casuale della distribuzione normale con media µ e varianza d². In questo paragrafo impareremo a costruire test di ipotesi per d. Gli strumenti fondamentali che utilizzeremo sono la media campionaria e la varianza campionaria, e le proprietà di queste statistiche nel caso della distribuzione normale. Questo paragrafo è parallelo a quello sulla Stima della varianza nel modello normale nel capitolo sulla stima intervallare.

La media µ avrà il ruolo di parametro di disturbo, nel senso che le procedure di test sono diverse a seconda che µ sia noto oppure no.

Assumeremo in primo luogo che la media µ sia nota, anche se questa assunzione è spesso poco realistica. In questo caso lo spazio parametrico è {d: d > 0} e le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è

V₀ = (1 / d₀²)_{i
= 1, ..., n} (X_i - µ)².

Nota che W² = d₀² V₀ / n è lo stimatore naturale della varianza quando µ è noto.

$Esercizio teorico$ 1. Mostra che, se d₀ = d, V₀ ha distribuzione chi-quadro con n gradi di libertà

Consideriamo ora il caso più realistico in cui anche µ è ignoto. In questo caso, lo spazio parametrico sottostante è {(µ, d): µ appartiene a R, d > 0}, e tutte le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è

V₀ = (1 / d₀²)_{i
= 1, ..., n} (X_i - M)².

dove M = (1 / n)_{i
= 1, ..., n}X_i è la media campionaria. Nota che S² = d₀² V₀ / (n - 1) è la varianza campionaria.

$Esercizio teorico$ 2. Mostra che, se d₀ = d, V₀ ha distribuzione chi-quadro con n - 1 gradi di libertà.

Test di ipotesi

I test di ipotesi per d funzionano nello stesso modo, sia µ noto oppure no; l'unica differenza sta nella definizione della statistica test V₀ e nel numero dei gradi di libertà della distribuzione chi-quadro. Indicheremo con v_{k, p} il quantile di ordine p della distribuzione chi-quadro con k gradi di libertà. Se µ è noto, avremo k = n; in caso contrario k = n - 1. Per dati valori di k e p, v_{k, p} può essere ottenuto dalla tavola della distribuzione chi-quadro.

$Esercizio teorico$ 3. Mostra che, per H₀: d = d₀ contro H₁: d d₀, il seguente test ha livello di significatività r:

Rifiutare H₀ se e solo se V₀ > v_k_{,
1 -}_r_/2 o V₀ < v_k_, _r_/2.

$Esercizio teorico$ 4. Prova che per H₀: d d₀ contro H₁: d > d₀, il seguente test ha livello di significatività r:

Rifiutare H₀ se e solo se V₀ > v_k_{,
1 -}_r.

$Esercizio teorico$ 5. Mostra che per H₀: d d₀ versus H₁: d < d₀, il seguente test ha livello di significatività r:

Rifiutare H₀ se e solo se V₀ < v_k_{,
r}.

$Esercizio teorico$ 6. Prova che, nei test degli esercizi 3, 4 e 5 non rifiutiamo H₀ a livello di significatività a se e solo se la varianza test d₀² giace nel corrispondente intervallo di confidenza a livello 1 - r.

Ovviamente, il risultato dell'esercizio 6 è un caso particolare dell'equivalenza tra test di ipotesi e stima intervallare che abbiamo discusso nell'introduzione.

Curve di potenza

Ricorda che la funzione di potenza per un test su d è Q(d) = P(Rifiutare H₀ | d). Per i test presentati sopra, possiamo calcolare esplicitamente le funzioni di potenza in termini della funzione di ripartizione Fk della distribuzione chi-quadro con k gradi di libertà. Di nuovo, k = n se µ è nota e k = n - 1 altrimenti.

$Esercizio teorico$ 7. Per il test H₀: d = d₀ contro H₁: d d₀ al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

Q(d) = 1 - F_k[d₀² v_k_{,
1 -}_r_/2 / d²] + F_k[d₀² v_k_, _r_/2 / d²]
Q(d) è decrescente per d < d₀ ed è crescente per d > d₀.
Q(d₀) = r.
Q(d) 1 per d 0⁺ e Q(d) 1 per d .

$Esercizio teorico$ 8. Per il test H₀: d d₀ contro H₁: d > d₀ al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

Q(d) = 1 - F_k[d₀² v_k, 1 - a / d²]
Q(d) è crescente per d > 0.
Q(d₀) = a.
Q(d) 0 per d 0⁺ e Q(d) 1 per d .

$Esercizio teorico$ 9. Per il test H₀: d d₀ contro H₁: d < d₀ al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

Q(d) = F_k[d₀² v_k_,_r / d²]
Q(d) è decrescente per d > 0.
Q(d₀) = r.
Q(d) 1 as d 0⁺ e Q(d) 0 per d .

$Esercizio teorico$ 10. Prova che, in ciascun caso, il test per d è più potente quando µ è noto.

Simulazioni

11. Nell'esperimento di test della varianza, seleziona la distribuzione normale a media 0, il test bidirezionale a livello di significatività 0.1, dimensione campionaria n = 10, e testa che la deviazione standard sia 1.0.

Per ogni valore vero della deviazione standard 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H₀.
Quando la deviazione standard vera è 1.0, confronta la frequenza relativa di rifiuto di H₀ col livello di significatività.
Utilizzando le frequenze relative in (a), traccia la curva di potenza empirica.

12. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda sinistra.

13. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda destra.

14. Nell'esperimento di test della varianza, seleziona la distribuzione normale con µ = 0 e deviazione standard 2, intervallo di confidenza bidirezionale al livello 0.90, e dimensione campionaria n = 10. Simula 20 replicazioni, aggiornando ogni volta. Formula le ipotesi corrispondenti e il livello di significatività e per ogni replicazione riporta l'insieme di deviazioni standard test per cui l'ipotesi nulla sarebbe rifiutata.

15. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza inferiore.

16. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza superiore.

Distribuzioni non normali

Anche quando la distribuzione sottostante non è normale, le procedure esaminate in questo paragrafo si possono utilizzare per sottoporre a test, approssimativamente, la varianza. Vedrai, nelle simulazioni che seguono, che questa procedura non è così robusta come quella relativa alla media. In ogni caso, se la distribuzione non è troppo difforme dalla normale, la procedura dà risultati soddisfacenti.

17. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1 (la deviazione standard è quindi 1). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.

Per ciascun valore di deviazione standard test 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H₀.
Quando la deviazion standard test è 1.0, confronta la frequenza relativa di (a) col livello di significatività.

18. Nell'esperimento di test della varianza, ripeti l'esercizio 17 con dimensione campionaria n = 20.

19. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 4 e parametro di scala 1 (la deviazione standard è quindi 2). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.

Per ciascun valore di deviazione standard test 1.6, 1.8, 2.0, 2.2, 2.4, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H₀.
Quando la deviazion standard test è 2.0, confronta la frequenza relativa di (a) col livello di significatività.

20. Nell'esperimento di test della varianza, seleziona la distribuzione uniforme su (0, 4) (pertanto la deviazione standard vera è circa 1.15). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10..

Per ciascun valore di deviazione standard test 0.69, 0.92, 1.15, 1.39, 1.62, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H₀.
Quando la deviazion standard test è 1.15, confronta la frequenza relativa di (a) col livello di significatività.

Esercizi numerici

21. Utilizzando i dati di Michelson, esegui un test per vedere se la deviazione standard delle misurazioni della velocità della luce è inferiore a 80 km/sec, al livello di significatività di 0.1

Assumendo che µ sia il "valore vero."
Assumendo che µ sia ignoto.

22. Utilizzando i dati di Cavendish, esegui un test per vedere se la deviazione standard delle misurazioni è maggiore di 0.2, al livello di significativtà di 0.05

Assumendo che µ sia il "valore vero."
Assumendo che µ sia ignoto.

23. Utilizzando i dati di Short, esegui un test per vedere se la deviazione standard delle misurazioni della parallasse differisce da 0.7 secondi di grado, al livello di significatività di 0.1.

Assumendo che µ sia il "valore vero."
Assumendo che µ sia ignoto.

24. Utilizzando i dati di Fisher sugli iris, esegui i seguenti test, al livello di significatività di 0.1:

La deviazione standard della lunghezza dei petali della Setosa è diversa da 2 mm.
La deviazione standard della lunghezza dei petali della Verginica è maggiore di 5 mm.
La deviazione standard della lunghezza dei petali della Versicolor è minore di 5.5 mm.