3. Test per la varianza nel modello normale


Concetti preliminari

Supponiamo che X1, X2, ..., Xn sia un campione casuale della distribuzione normale con media µ e varianza d2. In questo paragrafo impareremo a costruire test di ipotesi per d. Gli strumenti fondamentali che utilizzeremo sono la media campionaria e la varianza campionaria, e le proprietà di queste statistiche nel caso della distribuzione normale. Questo paragrafo è parallelo a quello sulla Stima della varianza nel modello normale nel capitolo sulla stima intervallare.

La media µ avrà il ruolo di parametro di disturbo, nel senso che le procedure di test sono diverse a seconda che µ sia noto oppure no.

Assumeremo in primo luogo che la media µ sia nota, anche se questa assunzione è spesso poco realistica. In questo caso lo spazio parametrico è {d: d > 0} e le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è

V0 = (1 / d02)sommatoriai = 1, ..., n (Xi - µ)2.

Nota che W2 = d02 V0 / n è lo stimatore naturale della varianza quando µ è noto.

Esercizio teorico 1. Mostra che, se d0 = d, V0 ha distribuzione chi-quadro con n gradi di libertà

Consideriamo ora il caso più realistico in cui anche µ è ignoto. In questo caso, lo spazio parametrico sottostante è {(µ, d): µ appartiene a R, d > 0}, e tutte le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è

V0 = (1 / d02)sommatoriai = 1, ..., n (Xi - M)2.

dove M = (1 / n)sommatoriai = 1, ..., n Xi è la media campionaria. Nota che S2 = d02 V0 / (n - 1) è la varianza campionaria.

Esercizio teorico 2. Mostra che, se d0 = d, V0 ha distribuzione chi-quadro con n - 1 gradi di libertà.

Test di ipotesi

I test di ipotesi per d funzionano nello stesso modo, sia µ noto oppure no; l'unica differenza sta nella definizione della statistica test V0 e nel numero dei gradi di libertà della distribuzione chi-quadro. Indicheremo con vk, p il quantile di ordine p della distribuzione chi-quadro con k gradi di libertà. Se µ è noto, avremo k = n; in caso contrario k = n - 1. Per dati valori di k e p, vk, p può essere ottenuto dalla tavola della distribuzione chi-quadro.

Esercizio teorico 3. Mostra che, per H0: d = d0 contro H1: d <> d0, il seguente test ha livello di significatività r:

Rifiutare H0 se e solo se V0 > vk, 1 - r/2 o V0 < vk, r/2.

Esercizio teorico 4. Prova che per H0: d <= d0 contro H1: d > d0, il seguente test ha livello di significatività r:

Rifiutare H0 se e solo se V0 > vk, 1 - r.

Esercizio teorico 5. Mostra che per H0: d >= d0 versus H1: d < d0, il seguente test ha livello di significatività r:

Rifiutare H0 se e solo se V0 < vk, r.

Esercizio teorico 6. Prova che, nei test degli esercizi 3, 4 e 5 non rifiutiamo H0 a livello di significatività a se e solo se la varianza test d02 giace nel corrispondente intervallo di confidenza a livello 1 - r.

Ovviamente, il risultato dell'esercizio 6 è un caso particolare dell'equivalenza tra test di ipotesi e stima intervallare che abbiamo discusso nell'introduzione.

Curve di potenza

Ricorda che la funzione di potenza per un test su d è Q(d) = P(Rifiutare H0 | d). Per i test presentati sopra, possiamo calcolare esplicitamente le funzioni di potenza in termini della funzione di ripartizione Fk della distribuzione chi-quadro con k gradi di libertà. Di nuovo, k = n se µ è nota e k = n - 1 altrimenti.

Esercizio teorico 7. Per il test H0: d = d0 contro H1: d <> d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

  1. Q(d) = 1 - Fk[d02 vk, 1 - r/2 / d2] + Fk[d02 vk, r/2 / d2]
  2. Q(d) è decrescente per d < d0 ed è crescente per d > d0.
  3. Q(d0) = r.
  4. Q(d) converge a 1 per d converge a 0+ e Q(d) converge a 1 per d converge a infinito.

Esercizio teorico 8. Per il test H0: d <= d0 contro H1: d > d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

  1. Q(d) = 1 - Fk[d02 vk, 1 - a / d2]
  2. Q(d) è crescente per d > 0.
  3. Q(d0) = a.
  4. Q(d) converge a 0 per d converge a 0+ e Q(d) converge a 1 per d converge a infinito.

Esercizio teorico 9. Per il test H0: d >= d0 contro H1: d < d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

  1. Q(d) = Fk[d02 vk, r / d2]
  2. Q(d) è decrescente per d > 0.
  3. Q(d0) = r.
  4. Q(d) converge a 1 as d converge a 0+ e Q(d) converge a 0 per d converge a infinito.

Esercizio teorico 10. Prova che, in ciascun caso, il test per d è più potente quando µ è noto.

Simulazioni

Simulazione 11. Nell'esperimento di test della varianza, seleziona la distribuzione normale a media 0, il test bidirezionale a livello di significatività 0.1, dimensione campionaria n = 10, e testa che la deviazione standard sia 1.0.

  1. Per ogni valore vero della deviazione standard 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H0.
  2. Quando la deviazione standard vera è 1.0, confronta la frequenza relativa di rifiuto di H0 col livello di significatività.
  3. Utilizzando le frequenze relative in (a), traccia la curva di potenza empirica.

Simulazione 12. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda sinistra.

Simulazione 13. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda destra.

Simulazione 14. Nell'esperimento di test della varianza, seleziona la distribuzione normale con µ = 0 e deviazione standard 2, intervallo di confidenza bidirezionale al livello 0.90, e dimensione campionaria n = 10. Simula 20 replicazioni, aggiornando ogni volta. Formula le ipotesi corrispondenti e il livello di significatività e per ogni replicazione riporta l'insieme di deviazioni standard test per cui l'ipotesi nulla sarebbe rifiutata.

Simulazione 15. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza inferiore.

Simulazione 16. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza superiore.

Distribuzioni non normali

Anche quando la distribuzione sottostante non è normale, le procedure esaminate in questo paragrafo si possono utilizzare per sottoporre a test, approssimativamente, la varianza. Vedrai, nelle simulazioni che seguono, che questa procedura non è così robusta come quella relativa alla media. In ogni caso, se la distribuzione non è troppo difforme dalla normale, la procedura dà risultati soddisfacenti.

Simulazione 17. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1 (la deviazione standard è quindi 1). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.

  1. Per ciascun valore di deviazione standard test 0.7, 0.8, 0.9, 1.0, 1.1, 1.2, 1.3, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H0.
  2. Quando la deviazion standard test è 1.0, confronta la frequenza relativa di (a) col livello di significatività.

Simulazione 18. Nell'esperimento di test della varianza, ripeti l'esercizio 17 con dimensione campionaria n = 20.

Simulazione 19. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 4 e parametro di scala 1 (la deviazione standard è quindi 2). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.

  1. Per ciascun valore di deviazione standard test 1.6, 1.8, 2.0, 2.2, 2.4, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H0.
  2. Quando la deviazion standard test è 2.0, confronta la frequenza relativa di (a) col livello di significatività.

Simulazione 20. Nell'esperimento di test della varianza, seleziona la distribuzione uniforme su (0, 4) (pertanto la deviazione standard vera è circa 1.15). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10..

  1. Per ciascun valore di deviazione standard test 0.69, 0.92, 1.15, 1.39, 1.62, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa dei rifiuti di H0.
  2. Quando la deviazion standard test è 1.15, confronta la frequenza relativa di (a) col livello di significatività.

Esercizi numerici

Esercizio numerico 21. Utilizzando i dati di Michelson, esegui un test per vedere se la deviazione standard delle misurazioni della velocità della luce è inferiore a 80 km/sec, al livello di significatività di 0.1

  1. Assumendo che µ sia il "valore vero."
  2. Assumendo che µ sia ignoto.

Esercizio numerico 22. Utilizzando i dati di Cavendish, esegui un test per vedere se la deviazione standard delle misurazioni è maggiore di 0.2, al livello di significativtà di 0.05

  1. Assumendo che µ sia il "valore vero."
  2. Assumendo che µ sia ignoto.

Esercizio numerico 23. Utilizzando i dati di Short, esegui un test per vedere se la deviazione standard delle misurazioni della parallasse differisce da 0.7 secondi di grado, al livello di significatività di 0.1.

  1. Assumendo che µ sia il "valore vero."
  2. Assumendo che µ sia ignoto.

Esercizio numerico 24. Utilizzando i dati di Fisher sugli iris, esegui i seguenti test, al livello di significatività di 0.1:

  1. La deviazione standard della lunghezza dei petali della Setosa è diversa da 2 mm.
  2. La deviazione standard della lunghezza dei petali della Verginica è maggiore di 5 mm.
  3. La deviazione standard della lunghezza dei petali della Versicolor è minore di 5.5 mm.