Supponiamo che X1, X2, ..., Xn sia un campione casuale della distribuzione normale con media µ e varianza d2. In questo paragrafo impareremo a costruire test di ipotesi per d. Gli strumenti fondamentali che utilizzeremo sono la media campionaria e la varianza campionaria, e le proprietà di queste statistiche nel caso della distribuzione normale. Questo paragrafo è parallelo a quello sulla Stima della varianza nel modello normale nel capitolo sulla stima intervallare.
La media µ avrà il ruolo di parametro di disturbo, nel senso che le procedure di test sono diverse a seconda che µ sia noto oppure no.
Assumeremo in primo luogo che la media µ sia nota, anche se questa assunzione è spesso poco realistica. In questo caso lo spazio parametrico è {d: d > 0} e le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è
V0 = (1 / d02)i = 1, ..., n (Xi - µ)2.
Nota che W2 = d02 V0 / n è lo stimatore naturale della varianza quando µ è noto.
1. Mostra che, se d0 = d, V0 ha distribuzione chi-quadro con n gradi di libertà
Consideriamo ora il caso più realistico in cui anche µ è ignoto. In questo caso, lo spazio parametrico sottostante è {(µ, d): µ appartiene a R, d > 0}, e tutte le ipotesi su d definiscono sottinsiemi di questo spazio. Una statistica test naturale è
V0 = (1 / d02)i = 1, ..., n (Xi - M)2.
dove M = (1 / n)i = 1, ..., n Xi è la media campionaria. Nota che S2 = d02 V0 / (n - 1) è la varianza campionaria.
2. Mostra che, se d0 = d, V0 ha distribuzione chi-quadro con n - 1 gradi di libertà.
I test di ipotesi per d funzionano nello stesso modo, sia µ noto oppure no; l'unica differenza sta nella definizione della statistica test V0 e nel numero dei gradi di libertà della distribuzione chi-quadro. Indicheremo con vk, p il quantile di ordine p della distribuzione chi-quadro con k gradi di libertà. Se µ è noto, avremo k = n; in caso contrario k = n - 1. Per dati valori di k e p, vk, p può essere ottenuto dalla tavola della distribuzione chi-quadro.
3. Mostra che, per H0: d = d0 contro H1: d d0, il seguente test ha livello di significatività r:
Rifiutare H0 se e solo se V0 > vk, 1 - r/2 o V0 < vk, r/2.
4. Prova che per H0: d d0 contro H1: d > d0, il seguente test ha livello di significatività r:
Rifiutare H0 se e solo se V0 > vk, 1 - r.
5. Mostra che per H0: d d0 versus H1: d < d0, il seguente test ha livello di significatività r:
Rifiutare H0 se e solo se V0 < vk, r.
6. Prova che, nei test degli esercizi 3, 4 e 5 non rifiutiamo H0 a livello di significatività a se e solo se la varianza test d02 giace nel corrispondente intervallo di confidenza a livello 1 - r.
Ovviamente, il risultato dell'esercizio 6 è un caso particolare dell'equivalenza tra test di ipotesi e stima intervallare che abbiamo discusso nell'introduzione.
Ricorda che la funzione di potenza per un test su d è Q(d) = P(Rifiutare H0 | d). Per i test presentati sopra, possiamo calcolare esplicitamente le funzioni di potenza in termini della funzione di ripartizione Fk della distribuzione chi-quadro con k gradi di libertà. Di nuovo, k = n se µ è nota e k = n - 1 altrimenti.
7. Per il test H0: d = d0 contro H1: d d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:
8. Per il test H0: d d0 contro H1: d > d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:
9. Per il test H0: d d0 contro H1: d < d0 al livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:
10. Prova che, in ciascun caso, il test per d è più potente quando µ è noto.
11. Nell'esperimento di test della varianza, seleziona la distribuzione normale a media 0, il test bidirezionale a livello di significatività 0.1, dimensione campionaria n = 10, e testa che la deviazione standard sia 1.0.
12. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda sinistra.
13. Nell'esperimento di test della varianza, ripeti l'esercizio 11 col test sulla coda destra.
14. Nell'esperimento di test della varianza, seleziona la distribuzione normale con µ = 0 e deviazione standard 2, intervallo di confidenza bidirezionale al livello 0.90, e dimensione campionaria n = 10. Simula 20 replicazioni, aggiornando ogni volta. Formula le ipotesi corrispondenti e il livello di significatività e per ogni replicazione riporta l'insieme di deviazioni standard test per cui l'ipotesi nulla sarebbe rifiutata.
15. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza inferiore.
16. Nell'esperimento di test della varianza, ripeti l'esercizio 14 col limite di confidenza superiore.
Anche quando la distribuzione sottostante non è normale, le procedure esaminate in questo paragrafo si possono utilizzare per sottoporre a test, approssimativamente, la varianza. Vedrai, nelle simulazioni che seguono, che questa procedura non è così robusta come quella relativa alla media. In ogni caso, se la distribuzione non è troppo difforme dalla normale, la procedura dà risultati soddisfacenti.
17. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1 (la deviazione standard è quindi 1). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.
18. Nell'esperimento di test della varianza, ripeti l'esercizio 17 con dimensione campionaria n = 20.
19. Nell'esperimento di test della varianza, seleziona la distribuzione gamma con parametro di forma 4 e parametro di scala 1 (la deviazione standard è quindi 2). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10.
20. Nell'esperimento di test della varianza, seleziona la distribuzione uniforme su (0, 4) (pertanto la deviazione standard vera è circa 1.15). Seleziona il test bidirezionale al livello di significatività 0.1 e con dimensione campionaria n = 10..
21. Utilizzando i dati di Michelson, esegui un test per vedere se la deviazione standard delle misurazioni della velocità della luce è inferiore a 80 km/sec, al livello di significatività di 0.1
22. Utilizzando i dati di Cavendish, esegui un test per vedere se la deviazione standard delle misurazioni è maggiore di 0.2, al livello di significativtà di 0.05
23. Utilizzando i dati di Short, esegui un test per vedere se la deviazione standard delle misurazioni della parallasse differisce da 0.7 secondi di grado, al livello di significatività di 0.1.
24. Utilizzando i dati di Fisher sugli iris, esegui i seguenti test, al livello di significatività di 0.1: