Test per la media nel modello normale

2. Test per la media nel modello normale

Concetti preliminari

Supponiamo che X₁, X₂, ..., X_n sia un campione casuale della distribuzione normale con media µ e varianza d². In questo paragrafo impareremo a costruire test di ipotesi per µ, cioè una delle situazioni più rilevanti. Questo paragrafo è parallelo a quello sulla stima della media nel modello normale nel capitolo sulla stima intervallare.

La procedura di test è diversa a seconda che si conosca oppure no d; per questa ragione, d rappresenta un parametro di disturbo relativamete al problema del test per µ. Gli elementi chiave nella costruzione del test sono la media campionaria e la varianza campionaria

M = (1 / n)_{i
= 1, ..., n} X_i.
S² = [1 / (n - 1)_{i
= 1, ..., n} (X_i - M)².

e le proprietà di queste statistiche quando la distribuzione è normale.

Test per µ con `d` noto

Supponiamo in primo luogo che la deviazione standard d sia nota; questa assunzione è di solito artificiale, ma non sempre (vedi l'esercizio 23). Lo spazio parametrico è quindi {µ: µ appartiene a R} e ogni ipotesi definisce sottinsiemi di questo spazio. La statistica test che utilizzeremo è

Z₀ = (M - µ₀) / (d / n^1/2).

Nota che Z₀ è la distanza della media campionaria da µ₀ in unità di deviazioni standard. Pertanto, Z₀ dovrebbe fornire buone informazioni sulle ipotesi relative a µ₀.

$Esercizio teorico$ 1. Dimostra che Z₀ ha distribuzione normale con

E(Z₀) = (µ - µ₀) / (d / n^1/2).
var(Z₀) = 1.

In particolare, se µ = µ₀, Z₀ è lo standard score e ha distribuzione normale standardizzata. Al solito, per p appartenente a (0, 1), indicheremo con z_p il quantile di ordine p della distribuzione normale standardizzata. Per dati valori di p, gli z_p possono essere ricavati dall'applet quantile.

$Esercizio teorico$ 2. Prova che i seguenti test hanno livello di significatività r:

Rifiutare H₀: µ = µ₀ contro H₁: µ µ₀ se e solo se Z₀ > z_{1 -} _r_/2 o Z₀ < -z_{1
-}_r_/2.
Rifiutare H₀: µ µ₀ contro H₁: µ > µ₀ se e solo se Z₀ > z_{1 -}_r.
Rifiutare H₀: µ µ₀ contro H₁: µ < µ₀ se e solo se Z₀ < -z_{1 -}_r.

L'esercizio seguente è un caso particolare dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo esaminato nell'introduzione.

$Esercizio teorico$ 3. Per ognuno dei test presentati nell'esercizio 2, prova che non rifiutiamo H₀ a livello di significatività a se e solo se µ₀ appartiene al corrispondente intervallo di confidenza al livello 1 - r.

Il p-value di questi test può essere calcolato in termini della funzione di ripartizione della normale standardizzata G.

$Esercizio teorico$ 4. Dimostra che i p-values dei test dell'esercizio 2 sono

2[1 - G(|Z₀|)]
1 - G(Z₀)
G(Z₀)

5. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20, e µ₀ = 0. Per ciascuno dei seguenti tre test:

Per µ = -1.0, -0.75, -0.5, 0.25, 0, 0.25, 0.5, 0.75, 1, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa del rifiuto di H₀ per ciascun valore.
Per µ = 0, confronta la frequenza relativa col livello di significatività.
Basandoti su queste frequenze relative, disegna la funzione di potenza empirica.

6. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ₀ per cui si rifiuterebbe l'ipotesi nulla.

Curve di potenza

Ricorda che la funzione di potenza per un test su µ è Q(µ) = P(Rifiuta H₀ | µ). Per i test dell'esercizio 2, possiamo calcolare esplicitamente le funzioni di potenza in termine della funzione di ripartizione G della distribuzione normale standardizzata.

$Esercizio teorico$ 7. Per il test H₀: µ = µ₀ contro H₁: µ µ₀ a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

Q(µ) = G[-z_{1 -} _r_/2 + (µ - µ₀) / (d / n^1/2)] + G[-z_{1 -} _r_/2 - (µ - µ₀) / (d / n^1/2)]
Q(µ) è simmetrico attorno a µ₀.
Q(µ) è decrescente per µ < µ₀ e crescente per µ > µ₀.
Q(µ₀) = r.
Q(µ) 1 per µ e Q(µ) 1 per µ -.

$Esercizio teorico$ 8. Per il test H₀: µ µ₀ contro H₁: µ > µ₀ a livello di significatività a, prova i seguenti risultati e traccia il grafico di Q.

Q(z) = G[-z_{1 -}_r + (µ - µ₀) / (d / n^1/2)]
Q è crescente
Q(µ₀) = r.
Q(µ) 0 per µ - e G(µ) 1 per µ .

$Esercizio teorico$ 9. Per il test H₀: µ µ₀ contro H₁: µ < µ₀ a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

Q(z) = G[-z_{1 - a} - (µ - µ₀) / (d / n^1/2)]
Q è decrescente
Q(µ₀) = r.
Q(µ) 1 per µ - e G(µ) 0 per µ .

$Esercizio teorico$ 10. Prova che, per ciascuno dei tre test, incrementare la dimensione campionaria n o decrementare la deviazione standard d restituisce un test uniformemente più potente.

Test distorti

Per l'ipotesi H₀: µ = µ₀ contro H₁: µ µ₀, il test bidirezionale simmetrico dell'esercizio 2 è quello più utilizzato, ma non l'unico. Negli esercizi seguenti, analizzeremo la potenza dei test non simmetrici. Per p appartenente a (0, 1) considera il test

Rifiutare H₀ se e solo se Z₀ > z_{1
- pr} o Z₀ < z_{(1 - p)}_r.

Nota che, quando p = 1/2, il test concorda con quello simmetrico presentato nell'esercizio 2.

$Esercizio teorico$ 11. Mostra che il test ha livello di significatività a per ogni p appartenente a (0, 1).

$Esercizio teorico$ 12. Prova che la funzione di potenza Q del test soddisfa le proprietà seguenti e tracciane il grafico:

Q(µ) = G[-z_{1 - pr} + (µ - µ₀) / (d / n^1/2)] + G[z_{(1 - p)}_r - (µ - µ₀) / (d / n^1/2)]
Q(µ) decresce per µ < m e cresce per µ > m dove m = µ₀ + (z_{1 - pr} + z_{(1 -
p)}_r) n^1/2 / (2d).
Q(µ₀) = a.
Q(µ) 1 per µ e Q(µ) 1 per µ -.

$Esercizio teorico$ 13. Prova che, se p cresce, il test diventa più potente per µ > µ₀ e meno potente per µ < µ₀.

Disegno di esperimenti

In molti casi, il primo passo è pianificare l'esperimento in modo che il livello di significatività sia r e che il test abbia una certa potenza per una data alternativa.

$Esercizio teorico$ 14. Per un test monodirezionale, dimostra che la dimensione camopionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ₁ è

n = (z_{1 -} _r_/2 + z_{1 -}_s)² d² / (µ₁ - µ₀)².

Suggerimento: Poni la funzione di potenza uguale a 1 - s e risolvi rispetto a n.

$Esercizio teorico$ 15. Per un test bidirezionale, mostra che la dimensione campionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ₁ è approssimativamente

n = (z_{1 -}_r + z_{1 -}_s)² d² / (µ₁ - µ₀)².

Suggerimento: Nella funzione di potenza per il test bidirezionale, trascura il primo termine se µ₁ < µ₀ e il secondo se µ₁ > µ₀.

Test per µ con `d` ignoto

Consideriamo ora il caso, più realistico, in cui sia d che µ sono ignoti. In questo caso, lo spazio parametrico è {(µ, d): µ appartiene a R, d > 0} e tutte le ipotesi definiscono sottinsiemi di questo spazio. La statistica test di base che useremo per i test su µ è

T₀ = (M - µ₀) / (S / n^1/2).

Ricorda che, se µ = µ₀, T₀ ha distribuzione t di Student con n - 1 gradi di libertà; se µ µ₀, la distribuzione di T₀ è detta distribuzione t non centrata. Al solito, t_{k, p} indicherà il quantile di ordine p della distribuzione t con k gradi di libertà.

$Esercizio teorico$ 16. Prova che i test seguenti hanno livello di significatività r.

Rifiutare H₀: µ = µ₀ contro H₁: µ µ₀ se e solo se T₀ > t_n _{- 1, 1 -} _r_/2 o T₀ < -t_n _{- 1, 1 -}_r_/2.
Rifiutare H₀: µ µ₀ contro H₁: µ > µ₀ se e solo se T₀ > t_n _{- 1, 1 -}_r.
Rifiutare H₀: µ µ₀ contro H₁: µ < µ₀ se e solo se T₀ < -t_n _{- 1, 1 -}_r.

Ricorda, di nuovo, il paragrafo sulla stima della media, nel capitolo sulla stima intervallare. L'esercizio seguente è un caso speciale dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo già discusso nell'introduzione.

$Esercizio teorico$ 17. Per ciascuno dei test dell'esercizio 2, mostra che non rifiutiamo H₀ a livello di significatività a se e solo se µ₀ giace nel corrispondente intervallo di confidenza al livello 1 - r.

Il p-value di questi test può essere calcolato in termini della funzione di ripartizione G_n - 1 della distribuzione t con n - 1 gradi di libertà.

$Esercizio teorico$ 18. Prova che i p-value dei test dell'esercizio 16 sono

2[1 - G_n - 1(|T₀|)]
1 - G_n - 1(T₀)
G_n - 1(T₀)

19. Nell'esperimento del test della media, assicurati che siano selezionati S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20 e µ₀ = 0. Per ciascuno dei tre test:

Per µ = -1, -0.75, -0.5, -0.25, 0, 0.25, 0.5, 0.75, 1, simula 1000 replicazioni, aggiornando ogni 10, e osserva la freuenza relativa del rifiuto di H₀ per ciascun valore.
Per µ = 0, confronta la frequenza relativa col livello di significatività.
Basandoti su queste frequenze relative, disegna la curva di potenza empirica.

20.Nell'esperimento del test della media, assicurati che sia selezionato S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ₀ per cui si rifiuterebbe l'ipotesi nulla.

La funzione di potenza per i test dell'esercizio 16 possono essere calcolati esplicitamente in termini della funzione di ripartizione della distribuzione t non centrata. Qualitativamente, i grafici delle funzioni di potenza sono simili al caso in cui µ è noto riportati negli esercizi 7, 8 e 9.

Se è noto un limite superiore d₀ per la deviazione standard d, si possono ottenere stime conservative della dimensione campionaria necessaria per un dato livello di confidenza e un dato margine di errore utilizzando i metodi degli esercizi 14 e 15.

Distribuzioni non normali

Una delle assunzioni fondamentali fatte finora è che la distribuzione sottostante sia normale. Ovviamente, nelle applicazioni statistiche reali, è improbabile sapere qualcosa sulla distribuzione sottostante. Supponiamo che la distribuzione non sia normale. Se n è relativamente grande, la distribuzione della media campionaria sarà approssimativamente normale per il teorema limite centrale, e pertanto le nostre conclusioni dovrebbero restare approssimativamente valide. Gli esercizi seguenti ti danno la possibilità di verificare la robustezza della procedura.

21. Nell' esperimento di test della media, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1. Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ₀, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H₀. Quando H₀ è vera, confronta la frequenza relativa col livello di significatività.

22. Nell' esperimento di test della media, seleziona la distribuzione uniforme su (0, 4). Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ₀, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H₀. Quando H₀ è vera, confronta la frequenza relativa col livello di significatività.

La dimensione minima di n affinché la procedura funzioni correttamente dipende, ovviamente, dalla distribuzione sottostante; più tale distribuzione differisce dalla normale, più grande dev'essere n. Fortunatamente, la convergenza prevista dal teorema limite centrale è rapida e quindi, come hai già visto negli esercizi, possiamo cavarcela, nella maggior parte dei casi, con campioni relativamente piccoli (30 o più unità).

Esercizi numerici

$Esercizio teorico$ 23. La lunghezza di un certo pezzo meccanico dev'essere 10 centimetri. A causa di imperfezioni nel processo produttivo, però, la lunghezza risulta essere una variabile casuale. La deviazione standard è causata da fattori inerenti il processo produttivo che risultano costanti nel tempo. Dai dati storici si sa che la deviazione standard è 0.3. La media, d'altra parte, dipende da vari parametri e può variare di frequente. Siao interessati a testare H₀: µ = 10 contro H₁: µ 10.

Supponi che un campione di 100 pezzi abbia media 10.1. Esegui al test al livello di significatività del 10%.
Calcola il p-value per i dati in (a).
Calcola la potenza del test in (a) a µ = 10.05.
Calcola la dimensione campionaria approssimativa necessaria per avere livello di significatività del 10% e potenza 80% per µ = 10.05.

$Esercizio teorico$ 24. Un pacchetto di patatine è marchiato per 250 grammi. Il peso (in grammi) è però una variabile casuale. Supponiamo che un campione di 75 pacchetti abbia media 248 e deviazione standard 5. Testa, al livello di significatività dello 0.05, H₀: µ 250 contro H₁: µ < 250.

$Esercizio teorico$ 25. In un'azienda di telemarketing la durata delle telefonate è una variabile casuale. Un campione di 50 telefonate ha media 310 e deviazione standard 25. Possiamo concludere, al livello di significatività dello 0.1, che µ > 300?

$Esercizio teorico$ 26. In una certa fattoria, il peso di una pesca (in once) è una variabile casuale. Un campione di 100 pesche ha media 8.2 e deviazione standard 0.5. Possiamo dire, al livello di significatività di 0.05, che µ > 8?

$Esercizio teorico$ 27. Il salario orario per un certo tipo di lavoro edile è una variabile casuale con deviazione standard 1.25. Su un campione di 25 lavoratorio, il salario medio è di 6.75$. Possiamo concludere, al livello di significatività di 0.01, che µ < 7.00?

28. Usa i dati Michelson, per sottoporre a test l'ipotesi che la velocità della luce sia maggiore di 730 (+299000) km/sec, al livello di significatività 0.1.

29. Usa i dati di Cavendish, per sottoporre a test l'ipotesi che la densità della terra sia minore di 5.5 volte la densità dell'acqua, al livello di significatività 0.05.

30. Usa i dati di Short, per sottoporre a test l'ipotesi che la parallasse del sole differisca da 9 secondi di grado, al livello di significatività 0.1.

31. Sui dati Fisher sugli iris, esegui i seguenti test, al livello di significatività 0.1:

La lunghezza media del petalo di Setosa è diversa da 15 mm.
La lunghezza media del petalo di Verginica è maggiore di 52 mm.
La lunghezza media del petalo di Versicolor è minore di 42 mm.