Laboratorio virtuale > Test di ipotesi > 1 [2] 3 4 5 6 7

2. Test per la media nel modello normale


Concetti preliminari

Supponiamo che X1, X2, ..., Xn sia un campione casuale della distribuzione normale con media µ e varianza d2. In questo paragrafo impareremo a costruire test di ipotesi per µ, cioè una delle situazioni più rilevanti. Questo paragrafo è parallelo a quello sulla stima della media nel modello normale nel capitolo sulla stima intervallare.

La procedura di test è diversa a seconda che si conosca oppure no d; per questa ragione, d rappresenta un parametro di disturbo relativamete al problema del test per µ. Gli elementi chiave nella costruzione del test sono la media campionaria e la varianza campionaria

  1. M = (1 / n)sommatoriai = 1, ..., n Xi.
  2. S2 = [1 / (n - 1)sommatoriai = 1, ..., n (Xi - M)2.

e le proprietà di queste statistiche quando la distribuzione è normale.

Test per µ con d noto

Supponiamo in primo luogo che la deviazione standard d sia nota; questa assunzione è di solito artificiale, ma non sempre (vedi l'esercizio 23). Lo spazio parametrico è quindi {µ: µ appartiene a R} e ogni ipotesi definisce sottinsiemi di questo spazio. La statistica test che utilizzeremo è

Z0 = (M - µ0) / (d / n1/2).

Nota che Z0 è la distanza della media campionaria da µ0 in unità di deviazioni standard. Pertanto, Z0 dovrebbe fornire buone informazioni sulle ipotesi relative a µ0.

Esercizio teorico 1. Dimostra che Z0 ha distribuzione normale con

  1. E(Z0) = (µ - µ0) / (d / n1/2).
  2. var(Z0) = 1.

In particolare, se µ = µ0, Z0 è lo standard score e ha distribuzione normale standardizzata. Al solito, per p appartenente a (0, 1), indicheremo con zp il quantile di ordine p della distribuzione normale standardizzata. Per dati valori di p, gli zp possono essere ricavati dall'applet quantile.

Esercizio teorico 2. Prova che i seguenti test hanno livello di significatività r:

  1. Rifiutare H0: µ = µ0 contro H1: µ <> µ0 se e solo se Z0 > z1 - r/2 o Z0 < -z1 - r/2.
  2. Rifiutare H0: µ <= µ0 contro H1: µ > µ0 se e solo se Z0 > z1 - r.
  3. Rifiutare H0: µ >= µ0 contro H1: µ < µ0 se e solo se Z0 < -z1 - r.

L'esercizio seguente è un caso particolare dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo esaminato nell'introduzione.

Esercizio teorico 3. Per ognuno dei test presentati nell'esercizio 2, prova che non rifiutiamo H0 a livello di significatività a se e solo se µ0 appartiene al corrispondente intervallo di confidenza al livello 1 - r.

Il p-value di questi test può essere calcolato in termini della funzione di ripartizione della normale standardizzata G.

Esercizio teorico 4. Dimostra che i p-values dei test dell'esercizio 2 sono

  1. 2[1 - G(|Z0|)]
  2. 1 - G(Z0)
  3. G(Z0)

Simulazione 5. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20, e µ0 = 0. Per ciascuno dei seguenti tre test:

  1. Per µ = -1.0, -0.75, -0.5, 0.25, 0, 0.25, 0.5, 0.75, 1, simula 1000 replicazioni, aggiornando ogni 10, e osserva la frequenza relativa del rifiuto di H0 per ciascun valore.
  2. Per µ = 0, confronta la frequenza relativa col livello di significatività.
  3. Basandoti su queste frequenze relative, disegna la funzione di potenza empirica.

Simulazione 6. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ0 per cui si rifiuterebbe l'ipotesi nulla.

Curve di potenza

Ricorda che la funzione di potenza per un test su µ è Q(µ) = P(Rifiuta H0 | µ). Per i test dell'esercizio 2, possiamo calcolare esplicitamente le funzioni di potenza in termine della funzione di ripartizione G della distribuzione normale standardizzata.

Esercizio teorico 7. Per il test H0: µ = µ0 contro H1: µ <> µ0 a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

  1. Q(µ) = G[-z1 - r/2 + (µ - µ0) / (d / n1/2)] + G[-z1 - r/2 - (µ - µ0) / (d / n1/2)]
  2. Q(µ) è simmetrico attorno a µ0.
  3. Q(µ) è decrescente per µ < µ0 e crescente per µ > µ0.
  4. Q0) = r.
  5. Q(µ) converge a 1 per µ converge a infinito e Q(µ) converge a 1 per µ converge a -infinito.

Esercizio teorico 8. Per il test H0: µ <= µ0 contro H1: µ > µ0 a livello di significatività a, prova i seguenti risultati e traccia il grafico di Q.

  1. Q(z) = G[-z1 - r + (µ - µ0) / (d / n1/2)]
  2. Q è crescente
  3. Q0) = r.
  4. Q(µ) converge a 0 per µ converge a -infinito e G(µ) converge a 1 per µ converge a infinito.

Esercizio teorico 9. Per il test H0: µ >= µ0 contro H1: µ < µ0 a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:

  1. Q(z) = G[-z1 - a - (µ - µ0) / (d / n1/2)]
  2. Q è decrescente
  3. Q0) = r.
  4. Q(µ) converge a 1 per µ converge a -infinito e G(µ) converge a 0 per µ converge a infinito.

Esercizio teorico 10. Prova che, per ciascuno dei tre test, incrementare la dimensione campionaria n o decrementare la deviazione standard d restituisce un test uniformemente più potente.

Test distorti

Per l'ipotesi H0: µ = µ0 contro H1: µ <> µ0, il test bidirezionale simmetrico dell'esercizio 2 è quello più utilizzato, ma non l'unico. Negli esercizi seguenti, analizzeremo la potenza dei test non simmetrici. Per p appartenente a (0, 1) considera il test

Rifiutare H0 se e solo se Z0 > z1 - pr o Z0 < z(1 - p) r.

Nota che, quando p = 1/2, il test concorda con quello simmetrico presentato nell'esercizio 2.

Esercizio teorico 11. Mostra che il test ha livello di significatività a per ogni p appartenente a (0, 1).

Esercizio teorico 12. Prova che la funzione di potenza Q del test soddisfa le proprietà seguenti e tracciane il grafico:

  1. Q(µ) = G[-z1 - pr + (µ - µ0) / (d / n1/2)] + G[z(1 - p) r - (µ - µ0) / (d / n1/2)]
  2. Q(µ) decresce per µ < m e cresce per µ > m dove m = µ0 + (z1 - pr + z(1 - p) r) n1/2 / (2d).
  3. Q0) = a.
  4. Q(µ) converge a 1 per µ converge a infinito e Q(µ) converge a 1 per µ converge a -infinito.

Esercizio teorico 13. Prova che, se p cresce, il test diventa più potente per µ > µ0 e meno potente per µ < µ0.

Disegno di esperimenti

In molti casi, il primo passo è pianificare l'esperimento in modo che il livello di significatività sia r e che il test abbia una certa potenza per una data alternativa.

Esercizio teorico 14. Per un test monodirezionale, dimostra che la dimensione camopionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ1 è

n = (z1 - r/2 + z1 - s)2 d2 / (µ1 - µ0)2.

Suggerimento: Poni la funzione di potenza uguale a 1 - s e risolvi rispetto a n.

Esercizio teorico 15. Per un test bidirezionale, mostra che la dimensione campionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ1 è approssimativamente

n = (z1 - r + z1 - s)2 d2 / (µ1 - µ0)2.

Suggerimento: Nella funzione di potenza per il test bidirezionale, trascura il primo termine se µ1 < µ0 e il secondo se µ1 > µ0.

Test per µ con d ignoto

Consideriamo ora il caso, più realistico, in cui sia d che µ sono ignoti. In questo caso, lo spazio parametrico è {(µ, d): µ appartiene a R, d > 0} e tutte le ipotesi definiscono sottinsiemi di questo spazio. La statistica test di base che useremo per i test su µ è

T0 = (M - µ0) / (S / n1/2).

Ricorda che, se µ = µ0, T0 ha distribuzione t di Student con n - 1 gradi di libertà; se µ <> µ0, la distribuzione di T0 è detta distribuzione t non centrata. Al solito, tk, p indicherà il quantile di ordine p della distribuzione t con k gradi di libertà.

Esercizio teorico 16. Prova che i test seguenti hanno livello di significatività r.

  1. Rifiutare H0: µ = µ0 contro H1: µ <> µ0 se e solo se T0 > tn - 1, 1 - r/2 o T0 < -tn - 1, 1 - r/2.
  2. Rifiutare H0: µ <= µ0 contro H1: µ > µ0 se e solo se T0 > tn - 1, 1 - r.
  3. Rifiutare H0: µ >= µ0 contro H1: µ < µ0 se e solo se T0 < -tn - 1, 1 - r.

Ricorda, di nuovo, il paragrafo sulla stima della media, nel capitolo sulla stima intervallare. L'esercizio seguente è un caso speciale dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo già discusso nell'introduzione.

Esercizio teorico 17. Per ciascuno dei test dell'esercizio 2, mostra che non rifiutiamo H0 a livello di significatività a se e solo se µ0 giace nel corrispondente intervallo di confidenza al livello 1 - r.

Il p-value di questi test può essere calcolato in termini della funzione di ripartizione Gn - 1 della distribuzione t con n - 1 gradi di libertà.

Esercizio teorico 18. Prova che i p-value dei test dell'esercizio 16 sono

  1. 2[1 - Gn - 1(|T0|)]
  2. 1 - Gn - 1(T0)
  3. Gn - 1(T0)

Simulazione 19. Nell'esperimento del test della media, assicurati che siano selezionati S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20 e µ0 = 0. Per ciascuno dei tre test:

  1. Per µ = -1, -0.75, -0.5, -0.25, 0, 0.25, 0.5, 0.75, 1, simula 1000 replicazioni, aggiornando ogni 10, e osserva la freuenza relativa del rifiuto di H0 per ciascun valore.
  2. Per µ = 0, confronta la frequenza relativa col livello di significatività.
  3. Basandoti su queste frequenze relative, disegna la curva di potenza empirica.

Simulazione 20.Nell'esperimento del test della media, assicurati che sia selezionato S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ0 per cui si rifiuterebbe l'ipotesi nulla.

La funzione di potenza per i test dell'esercizio 16 possono essere calcolati esplicitamente in termini della funzione di ripartizione della distribuzione t non centrata. Qualitativamente, i grafici delle funzioni di potenza sono simili al caso in cui µ è noto riportati negli esercizi 7, 8 e 9.

Se è noto un limite superiore d0 per la deviazione standard d, si possono ottenere stime conservative della dimensione campionaria necessaria per un dato livello di confidenza e un dato margine di errore utilizzando i metodi degli esercizi 14 e 15.

Distribuzioni non normali

Una delle assunzioni fondamentali fatte finora è che la distribuzione sottostante sia normale. Ovviamente, nelle applicazioni statistiche reali, è improbabile sapere qualcosa sulla distribuzione sottostante. Supponiamo che la distribuzione non sia normale. Se n è relativamente grande, la distribuzione della media campionaria sarà approssimativamente normale per il teorema limite centrale, e pertanto le nostre conclusioni dovrebbero restare approssimativamente valide. Gli esercizi seguenti ti danno la possibilità di verificare la robustezza della procedura.

Simulazione 21. Nell' esperimento di test della media, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1. Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ0, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H0. Quando H0 è vera, confronta la frequenza relativa col livello di significatività.

Simulazione 22. Nell' esperimento di test della media, seleziona la distribuzione uniforme su (0, 4). Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ0, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H0. Quando H0 è vera, confronta la frequenza relativa col livello di significatività.

La dimensione minima di n affinché la procedura funzioni correttamente dipende, ovviamente, dalla distribuzione sottostante; più tale distribuzione differisce dalla normale, più grande dev'essere n. Fortunatamente, la convergenza prevista dal teorema limite centrale è rapida e quindi, come hai già visto negli esercizi, possiamo cavarcela, nella maggior parte dei casi, con campioni relativamente piccoli (30 o più unità).

Esercizi numerici

Esercizio teorico 23. La lunghezza di un certo pezzo meccanico dev'essere 10 centimetri. A causa di imperfezioni nel processo produttivo, però, la lunghezza risulta essere una variabile casuale. La deviazione standard è causata da fattori inerenti il processo produttivo che risultano costanti nel tempo. Dai dati storici si sa che la deviazione standard è 0.3. La media, d'altra parte, dipende da vari parametri e può variare di frequente. Siao interessati a testare H0: µ = 10 contro H1: µ <> 10.

  1. Supponi che un campione di 100 pezzi abbia media 10.1. Esegui al test al livello di significatività del 10%.
  2. Calcola il p-value per i dati in (a).
  3. Calcola la potenza del test in (a) a µ = 10.05.
  4. Calcola la dimensione campionaria approssimativa necessaria per avere livello di significatività del 10% e potenza 80% per µ = 10.05.

Esercizio teorico 24. Un pacchetto di patatine è marchiato per 250 grammi. Il peso (in grammi) è però una variabile casuale. Supponiamo che un campione di 75 pacchetti abbia media 248 e deviazione standard 5. Testa, al livello di significatività dello 0.05, H0: µ >= 250 contro H1: µ < 250.

Esercizio teorico 25. In un'azienda di telemarketing la durata delle telefonate è una variabile casuale. Un campione di 50 telefonate ha media 310 e deviazione standard 25. Possiamo concludere, al livello di significatività dello 0.1, che µ > 300?

Esercizio teorico 26. In una certa fattoria, il peso di una pesca (in once) è una variabile casuale. Un campione di 100 pesche ha media 8.2 e deviazione standard 0.5. Possiamo dire, al livello di significatività di 0.05, che µ > 8?

Esercizio teorico 27. Il salario orario per un certo tipo di lavoro edile è una variabile casuale con deviazione standard 1.25. Su un campione di 25 lavoratorio, il salario medio è di 6.75$. Possiamo concludere, al livello di significatività di 0.01, che µ < 7.00?

Esercizio numerico 28. Usa i dati Michelson, per sottoporre a test l'ipotesi che la velocità della luce sia maggiore di 730 (+299000) km/sec, al livello di significatività 0.1.

Esercizio numerico 29. Usa i dati di Cavendish, per sottoporre a test l'ipotesi che la densità della terra sia minore di 5.5 volte la densità dell'acqua, al livello di significatività 0.05.

Esercizio numerico 30. Usa i dati di Short, per sottoporre a test l'ipotesi che la parallasse del sole differisca da 9 secondi di grado, al livello di significatività 0.1.

Esercizio numerico 31. Sui dati Fisher sugli iris, esegui i seguenti test, al livello di significatività 0.1:

  1. La lunghezza media del petalo di Setosa è diversa da 15 mm.
  2. La lunghezza media del petalo di Verginica è maggiore di 52 mm.
  3. La lunghezza media del petalo di Versicolor è minore di 42 mm.