Laboratorio virtuale > Test di ipotesi > 1 [2] 3 4 5 6 7
Supponiamo che X1, X2, ..., Xn sia un campione casuale della distribuzione normale con media µ e varianza d2. In questo paragrafo impareremo a costruire test di ipotesi per µ, cioè una delle situazioni più rilevanti. Questo paragrafo è parallelo a quello sulla stima della media nel modello normale nel capitolo sulla stima intervallare.
La procedura di test è diversa a seconda che si conosca oppure no d; per questa ragione, d rappresenta un parametro di disturbo relativamete al problema del test per µ. Gli elementi chiave nella costruzione del test sono la media campionaria e la varianza campionaria
e le proprietà di queste statistiche quando la distribuzione è normale.
Supponiamo in primo luogo che la deviazione standard d sia nota; questa assunzione è di solito artificiale, ma non sempre (vedi l'esercizio 23). Lo spazio parametrico è quindi {µ: µ appartiene a R} e ogni ipotesi definisce sottinsiemi di questo spazio. La statistica test che utilizzeremo è
Z0 = (M - µ0) / (d / n1/2).
Nota che Z0 è la distanza della media campionaria da µ0 in unità di deviazioni standard. Pertanto, Z0 dovrebbe fornire buone informazioni sulle ipotesi relative a µ0.
1. Dimostra che Z0 ha distribuzione normale con
In particolare, se µ = µ0, Z0 è lo standard score e ha distribuzione normale standardizzata. Al solito, per p appartenente a (0, 1), indicheremo con zp il quantile di ordine p della distribuzione normale standardizzata. Per dati valori di p, gli zp possono essere ricavati dall'applet quantile.
2. Prova che i seguenti test hanno livello di significatività r:
L'esercizio seguente è un caso particolare dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo esaminato nell'introduzione.
3. Per ognuno dei test presentati nell'esercizio 2, prova che non rifiutiamo H0 a livello di significatività a se e solo se µ0 appartiene al corrispondente intervallo di confidenza al livello 1 - r.
Il p-value di questi test può essere calcolato in termini della funzione di ripartizione della normale standardizzata G.
4. Dimostra che i p-values dei test dell'esercizio 2 sono
5. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20, e µ0 = 0. Per ciascuno dei seguenti tre test:
6. Nell'esperimento del test della media, assicurati che sia selezionato sigma e i quantili z. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ0 per cui si rifiuterebbe l'ipotesi nulla.
Ricorda che la funzione di potenza per un test su µ è Q(µ) = P(Rifiuta H0 | µ). Per i test dell'esercizio 2, possiamo calcolare esplicitamente le funzioni di potenza in termine della funzione di ripartizione G della distribuzione normale standardizzata.
7. Per il test H0: µ = µ0 contro H1: µ µ0 a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:
8. Per il test H0: µ µ0 contro H1: µ > µ0 a livello di significatività a, prova i seguenti risultati e traccia il grafico di Q.
9. Per il test H0: µ µ0 contro H1: µ < µ0 a livello di significatività r, prova i seguenti risultati e traccia il grafico di Q:
10. Prova che, per ciascuno dei tre test, incrementare la dimensione campionaria n o decrementare la deviazione standard d restituisce un test uniformemente più potente.
Per l'ipotesi H0: µ = µ0 contro H1: µ µ0, il test bidirezionale simmetrico dell'esercizio 2 è quello più utilizzato, ma non l'unico. Negli esercizi seguenti, analizzeremo la potenza dei test non simmetrici. Per p appartenente a (0, 1) considera il test
Rifiutare H0 se e solo se Z0 > z1 - pr o Z0 < z(1 - p) r.
Nota che, quando p = 1/2, il test concorda con quello simmetrico presentato nell'esercizio 2.
11. Mostra che il test ha livello di significatività a per ogni p appartenente a (0, 1).
12. Prova che la funzione di potenza Q del test soddisfa le proprietà seguenti e tracciane il grafico:
13. Prova che, se p cresce, il test diventa più potente per µ > µ0 e meno potente per µ < µ0.
In molti casi, il primo passo è pianificare l'esperimento in modo che il livello di significatività sia r e che il test abbia una certa potenza per una data alternativa.
14. Per un test monodirezionale, dimostra che la dimensione camopionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ1 è
n = (z1 - r/2 + z1 - s)2 d2 / (µ1 - µ0)2.
Suggerimento: Poni la funzione di potenza uguale a 1 - s e risolvi rispetto a n.
15. Per un test bidirezionale, mostra che la dimensione campionaria n necessaria per un test con livello di significatività r e potenza 1 - s per l'alternativa µ1 è approssimativamente
n = (z1 - r + z1 - s)2 d2 / (µ1 - µ0)2.
Suggerimento: Nella funzione di potenza per il test bidirezionale, trascura il primo termine se µ1 < µ0 e il secondo se µ1 > µ0.
Consideriamo ora il caso, più realistico, in cui sia d che µ sono ignoti. In questo caso, lo spazio parametrico è {(µ, d): µ appartiene a R, d > 0} e tutte le ipotesi definiscono sottinsiemi di questo spazio. La statistica test di base che useremo per i test su µ è
T0 = (M - µ0) / (S / n1/2).
Ricorda che, se µ = µ0, T0 ha distribuzione t di Student con n - 1 gradi di libertà; se µ µ0, la distribuzione di T0 è detta distribuzione t non centrata. Al solito, tk, p indicherà il quantile di ordine p della distribuzione t con k gradi di libertà.
16. Prova che i test seguenti hanno livello di significatività r.
Ricorda, di nuovo, il paragrafo sulla stima della media, nel capitolo sulla stima intervallare. L'esercizio seguente è un caso speciale dell'equivalenza generale tra test di ipotesi e stima intervallare che abbiamo già discusso nell'introduzione.
17. Per ciascuno dei test dell'esercizio 2, mostra che non rifiutiamo H0 a livello di significatività a se e solo se µ0 giace nel corrispondente intervallo di confidenza al livello 1 - r.
Il p-value di questi test può essere calcolato in termini della funzione di ripartizione Gn - 1 della distribuzione t con n - 1 gradi di libertà.
18. Prova che i p-value dei test dell'esercizio 16 sono
19. Nell'esperimento del test della media, assicurati che siano selezionati S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di significatività 0.1, dimensione campionaria n = 20 e µ0 = 0. Per ciascuno dei tre test:
20.Nell'esperimento del test della media, assicurati che sia selezionato S e i quantili t. Seleziona la distribuzione normale con deviazione standard 2, livello di confidenza 0.90, e dimensione campionaria n = 10. Per ciascuno dei tre tipi di intervallo di confidenza, simula 20 replicazioni aggiornando ogni volta. Formula le corrispondenti ipotesi e livelli di significatività e, per ogni replicazione, trova l'insieme di µ0 per cui si rifiuterebbe l'ipotesi nulla.
La funzione di potenza per i test dell'esercizio 16 possono essere calcolati esplicitamente in termini della funzione di ripartizione della distribuzione t non centrata. Qualitativamente, i grafici delle funzioni di potenza sono simili al caso in cui µ è noto riportati negli esercizi 7, 8 e 9.
Se è noto un limite superiore d0 per la deviazione standard d, si possono ottenere stime conservative della dimensione campionaria necessaria per un dato livello di confidenza e un dato margine di errore utilizzando i metodi degli esercizi 14 e 15.
Una delle assunzioni fondamentali fatte finora è che la distribuzione sottostante sia normale. Ovviamente, nelle applicazioni statistiche reali, è improbabile sapere qualcosa sulla distribuzione sottostante. Supponiamo che la distribuzione non sia normale. Se n è relativamente grande, la distribuzione della media campionaria sarà approssimativamente normale per il teorema limite centrale, e pertanto le nostre conclusioni dovrebbero restare approssimativamente valide. Gli esercizi seguenti ti danno la possibilità di verificare la robustezza della procedura.
21. Nell' esperimento di test della media, seleziona la distribuzione gamma con parametro di forma 1 e parametro di scala 1. Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ0, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H0. Quando H0 è vera, confronta la frequenza relativa col livello di significatività.
22. Nell' esperimento di test della media, seleziona la distribuzione uniforme su (0, 4). Per i tre diversi test e per vari livelli di significatività, dimensioni campionarie e valori di µ0, simula 1000 replicazioni aggiornando ogni 10. Per ciascuna configurazione, osserva la frequenza relativa dei rifiuti di H0. Quando H0 è vera, confronta la frequenza relativa col livello di significatività.
La dimensione minima di n affinché la procedura funzioni correttamente dipende, ovviamente, dalla distribuzione sottostante; più tale distribuzione differisce dalla normale, più grande dev'essere n. Fortunatamente, la convergenza prevista dal teorema limite centrale è rapida e quindi, come hai già visto negli esercizi, possiamo cavarcela, nella maggior parte dei casi, con campioni relativamente piccoli (30 o più unità).
23. La lunghezza di un certo pezzo meccanico dev'essere 10 centimetri. A causa di imperfezioni nel processo produttivo, però, la lunghezza risulta essere una variabile casuale. La deviazione standard è causata da fattori inerenti il processo produttivo che risultano costanti nel tempo. Dai dati storici si sa che la deviazione standard è 0.3. La media, d'altra parte, dipende da vari parametri e può variare di frequente. Siao interessati a testare H0: µ = 10 contro H1: µ 10.
24. Un pacchetto di patatine è marchiato per 250 grammi. Il peso (in grammi) è però una variabile casuale. Supponiamo che un campione di 75 pacchetti abbia media 248 e deviazione standard 5. Testa, al livello di significatività dello 0.05, H0: µ 250 contro H1: µ < 250.
25. In un'azienda di telemarketing la durata delle telefonate è una variabile casuale. Un campione di 50 telefonate ha media 310 e deviazione standard 25. Possiamo concludere, al livello di significatività dello 0.1, che µ > 300?
26. In una certa fattoria, il peso di una pesca (in once) è una variabile casuale. Un campione di 100 pesche ha media 8.2 e deviazione standard 0.5. Possiamo dire, al livello di significatività di 0.05, che µ > 8?
27. Il salario orario per un certo tipo di lavoro edile è una variabile casuale con deviazione standard 1.25. Su un campione di 25 lavoratorio, il salario medio è di 6.75$. Possiamo concludere, al livello di significatività di 0.01, che µ < 7.00?
28. Usa i dati Michelson, per sottoporre a test l'ipotesi che la velocità della luce sia maggiore di 730 (+299000) km/sec, al livello di significatività 0.1.
29. Usa i dati di Cavendish, per sottoporre a test l'ipotesi che la densità della terra sia minore di 5.5 volte la densità dell'acqua, al livello di significatività 0.05.
30. Usa i dati di Short, per sottoporre a test l'ipotesi che la parallasse del sole differisca da 9 secondi di grado, al livello di significatività 0.1.
31. Sui dati Fisher sugli iris, esegui i seguenti test, al livello di significatività 0.1: