Laboratorio virtuale > Test di ipotesi > 1 2 3 4 [5] 6 7

5. Test nel modello normale bivariato


In questo paragrafo, studieremo il test di ipotesi nel modello normale a due campioni e nel modello normale bivariato. Questa paragrafo è parallelo a quello sulla stima del modello normale bivariato nel capitolo sulla stima intervallare.

Il modello normale a due campioni

Supponiamo in primo luogo che X = (X1, X2, ..., Xn1) sia un campione casuale di dimensione n1 della distribuzione normale con media µ1 e varianza d12 e che Y = (Y1, Y2, ..., Yn2) sia un campione casuale di dimensione n2 della distribuzione normale con media µ2 e varianza d22. Supponiamo inoltre che i campioni X e Y siano indipendenti.

Questa situazione si verifica di frequente quando le variabili casuali rappresentano delle misurazioni di interesse sulle unità della popolazione, e i campioni corrispondono a due diversi trattamenti. Per esempio, possiamo essere interessati alla pressione sanguigna di una certa popolazione di pazienti. Il vettore X registra la pressione sanguigna di un campione di controllo, mentre il vettore Y registra la pressione sanguigna di un campione trattato con un nuovo farmaco. Similmente, possiamo essere interessati al rendimento di una piantagione di grano. Il vettore X registrerebbe allora il rendimento di un appezzamento trattato con un tipo di fertilizzante, mentre il vettore Y quello di un appezzamento trattato con un altro tipo di fertilizzante.

Di solito, si è interessati a un confronto tra i parametri (media o varianza) per le due distribuzioni. In questo paragrafo, impareremo a costruire test per il rapporto tra varianze e per la differenza tra le medie. Analogamente a quanto abbiamo già visto per le procedure di stima, la costruzione del test è diversa a seconda che i parametri siano noti oppure no. Di nuovo, gli elementi fondamentali nella costruzione dei test sono le medie campionarie, le varianze campionarie e le proprietà di queste statistiche quando la distribuzione è normale. Useremo la seguente notazioni:

  1. M1 = (1 / n1)sommatoriai = 1, ..., n1 Xi.
  2. W12 = (1 / n1)sommatoriai = 1, ..., n1 (Xi - µ1)2.
  3. S12 = [1 / (n1 - 1)]sommatoriai = 1, ..., n1 (Xi - M1)2.
  4. M2 = (1 / n2)sommatoriai = 1, ..., n2 Xi.
  5. W22 = (1 / n2)sommatoriai = 1, ..., n2 (Xi - µ2)2.
  6. S22 = [1 / (n2 - 1)]sommatoriai = 1, ..., n2 (Xi - M2)2.

Test per d22 / d12 con µ1 e µ2 noti

Consideriamo in primo luogo considereremo il test per il rapporto tra varianze d22 / d12 quando le medie µ1 e µ2 sono note. Ovviamente questa assunzione è spesso irrealistica. La statistica test è

F0 = (W12 / W22)a0 dove a0 > 0.

Esercizio teorico 1. Mostra che se d22 / d12 = a0 allora F0 ha distribuzione F con n1 gradi di libertà al numeratore e n2 gradi di libertà al denominatore.

Per p appartenente a (0, 1) e per m > 0 e k >0, sia fm, n, p il quantile di ordine p della distribuzione F con m gradi di libertà al numeratore e n gradi di libertà al denominatore.

Esercizio teorico 2. Mostra che i seguenti test hanno livello di significatività r:

  1. Rifiutare H0: d22 / d12 = a0 contro H1: d22 / d12 <> a0 se e solo se F0 > fn1, n2, 1 - r/2 o F0 < fn1, n2, a/21, n2, a/2.
  2. Rifiutare H0: d22 / d12 <= a0 contro H1: d22 / d12 > a0 se e solo se F0 < fn1, n2, r.
  3. Rifiutare H0: d22 / d12 >= a0 contro H1: d22 / d12 < a0 se e solo se F0 > fn1, n2, 1 - r.

Esercizio teorico 3. Per ciascuno dei test dell'esercizio 2, prova che non rifiutiamo H0 a livello di significatività r se e solo se a0 appartiene al corrispondente al intervallo di confidenza al livello 1 - r.

Test per d22 / d12 con µ1 e µ2 ignoti

Consideriamo ora il test per il rapporto tra le varianze d22 / d12 sotto l'assunzione, più realistica che le medie µ1 e µ2 siano ignote. In questo caso, la statistica test è

F0 = (S12 / S22)a0 dove a0 > 0.

Esercizio teorico 4. Mostra che se d22 / d12 = a0 allora F0 ha distribuzione F con n1 - 1 gradi di libertà al numeratore e n2 - 1 gradi di libertà al denominatore.

Esercizio teorico 5. Mostra che i seguenti test hanno livello di significatività r:

  1. Rifiutare H0: d22 / d12 = a0 contro H1: d22 / d12 <> a0 se e solo se F0 > fn1 - 1, n2 - 1, 1 - r/2 o F0 < fn1 - 1, n2 - 1, r/2.
  2. Rifiutare H0: d22 / d12 <= a0 contro H1: d22 / d12 > a0 se e solo se F0 < fn1 - 1, n2 - 1, r.
  3. Rifiutare H0: d22 / d12 >= a0 contro H1: d22 / d12 < a0 se e solo se F0 > fn1 - 1, n2 - 1, 1 - r.

Esercizio teorico 6. Per ciascuno dei test dell'esercizio 5, prova che non rifiutiamo H0 a livello di significatività r se e solo se a0 appartiene al corrispondente al intervallo di confidenza al livello 1 - r.

Test per µ2 - µ1 con d1 e d2 noti

Consideriamo ora il problema della stima della differenza tra medie µ2 - µ1 sotto l'assunzione che le deviazioni standard d1 e d2 siano note. Al solito, questa assunzione è spesso irrealistica. La statistica test è

Z0 = [(M2 - M1) - a0] / (d12 / n1 + d22 / n2)1/2.

Esercizio teorico 7. Mostra che Z0 ha distribuzione normale con media a0 - (µ2 - µ1) e varianza 1.

Al solito, indichiamo con zp il quantile di ordine p della distribuzione normale standardizzata. Per dati valori di p, i valori zp possono essere ricavti dall'applet quantile.

Esercizio teorico 8. Mostra che i seguenti test hanno livello di significatività r:

  1. Rifiutare H0: µ2 - µ1 = a0 contro H1: µ2 - µ1 <> a0 se e solo se Z0 > z1 - r / 2 o Z0 < -z1 - r / 2.
  2. Rifiutare H0: µ2 - µ1 <= a0 contro H1: µ2 - µ1 > a0 se e solo se Z0 > z1 - r.
  3. Rifiutare H0: µ2 - µ1 >= a0 contro H1: µ2 - µ1 < a0 se e solo se Z0 < -z1 - r.

Esercizio teorico 9. Per ciascuno dei test dell'esercizio 8, prova che non rifiutiamo H0 a livello di significatività r se e solo se a0 appartiene al corrispondente al intervallo di confidenza al livello 1 - r.

Test per µ2 - µ1 con d1 e d2 ignoti

Consideriamo infine i test per la differenza tra le medie sotto l'assunzione, più realistica, che le deviazioni standard d1 e d2 siano ignote ma uguali:

d1 = d2 = d.

Questa assunzione è ragionevole se la variabilità nella misurazione delle variabili non cambia quando si applicano diversi trattamenti alle unità della popolazione. Ricorda che la stima raggruppata della varianza comune d2 è

S2 = [(n1 - 1)S12 + (n2 - 1)S22] / (n1 + n2 - 2).

La statistica test che utilizzeremo è

T0 = [(M2 - M1) - a0] / [S (1 / n1 + 1 / n2)1/2].

Esercizio teorico 10. Prova che, se µ2 - µ1 = a0, allora T0 ha distribuzione t con n = n1 + n2 - 2 gradi di libertà.

Al solito, per k > 0 e p appartenente a (0, 1) sia tk, p il quantile di ordine p della distribuzione t con k gradi di libertà. Per dati valori di k e p, i valori tk, p si ottengono dall'applet quantile.

Esercizio teorico 11. Mostra che i seguenti test hanno livello di significatività r:

  1. Rifiutare H0: µ2 - µ1 = a0 contro H1: µ2 - µ1 <> a0 se e solo se T0 > tn, 1 - r / 2 o T0 < -tn, 1 - r / 2.
  2. Rifiutare H0: µ2 - µ1 <= a0 contro H1: µ2 - µ1 > a0 se e solo se T0 > tn, 1 - r.
  3. Rifiutare H0: µ2 - µ1 >= a0 contro H1: µ2 - µ1 < a0 se e solo se T0 < -tn, 1 - r.

Esercizio teorico 12. Per ciascuno dei test dell'esercizio 11, prova che non rifiutiamo H0 a livello di significatività r se e solo se a0 appartiene al corrispondente al intervallo di confidenza al livello 1 - r.

Test nel modello normale bivariato

Consideriamo adesso un modello simile a quello normale a due campioni, ma molto più semplice. Supponiamo che

(X1, Y1), (X2, Y2), ..., (Xn, Yn)

sia un campione casuale di dimensione n della distribuzione normale bivariata con

E(X) = µ1, E(Y) = µ2, var(X) = d12, var(Y) = d22, cov(X, Y) = d1,2.

Quindi, invece che una coppia di campioni, abbiamo un campione di coppie. Questo tipo di modello si presenta di frequente negli esperimenti prima e dopo, in cui si registra una misura di interesse su un campione di n unità della popolazione prima e dopo un certo trattamento. Per esempio, possiamo registrare la pressione sanguigna su un campione di n pazienti prima e dopo la somministrazione di un certo farmaco.

Esercizio teorico 13. Mostra che Y1 - X1, Y2 - X2, ..., Yn - Xn è un campione casuale di dimensione n dalla distribuzione normale con media µ2 - µ1 e varianza d2 = d12 + d22 - 2d1,2.

Le differenze quindi seguono il modello normale a un campione che abbiamo già esaminato. In particolare, per i test per µ2 - µ1, controlla il paragrafo sul test per la media nel modello normale, per i test per d2, quello sui test per la varianza nel modello normale.

Esercizi numerici

Esercizio teorico 14. Si sta sviluppando un nuovo farmaco per ridurre un certo componente del sangue. Un campione di 36 pazienti riceve un placebo, mentre a 49 pazienti è somministrato il farmaco. Le statistiche (in mg) sono m1 = 87, s1 = 4, m2 = 63, s2 = 6. Esegui i seguenti test al livello di significatività del 10%:

  1. H0: d1 = d2 contro H1: d1 <>d2.
  2. H0: µ1 <= µ2 contro H1: µ1 > µ2 (assumendo d1 = d2).
  3. Basandoti su (b), il farmaco ti sembra efficace?

Esercizio teorico 15. Un'azienda afferma che un composto erboristico incrementa l'intelligenza. Si sottopone a 25 soggetti un test standard per quoziente di intelligenza prima e dopo aver assunto il composto. Le statistiche sono m1 = 105, s1 = 13, m2 = 110, s2 = 17, s12 = 190. Al livello di significatività del 10%, credi a quanto afferma l'azienda?

Esercizio numerico 16. Sui dati di Fisher sugli iris, considera la variabile lunghezza del petalo per i campioni di iris Versicolor e Virginica. Esegui i seguenti test al livello di significatività del 10%:

  1. H0: d1 = d2 contro H1: d1 <>d2.
  2. H0: µ1 <= µ2 contro H1: µ1 > µ2 (assumendo d1 = d2).

Esercizio teorico 17. Un'industria ha due macchine che producono una barra circolare il cui diametro (in cm) è importante. Un campione di 100 barre prodotte dalla prima macchina ha media 10.3 e deviazione standard 1.2, metre un campione di 100 barre prodotte dalla seconda macchina ha media 9.8 e deviazione standard 1.6.

  1. H0: d1 = d2 contro H1: d1 <>d2.
  2. H0: µ1 = µ2 contro H1: µ1 <> µ2 (assumendo d1 = d2).