Laboratorio virtuale > Test di ipotesi > 1 2 3 4 5 [6] 7

6. Test del rapporto di verosimiglianza


Concetti preliminari

Al solito, iniziamo con l'introdurre un esperimento casuale definito su un certo spazio campionario e con misura di probabilità P. Nel modello statistico di base, abbiamo una variabile casuale osservabile X che assume valori in S. In generale, X può avere struttura complessa. Ad esempio, se l'esperimento consiste nell'estrarre n unità da una popolazione e registrare le varie misure di interesse, allora

X = (X1, X2, ..., Xn)

dove Xi è il vettore di misurazioni per l'i-esima unità. Il caso più importante si ha quando X1, X2, ..., Xn, sono indipendenti e identicamente distribuite. Si ha allora un campione casuale di dimensione n dalla distribuzione comune.

Nelle sezioni precedenti, abbiamo introdotto dei test sui parametri basandoci sulle statistiche naturali. In altri casi, tuttavia, si può avere interesse a test non parametrici, o può non esistere una statistica naturale da cui muovere. Serve pertanto un metodo generale per costruire statistiche test. Inoltre, non sappiamo ancora se i test che abbiamo finora presentato sono i migliori, nel senso di massimizzare la potenza per l'insieme di ipotesi alternative. In questo e nel prossimo paragrafo, ci occuperemo di entrambi questi aspetti. Le funzioni di verosimiglianza, simili a quelle usate nella stima di massima verosimiglianza, avranno un ruolo chiave.

Test di ipotesi semplici

Supponiamo che X abbiamo due possibili distribuzioni. Le ipotesi semplici sono

H0: X ha densità f0; H1: X ha densità f1.

Il test che costruiremo è basato sulla seguente idea: se si osserva x, allora la condizione f1(x) > f0(x) testimonia a favore dell'ipotesi alternativa; la diseguaglianza opposta, invece, testimonia contro l'ipotesi alternativa. Poniamo

L(x) = f0(x) / f1(x) per x appartenente a S.

La funzione L è la funzione del rapporto di verosimiglianza per l'ipotesi e L(X) è la statistica rapporto di verosimiglianza. Riprendendo la nostra osservazione precedente, osserviamo che valori piccoli di L sono prove a favore di H1. Sembra quindi ragionevole che il rapporto di verosimiglianza possa essere una buona statistica test, e che si debbano considerare test del seguente tipo, con k costante:

Rifiutare H0 se e solo se L(X) <= k.

Esercizio teorico 1. Prova che il livello di significatività del test è

r = P[L(X) <= k | H0].

Al solito, possiamo cercare di costruire un test scegliendo k tale che r sia un valore desiderato. Se X è discreta, ciò è possibile solo se r è un valore della funzione di ripartizione di L(X).

Un caso particolare di particolare importanza si ha quando la funzione di densità f(x | a) di X dipende da un parametro a che può assumere due valori. Lo spazio parametrico è quindi A = {a0, a1}. In questo caso, le ipotesi sono

H0: a = a0 contro H1: a = a1,

e la funzione rapporto di verosimiglianza è L(x) = f(x | a0) / f(x | a1).

Il lemma di Neyman-Pearson

L'esercizio seguente introduce il lemma di Neyman-Pearson, e dimostra che il test introdotto poc'anzi è il più potente. Sia

R = {x in S: L(x) <= k}.

Esercizio teorico 2. Usa la definizione di L e quella di R per mostrare che

  1. P(X in B | H0) <= k P(X in B | H1) per B sottinsieme R.
  2. P(X in B | H0) >= k P(X in B | H1) per B sottinsieme Rc.

Esercizio teorico 3. Prova che, se A sottinsieme R, allora

P(X in R | H1) - P(X in B | H1) >= (1 / k) [P(X in R | H0) - P(X in B | H0)].

Suggerimento: Scrivi R = (R intersecato B) unione (R intersecato Bc) e B = (B intersecato R) unione (B intersecato Rc). Usa l'additività della probabilità e il risultato dell'esercizio 1.

Esercizio teorico 4. Considera i test con regioni di rifiuto R e B. Usa l'esercizio 3 per mostrare che, se la dimensione di B non è maggiore di quella di R, allora il test con regione di rifiuto R è più potente:

P(X in R | H1) >= P(X in B | H1).

Il lemma di Neyman-Pearson è un risultato molto gradevole, ed è più utile di quanto possa inizialmente sembrare. In molti casi importanti, lo stesso test più potente funzione su un insieme di alternative, ed è quindi uniformemente più potente su questo insieme. Considereremo qui di seguito alcuni di questi casi particolari.

Test per il modello esponenziale

Supponi che X = (X1, X2, ..., Xn) sia un campione casuale della distribuzione esponenziale con parametro di scala b. Le variabili casuali possono rappresentare le durate di un campione di apparecchiature. Vogliamo sottoporre a test la seguente ipotesi semplice, dove b0 e b1 > 0 sono valori dati e distinti.

H0: b = b0 contro H1: b = b1.

Esercizio teorico 5. Prova che la statistica rapporto di verosimiglianza è

L(X) = (b1 / b0)n exp[(1 / b1 - 1 / b0)Y] dove Y = X1 + X2 + ··· + Xn.

Ricorda che Y ha distribuzione gamma con parametro di forma n e parametro di scala b. Indicheremo il quantile di ordine r di questa distribuzione con yr(n, b).

Esercizio teorico 6. Supponi che b1 > b0. Prova che il test più potente a livello r è

Rifiutare H0 se e solo se Y > y1 - r(n, b0).

Esercizio teorico 7. Supponi che b1 < b0. Prova che il test più potente a livello r è

Rifiutare H0 se e solo se Y < yr(n, b0).

Osserva che il test degli esercizi 6 e 7 non dipende dal valore di b1. Questo fatto, accoppiato alla monotonicità della funzione di potenza, può essere utilizzato per mostrare che i test sono uniformemente più potenti per i test monodirezionali consueti.

Esercizio teorico 8. Prova che il test degli esercizi 6 e 7 è uniformemente più potente per le ipotesi

H0: b <= b0 contro H1: b > b0.

Esercizio teorico 9. Prova che il test dell'esercizio 7 è uniformemente più potente per le ipotesi

H0: b >= b0 contro H1: b < b0.

Test nel modello di Bernoulli

Supponi che I = (I1, I2, ..., In) sia un campione casuale della distribuzione di Bernoulli con parametro p. Il campione può rappresentare il risultato di un lancio di una moneta ripetuto n volte, dove p indica la probabilità di ottenere testa. Vogliamo sottoporre a test l'ipotesi semplice

H0: p = p0 contro H1: p = p1,

dove p0 e p1, appartenenti a (0, 1), sono valori distinti e dati. Si sa che la probabilità di ottenere testa è p0 o p1.

Esercizio teorico 10. Prova che la statistica rapporto di verosimiglianza è

L(I) = [(1 - p0) / (1 - p1)]n {p0(1 - p1) / [p1(1 - p0)]}X dove X = I1 + I2 + ··· + In.

Ricorda che X ha distribuzione binomiale con parametri n e p. Indicheremo il quantile di ordine r di questa distribuzione con xr(n, p); poiché però la distribuzione è discreta, sono ammissibili solo alcuni valori di r.

Esercizio teorico 11. Supponi che p1 > p0. Mostra che il test più potente a livello r è

Rifiutare H0 se e solo se X >= x1 - r(n, p0).

Esercizio teorico 12. Supponi che p1 < p0. Mostra che il test più potente a livello r è

Rifiutare H0 se e solo se X <= xr(n, p0).

Nota, anche in questo caso, che i test degli esercizi 11 e 12 non dipendono dal valore di p1. Questo fatto, accoppiato alla monotonicità della funzione di potenza, può essere utilizzato per mostrare che i test sono uniformemente più potenti per i test monodirezionali consueti.

Esercizio teorico 13. Prova che il test dell'esercizio 11 è uniformemente più potente per le ipotesi

H0: p <= p0 contro H1: p > p0.

Esercizio teorico 14. Prova che il test dell'esercizio 12 è uniformemente più potente per le ipotesi

H0: p >= p0 contro H1: p < p0.

Test uniformemente più potenti

I test monodirezionali che abbiamo introdotto per il modello normale, per µ con d nota, per µ con d ignota e per d con µ ignota sono tutti uniformemente più potenti. D'altra parte, nessuno dei test bidirezionali è uniformemente più potente.

Un caso non-parametrico

Supponiamo che X = (X1, X2, ..., Xn) sia un campione casuale proveniente o da una distribuzione di Poisson a parametro 1 o dalla distribuzione geometrica a parametro 1/2. Osserva che entrambe queste distribuzioni hanno valori interi non negativi, e entrambe hanno media 1. Vogliamo quindi sottoporre a test

  1. H0: X sia un campione di g0(x) = e-x / x! per x = 0, 1, ...
  2. H1: X sia un campione di g1(x) = (1/2)x + 1 per x = 0, 1, ...

Esercizio teorico 15. Prova che la statistica rapporto di verosimiglianza è

L(X) = 2n e-n 2Y / U dove Y = X1 + X2 + ··· + Xn e U = X1! X2! ··· Xn!.

Esercizio teorico 16. Mostra che i test più potenti hanno la forma seguente, con d costante.

Rifiutare H0 se e solo se ln(2) Y - ln(U) <= d.

Rapporto di verosimiglianza generalizzato

La statistica rapporto di verosimiglianza può essere generalizzata al caso delle ipotesi composte. Supponiamo, di nuovo, che la densità f(x | a) della variabile dei dati X dipenda da un parametro a, a valori in A. Considera le seguenti ipotesi, dove A0 è sottinsieme di A:

H0: a in A0 contro H1: a in A - A0.

Definiamo

L(x) = max{f(x | a): a in A0} / max{f(x | a): a in A} per x appartenente a S.

La funzione L è la funzione rapporto di verosimiglianza e L(X) è la statistica rapporto di verosimiglianza. Seguendo lo stesso ragionamento fatto poc'anzi, valori piccoli di L(x) rappresentano prove a favore dell'ipotesi alternativa.