Completezza, sufficienza e ancillarità

6. Completezza, sufficienza e ancillarità

Consideriamo un modello statistico di base, con un espiremento casuale a cui è associata una variabile casuale osservabile X a valori in S. Di nuovo, l'esperimento consiste nell'estrarre n unità da una popolazione e registrarne le misure in un vettore. In questo caso, X ha forma

X = (X₁, X₂, ..., X_n).

dove X_i è il vettore delle misurazioni per l'i-esima unità.

Supponiamo che la distribuzione di X dipenda da un parametro a che assume valori in uno spazio parametrico A. In genere, a è un vettore di parametro reali.

Statistiche sufficienti

Intuitivamente, una statistica U = h(X) è sufficiente per a se U contiene tutta l'informazione relativa ad a disponibile nell'intero vettore dei dati X. Formalmente, U è sufficiente per a se la distribuzione condizionata di X dato U non dipende da a.

Il concetto di sufficienza è collegato a quello di riduzione dei dati. Supponiamo che X assuma valori in Rⁿ. Se possiamo individuare una statistica sufficiente U a valori in R^j, allora possiamo ridurre il vettore X (la cui dimensione n è solitamente grande) al vettore di statistiche U (la cui dimensione j è di solito molto minore) senza perdita di informazione sul parametro a.

Il seguente risultato è una condizione di sufficienza equivalente a questa definizione.

$Esercizio teorico$ 1. Si abbia U = h(X) e siano f(x | a) e g(u | a) le funzioni di densità di probabilità di X e U, rispettivamente. Dimostra che U è sufficiente per a se e solo se

f(x | a) / g(h(x) | a)

è indipendente da a per ogni x appartenente a S. Suggerimento: La distribuzione congiunta di (X, U) è concentrata sull'insieme {(x, h(x)): x S}.

$Esercizio teorico$ 2. Supponi che I₁, I₂, ..., I_n sia un campione casuale di dimensione n della distribuzione di Bernoulli con parametro p appartenente a (0, 1). Dimostra che X_n = I₁ + I₂ + ··· + I_n è sufficiente per p.

Il risultato dell'esercizio 2 è molto seducente in termini concettuali: in una sequenza di prove Bernoulliane, tutta l'informazione relativa alla probabilità di successo p è contenuta nel numero di successi X_n. L'ordine in cui si verificano successi e insuccessi non aggiunge alcuna informazione.

Il teorema di fattorizzazione

La definizione di sufficienza riportata poc'anzi coglie il significato intuitivo di questo concetto, ma può essere complessa da applicare. Dobbiamo conoscere a priori una statistica "candidata" U, e dobbiamo poi essere in grado di trovare la distribuzione condizionata di X dato U. Il teorema di fattorizzazione, che riportiamo nell'esercizio seguente, ci consente in molti casi di identificare una statistica sufficiente a partire dalla forma della funzione di densità di X.

$Esercizio teorico$ 3. Sia f(x | a) la funzione di densità di X. Dimostra che U = h(X) è sufficiente per a se e solo se esistono funzioni G(u | a) e r(x) tali che

f(x | a) = G[h(x) | a] r(x) per x appartenente a S e a appartenente a A.

Come la notazione stessa suggerisce, r dipende solo dal vettore dei dati x e non dal parametro a.

$Esercizio teorico$ 4. Prova che, se U e V sono statistiche equivalenti e U è sufficiente per a, allora V è sufficiente per a.

$Esercizio teorico$ 5. Supponi che la distribuzione di X sia una famiglia esponenziale a k parametri con statistica naturale h(X). Prova che h(X) è sufficiente per a.

Sulla base di questo risultato, h(X) è spesso indicata come statistica sufficiente naturale per la famiglia esponenziale.

$Esercizio teorico$ 6. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n della distribuzione normale con media µ appartenente a R e varianza d² > 0.

Prova che (X₁ + X₂ + ··· + X_n, X₁² + X₂² + ··· + X_n²) è sufficiente per (µ, d²),
Prova che (M, S²) è sufficiente per (µ, d²) dove M è la media campionaria e S² la varianza campionaria. Suggerimento: Usa il risultato (a) e l'equivalenza.

$Esercizio teorico$ 7. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n dalla distribuzione di Poisson con parametro a > 0. Prova che X₁ + X₂ + ··· + X_n è sufficiente per a dove

$Esercizio teorico$ 8. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n distribuzione gamma con parametro di forma k > 0 e parametro di scala b > 0.

Mostra che (X₁ + X₂ + ··· + X_n, X₁X₂ ··· X_n) è sufficiente per (k, b).
Mostra che (M, U) è sufficiente per (k, b) dove M è la media (aritmetica) campionaria e U è la media geometrica campionaria. Suggerimento: Usa il risultato (a) e l'equivalenza.

$Esercizio teorico$ 9. Supponi che X₁, X₂, ..., X_n sia un campione casuale estratto da una distribuzione beta con parametri a > 0 e b > 0. Mostra che (U, V) è sufficiente per (a, b) dove

U = X₁X₂ ··· X_n, V = (1 - X₁)(1 - X₂) ··· (1 - X_n).

$Esercizio teorico$ 10. Supponiamo che X₁, X₂, ..., X_n sia un campione casuale estratto dalla distribuzione uniforme sull'intervallo [0, a] dove a > 0. Mostra che X_(n) (l'n-esima statistica d'ordine) è sufficiente per a.

Statistiche sufficienti minimali

Ovviamente il vettore X è sufficiente per a. Tuttavia, come abbiamo già osservato, spesso esiste una statistica U sufficiente per a ma di dimensioni più piccole, cosicché è possibile ridurre effettivamente la dimensione dei dati. Chiaramente vorremmo individuare la statistica U di minori dimensioni possibili. In molti casi, la dimensione più piccola j coincide con la dimensione k del vettore dei parametri a. Tuttavia non è sempre così; j può essere più piccolo o più grande di k.

In termini più formali, supponiamo che una statistica U sia sufficiente per a. U è sufficiente minimale se U è funzione di una qualsiasi altra statistica V sufficiente per a.

Di nuovo, la definizione coglie alla perfezione il concetto di sufficienza minimale, ma è di difficile applicabilità. L'esercizio seguente presenta una condizione equivalente.

$Esercizio teorico$ 11. Sia f(x | a) la funzione di densità di X e sia U = h(X). Prova che U è sufficiente minimale per a se valgono le seguenti condizioni:

f(x | a) / f(y | a) non dipende da a se e solo se h(x) = h(y).

Suggerimento: Se V = g(X) è un'altra statistica sufficiente, usa il teorema di fattorizzazione e la condizione di cui sopra per mostrare che g(x) = g(y) implica h(x) = h(y). Concludi quindi che U è funzione di V.

$Esercizio teorico$ 12. Prova che, se U e V sono statistiche equivalenti e U è sufficiente minimale per a allora V è sufficiente minimale per a.

$Esercizio teorico$ 13. Supponi che la distribuzione di X sia una famiglia esponenziale a k parametri con statistica sufficiente naturale U = h(X). Prova che U è sufficiente minimale per a. Suggerimento: Ricorda che j è il più piccolo intero per cui X è una famiglia esponenziale a j parametri.

$Esercizio teorico$ 14. Prova che le statistiche sufficienti presentate sopra per le distribuzioni di Bernoulli, di Poisson, normale, gamma e beta sono sufficienti minimali per i parametri dati.

$Esercizio teorico$ 15. Supponi che X₁, X₂, ..., X_n sia un campione casuale estratto dalla distribuzione uniforme sull'intervallo [a, a + 1] dove a > 0. Dimostra che (X₍₁₎, X_(n)) è sufficiente minimale per a.

Nell'ultimo esercizio, osserva che si ha un unico parametro, ma la statistica minimale è un vettore a due dimensioni.

Proprietà delle statistiche sufficienti

La sufficienza è correlata ai metodi di costruzione degli stimatori che abbiamo studiato.

$Esercizio teorico$ 16. Supponi che U sia sufficiente per a e che esista uno stimatore di massima verosimiglianza di a. Mostra che esiste uno stimatore di massima verosimiglianza V che è funzione di U. Suggerimento: Usa il teorema di fattorizzazione.

In particolare, supponi che V sia l'unico stimatore di massima verosimiglianza di a e che V sia sufficiente per a. Se U è sufficiente per a, allora V è funzione di U, sulla base dell'esercizio precedente. Segue quindi che V è sufficiente minimale per a.

$Esercizio teorico$ 17. Supponi che la statistica U sia sufficiente per a e che V sia uno stimatore Bayesiano di a. Prova che V è funzione di U. Suggerimento: Usa il teorema di fattorizzazione.

L'esercizio seguente riporta il teorema di Rao-Blackwell, che mostra come una statistica sufficiente possa essere utilizzata per migliorare uno stimatore corretto.

$Esercizio teorico$ 18. Supponi che U sia sufficiente per a e che V sia uno stimatore corretto del parametro reale b = b(a). Usa la sufficienza, le proprietà di valore atteso condizionato e di varianza condizionata per mostrare che

E(V | U) è una statistica valida (ovvero non dipende da a) ed è funzione di U.
E(V | U) è uno stimatore corretto di b.
var[E(V | U)] var(V) per ogni a, per cui E(V | U) è uniformemente migliore di V.

Statistiche complete

Supponi che U = h(X) sia una statistica. U si dice completa se

E[g(U) | a] = 0 per ogni a appartenente a A implica P[g(U) = 0 | a] = 1 per ogni a appartenente a A.

$Esercizio teorico$ 19. Mostra che, se U e V sono statistiche equivalenti e U è completa per a allora V è completa per a.

$Esercizio teorico$ 20. Supponi che I₁, I₂, ..., I_n sia un campione casuale di dimensione n dalla distribuzione di Bernoulli con parametro p appartenente a (0, 1). Mostra che la somma è completa per p:

Y = I₁ + I₂ + ··· + I_n.

Suggerimento: Osserva che E_p[g(Y)] può essere scritto come polinomio in t = p / (1 - p). Se tale polinomio vale 0 per ogni t > 0, allora i coefficienti devono valere 0.

$Esercizio teorico$ 21. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n dalla distribuzione di Poisson con parametro a > 0. Mostra che la somma è completa per a:

Y = X₁ + X₂ + ··· + X_n.

Suggerimento: Osserva che E_a[g(Y)] può essere scritta come serie in a. Se la serie vale 0 per ogni a > 0, i coefficienti devono essere 0.

$Esercizio teorico$ 22. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n estratto da una distribuzione esponenziale con parametro di scala b > 0. Mostra che la somma è completa per b.

Y = X₁ + X₂ + ··· + X_n.

Suggerimento: Prova che E_b[g(Y)] è la trasformata di Laplace di una certa funzione . Se tale trasformata è 0 per ogni b > 0, allora la funzione dev'essere identicamente 0.

Il risultato dell'esercizio precedente si può generalizzare alle famiglie esponenziali, anche se la dimostrazione è complessa. In particolare, se la distribuzione di X è una famiglia esponenziale a j parametri con vettore di statistiche sufficieni naturali U = h(X) allora U è completa per a (nonché sufficiente minimale per a). Questo risultato si applica a campioni casuali estratti da distribuzioni di Bernoulli, di Poisson, normale, gamma e beta.

La nozione di completezza è dipendente dallo spazio parametrico.

$Esercizio teorico$ 23. Supponi che I₁, I₂, I₃ sia un campione casuale di dimensione 3 estratto da una distribuzione di Bernoulli con parametro p appartenente a {1/3, 1/2}. Prova che Y = I₁ + I₂ + I₃ non è completa per p.

L'esercizio seguente mostra l'importanza delle statistiche complete e sufficienti, ed è noto come teorema di Lehmann-Scheffe.

$Esercizio teorico$ 24. Supponi che U sia sufficiente e completa per a e che T = r(U) sia uno stimatore corretto del parametro reale b(a). Dimostra che T è UMVUE per b(a). La dimostrazione fa uso dei seguenti passi:

Supponi che V sia uno stimatore corretto di b(a). Per il teorema di Rao-Blackwell, anche E(V | U) è uno stimatore corretto di b(a) ed è uniformemente migliore di V.
Poiché E(V | U) è funzione di U, usa la completezza per concludere che T = E(V | U) (quasi certamente).

$Esercizio teorico$ 25. Supponi che (I₁, I₂, ..., I_n) sia un campione casuale di dimensione n estratto dalla distribuzione di Bernoulli con parametro p appartenente a (0, 1). Mostra che un UMVUE per la varianza della distribuzione p(1 - p)

X / (n - 1) - X² / [n(n - 1)] dove X = I₁ + I₂ + ··· + I_n.

$Esercizio teorico$ 26. Supponi che X₁, X₂, ..., X_n sia un sia un campione casuale di dimensione n da una distribuzione di Poisson con parametro a. Mostra che un UMVUE per P(X = 0) = e^-a è

[(n - 1) / n]^Y dove Y = X₁ + X₂ + ··· + X_n.

Suggerimento: Usa la funzione generatrice di probabilità di Y.

Statistiche ancillari

Supponi che V = r(X) sia una statistica. Se la distribuzione di V non dipende da a, allora V è detta statistica ancillare per a. Pertanto, la nozione di ancillarità è complementare a quella di sufficienza (ovvero il contenere tutte le informazioni disponibili sul parametro). Il risultato del seguente teorema, dimostrato da Basu, rende la situazione più chiara.

$Esercizio teorico$ 27. Supponi che U sia completa e sufficiente per a e che V sia una statistica ancillare. Prova che U e V sono indipendenti percorrendo i seguenti passi:

Supponi che V assuma valori in T . Sia g la funzione di densità di V e sia g(· | U) la densità condizionata di V dato U.
Usa le proprietà del valore atteso condizionato per mostrare che E[g(v | U)] = g(v) per v appartenente a T.
Usa la completezza per concludere che g(v | U) = g(v) quasi certamente.

$Esercizio teorico$ 28. Prova che, se U e V sono equivalenti e U è ancillare per a, allora anche V è ancillare per a.

$Esercizio teorico$ 29. Supponi che X₁, X₂, ..., X_n sia un campione casuale estratto da una famiglia di scala con parametro di scala b > 0. Prova che se V è funzione di X₁ / X_n, X₂ / X_n, ..., X_n - 1 / X_n allora V è ancillare per b.

$Esercizio teorico$ 30. Supponi che X₁, X₂, ..., X_n sia un campione casuale di dimensione n della distribuzione gamma con parametro di forma k > 0 e parametro di scala b > 0. Sia M la media campionaria (aritmetica) e U la media campionaria geometrica. Dimostra che M / U è ancillare per b, e concludi che M e M / U sono indipendenti. Suggerimento: Usa il risultato dell'esercizio precedente.