Laboratorio virtuale > Stima intervallare > 1 2 3 4 5 [6]

6. Intervalli di confidenza Bayesiani


Definizioni

Al solito, iniziamo introducendo un esperimento casuale definito su un certo spazio campionario e con misura di probabilità P. Nel modello statistico di base, abbiamo una variabile casuale osservabile X a valori in S. In generale, X può avere struttura complessa. Per esempio, se l'esperimento consiste nell'estrarre n unità da una popolazione e registrare le misurazioni di interesse, allora

X = (X1, X2, ..., Xn)

dove Xi è il vettore di misurazioni per l'i-esima unità. Il caso più importante si ha quando X1, X2, ..., Xn, sono indipendenti e identicamente distribuite. In questo caso, abbiamo un campione casuale di dimensione n estratto dalla distribuzione comune.

Supponiamo inoltre che la distribuzione di X dipenda da un parametro a che assume valori in uno spazio parametrico A. Normalmente, a è un vettore di parametri reali, cosicché A è sottinsieme di Rk per dati k e

a = (a1, a2, ..., ak).

Ricorda che nell'analisi Bayesiana, il parametro ignoto a è trattato come una variabile casuale. In particolare, supponiamo che la densità condizionata del vettore di dati X dato a sia f(x | a). Inoltre, assegnamo al parametro a distribuzione a priori con densità h. (La distribuzione a priori è scelta in modo da riflettee la nostra conoscenza, se ne abbiamo, relativamente al parametro). La densità congiunta del vettore dei dati e del parametro è

f(x | a) h(a), per x appartenente a S e a appartenente a A.

Inoltre la densità (non condizionata) di X è data dalla funzione g(x) ottenuta integrando (nel caso continuo) o sommando (nel caso discreto) la densità congiunta per i diversi a appartenenti ad A. Infine, la densità a posteriori di a dato x è (per il teorema di Bayes)

h(a | x) = f(x | a)h(a) / g(x) per x appartenente a S e a appartenente a A.

Sia ora A(X) un insieme di confidenza (cioè un sottinsieme dello spazio parametrico che dipende dalla variabile X, ma non da parametri ignoti). Una possibile definizione per l'insieme di confidenza Bayesiano al livello 1 - r richiede che

P[a in A(X) | X = x] = 1 - r.

In questa definizione, solo a è stocastico, per cui la probabilità di cui sopra si può calcolare utilizzando la densità a posteriori h(a | x). Un'altra possibile definizione impone che

P[a in A(X)] = 1 - r.

In questo caso, sia X che a sono casuali, per cui la probabilità dev'essere calcolata utilizzando la densità congiunta f(x | a)h(a). Al di là delle argomentazioni teoretiche, la prima definizione è senz'altro più semplice dal punto di vista computazionale, ed è quindi la più utilizzata.

Confrontiamo ora l'approccio Bayesiano con quello classico. In quest'ultimo, il parametro è deterministico ma ignoto. Prima di raccogliere i dati, l'insieme di confidenza (che risulta casuale), contiene il parametro con probabilità 1 - r. Dopo aver raccolto i dati, l'insieme di confidenza (calcolato) può contenere oppure no il parametro (e di solito non lo sappiamo). Al contrario, in un insieme di confidenza Bayesiano, il parametro stocastico a giace nell'insieme di confidenza (deterministico) con probabilità 1 - r.

La distribuzione di Bernoulli

Supponiamo che (I1, I2, ..., In) sia un campione casuale della distribuzione di Bernoulli con parametro p. Supponiamo inoltre che p abbia distribuzione a priori beta con parametri a > 0, b > 0. Sia X = I1 + I2 + ··· + In.

Esercizio teorico 1. Prova che, dato X = x, un intervallo di confidenza Bayesiano al livello 1 - r per p è [L(x), U(x)], dove L(x) è il quantile di ordine r / 2 e U(x) è il quantile di ordine 1 - r / 2 della distribzione beta con parametri a + x, b+ (n - x).

Esercizio teorico 2. In particolare, supponi di avere una moneta con probabilità ignota p che esca testa e di assgnare a p disribuzione a priori uniforme. Lanci poi la moneta 10 volte e ottieni 7 teste. Calcola l'intervallo di confidenza Bayesiano al 90% per p.

La distribuzione di Poisson

Supponi che (X1, X2, ..., Xn) sia un campione casuale di dimensione n da una distribuzione di Poisson con parametro µ. Supponi inoltre che µ abbia distribuzione a priori gamma con parametro di forma k e parametro di scala b. Sia Y = X1 + X2 + ··· + Xn.

Esercizio teorico 3. Prova che, dato Y = y, un intervallo di confidenza Bayesiano al livello 1 - r per µ è [L(y), U(y)], dove L(y) è il quantile di ordine r / 2 e U(y) è il quantile di ordine 1 - r / 2 della distribuzione gamma con parametro di forma k + y e parametro di scala b / (nb + 1).

Esercizio teorico 4. In particolare, supponi che il numero di difetti in un manufatto abbia distribuzione di Poisson con parametro µ e di assegnare a µ distribuzione a priori esponenziale con parametro 1. Estraiamo 5 manufatti e osserviamo in totle 8 difetti. Calcola l'intervallo di confidenza Bayesiano al 90%.