Laboratorio virtuale > Distribuzioni > 1 2 [3] 4 5 6 7 8 9

3. Distribuzioni miste


Al solito, inziamo con l'introdurre un esperimento casuale definito su un certo spazio campionario e con misura di probabilità P. In questo paragrafo, presenteremo due casi "misti" per la distribuzione di una variabile casuale: il caso in cui la distribuzione è in parte discreta e in parte continua e il caso in cui la variabile ha sia coordinate discrete che coordinate continue.

Distribuzioni di tipo misto

Supponi che X sia una variabile casuale relativa all'esperimento, a valori in un sottinsieme S di Rn. X ha distribuzione di tipo misto se S può essere partizionato in sottinsiemi D e C con le seguenti proprietà:

  1. D è numerabile e 0 < P(X in D) < 1.
  2. P(X = x) = 0 per x in C.

Quindi parte della distribuzione di X è concentrata su punti di un insieme discreto D; il resto è ripartito in maniera continua su C.

Sia p = P(X in D), cosicché 0 < p < 1. Possiamo definire su D una funzione di densità discreta parziale.

Esercizio teorico 1. Sia g(x) = P(X = x) per x appartenente a D. Prova che

  1. g(x) >= 0 per x appartenente a D.
  2. sumx in D g(x) = p.
  3. P(X in A) = sumx in A g(x) per A D.

Di solito, anche la parte continua della distribuzione è descritta da una funzione di densità parziale. Supponiamo quindi che esista una funzione non negativa h su C tale che

P(X in A) = A h(x)dx per A C.

Esercizio teorico 2. Prova che C h(x)dx = 1 - p.

la distribuzione di X è individuata completamente dalle densità parziali g e h. In primo luogo, estendiamo le funzioni g e h a S nella maniera consueta: g(x) = 0 per x appartenente a C; h(x) = 0 per x appartenente a D.

Esercizio teorico 3. Supponi che A S. Prova che

P(X in A) = sommatoriax in A g(x) + A h(x)dx.

Le distribuzioni condizionate su D e C sono, rispettivamente, solamente discreta e solamente continua.

Esercizio teorico 4. Dimostra che la distribuzione condizionata di X dato X in D è discreta con funzione di densità

f(x | X in D) = g(x) / p per x in D.

Esercizio teorico 5. Dimostra che la distribuzione condizionata di X dato X in C è continua con funzione di densità

f(x | X in C) = h(x) / (1 - p) per x in C.

La distribuzione di X è pertanto un ibrido tra distibuzione discreta e continua. Le distribuzioni miste sono studiate in maniera più generale nel paragrafo sulle distribuzioni condizionate.

Esercizio teorico 6. Supponi che X abbia probabilità 1/2 distribuita uniformemente su {1, 2, ..., 8} e probabilità 1/2 distribuita uniformemente sull'intervallo (0, 10). Trova P(X > 6).

Esercizio teorico 7. Supponi che (X, Y) abbia probabilità 1/3 distribuita uniformemente su {0, 1, 2}2 e probabilità 2/3 distribuita uniformemente su (0, 2)2. Trova P(Y > X).

Variabili troncate

Le distribuzioni di tipo misto si presentano in maniera naturale quando una variabile casuale con distribuzione continua viene in qualche modo troncata. Per esempio, supponiamo che T sia la durata di un congegno e abbia funzione di densità f(t) per t > 0. Nel contesto di un test inerente la rottura di un congegno, non possiamo aspettare all'infinito, per cui possiamo scegliere una costante positiva a e registrare la seguente variabile casuale:

U = T se T < a; U = a se T >= a.

Esercizio teorico 8. Prova che U ha distribuzione mista; in particolare mostra che, con la notazione di cui sopra,

  1. D = {a} e g(a) = {t: t > a} f(t)dt.
  2. C = (0, a) e h(t) = f(t) per 0 < t < a.

Esercizio teorico 9. Supponi che la durata T di un congegno (in unità di 1000 ore) abbia distribuzione esponenziale f(t) = exp(-t), t > 0. Il test per il dispositivo deve avere termine dopo 2000 ore; si registra la durata troncata U. Trova

  1. P(U < 1).
  2. P(U = 2).

Supponiamo che X abbia distribuzione continua su R, con funzione di densità f. La variabile viene troncata a a e b (a < b) per creare una nuova variabile Y definita come segue:

Y = a se X a; Y = X se a < X < b; Y = b se X >= b.

Esercizio teorico 10. Mostra che Y ha distribuzione mista. In particolare, prova che

  1. D = {a, b}, g(a) = {x: x < a} f(x)dx, g(b) = {x: x > b} f(x)dx.
  2. C = (a, b) e h(x) = f(x) per a < x < b.

Coordinate miste

Supponiamo che X e Y siano variabili casuali relative al nostro esperimento, e che X abbia distribuzione discreta a valori in un insieme numerabile S mentre Y ha distribuzione continua su un sottinsieme T di Rn. Allora (X, Y) ha distribuzione continua su qualche sottinsieme di S × T.

Esercizio teorico 11. Dimostra che P[(X, Y) = (x, y)] = 0 per x appartenente a S, y appartenente a T.

Di solito, (X, Y) ha funzione di densità f su S × T nel senso seguente:

P[(X, Y) in A × B] = sommatoriax in A B f(x, y)dy per A S e B T,

Esercizio teorico 12. Più in generale, per C S × T e x in S, sia C(x) = {y in T: (x, y) in C}. Dimostra che

P[(X, Y) in C] = sommatoriax in S C(x) f(x, y)dy.

Tecnicamente, f è la densità di (X, Y) rispetto a una misura di conteggio su S e a una misura n-dimensionale su T.

I vettori casuali con coordinate miste si presentano spesso nei problemi applicati. Per esempio, i dati sulla cicala contengono 4 variabili continue e 2 variabili discrete. I dati M&M contengono 6 variabili discrete e 1 variabile continua. I vettori con coordinate miste si presentano anche quando si casualizza un parametro discreto per una distribuzione continua, o un parametro continuo per una distribuzione discreta.

Esercizio teorico 13. Sia f(1, y) = 1/3 per 0 < y < 1, f(2, y) = 1/6 per 0 < y < 2, f(3, y) = 1/9 per 0 < y < 3.

  1. Mostra che f è una densità mista nel senso precisato sopra, con S = {1, 2, 3}, T = (0, 3).
  2. Trova P(X > 1, Y < 1) dove (X, Y) ha densità f.

Esercizio teorico 14. Sia f(p, k) = 6 C(3, k) pk + 1(1 - p)4 - k per k in {0, 1, 2, 3} e p in (0, 1).

  1. Mostra che f è una densità mista nel senso precisato sopra.
  2. Trova P(V < 1 / 2, X = 2) dove (V, X) ha densità f.

Come vedremo nel paragrafo sulle distribuzioni condizionate, la distribuzione dell'esercizio precedente serve a modellare il seguente esperimento: si seleziona una probabilità aleatoria V e poi si lancia tre volte una moneta con questa probabilità di testa; X è il numero di teste.

Esercizio numerico 15. Sui dati M&M, sia N il numero totale di pastiglie e W il peso netto (in grammi). Costruisci una densità empirica per (N, W).