Laboratorio virtuale > Distribuzioni > 1 2 3 4 5 6 [7] 8 9

7. Trasformazioni di variabili


Il problema generale

Al solito, iniziamo introducendo un esperimento casuale su un certo spazio campionario e con misura di probabilità P. Supponiamo di avere una variabile casuale X relativa all'esperimento, a valori in S e una trasformazione r: S to T. Y = r(X) è pertanto una nuova variabile casuale a valori in T. Se la distribuzione di X è nota, come facciamo a trovare la distribuzione di Y? In senso superficiale, la soluzione è semplice.

Esercizio teorico 1. Prova che

P(Y in B) = P[X in r -1(B)] for B T.

Però spesso la distribuzione di X è nota o tramite la sua funzione di ripartizione F o tramite la sua funzione di densità f, e similmente si sarà interessati a trovare la funzione di ripartizione o di densità di Y. Questo problema è generalmente più difficile poiché, come vedremo, anche trasformazioni semplici di variabili con distribuzioni semplici possono produrre variabili con distribuzioni complesse. Risolveremo questo problema in alcuni casi particolari.

Trasformazioni discrete

Esercizio teorico 2. Supponi che X abbia distribuzione discreta con densità f (per cui S è numerabile). Dimostra che Y ha distribuzione discreta con funzione di densità g data da

g(y) = x in r-1(y) f(x) per y appartenente a T.

Esercizio teorico 3. Supponi che X abbia distribuzione continua su un sottinsieme S di Rn, con densità f e che T sia numerabile. Mostra che Y ha distribuzione continua con funzione di densità g data da

g(y) = r-1(y) f(x)dx per y appartenente a T.

Esercizio teorico 4. Supponi di lanciare due dadi equilibrati e di registrare la sequenza dei punteggi (X1, X2). Trova la funzione di densità delle seguenti variabili casuali:

  1. Y = X1 + X2.
  2. Z = X1 - X2.
  3. U = min{X1, X2}
  4. V = max{X1, X2}
  5. (Y, Z)
  6. (U, V)

Esercizio teorico 5. Supponi che T abbia funzione di densità f(t) = r exp(-rt), t > 0 dove r > 0 è un parametro. (Si tratta della distribuzione esponenziale con parametro di velocità r). Trova la funzione di densità delle seguenti variabili casuali:

  1. floor(T) (il minor intero minore o uguale a T).
  2. ceil(T) (il minor intero maggiore o uguale a T).

Esercizio teorico 6. Supponi che (X, Y) abbia funzione di densità f(x, y) = x + y per 0 < x < 1, 0 < y < 1. Sia I la variabile indicatore dell'evento {X > 1/2} e J la variabile indicatore dell'evento {Y > 1/2}. Trova la densità di (I, J).

Distribuzioni continue

Supponiamo che Y = r(X), dove X e Y hanno distribuzione continua e X ha densità nota f. In molti casi la densità di Y può essere ottenuta trovando la funzione di ripartizione di Y (utilizzando le regole della probabilità) e facendone la derivata.

Esercizio teorico 7. Supponi che X sia distribuita uniformemente sull'intervallo (-2, 2). Sia Y = X2.

  1. Trova la funzione di ripartizione di Y.
  2. Trova la funzione di densità di Y e tracciane il grafico.

Esercizio teorico 8. Supponi che X sia distribuita uniformemente sull'intervallo (-1, 3). Sia Y = X2.

  1. Trova la funzione di ripartizione di Y.
  2. Trova la funzione di densità di Y e tracciane il grafico.

L'ultimo esercizio mostra che anche una trasformazione semplice di una distribuzione semplice può produrre una distribuzione complessa.

Esercizio teorico 9. Supponi che X abbia funzione di densità f(x) = a / xa + 1 per x > 1, dove a > 0 è un parametro (si tratta della distribuzione di Pareto con parametro di forma a). Sia Y = ln(X).

  1. Trova la funzione di ripartizione di Y.
  2. Trova la funzione di densità di Y e tracciane il grafico.

Osserva che la variabile casuale Y dell'esercizio precedente ha distribuzione esponenziale con parametro di velocità a.

Esercizio teorico 10. Supponi che (X, Y) abbia densità f(x, y) = exp(-x -y) per x > 0, y > 0. X e Y sono pertanto indipendenti, e ciascuno ha distribuzione esponenziale con parametro 1. Sia Z = Y / X.

  1. Trova la funzione di ripartizione di Z.
  2. Trova la funzione di densità di Z.

Esercizio teorico 11. Valore assoluto di una variabile casuale. Supponi che X abbia distribuzione continua su R con funzione di ripartizione F e funzione di densità f. Dimostra che

  1. |X| ha funzione di ripartizione G(y) = F(y) - F(-y) per y > 0.
  2. |X| ha funzione di densità g(y) = f(y) + f(-y) per y > 0.

Esercizio teorico 12. Continua. Supponi che la densità f di X sia simmetrica attorno a 0. Sia J il segno di X, per cui J = 1 se X > 0, J = 0 se X = 0 e J = -1 se X < 0. Prova che

  1. |X| ha funzione di ripartizione G(y) = 2F(y) - 1 per y > 0.
  2. |X| ha funzione di densità g(y) = 2f(y) per y > 0.
  3. J è distribuita uniformemente su {-1, 1}
  4. |X| e J sono indipendenti.

La distribuzione uniforme su (0, 1)

Un fatto degno di nota è che la distribuzione uniforme su (0, 1) può essere trasformata in ciascun'altra distribuzione su R. Ciò è particolarmente importante per le simulazioni, poiché molti linguaggi di programmazione possiedono algoritmi per la generazione di numeri casuali, cioè replicazioni di variabili indipendenti, ciascun distribuita su (0, 1). Di converso, ogni distribuzione continua supportata su un intervallo di R può essere trasformata nella distribuzione uniforme su (0, 1).

Supponiamo in primo luogo che F sia una funzione di ripartizione, e indichiamo con F-1 la funzione quantile.

Esercizio teorico 13. Supponi che U sia distribuita uniformemente su (0, 1). Prova che X = F-1(U) ha funzione di ripartizione F.

Assumendo di poter calcolare F-1, l'esercizio precedente mostra come si possa simulare una distribuzione con funzione di ripartizione F. In altri termini, possimao simulare una variabile con funzione di ripartizione F semplicemente calcolando un quantile casuale.

Esercizio teorico 14. Supponi che X abbia distribuzione continua su un intervallo S e che la funzione di ripartizione F sia strettamente crescente su S. Dimostra che U = F(X) ha distribuzione uniforme su (0, 1).

Esercizio teorico 15. Mostra come simulare, partendo da un numero casuale, la distribuzione uniforme sull'intervallo (a, b).

Esercizio teorico 16. Mostra come simulare, partendo da un numero casuale, la distribuzione esponenziale con parametro di velocità r > 0.

Esercizio teorico 17. Mostra come simulare, partendo da un numero casuale, la distribuzione di Pareto con parametro di forma a > 0.

La formula del cambiamento di variabile

Quando la trasformazione r è biunivoca e "liscia" (nel senso che non ha "salti"), esite una formula per trovare la densità di Y direttamente in termini della densità di X. Tale risultato è detto formula del cambiamento di variabile

Analizziamo in primo luogo il caso monodimensionale, in cui concetti e formule sono più semplici. Supponiamo perciò che una variabile casuale X abbia distribuzione continua su un intervallo S di R con funzione di ripartizione F e funzione di densità f. Supponi che Y = r(X) dove r è funzione derivabile da S su un intervallo T. Al solito, indicheremo con G la funzione di ripartizione di Y e con g la funzione di densità di Y.

Esercizio teorico 18. Supponi che r sia strettamente crescente su S. Prova che, per y appartenente a T

  1. G(y) = F[r-1(y)]
  2. g(y) = f[r-1(y)] dr-1(y) / dy

Esercizio teorico 19. Supponi che r sia strettamente decrescente su S. Prova che, per y appartenente a T

  1. G(y) = 1 - F[r-1(y)]
  2. g(y) = -f[r-1(y)] dr-1(y) / dy

Le formule degli esercizi 18 (a) e 19 (b) possono essere combinate: se r è strettamente monotona su S allora la densità g di Y è data da

g(y) = f[r-1(y)] |dr-1(y) / dy| per y appartenente a T.

La generalizzazione di questo risultato è in ultima analisi un teorema di analisi multivariata. Supponiamo che X sia una variabile casuale a valori in un sottinsieme S di Rn e che X abbia distribuzione continua con funzione di densità di probabilità f. Supponiamo inoltre che Y = r(X) dove r è una funzione biunivoca e derivabile da S su un sottinsieme T di Rn. Il Jacobiano (detto così in onore di Karl Gustav Jacobi) della funzione inversa

x = r -1(y)

è il determinante della matrice di derivate prime della funzione inversa, ovvero la matrice il cui elemento (i, j) è la derivata di xi rispetto a yj. Indicheremo il Jacobiano con J(y). La formula del cambiamento di variabile nel caso multivariato afferma che la densità g di Y è data da

g(y) = f[r-1(y)] |J(y)| per y appartenente a T.

Esercizio teorico 20. Supponi che X sia distribuito uniformemente sull'intervallo (2, 4). Trova la funzione di densità di Y = X2.

Esercizio teorico 21. Supponi che X abbia funzione di densità f(x) = x2 / 3 per –1 < x < 2. Trova la funzione di densità di Y = X1/3.

Esercizio teorico 22. Supponi che X abbia distribuzione di Pareto con parametro di forma a > 0. Trova la funzione di densità di Y = 1/X. La distribuzione di Y è una beta con parametri a e b = 1.

Esercizio teorico 23. Supponi che X e Y siano indipendenti e uniformemente distribuite su (0, 1). Sia U = X + Y e V = X - Y.

  1. Disegna il campo di variazione di (X, Y) e di (U, V).
  2. Trova la funzione di densità di (U, V).
  3. Trova la funzione di densità di U.
  4. Trova la funzione di densità di V.

Alcuni dei risultati dell'esercizio precedente saranno generalizzati più avanti.

Esercizio teorico 24. Supponi che (X, Y) abbia funzione di densità di probabilità f(x, y) = 2(x + y) per 0 < x < y < 1. Sia U = XY e V = Y/X.

  1. Disegna il campo di variazione di (X, Y) e di (U, V).
  2. Trova la funzione di densità di (U, V).
  3. Trova la funzione di densità di U.
  4. Trova la funzione di densità di V.

Trasformazioni lineari

Le trasformazioni lineari sono tra le più comuni e le più importanti. In più, il teorema del cambiamento di variabile ha forma particolarmente semplice quando la trasformazione lineare è espressa in forma matriciale. Supponimo, come sopra, che X sia una variabile casuale a valori in un sottinsieme S di Rn e che X abbia distribuzione continua su S con funzione di densità di probabilità f. Sia

Y = AX

dove A è una matrice invertibile n × n. Ricorda che la trasformazione y = Ax è biunivoca, e la trasformazione inversa è

x = A-1y.

Notiamo che Y assuma valori in un sottinsieme T = {Ax: x in S} of Rn.

Esercizio teorico 25. Dimostra che il Jacobiano è J(y) = det(A-1) per y in T.

Esercizio teorico 26. Applica il teorema del cambiamento di variabile per mostrare che Y ha funzione di densità

g(y) = f(A-1y) |det(A-1)| for y in T.

La distribuzione uniforme permane sotto trasformazioni lineari:

Esercizio teorico 27. Supponi che X sia distribuita uniformemente su S. Mostra che Y è distribuita uniformemente su T.

Esercizio teorico 28. Supponi che (X, Y, Z) sia distribuito uniformemente sul cubo (0, 1)3. Trova la funzione di densità di

(U, V, W) dove U = X + Y, V = Y + Z, W = X + Z.

Esercizio teorico 29. Supponi che (X, Y) abbia funzione di densità f(x, y) = exp[-(x + y)] per x > 0, y > 0 (quindi X e Y sono indipendenti e con distribuzione esponenziale con parametro 1). Trova la funzione di densità di

(U, V) dove U = X + 2Y, V = 3X - Y.

Convoluzione

La più importante di tutte le trasformazioni è la semplice addizione.

Esercizio teorico 30. Supponi che X e Y siano variabili casuali discrete e indipendenti, a valori nei sottinsiemi S e T di R, con funzioni di densità rispettivamente f e g. Prova che la densità di Z = X + Y è

f * g(z) = x f(x)g(z - x)

dove la sommatoria è per gli {x in R: x in S e z - x in T}. La densità f * g è detta convoluzione discreta di f e g.

Esercizio teorico 31. Supponi che X e Y siano variabili casuali continue e indipendenti, a valori nei sottinsiemi S e T di R, con funzioni di densità rispettivamente f e g. Prova che la densità di Z = X + Y è

f * g(z) = integralR f(x)g(z - x)dx.

La densità f * g è detta convoluzione continua di f e g.

Esercizio teorico 32. Prova che la convoluzione (discreta o continua) soddisfa le seguenti proprietà

  1. f * g = g * f (proprietà commutativa)
  2. f * (g * h) = (f * g) * h (proprietà associativa)

Notiamo che se X1, X2, ..., Xn sono indipendenti e identicamente distribuite con funzione di densità comune f, allora

Y = X1 + X2 + ··· + Xn.

ha funzione di densità f*n, la convoluzione n-fold di f con se stessa.

Esercizio teorico 33. Supponi di lanciare due dadi equilibrati. Trova la densità della somma dei punteggi.

Simulazione 34. Nell'esperimento dei dadi, seleziona due dadi equilibrati. Simula 1000 replicazioni, aggiornando ogni 10, e osserva la convergenza della funzione di densità empirica a quella teorica.

Esercizio teorico 35. In un dado piatto uno-sei, le facce 1 e 6 si escono con probabilità 1/4 ciascuna e le altre facce con probabilità 1/8 ciascuna. Supponi di lanciare due volte un dado di questo tipo. Trova la densità della somma dei punteggi.

Simulazione 36. Nell'esperimento dei dadi, seleziona due dadi piatti uno-sei. Simula 1000 replicazioni, aggiornando ogni 10, e osserva la convergenza della funzione di densità empirica a quella teorica.

Esercizio teorico 37. Supponi di lanciare un dado equilibrato e un dado piatto uno-sei. Trova la funzione di densità della somma dei punteggi.

Esercizio teorico 38. Supponi che X abbia distribuzione esponenziale con parametro di velocità a > 0, Y abbia distribuzione esponenziale con parametro di velocità b > 0 e che X e Y siano indipendenti. Trova la densità di Z = X + Y.

Esercizio teorico 39. Sia f la funzione di densità della distribuzione uniforme su (0, 1). Calcola f*2 e f*3. Traccia i grafici delle densità.

Molte importanti famiglie parametriche di distribuzioni sono chiuse rispetto alla convoluzione. Ciò significa che, quando due variabili casuali indipendenti hanno distribuzioni che appartengono a una certa famiglia, così è per la loro somma. Si tratta di una proprietà molto importante ed è una delle ragioni della rilevanza di tali famiglie.

Esercizio teorico 40. Ricorda che f(n) = exp(-t) tn / n! per n = 0, 1, 2, ... è la funzione di densità di probabilità della distribuzione di Poisson con parametro t > 0. Supponi che X e Y siano indipendenti, e che X abbia distribuzione di Poisson con parametro a > 0 mentre Y abbia distribuzione di Poisson con parametro b > 0. Prova che X + Y ha distribuzione di Poisson con parametro a + b. Suggerimento: Usa il teorema binomiale.

Esercizio teorico 41. Ricorda che f(k) = C(n, k) pk (1 - p)n - k for k = 0, 1, ..., n è la funzione di densità di probabilità della distribuzione binomiale con parametri n appartenente a {1, 2, ...} e p appartenente a (0, 1). Supponi che X e Y siano indipendenti e che X abbia distribuzione binomiale con parametri n e p  mentre Y ha distribuzione binomiale con parametri m e p. Prova che X + Y ha distribuzione binomiale con parametri n + m e p. Suggerimento: Usa il teorema binomiale.

Minimo e massimo

Supponi che X1, X2, ..., Xn siano variabili casuali indipendenti a valori reali e che Xi abbia funzione di ripartizione Fi per ciascun i. Le trasformazioni minimo e massimo sono molto importanti per un gran numero di applicazioni. Specificamente, siano 

  e siano rispettivamente G e H le funzioni di ripartizione di U e V.  . 

Esercizio teorico 42.  Prova che

  1. V <= x se e solo se X1 <= x, X2 <= x, ..., Xn <= x.
  2. H(x) = F1(x) F2(x) ··· Fn(x) per x appartenente a R.

Esercizio teorico 43. Prova che

  1. U > x se e solo se X1 > x, X2 > x, ..., Xn > x.
  2. G(x) = 1 - [1 - F1(x)][1 - F2(x)] ··· [1 - Fn(x)] per x appartenente a R.

Se Xi ha distribuzione continua con funzione di densità fi per ogni i, allora U e V hanno anch'esse distribuzione continua, e le densità possono essere ottenute derivando le funzioni di ripartizione degli esercizi 37 e 38.

Esercizio teorico 44. Supponi che X1, X2, ..., Xn siano variabili casuali indipendenti distribuite uniformemente su (0, 1). Trova le funzioni di ripartizione e di densità di

  1. U = min{X1, X2, ..., Xn}
  2. V = max{X1, X2, ..., Xn}

Nota che U e V dell'esercizio precedente hanno distribuzione beta.

Simulazione 45. Nell'esperimento statistica d'ordine, seleziona la distribuzione uniforme. 

  1. Poni k = 1 (per avere il minimo U). Modifica n con la barra e osserva la forma della funzione di densità. Con n = 5, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.
  2. Modifica n con la barra a scorrimento, ponendo ogni volta k = n (per avere il massimo V) e osserva la forma della funzione di densità. Con n = 5, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.

Esercizio teorico 46. Supponi che X1, X2, ..., Xn siano variabili casuali indipendenti e che Xi abbia distribuzione esponenziale con parametro di velocità ri > 0 per ogni i. Trova le funzioni di densità e di ripartizione di

  1. Trova la funzione di ripartizione di U = min{X1, X2, ..., Xn}
  2. Trova la funzione di ripartizione di  V = max{X1, X2, ..., Xn}
  3. Trova la funzione di densità di U e V nel caso in cui ri = r per ciascun i

Notiamo che il minimo U in (a) ha distribuzione esponenziale con parametro

r1 + r2 + ··· + rn.

Simulazione 47. Nell'esperimento statistica d'ordine, seleziona la distribuzione esponenziale. 

  1. Poni k = 1 (per avere il minimo U). Modifica n con la barra e osserva la forma della funzione di densità. Con n = 5, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.
  2. Modifica n con la barra a scorrimento, ponendo ogni volta k = n (per avere il massimo V) e osserva la forma della funzione di densità. Con n = 5, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.

Esercizio teorico 48. Supponi di lanciare n dadi equilibrati. Trova la funzione di densità del

  1. punteggio minimo
  2. punteggio massimo

Simulazione 49. Nell'esperimento dei dadi, seleziona dadi equilibrati e ciascuna delle seguenti variabili casuali. Modifica n con la barra e osserva la forma della funzione di densità. Con n = 4, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.

  1. punteggio minimo
  2. punteggio massimo

Esercizio teorico 50. Supponi di lanciare n dadi piatti uno-sei (le facce 1 e 6 hanno probabilità 1/4; le facce 2, 3, 4, 5 hanno probabilità 1/8). Trova la funzione di densità del

  1. punteggio minimo
  2. punteggio massimo

Simulazione 51. Nell'esperimento dei dadi, seleziona dadi piatti uno-sei e ciascuna delle seguenti variabili casuali. Modifica n con la barra e osserva la forma della funzione di densità. Con n = 4, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della funzione di densità empirica a quella teorica.

  1. punteggio minimo
  2. punteggio massimo

Per un argomento correlato, si rimanda alla trattazione delle statistiche d'ordine nel capitolo sui campioni casuali.