Funzioni di ripartizione

6. Funzioni di ripartizione

Definizione

Al solito, iniziamo introducendo un esperimento casuale su un certo spazio campionario e con misura di probabilità P. Supponiamo che X sia una variabile casuale a valori reali relativa all'esperimento. La funzione di ripartizione (cumulata) di X è la funzione F data da

F(x) = P(X x) per x appartenente a R.

Tale funzione è estremamente importante poiché ha senso per qualsiasi tipo di variabile, indipendentemente dal fatto che la distribuzione sia discreta, continua, o anche mista, e poiché individua completamente la distribuzione di X.

Abbrevieremo come segue alcuni dei limiti di F:

F(x⁺) = lim F(t) per t x⁺.
F(x^-) = lim F(t) per t x^-.
F() = lim F(t) per t .
F(-) = lim F(t) per t -

Proprietà fondamentali

Le proprietà elencate negli esercizi seguenti individuano completamente le funzioni di ripartizione. I teoremi di continuità della probabilità saranno utili per le dimostrazioni.

$Esercizio teorico$ 1. Prova che F è crescente: se x

y allora F(x)

F(y).

$Esercizio teorico$ 2. Dimostra che F(x⁺) = F(x) per x appartenente a R. Pertanto F è continua da destra:

$Esercizio teorico$ 3. Mostra che F(x^-) = P(X < x) per x appartenente a R. Quindi, F ha limiti sinistri:

$Esercizio teorico$ 4. Prova che F() = 1.

$Esercizio teorico$ 5. Prova che F(-) = 0.

L'esercizio seguente mostra come la funzione di ripartizione possa essere utilizzata per calcolare la probabilità che X cada in un certo intervallo. Ricorda che una distribuzione di probabilità su R è completamente individuata dalle probabilità degli intervalli; pertanto, la funzione di ripartizione individua la distribuzione di X. In ciascun caso, il risultato utile è

P(B A^c) = P(B) - P(A) se A B.

$Esercizio teorico$ 6. Supponi che a e b appartengano a R con a < b. Dimostra che

P(X = a) = F(a) - F(a^-)
P(a < X b) = F(b) - F(a)
P(a < X < b) = F(b^-) - F(a)
P(a X b) = F(b) - F(a^-)
P(a X < b) = F(b^-) - F(a^-)

$Esercizio teorico$ 7. Dimostra che se X ha distribuzione continua, allora la funzione di ripartizione F è continua.

Relazione con la funzione di densità

Esiste una relazione molto semplice tra funzione di ripartizione e funzione di densità.

$Esercizio teorico$ 8. Supponi che X abbia distribuzione discreta con funzione di densità f e funzione di ripartizione F. Prova che per x appartenente a R,

F(x) = _{t
<= x} f(t).
f(x) = F(x) - F(x^-)

Pertanto F è una funzione a gradini con "salti" per i valori di X con probabilità positiva; l'ampiezza del salto in x coincide con la funzione di densità in x. Esiste un risultato analogo per le distribuzioni continue.

$Esercizio teorico$ 9. Supponi che X abbia distribuzione continua con funzione di densità f e funzione di ripartizione F. Dimostra che

F(x) = _{t
<= x} f(t)dt.
f(x) = F'(x)

Per le distribuzioni miste, il risultato è una combinazione di quelli degli ultimi due esercizi.

$Esercizio teorico$ 10. Supponi che X abbia distribuzione mista con densità parziale discreta g e densità parziale continua h. Sia F la funzione di ripartizione. Dimostra che

F(x) = _{t
<= x} g(t) + _{t
<= x} h(t)dt.
g(x) = F(x) - F(x-) se F è discontinua in x.
h(x) = F'(x) se F è continua in x.

Ovviamente, la funzione di ripartizione può essere definita relativamente a ciascuna delle distribuzioni condizionate che abbiamo presentato. Non servono nuovi concetti, e tutti i risultati presentati poc'anzi continuano a valere.

$Esercizio teorico$ 11. Supponi che X abbia distribuzione continua su R con funzione di densità f simmetrica attorno a un punto a:

f(a + t) = f(a - t) per t appartenente a R.

Prova che la funzione di ripartizione F soddisfa

F(a - t) = 1 - F(a + t) per t appartenente a R.

Esercizi numerici

$Esercizio teorico$ 12. Supponi di lanciare due dadi equilibrati e registrare la sequenza di punteggi (X₁, X₂). Trova la funzione di ripartizione di

Y = X₁ + X₂, la somma dei punteggi.
V = max (X₁, X₂), il punteggio massimo.
Y dato V = 5.

$Esercizio teorico$ 13. Supponi che X sia distribuito uniformemente sull'intervallo (a, b) dove a < b.

Trova la funzione di ripartizione X.
Disegna i grafici delle funzioni di densità e di ripartizione.

$Esercizio teorico$ 14. Supponi che X abbia funzione di densità f(x) = 12x²(1 - x), 0 < x < 1. Ciò significa che X ha distribuzione beta.

Trova la funzione di ripartizione X.
Disegna i grafici delle funzioni di densità e di ripartizione.

$Esercizio teorico$ 15. Supponi che X abbia funzione di densità f(x) = r exp(-rx), x > 0 dove r > 0 è un parametro. Ciò significa che X ha distribuzione esponenziale con parametro di velocità r.

Trova la funzione di ripartizione X.
Disegna i grafici delle funzioni di densità e di ripartizione.

$Esercizio teorico$ 16. Supponi che X abbia funzione di densità f(x) = a / x^a⁺¹ per x > 1 dove a > 0 è un parametro. Ciò significa che X ha distribuzione di Pareto con parametro di forma a.

Trova la funzione di ripartizione X.
Disegna i grafici delle funzioni di densità e di ripartizione.

$Esercizio teorico$ 17. Supponi che X abbia funzione di densità f(x) = 1 / [ (1 + x²)] per x appartenente a R. Ciò significa che X ha distribuzione di Cauchy.

Trova la funzione di ripartizione X.
Disegna i grafici delle funzioni di densità e di ripartizione.

18. Nell'applet quantile, modifica i parametri e osserva la forma della funzione di densità e della funzione di ripartizione per ciascuna delle seguenti distribuzioni:

Normale
Gamma
Beta
Di Pareto

$Esercizio teorico$ 19. Sia F la funzione definita come segue:

F(x) = 0, per x < 1
F(x) = 1 / 10 per 1 x < 3 / 2
F(x) = 3 / 10 per 3 / 2 x < 2
F(x) = 6 / 10 per 2 x < 5 / 2
F(x) = 9 / 10 per 5 / 2 x < 3
F(x) = 1 per x 3.

Prova che F è la funzione di ripartizione di una distribuzione discreta.
Trova la corrispondente funzione di densità f.
Disegna i grafici di f e F.
Trova P(2 X < 3) dove X ha questa distribuzione.

$Esercizio teorico$ 20. Sia F(x) = 0 per x < 0, F(x) = x / (x + 1) for 0 x.

Prova che F è la funzione di ripartizione di una distribuzione continua.
Trova la corrispondente funzione di densità f.
Disegna i grafici di f e F.
Trova P(2 X < 3) dove X ha questa distribuzione.

$Esercizio teorico$ 21. Sia F la funzione definita da

F(x) = 0 per x < 0
F(x) = x / 4 per 0 x < 1
F(x) =1 / 3 + (x - 1)² / 4 per 1 x < 2
F(x) = 2 / 3 + (x - 2)³ / 4 per 2 x < 3
F(x) = 1 per x > 3

Disegna il grafico di F.
Prova che F è la funzione di ripartizione di una distribuzione mista.
Trova la densità parziale della parte discreta.
Trova la densità parziale della parte continua.
Trova P(2 X < 3) dove X ha questa distribuzione.

Quantili

Sia X una variabile casuale con funzione di ripartizione F. Supponi che p (0, 1). Un valore di x tale che

F(x^-) = P(X < x) p e F(x) = P(X x) p

è detto quantile di ordine p per la distribuzione. In prima approssimazione, un quantile di ordine p è un valore per cui la distribuzione cumulata passa per p.

Notiamo che sussiste una sorta di relazione inversa tra i quantili e i valori della distribuzione cumulata. Per esplorare ulteriormente questa relazione, supponiamo in primo luogo che F sia la funzione di ripartizione di una distribuzione continua su un intervallo aperto S. (Poiché la distribuzione è continua, non si perde in generalità assumendo che S sia aperto). Inoltre, supponiamo che F sia strettamente crescente, e che vada da S su (0, 1). (Ciò significa che ciascuno sottointervallo aperto di S ha probabilità positiva, cosicché la distribuzione ha supporto in S). F, allora, ha un'inversa definita F^-1 che vada da (0, 1) su S.

$Esercizio teorico$ 22. Sotto le condizioni di cui sopra, prova che F^-1(p) è l'unico quantile di ordine p.

Per il calcolo dei quantili e per molte altre applicazione è molto utile estendere la nozione di inversa a una funzione di ripartizione arbitraria F. Per p appartenente a (0, 1), definiamo la funzione quantile; come

F^-1(p) = inf{x R: p F(x)}.

Ovviamente, se S è un intervallo e F è strettamente crescente su S, allora F^-1 è l'inversa ordinaria di F, come visto poc'anzi. L'esercizio seguente ne spiega il nome: F^-1(p) è il minimo dei quantili di ordine p.

$Esercizio teorico$ 23. per p appartenente a (0, 1), prova che

F^-1(p) è un quantile di ordine p.
Se x è un altro quantile di ordine p allora F^-1(p) < x.

Le altre due proprietà fondamentali sono dati nei due esercizi seguenti.

$Esercizio teorico$ 24. Dimostra che, in generale

F^-1 è crescente in (0, 1).
F^-1[F(x)] x per ciascun x in R con 0 < F(x) < 1.
F[F^-1(p)] p per ciascun p in (0, 1).

$Esercizio teorico$ 25. Mostra che per x appartenente a R e p appartenente a (0, 1),

F^-1(p) x se e solo se p F(x).

Un quantile di ordine 1/2 si dice mediana della distribuzione. Quando c'è una sola mediana, la si può utilizzare come misura del centro della distribuzione. Un quantile di ordine 1/4 è detto primo quartile e uno di ordine 3/4 terzo quartile. Una mediana è un secondo quartile. Assumendo l'unicità, siano q₁, q₂ e q₃ rispettivamentede primo, secondo e terzo quartile di X. Nota che l'intervallo da q₁ a q₃ include metà della distribuzione, per cui lo scarto interquartile si definisce come

IQR = q₃ - q₁,

ed è a volte usato come misura della dispersione della distribuzione rispetto alla mediana. Siano a e b rispettivamente i valori minimo e massimo di X (assumendo che siano finiti). I cinque parametri

a, q₁, q₂, q₃, b

sono detti spesso five-number summary. Presi insiemi, tali parametri contengono un bel po' di informazioni sulla distribuzione in termini di centralità, dispersione e asimmetria. Graficamente, tali parametri sono spesso rappresentati in un boxplot, formato da una linea che si estende dal valore minimo a al valore massimo b, con una rettangolo da q₁ a q₃, e segni in a, q₂ (la mediana) e b.

26. Nell'istogramma interattivo, seleziona boxplot. Poni l'ampiezza di classe a 0.1 e costruisci una distribuzione discreta con almeno 30 valori di ciascuno dei tipi indicati sotto. Osserva la forma del boxplot e le posizioni relative dei parametri del five-number summary:

Distribuzione uniforme.
Distribuzione simmetrica unimodale.
Distribuzione unimodale asimmetrica a destra.
Distribuzione unimodale asimmetrica a sinistra.
Distribuzione simmetrica bimodale
Distribuzione a forma di u.

$Esercizio teorico$ 27. Supponi che F sia la funzione di ripartizione della distribuzione uniforme su [a, b].

Trova la funzione quantile F^-1(p).
Riporta il five number summary e disegna il boxplot.

$Esercizio teorico$ 28. Supponi che F sia la funzione di ripartizione della distribuzione esponenziale con parametro di velocità r.

Trova la funzione quantile F^-1(p).
Trova mediana, primo e terzo quartile e scarto interquartile.
Con r = 2, disegna il grafico della funzione di densità e indica la media e il primo e il terzo quartile.

$Esercizio teorico$ 29. Supponi che F sia la funzione di ripartizione della distribuzione di Pareto con parametro di forma a.

Trova la funzione quantile F^-1(p).
Trova mediana, primo e terzo quartile e scarto interquartile.
Con a = 2, disegna il grafico della funzione di densità e indica la media e il primo e il terzo quartile.

$Esercizio teorico$ 30. Supponi che F sia la funzione di ripartizione della distribuzione di Cauchy.

Trova la funzione quantile F^-1(p).
Trova mediana, primo e terzo quartile e scarto interquartile.
Disegna il grafico della funzione di densità e indica la media e il primo e il terzo quartile.

$Esercizio teorico$ 31. Trova la funzione quantile F^-1 della funzione di ripartizione F dell'esercizio 19.

$Esercizio teorico$ 32. Trova la funzione quantile F^-1 della funzione di ripartizione F dell'esercizio 20.

$Esercizio teorico$ 33. Trova la funzione quantile F^-1 della funzione di ripartizione F dell'esercizio 21.

34. Nell'applet quantile, trova la mediana e il primo e terzo quartile delle seguenti distribuzioni. In ciascun caso, osserva sia la funzione di densità che la funzione di ripartizione.

Distribuzione normale standardizzata (mi = 0, sigma = 1)
Distribuzione gamma con parametro di forma 2 e parametro di scala 1.
Distribuzione beta con a = 1.5 e b = 2.
Distribuzione di Pareto con parametro di forma 2.

$Esercizio teorico$ 35. Supponi che X abbia distribuzione continua su R con densità f simmetrica rispetto a un punto a:

f(a - t) = f(a + t) per t appartenente a R.

Dimostra che se a + t è un quantile di ordine p allora a - t è un quantile di ordine 1 - p.

La funzione di ripartizione della coda destra

Supponiamo anche qui che X sia una variabile casuale con funzione di ripartizione F. Una funzione che chiaramente veicola la stessa informazione rispetto a F è la funzione di ripartizione della coda destra:

G(x) = 1 - F(x) = P(X > x) per x R.

$Esercizio teorico$ 36. Riporta le proprietà matematiche della funzione di ripartizione della coda destra, analoghe alle proprietà degli esercizi 1-5.

Supponi che T sia una variabile casuale con distribuzione continua su (0, ). Se interpretiamo T come la durata di un congegno, la funzione di ripartizione della coda destra G è detta funzione di affidabilità: G(t) è la probabilità che il congegno duri almeno t unità di tempo. Inoltre, la funzione h definita qui sotto è detta funzione del tasso di guasto:

h(t) = f(t) / G(t).

$Esercizio teorico$ 37. Dimostra che h(t)dt ~ P(t < T < t + dt | T > t) se dt è piccolo.

Quindi, h(t) dt rappresenta la probabilità che il congegno si rompa nelle prossime dt unità di tempo, sapendo che ha funzionato fino al tempo t. Inoltre, la funzione tasso di guasto individua completamente la distribuzione di T.

$Esercizio teorico$ 38. Mostra che

G(t) = exp[-_(0,
t) h(s)ds] per t > 0.

$Esercizio teorico$ 39. Prova che la funzione tasso di guasto h soddisfa le seguenti proprietà:

h(t) 0 per t > 0.
_{(t:
t > 0)} h(t)dt = .

$Esercizio teorico$ 40. Di converso, supponi che h soddisfi le condizioni dell'esercizio 39. Prova che la formula dell'esercizio 38 definisce una funzione di affidabilità.

$Esercizio teorico$ 41. Considera la distribuzione con funzione tasso di guasto h(t) = t^k, t > 0.

Trova la corrispondente funzione di affidabilità.
Trova la corrispondente funzione di densità.

La distribuzione dell'esercizio precedente è la distribuzione di Weibull con parametro di forma k, che prende il nome da Walodi Weibull.

Funzioni di ripartizione multivariate

Supponiamo che X e Y siano variabili casuali a valori reali relative a un esperimento, cosicché (X, Y) è un vettore casuale a valori in un sottinsieme di R². La funzione di ripartizione di (X, Y) è la funzione F definita come

F(x, y) = P(X x, Y y).

Come nel caso a variabile singola, la funzione di ripartizione di (X, Y) individua completamente la distribuzione di (X, Y).

$Esercizio teorico$ 42. Sia F la funzione di ripartizione di (X, Y), e siano G H, rispettivamente, le funzioni di ripartizione di X e Y. Dimostra che

G(x) = F(x, )
H(y) = F(, y)

$Esercizio teorico$ 43. Nel contesto dell'esercizio precedente, prova che X e Y sono indipendenti se e solo se

F(x, y) = G(x)H(y) per ogni x, y.

$Esercizio teorico$ 44. Supponi che (X, Y) abbia funzione di densità f(x, y) = x + y per 0 < x < 1, 0 < y < 1.

Trova la funzione di ripartizione di (X, Y).
Trova la funzione di ripartizione di X.
Trova la funzione di ripartizione di Y.
Trova la funzione di ripartizione condizionata di X dato Y = y (0 < y < 1).
Trova la funzione di ripartizione condizionata di Y dato X = x (0 < x < 1)
X e Y sono indipendenti?

Tutti i risultati presentati qui sopra si possono facilmente estendere al caso n-dimensionale.

La funzione di ripartizione empirica

Supponi che {x₁, x₂, ..., x_n} siano dei dati reali osservati su una variabile casuale a valori reali. La funzione di ripartizione empirica è definita come

F_n(x) = #{i {1, 2, ..., n}: x_i x} / n per x R.

F_n(x) indica quindi la proporzione di valori dei dati minori o uguali di x.

45. Sui dati M&M, calcola la funzione di ripartizione empirica del numero totale di pastiglie.

46. Nei dati sulla cicala, sia L la lunghezza corporea e G il sesso. Calcola le funzioni di ripartizione empiriche delle seguenti variabili:

L
L dato G = maschio
L dato G = femmina
Credi che L e G siano indipendenti?

Per analizzare dal punto di vista statistico alcuni concetti presentati in questo paragrafo, vedi il capitolo sui campioni casuali, e in particolare i paragrafi su distribuzioni empiriche e statistiche d'ordine.