Laboratorio virtuale > Distribuzioni > 1 2 3 4 5 [6] 7 8 9
Al solito, iniziamo introducendo un esperimento casuale su un certo spazio campionario e con misura di probabilità P. Supponiamo che X sia una variabile casuale a valori reali relativa all'esperimento. La funzione di ripartizione (cumulata) di X è la funzione F data da
F(x) = P(X x) per x appartenente a R.
Tale funzione è estremamente importante poiché ha senso per qualsiasi tipo di variabile, indipendentemente dal fatto che la distribuzione sia discreta, continua, o anche mista, e poiché individua completamente la distribuzione di X.
Abbrevieremo come segue alcuni dei limiti di F:
Le proprietà elencate negli esercizi seguenti individuano completamente le funzioni di ripartizione. I teoremi di continuità della probabilità saranno utili per le dimostrazioni.
1. Prova che F è crescente: se x y allora F(x) F(y).2. Dimostra che F(x+) = F(x) per x appartenente a R. Pertanto F è continua da destra:
3. Mostra che F(x-) = P(X < x) per x appartenente a R. Quindi, F ha limiti sinistri:
4. Prova che F() = 1.
5. Prova che F(-) = 0.
L'esercizio seguente mostra come la funzione di ripartizione possa essere utilizzata per calcolare la probabilità che X cada in un certo intervallo. Ricorda che una distribuzione di probabilità su R è completamente individuata dalle probabilità degli intervalli; pertanto, la funzione di ripartizione individua la distribuzione di X. In ciascun caso, il risultato utile è
P(B Ac) = P(B) - P(A) se A B.
6. Supponi che a e b appartengano a R con a < b. Dimostra che
7. Dimostra che se X ha distribuzione continua, allora la funzione di ripartizione F è continua.
Esiste una relazione molto semplice tra funzione di ripartizione e funzione di densità.
8. Supponi che X abbia distribuzione discreta con funzione di densità f e funzione di ripartizione F. Prova che per x appartenente a R,
Pertanto F è una funzione a gradini con "salti" per i valori di X con probabilità positiva; l'ampiezza del salto in x coincide con la funzione di densità in x. Esiste un risultato analogo per le distribuzioni continue.
9. Supponi che X abbia distribuzione continua con funzione di densità f e funzione di ripartizione F. Dimostra che
Per le distribuzioni miste, il risultato è una combinazione di quelli degli ultimi due esercizi.
10. Supponi che X abbia distribuzione mista con densità parziale discreta g e densità parziale continua h. Sia F la funzione di ripartizione. Dimostra che
Ovviamente, la funzione di ripartizione può essere definita relativamente a ciascuna delle distribuzioni condizionate che abbiamo presentato. Non servono nuovi concetti, e tutti i risultati presentati poc'anzi continuano a valere.
11. Supponi che X abbia distribuzione continua su R con funzione di densità f simmetrica attorno a un punto a:
f(a + t) = f(a - t) per t appartenente a R.
Prova che la funzione di ripartizione F soddisfa
F(a - t) = 1 - F(a + t) per t appartenente a R.
12. Supponi di lanciare due dadi equilibrati e registrare la sequenza di punteggi (X1, X2). Trova la funzione di ripartizione di
13. Supponi che X sia distribuito uniformemente sull'intervallo (a, b) dove a < b.
14. Supponi che X abbia funzione di densità f(x) = 12x2(1 - x), 0 < x < 1. Ciò significa che X ha distribuzione beta.
15. Supponi che X abbia funzione di densità f(x) = r exp(-rx), x > 0 dove r > 0 è un parametro. Ciò significa che X ha distribuzione esponenziale con parametro di velocità r.
16. Supponi che X abbia funzione di densità f(x) = a / xa+1 per x > 1 dove a > 0 è un parametro. Ciò significa che X ha distribuzione di Pareto con parametro di forma a.
17. Supponi che X abbia funzione di densità f(x) = 1 / [ (1 + x2)] per x appartenente a R. Ciò significa che X ha distribuzione di Cauchy.
18. Nell'applet quantile, modifica i parametri e osserva la forma della funzione di densità e della funzione di ripartizione per ciascuna delle seguenti distribuzioni:
19. Sia F la funzione definita come segue:
F(x) = 0, per x < 1
F(x) = 1 / 10 per 1 x < 3 / 2
F(x) = 3 / 10 per 3 / 2 x < 2
F(x) = 6 / 10 per 2 x < 5 / 2
F(x) = 9 / 10 per 5 / 2 x < 3
F(x) = 1 per x 3.
20. Sia F(x) = 0 per x < 0, F(x) = x / (x + 1) for 0 x.
21. Sia F la funzione definita da
Sia X una variabile casuale con funzione di ripartizione F. Supponi che p (0, 1). Un valore di x tale che
F(x-) = P(X < x) p e F(x) = P(X x) p
è detto quantile di ordine p per la distribuzione. In prima approssimazione, un quantile di ordine p è un valore per cui la distribuzione cumulata passa per p.
Notiamo che sussiste una sorta di relazione inversa tra i quantili e i valori della distribuzione cumulata. Per esplorare ulteriormente questa relazione, supponiamo in primo luogo che F sia la funzione di ripartizione di una distribuzione continua su un intervallo aperto S. (Poiché la distribuzione è continua, non si perde in generalità assumendo che S sia aperto). Inoltre, supponiamo che F sia strettamente crescente, e che vada da S su (0, 1). (Ciò significa che ciascuno sottointervallo aperto di S ha probabilità positiva, cosicché la distribuzione ha supporto in S). F, allora, ha un'inversa definita F-1 che vada da (0, 1) su S.
22. Sotto le condizioni di cui sopra, prova che F-1(p) è l'unico quantile di ordine p.
Per il calcolo dei quantili e per molte altre applicazione è molto utile estendere la nozione di inversa a una funzione di ripartizione arbitraria F. Per p appartenente a (0, 1), definiamo la funzione quantile; come
F-1(p) = inf{x R: p F(x)}.
Ovviamente, se S è un intervallo e F è strettamente crescente su S, allora F-1 è l'inversa ordinaria di F, come visto poc'anzi. L'esercizio seguente ne spiega il nome: F-1(p) è il minimo dei quantili di ordine p.
23. per p appartenente a (0, 1), prova che
Le altre due proprietà fondamentali sono dati nei due esercizi seguenti.
24. Dimostra che, in generale
25. Mostra che per x appartenente a R e p appartenente a (0, 1),
F-1(p) x se e solo se p F(x).
Un quantile di ordine 1/2 si dice mediana della distribuzione. Quando c'è una sola mediana, la si può utilizzare come misura del centro della distribuzione. Un quantile di ordine 1/4 è detto primo quartile e uno di ordine 3/4 terzo quartile. Una mediana è un secondo quartile. Assumendo l'unicità, siano q1, q2 e q3 rispettivamentede primo, secondo e terzo quartile di X. Nota che l'intervallo da q1 a q3 include metà della distribuzione, per cui lo scarto interquartile si definisce come
IQR = q3 - q1,
ed è a volte usato come misura della dispersione della distribuzione rispetto alla mediana. Siano a e b rispettivamente i valori minimo e massimo di X (assumendo che siano finiti). I cinque parametri
a, q1, q2, q3, b
sono detti spesso five-number summary. Presi insiemi, tali parametri contengono un bel po' di informazioni sulla distribuzione in termini di centralità, dispersione e asimmetria. Graficamente, tali parametri sono spesso rappresentati in un boxplot, formato da una linea che si estende dal valore minimo a al valore massimo b, con una rettangolo da q1 a q3, e segni in a, q2 (la mediana) e b.
26. Nell'istogramma interattivo, seleziona boxplot. Poni l'ampiezza di classe a 0.1 e costruisci una distribuzione discreta con almeno 30 valori di ciascuno dei tipi indicati sotto. Osserva la forma del boxplot e le posizioni relative dei parametri del five-number summary:
27. Supponi che F sia la funzione di ripartizione della distribuzione uniforme su [a, b].
28. Supponi che F sia la funzione di ripartizione della distribuzione esponenziale con parametro di velocità r.
29. Supponi che F sia la funzione di ripartizione della distribuzione di Pareto con parametro di forma a.
30. Supponi che F sia la funzione di ripartizione della distribuzione di Cauchy.
31. Trova la funzione quantile F-1 della funzione di ripartizione F dell'esercizio 19.
32. Trova la funzione quantile F-1 della funzione di ripartizione F dell'esercizio 20.
33. Trova la funzione quantile F-1 della funzione di ripartizione F dell'esercizio 21.
34. Nell'applet quantile, trova la mediana e il primo e terzo quartile delle seguenti distribuzioni. In ciascun caso, osserva sia la funzione di densità che la funzione di ripartizione.
35. Supponi che X abbia distribuzione continua su R con densità f simmetrica rispetto a un punto a:
f(a - t) = f(a + t) per t appartenente a R.
Dimostra che se a + t è un quantile di ordine p allora a - t è un quantile di ordine 1 - p.
Supponiamo anche qui che X sia una variabile casuale con funzione di ripartizione F. Una funzione che chiaramente veicola la stessa informazione rispetto a F è la funzione di ripartizione della coda destra:
G(x) = 1 - F(x) = P(X > x) per x R.
36. Riporta le proprietà matematiche della funzione di ripartizione della coda destra, analoghe alle proprietà degli esercizi 1-5.
Supponi che T sia una variabile casuale con distribuzione continua su (0, ). Se interpretiamo T come la durata di un congegno, la funzione di ripartizione della coda destra G è detta funzione di affidabilità: G(t) è la probabilità che il congegno duri almeno t unità di tempo. Inoltre, la funzione h definita qui sotto è detta funzione del tasso di guasto:
h(t) = f(t) / G(t).
37. Dimostra che h(t) dt ~ P(t < T < t + dt | T > t) se dt è piccolo.
Quindi, h(t) dt rappresenta la probabilità che il congegno si rompa nelle prossime dt unità di tempo, sapendo che ha funzionato fino al tempo t. Inoltre, la funzione tasso di guasto individua completamente la distribuzione di T.
38. Mostra che
G(t) = exp[-(0, t) h(s)ds] per t > 0.
39. Prova che la funzione tasso di guasto h soddisfa le seguenti proprietà:
40. Di converso, supponi che h soddisfi le condizioni dell'esercizio 39. Prova che la formula dell'esercizio 38 definisce una funzione di affidabilità.
41. Considera la distribuzione con funzione tasso di guasto h(t) = tk, t > 0.
La distribuzione dell'esercizio precedente è la distribuzione di Weibull con parametro di forma k, che prende il nome da Walodi Weibull.
Supponiamo che X e Y siano variabili casuali a valori reali relative a un esperimento, cosicché (X, Y) è un vettore casuale a valori in un sottinsieme di R2. La funzione di ripartizione di (X, Y) è la funzione F definita come
F(x, y) = P(X x, Y y).
Come nel caso a variabile singola, la funzione di ripartizione di (X, Y) individua completamente la distribuzione di (X, Y).
42. Sia F la funzione di ripartizione di (X, Y), e siano G H, rispettivamente, le funzioni di ripartizione di X e Y. Dimostra che
43. Nel contesto dell'esercizio precedente, prova che X e Y sono indipendenti se e solo se
F(x, y) = G(x)H(y) per ogni x, y.
44. Supponi che (X, Y) abbia funzione di densità f(x, y) = x + y per 0 < x < 1, 0 < y < 1.
Tutti i risultati presentati qui sopra si possono facilmente estendere al caso n-dimensionale.
Supponi che {x1, x2, ..., xn} siano dei dati reali osservati su una variabile casuale a valori reali. La funzione di ripartizione empirica è definita come
Fn(x) = #{i {1, 2, ..., n}: xi x} / n per x R.
Fn(x) indica quindi la proporzione di valori dei dati minori o uguali di x.
45. Sui dati M&M, calcola la funzione di ripartizione empirica del numero totale di pastiglie.
46. Nei dati sulla cicala, sia L la lunghezza corporea e G il sesso. Calcola le funzioni di ripartizione empiriche delle seguenti variabili:
Per analizzare dal punto di vista statistico alcuni concetti presentati in questo paragrafo, vedi il capitolo sui campioni casuali, e in particolare i paragrafi su distribuzioni empiriche e statistiche d'ordine.