Distribuzioni continue

2. Distribuzioni continue

Distribuzioni continue

Al solito, supponiamo di avere un esperimento casuale con spazio campionario R e misura di probabilità P. Una variabile casuale X a valori in un sottinsieme S di Rⁿ si dice avere distribuzione continua se

P(X = x) = 0 per ogni x appartenente a S.

Il fatto che X assuma ogni singolo valore con probabilità 0 può sembrare paradossale in prima battuta, ma non è concettualmente diverso dall'affermare che un intervallo di R può avere lunghezza positiva anche se è composto da punti che hanno tutti lunghezza 0. Similmente, una regione di R² può avere area positiva anche se composta di punti (o curve) che hanno tutti area 0.

$Esercizio teorico$ 1. Mostra che,se C è un sottinsieme numerabile di S, allora P(X C) = 0.

Quindi, le distribuzioni continue sono diverse dalle distribuzioni discrete, per le quali tutta la massa di probabilità è concentrata su un insieme discreto. Per una distribuzione continua, la massa di probabilità è ripartita in senso continuo su S. Nota inoltre che S stesso non può essere numerabile.

Densità delle distribuzioni continue

Supponiamo, di nuovo, che X abbia distribuzione continua su un sottinsieme S di Rⁿ. Una funzione a valori reali f definita su S si dice essere una funzione di densità di probabilità per X se f soddisfa le seguenti proprietà:

f(x) 0 per x in S.
_S f(x)dx = 1.
_A f(x)dx = P(X A) per A S.

Se n > 1, gli integrali delle proprietà (b) e (c) sono multipli rispetto a sottinsiemi di Rⁿ, e

dx = dx₁ dx₂ ··· dx_n dove x = (x₁, x₂, ..., x_n).

In realtà, tecnicamente, f è la denistà di X relativa a una misura n-dimensionale m_n, che ricordiamo essere data da

m_n(A) = _A 1dx per A Rⁿ.

Notiamo che m_n(S) dev'essere positivo (e può essere infinito). In particolare,

se n = 1, S dev'essere un sottinsieme di R di lunghezza positiva;
se n = 2, S dev'essere un sottinsieme di R² di area positiva;
se n = 3, S dev'essere un sottinsieme di R³ di volume positivo.

In ogni caso, ricordiamo che i casi in poche dimensioni (n = 1, 2, 3), a parte le finalità illustrative, non hanno particolare rilievo in probabilità. Gli esperimenti casuali più importanti di solito coinvolgono molte variabili casuali (cioè un vettore casule); raramente si ha una variabile casuale singola e isolata. Notiamo infine che possiamo sempre estendere f per la densità su tutto Rⁿ ponendo f(x) = 0 per gli x non appartenenti a S. Questa estensione a volte semplifica la notazione.

La proprietà (c) è particolarmente importante perché implica che la distribuzione di probabilità di X è completamente individuata dalla funzione di densità. Di converso, ogni funzione che soddisfa le proprietà (a) e (b) è una funzione di densità di probabilità, per cui la proprietà (c) può essere utilizzata per definire una distribuzione continua su S.

Un elemento x appartenente a S per cui la densità f è massima è detto moda della distribuzione. Se esiste un'unica moda, la si usa a volte come misura del centro della distribuzione.

A differenza del caso discreto, la funzione di densità di una distribuzione continua non è unica. Notiamo che i valori di f su un insieme finito (o anche numerabile) di punti può essere modificata con altri valori non negativi, e le proprietà (a), (b) e (c) continuerebbero a valere. Il fatto importante è che sono rilevanti solo gli integrali di f. Un'altra differenza è che f(x) può essere maggiore di 1; all'atto pratico, f può essere illimitato su S. Ricorda che f(x) non è una probabilità, è una densità di probabilità: f(x)dx è approssimativamente la probabilità che X giaccia in un intervallo n-dimensionale centrato su x con lati di lunghezza dx₁, ..., dx_n, se tali lunghezze sono piccole.

Esempi

$Esercizio teorico$ 2. Sia f(t) = r exp(-rt) per t > 0, dove r > 0 è un parametro. Prova che f è una funzione di densità di probabilità.

La distribuzione definita dalla funzione di densità dell'esercizio precedente è detta distributzione esponenziale con parametro di velocità r. Questa distribuzione è utilizzata spesso per modellare durate aleatorie, sotto certe assunzioni. La distributzione esponenziale è analizzata in dettaglio nel capitolo sui processi di Poisson.

$Esercizio teorico$ 3. La durata T di un certo apparecchio (in unità di 1000 ore) ha distribuzione esponenziale con parametro 1/2. Trova P(T > 2).

4. Nell'esperimento esponenziale, poni r = 1/2. Simula 1000 replicazioni, aggiornando ogni 10, e osserva la convergenza della funzione di densità empirica alla sua controparte teorica.

$Esercizio teorico$ 5. Nel problema di Bertrand, un certo angolo casuale A ha funzione di densità f(a) = sin(a), 0 < a < / 2.

Prova che f è una funzione di densità.
Disegna il grafico di f e trova la moda.
Trova P(A < / 4).

6. Nell'esperimento di Bertrand, seleziona il modello con distanza uniforme. Simula 200 replicazioni, aggiornando ogni volta, e calcola la probabilità empirica dell'evento {A < / 4}. Confrontala con la probabilità trovata nell'esercizio precedente.

$Esercizio teorico$ 7. Sia g_n(t) = exp(-t) tⁿ / n! per t > 0 dove n è un parametro intero non negativo.

Mostra che g_n è una funzione di densità di probabilità per ogni n.
Mostra che g_n(t) è crescente per t < n e decrescente per t > n, cosicché la moda è a t = n.

Abbiamo mostrato nel paragrafo precedente sulle distribuzioni discrete che f_t(n) = g_n(t) è una funzione di densità sugli interi non negativi per ogni t > 0. La distribuzione individuata dalla densità g_n è detta distribuzione gamma; n + 1 è il parametro di forma. La distribuzione gamma è studiata in dettaglio nel capitolo sui processi di Poisson.

$Esercizio teorico$ 8. Supponi che la durata di un apparecchio T (in unità di 1000 ore) abbia distribuzione gamma con n = 2. Trova P(T > 3).

9. Nell'esperimento gamma, poni r = 1 e k = 3. Replica l'esperimento 200 volte, aggiornando ogni volta. Calcola la probabilità empirica dell'evento {T > 3} e confrontala con la probabilità teorica dell'esercizio precedente.

La costruzione delle densità

$Esercizio teorico$ 10. Supponi che g sia una funzione non negativa su S. Sia

c = _S g(x)dx.

Prova che se c è positivo e finito, allora f(x) = g(x) / c per x appartenente a S definisce una funzione di densità di probabilità su S.

Osserva che i grafici di g e f sembrano identici, a parte la diversa scala dell'asse verticale. Il risultato dell'esercizio precedente può essere quindi usato per costruire funzioni di densità con le proprietà desiderate (dominio, forma, simmetria e così via). La costante c è detta a volte costante di normalizzazione.

$Esercizio teorico$ 11. Sia g(x) = x²(1 - x) per 0 < x < 1.

Disegna il grafico di g.
Trova la funzione di densità di probabilità f proporzionale a g.
Trova P(1/2 < X < 1) dove X è una variabile casuale con la densità come riportata in (b).

La distribuzione presentata nell'esercizio precedente è un'esempio di distribuzione beta.

$Esercizio teorico$ 12. Sia g(x) = 1 / x^a per x > 1, dove a > 0 è un parametro.

Disegna il grafico di g.
Per 0 < a 1, prova che non esiste una funzione di densità di probabilità proporzionale a g.
Per a > 1, prova che la costante di normalizzazione è 1 / (a - 1).

La distribuzione definita nell'esercizio precedente è detta distribuzione di Pareto con parametro di forma a.

$Esercizio teorico$ 13. Sia g(x) = 1 / (1 + x²) per x appartenente a R.

Disegna il grafico di g.
Mostra che la costante di normalizzazione è .
Trova P(–1 < X < 1) dove X ha funzione di densità proporzionale a g.

La distribuzione definita nell'esercizio precedente è detta distribuzione di Cauchy, in onore di Augustin Cauchy. Si tratta di un membro della famiglia di distribuzioni t di Student.

14. Nell'applet variabile casuale, seleziona la distribuzione t di Student. Poni n = 1 per avere la distribuzione di Cauchy e simula 1000 replicazioni, aggiornando ogni 10. Osserva come la funzione di densità empirica viene a coincidere con quella teorica.

$Esercizio teorico$ 15. Sia g(z) = exp(-z² / 2).

Disegna il grafico di g.
Mostra che la costante di normalizzazione è (2)^1/2. Suggerimento: Se c indica la costante di normalizzazione, esprimi c² come integrale doppio e passa in coordinate polari.

La distribuzione definita nell'esercizio precedente è la distribuzione normale standardizzata, forse la distribuzione più importante di tutta la probabilità.

16. Nell'applet variabile casuale, seleziona la distribuzione normale (i parametri predefiniti sono per la distribuzione normale standardizzata). Simula 1000 replicazioni, aggiornando ogni 10. Osserva come la funzione di densità empirica viene a coincidere con quella teorica.

$Esercizio teorico$ 17. Sia f(x, y) = x + y per 0 < x < 1, 0 < y < 1.

Mostra che f è una funzione di densità di probabilità
Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

$Esercizio teorico$ 18. Sia g(x, y) = x + y per 0 < x < y < 1.

Trova la funzione di densità di probabilità f proporzionale a g.
Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

$Esercizio teorico$ 19. Sia g(x, y) = x²y per 0 < x < 1, 0 < y < 1.

Trova la funzione di densità di probabilità f proporzionale a g.
Trova P(Y > X) dove (X, Y) ha la densità riportata in (a).

$Esercizio teorico$ 20. Sia g(x, y) = x²y per 0 < x < y < 1.

Trova la funzione di densità di probabilità f proporzionale a g.
Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

$Esercizio teorico$ 21. Sia g(x, y, z) = x + 2y + 3z per 0 < x < 1, 0 < y < 1, 0 < z < 1.

Trova la funzione di densità di probabilità f proporzionale a g.
Trova P(X < Y < Z) dove (X, Y, Z) ha la densità riportata in (a).

Distribuzioni uniformi continue

Gli esercizi seguenti trattano un'importante tipologia di distribuzioni continue.

$Esercizio teorico$ 22. Supponi che S sia sottinsieme di Rⁿ con misura positiva e finita m_n(S). Prova che

f(x) = 1 / m_n(S) per x appartenente a S definisce una funzione di densità di probabilità su S.
P(X A) = m_n(A) / m_n(S) per A S se X ha la funzione di densità di (a).

Un variabile casuale X con la funzione di densità dell'esercizio 14 è detta avere distribuzione uniforme continua su S. La distribuzione uniforme su un rettangolo del piano ha un ruolo fondamentale nei modelli geometrici.

$Esercizio teorico$ 23. Supponi che (X, Y) sia distribuito uniformemente sul quadrato S = (-6, 6)². Trova P(X > 0, Y > 0).

24. Nell'esperimento uniforme bivariato, seleziona quadrato nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

$Esercizio teorico$ 25. Supponi che (X, Y) sia distribuito uniformemente sul triangolo S = {(x, y): -6 < y < x < 6}. Trova P(X > 0, Y > 0)

26. Nell'esperimento uniforme bivariato, seleziona triangolo nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

$Esercizio teorico$ 27. Supponi che (X, Y) sia distribuito uniformemente sul cerchio S = {(x, y): x² + y² < 36}. Trova P(X > 0, Y > 0).

28. Nell'esperimento uniforme bivariato, seleziona cerchio nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

$Esercizio teorico$ 29. Supponi che (X, Y, Z) sia distribuito uniformemente sul cubo (0, 1)³. Trova P(X < Y < Z)

Utilizzando la funzione di densità.
Utilizzando un argomento combinatorio. Suggerimento: Spiega perché ciascuna delle 6 permutazioni di (X, Y, Z) dev'essere equiprobabile.

$Esercizio teorico$ 30. Il tempo T (in minuti) necessario per eseguire una certa operazione è distribuito uniformemente sull'intervallo (15, 60).

Trova la probabilità che l'operazione richieda più di 30 minuti.
Sapendo che l'operazione non è terminata dopo 30 minuti, trova la probabilità che siano necessari più di altri 15 minuti.

Densità condizionate

Supponi che X sia una variabile casuale a valori in un sottinsieme S di Rⁿ, con distribuzione continua con funzione di densità f. La funzione di densità X, ovviamente, è basata sulla misura di probabilità sottostante P sullo spazio campionario dell'esperimento, che indichiamo con R. Questa misura può essere una misura di probabilità condizionata, dato un evento E (sottinsieme di R), con P(E) > 0. La notazione consueta è

f(x | E), x S.

Si rammenti che, a parte la notazione, non si stanno introducendo nuovi concetti. La funzione riportata poc'anzi è una funzione di densità continua, ovvero soddisfa le proprietà (a) e (b), mentre la porprietà (c) diventa

_A f(x | E)dx = P(X A | E) per A S.

Tutti i risultati che valgono per le densità in generale hanno controparti analoghe per le densità condizionate.

$Esercizio teorico$ 31. Supponi che B S con P(X B) = _B f(x)dx > 0. Prova che la densità condizionata di X dato X B è

f(x | X B) = f(x) / P(X B) per x B.
f(x | X B) = 0 per x B^c.

$Esercizio teorico$ 32. Supponi che S sia un sottinsieme di Rⁿ con misura positiva e finita m_n(S) e che B S con m_n(B) > 0. Mostra che se X è distribuito uniformemente su S, allora la distribuzione condizionata di X dato X B è uniforme su B.

$Esercizio teorico$ 33. Supponi che (X, Y) abbia funzione di densità f(x, y) = x + y per 0 < x < 1, 0 < y < 1. Trova la densità condizionata di (X, Y) dato X < 1/2, Y < 1/2.

Esercizi numerici

Se {x₁, x₂, ..., x_n} Rⁿ è un insieme di dati per una variabile continua, X, allora una funzione di densità empirica può essere calcolata partizionando il campo di variazione dei dati in sottinsiemi di ampiezza minore, e calcolare le densità di punti in ogni sottinsieme. Le funzioni di densità empirica sono studiate dettagliatamente nel capitolo sui campioni casuali.

34. Nei dati sulla cicala, BW indica il peso corporeo, BL la lunghezza corporea e G il sesso. Costruisci una funzione di densità empirica per ciascuno dei seguenti e disegna tali funzioni in un grafico a barre:

BW
BL
BW dato G = femmina.

35. Nei dati sulla cicala, WL indica la lunghezza delle ali e WW la larghezza delle ali. Costruisci una funzione di densità empirica per (WL, WW).

Distribuzioni continue degeneri

Contrariamente al caso discreto, l'esistenza di una funzione di densità per una distribuzione continua è un'assunzione che si fa. Una variabile casuale può avere distribuzione continua su un sottinsieme S di Rⁿ ma senza funzione di densità; la distribuzione è detta a volte degenere. Vediamo ora alcuni casi in cui tali distribuzioni possono presentarsi.

Supponiamo in primo luogo che X sia una variabile casuale che assume valori in un sottinsieme S di Rⁿ con m_n(S) = 0. È possibile che X abbia distribuzione continua, ma X può non avere una densità relativa a m_n. In particolare, la proprietà (c) della definizione può non valere, poiché l'integrale di sinistra sarebbe 0 per ogni sottinsieme A di S. Comunque, in molti casi, X può essere definita in termini di variabili casuali continue su spazi di dimensione minore che posseggono densità.

Per esempio, supponiamo che U sia una variabile casuale con distribuzione continua su un sottinsieme T di R^k (dove k < n), e che X = h(U) per qualche funzione continua h da T in Rⁿ. Ogni evento definito in termini di X può essere trasformato in un evento definito in termini di U. L'esercizio seguente illustra questa situazione

$Esercizio teorico$ 36. Supponi che U sia distribuita uniformemente sull'intervallo (0, 2). Sia X = cos(U), Y = sin(U).

Prova che (X, Y) ha distribuzione continua sul cerchio C = {(x, y): x² + y² = 1}.
Prova che (X, Y) non ha una funzione di densità su C (rispetto a m₂).
Trova P(Y > X).

Un'altra situazione di questo tipo si verifica quando un vettore casuale X appartenente a Rⁿ (n > 1) ha alcuni componenti con distribuzioni discrete e altri con distribuzioni continue. Tali distribuzioni a componenti misti sono studiate più dettagliatamente nel paragrafo sulle distribuzioni miste; l'esercizio seguente, in ogni caso, illustra la situazione.

$Esercizio teorico$ 37. Supponi che X sia distribuita uniformemente su {0, 1, 2}, Y distribuita uniformemente su (0, 2) e che X e Y siano indipendenti.

Prova che (X, Y) ha distribuzione continua su {0, 1, 2} × (0, 2).
Prova che (X, Y) non ha una funzione di densità (a due dimensioni) su S (rispetto a m₂).
Trova P(Y > X).

Infine, è possibile anche avere una distribuzione continua su un sottinsieme S di Rⁿ con m_n(S) > 0, ma di nuovo senza funzione di densità. Tali distribuzioni si dicono singolari, e si applicano raramente. Per un esempio, in ogni caso, vedi il caso del gioco aggressivo nel capitolo su rosso e nero.