Laboratorio virtuale > Distribuzioni > 1 [2] 3 4 5 6 7 8 9

2. Distribuzioni continue


Distribuzioni continue

Al solito, supponiamo di avere un esperimento casuale con spazio campionario R e misura di probabilità P. Una variabile casuale X a valori in un sottinsieme S di Rn si dice avere distribuzione continua se

P(X = x) = 0 per ogni x appartenente a S.

Il fatto che X assuma ogni singolo valore con probabilità 0 può sembrare paradossale in prima battuta, ma non è concettualmente diverso dall'affermare che un intervallo di R può avere lunghezza positiva anche se è composto da punti che hanno tutti lunghezza 0. Similmente, una regione di R2 può avere area positiva anche se composta di punti (o curve) che hanno tutti area 0.

Esercizio teorico 1. Mostra che,se C è un sottinsieme numerabile di S, allora P(X in C) = 0.

Quindi, le distribuzioni continue sono diverse dalle distribuzioni discrete, per le quali tutta la massa di probabilità è concentrata su un insieme discreto. Per una distribuzione continua, la massa di probabilità è ripartita in senso continuo su S. Nota inoltre che S stesso non può essere numerabile.

Densità delle distribuzioni continue

Supponiamo, di nuovo, che X abbia distribuzione continua su un sottinsieme S di Rn. Una funzione a valori reali f definita su S si dice essere una funzione di densità di probabilità per X se f soddisfa le seguenti proprietà:

  1. f(x) >= 0 per x in S.
  2. integraleS f(x)dx = 1.
  3. integraleA f(x)dx = P(X in A) per A sottinsiemeS.

Se n > 1, gli integrali delle proprietà (b) e (c) sono multipli rispetto a sottinsiemi di Rn, e

dx = dx1 dx2 ··· dxn dove x = (x1, x2, ..., xn).

In realtà, tecnicamente, f è la denistà di X relativa a una misura n-dimensionale mn, che ricordiamo essere data da

mn(A) = integraleA 1dx per A sottinsiemeRn.

Notiamo che mn(S) dev'essere positivo (e può essere infinito). In particolare,

  1. se n = 1, S dev'essere un sottinsieme di R di lunghezza positiva;
  2. se n = 2, S dev'essere un sottinsieme di R2 di area positiva;
  3. se n = 3, S dev'essere un sottinsieme di R3 di volume positivo.

In ogni caso, ricordiamo che i casi in poche dimensioni (n = 1, 2, 3), a parte le finalità illustrative, non hanno particolare rilievo in probabilità. Gli esperimenti casuali più importanti di solito coinvolgono molte variabili casuali (cioè un vettore casule); raramente si ha una variabile casuale singola e isolata. Notiamo infine che possiamo sempre estendere f per la densità su tutto Rn ponendo f(x) = 0 per gli x non appartenenti a S. Questa estensione a volte semplifica la notazione.

La proprietà (c) è particolarmente importante perché implica che la distribuzione di probabilità di X è completamente individuata dalla funzione di densità. Di converso, ogni funzione che soddisfa le proprietà (a) e (b) è una funzione di densità di probabilità, per cui la proprietà (c) può essere utilizzata per definire una distribuzione continua su S.

Un elemento x appartenente a S per cui la densità f è massima è detto moda della distribuzione. Se esiste un'unica moda, la si usa a volte come misura del centro della distribuzione.

A differenza del caso discreto, la funzione di densità di una distribuzione continua non è unica. Notiamo che i valori di f su un insieme finito (o anche numerabile) di punti può essere modificata con altri valori non negativi, e le proprietà (a), (b) e (c) continuerebbero a valere. Il fatto importante è che sono rilevanti solo gli integrali di f. Un'altra differenza è che f(x) può essere maggiore di 1; all'atto pratico, f può essere illimitato su S. Ricorda che f(x) non è una probabilità, è una densità di probabilità: f(x)dx è approssimativamente la probabilità che X giaccia in un intervallo n-dimensionale centrato su x con lati di lunghezza dx1, ..., dxn, se tali lunghezze sono piccole.

Esempi

Esercizio teorico 2. Sia f(t) = r exp(-rt) per t > 0, dove r > 0 è un parametro. Prova che f è una funzione di densità di probabilità.

La distribuzione definita dalla funzione di densità dell'esercizio precedente è detta distributzione esponenziale con parametro di velocità r. Questa distribuzione è utilizzata spesso per modellare durate aleatorie, sotto certe assunzioni. La distributzione esponenziale è analizzata in dettaglio nel capitolo sui processi di Poisson.

Esercizio teorico 3. La durata T di un certo apparecchio (in unità di 1000 ore) ha distribuzione esponenziale con parametro 1/2. Trova P(T > 2).

Simulazione 4. Nell'esperimento esponenziale, poni r = 1/2. Simula 1000 replicazioni, aggiornando ogni 10, e osserva la convergenza della funzione di densità empirica alla sua controparte teorica.

Esercizio teorico 5. Nel problema di Bertrand, un certo angolo casuale A ha funzione di densità f(a) = sin(a), 0 < a < pi / 2.

  1. Prova che f è una funzione di densità.
  2. Disegna il grafico di f e trova la moda.
  3. Trova P(A < pi / 4).

Simulazione 6. Nell'esperimento di Bertrand, seleziona il modello con distanza uniforme. Simula 200 replicazioni, aggiornando ogni volta, e calcola la probabilità empirica dell'evento {A < pi / 4}. Confrontala con la probabilità trovata nell'esercizio precedente.

Esercizio teorico 7. Sia gn(t) = exp(-t) tn / n! per t > 0 dove n è un parametro intero non negativo.

  1. Mostra che gn è una funzione di densità di probabilità per ogni n.
  2. Mostra che gn(t) è crescente per t < n e decrescente per t > n, cosicché la moda è a t = n.

Abbiamo mostrato nel paragrafo precedente sulle distribuzioni discrete che ft(n) = gn(t) è una funzione di densità sugli interi non negativi per ogni t > 0. La distribuzione individuata dalla densità gn è detta distribuzione gamma; n + 1 è il parametro di forma. La distribuzione gamma è studiata in dettaglio nel capitolo sui processi di Poisson.

Esercizio teorico 8. Supponi che la durata di un apparecchio T (in unità di 1000 ore) abbia distribuzione gamma con n = 2. Trova P(T > 3).

Simulazione 9. Nell'esperimento gamma, poni r = 1 e k = 3. Replica l'esperimento 200 volte, aggiornando ogni volta. Calcola la probabilità empirica dell'evento {T > 3} e confrontala con la probabilità teorica dell'esercizio precedente.

La costruzione delle densità

Esercizio teorico 10. Supponi che g sia una funzione non negativa su S. Sia

c = integraleS g(x)dx.

Prova che se c è positivo e finito, allora f(x) = g(x) / c per x appartenente a S definisce una funzione di densità di probabilità su S.

Osserva che i grafici di g e f sembrano identici, a parte la diversa scala dell'asse verticale. Il risultato dell'esercizio precedente può essere quindi usato per costruire funzioni di densità con le proprietà desiderate (dominio, forma, simmetria e così via). La costante c è detta a volte costante di normalizzazione.

Esercizio teorico 11. Sia g(x) = x2(1 - x) per 0 < x < 1.

  1. Disegna il grafico di g.
  2. Trova la funzione di densità di probabilità f proporzionale a g.
  3. Trova P(1/2 < X < 1) dove X è una variabile casuale con la densità come riportata in (b).

La distribuzione presentata nell'esercizio precedente è un'esempio di distribuzione beta.

Esercizio teorico 12. Sia g(x) = 1 / xa per x > 1, dove a > 0 è un parametro.

  1. Disegna il grafico di g.
  2. Per 0 < a <= 1, prova che non esiste una funzione di densità di probabilità proporzionale a g.
  3. Per a > 1, prova che la costante di normalizzazione è 1 / (a - 1).

La distribuzione definita nell'esercizio precedente è detta distribuzione di Pareto con parametro di forma a.

Esercizio teorico 13. Sia g(x) = 1 / (1 + x2) per x appartenente a R.

  1. Disegna il grafico di g.
  2. Mostra che la costante di normalizzazione è pi.
  3. Trova P(–1 < X < 1) dove X ha funzione di densità proporzionale a g.

La distribuzione definita nell'esercizio precedente è detta distribuzione di Cauchy, in onore di Augustin Cauchy. Si tratta di un membro della famiglia di distribuzioni t di Student.

Simulazione 14. Nell'applet variabile casuale, seleziona la distribuzione t di Student. Poni n = 1 per avere la distribuzione di Cauchy e simula 1000 replicazioni, aggiornando ogni 10. Osserva come la funzione di densità empirica viene a coincidere con quella teorica.

Esercizio teorico 15. Sia g(z) = exp(-z2 / 2).

  1. Disegna il grafico di g.
  2. Mostra che la costante di normalizzazione è (2pi)1/2. Suggerimento: Se c indica la costante di normalizzazione, esprimi c2 come integrale doppio e passa in coordinate polari.

La distribuzione definita nell'esercizio precedente è la distribuzione normale standardizzata, forse la distribuzione più importante di tutta la probabilità.

Simulazione 16. Nell'applet variabile casuale, seleziona la distribuzione normale (i parametri predefiniti sono per la distribuzione normale standardizzata). Simula 1000 replicazioni, aggiornando ogni 10. Osserva come la funzione di densità empirica viene a coincidere con quella teorica.

Esercizio teorico 17. Sia f(x, y) = x + y per 0 < x < 1, 0 < y < 1.

  1. Mostra che f è una funzione di densità di probabilità
  2. Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

Esercizio teorico 18. Sia g(x, y) = x + y per 0 < x < y < 1.

  1. Trova la funzione di densità di probabilità f proporzionale a g.
  2. Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

Esercizio teorico 19. Sia g(x, y) = x2y per 0 < x < 1, 0 < y < 1.

  1. Trova la funzione di densità di probabilità f proporzionale a g.
  2. Trova P(Y > X) dove (X, Y) ha la densità riportata in (a).

Esercizio teorico 20. Sia g(x, y) = x2y per 0 < x < y < 1.

  1. Trova la funzione di densità di probabilità f proporzionale a g.
  2. Trova P(Y > 2X) dove (X, Y) ha la densità riportata in (a).

Esercizio teorico 21. Sia g(x, y, z) = x + 2y + 3z per 0 < x < 1, 0 < y < 1, 0 < z < 1.

  1. Trova la funzione di densità di probabilità f proporzionale a g.
  2. Trova P(X < Y < Z) dove (X, Y, Z) ha la densità riportata in (a).

Distribuzioni uniformi continue

Gli esercizi seguenti trattano un'importante tipologia di distribuzioni continue.

Esercizio teorico 22. Supponi che S sia sottinsieme di Rn con misura positiva e finita mn(S). Prova che

  1. f(x) = 1 / mn(S) per x appartenente a S definisce una funzione di densità di probabilità su S.
  2. P(X in A) = mn(A) / mn(S) per A sottinsiemeS se X ha la funzione di densità di (a).

Un variabile casuale X con la funzione di densità dell'esercizio 14 è detta avere distribuzione uniforme continua su S. La distribuzione uniforme su un rettangolo del piano ha un ruolo fondamentale nei modelli geometrici.

Esercizio teorico 23. Supponi che (X, Y) sia distribuito uniformemente sul quadrato S = (-6, 6)2. Trova P(X > 0, Y > 0).

Simulazione 24. Nell'esperimento uniforme bivariato, seleziona quadrato nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

Esercizio teorico 25. Supponi che (X, Y) sia distribuito uniformemente sul triangolo S = {(x, y): -6 < y < x < 6}. Trova P(X > 0, Y > 0)

Simulazione 26. Nell'esperimento uniforme bivariato, seleziona triangolo nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

Esercizio teorico 27. Supponi che (X, Y) sia distribuito uniformemente sul cerchio S = {(x, y): x2 + y2 < 36}. Trova P(X > 0, Y > 0).

Simulazione 28. Nell'esperimento uniforme bivariato, seleziona cerchio nel menu a tendina. Simula 100 replicazioni, aggiornando ogni volta, osservando i punti della dispersione. Calcola la probabilità empirica dell'evento {X > 0, Y > 0} e confrontala con la probabilità teorica.

Esercizio teorico 29. Supponi che (X, Y, Z) sia distribuito uniformemente sul cubo (0, 1)3. Trova P(X < Y < Z)

  1. Utilizzando la funzione di densità.
  2. Utilizzando un argomento combinatorio. Suggerimento: Spiega perché ciascuna delle 6 permutazioni di (X, Y, Z) dev'essere equiprobabile.

Esercizio teorico 30. Il tempo T (in minuti) necessario per eseguire una certa operazione è distribuito uniformemente sull'intervallo (15, 60).

  1. Trova la probabilità che l'operazione richieda più di 30 minuti.
  2. Sapendo che l'operazione non è terminata dopo 30 minuti, trova la probabilità che siano necessari più di altri 15 minuti.

Densità condizionate

Supponi che X sia una variabile casuale a valori in un sottinsieme S di Rn, con distribuzione continua con funzione di densità f. La funzione di densità X, ovviamente, è basata sulla misura di probabilità sottostante P sullo spazio campionario dell'esperimento, che indichiamo con R. Questa misura può essere una misura di probabilità condizionata, dato un evento E (sottinsieme di R), con P(E) > 0. La notazione consueta è

f(x | E), x in S.

Si rammenti che, a parte la notazione, non si stanno introducendo nuovi concetti. La funzione riportata poc'anzi è una funzione di densità continua, ovvero soddisfa le proprietà (a) e (b), mentre la porprietà (c) diventa

integraleA f(x | E)dx = P(X in A | E) per A sottinsiemeS.

Tutti i risultati che valgono per le densità in generale hanno controparti analoghe per le densità condizionate.

Esercizio teorico 31. Supponi che B sottinsieme S con P(X in B) = integraleB f(x)dx > 0. Prova che la densità condizionata di X dato X in B è

  1. f(x | X in B) = f(x) / P(X in B) per x in B.
  2. f(x | X in B) = 0 per x in Bc.

Esercizio teorico 32. Supponi che S sia un sottinsieme di Rn con misura positiva e finita mn(S) e che B sottinsieme S con mn(B) > 0. Mostra che se X è distribuito uniformemente su S, allora la distribuzione condizionata di X dato X in B è uniforme su B.

Esercizio teorico 33. Supponi che (X, Y) abbia funzione di densità f(x, y) = x + y per 0 < x < 1, 0 < y < 1. Trova la densità condizionata di (X, Y) dato X < 1/2, Y < 1/2.

Esercizi numerici

Se {x1, x2, ..., xn}sottinsieme Rn è un insieme di dati per una variabile continua, X, allora una funzione di densità empirica può essere calcolata partizionando il campo di variazione dei dati in sottinsiemi di ampiezza minore, e calcolare le densità di punti in ogni sottinsieme. Le funzioni di densità empirica sono studiate dettagliatamente nel capitolo sui campioni casuali.

Esercizio numerico 34. Nei dati sulla cicala, BW indica il peso corporeo, BL la lunghezza corporea e G il sesso. Costruisci una funzione di densità empirica per ciascuno dei seguenti e disegna tali funzioni in un grafico a barre:

  1. BW
  2. BL
  3. BW dato G = femmina.

Esercizio numerico 35. Nei dati sulla cicala, WL indica la lunghezza delle ali e WW la larghezza delle ali. Costruisci una funzione di densità empirica per (WL, WW).

Distribuzioni continue degeneri

Contrariamente al caso discreto, l'esistenza di una funzione di densità per una distribuzione continua è un'assunzione che si fa. Una variabile casuale può avere distribuzione continua su un sottinsieme S di Rn ma senza funzione di densità; la distribuzione è detta a volte degenere. Vediamo ora alcuni casi in cui tali distribuzioni possono presentarsi.

Supponiamo in primo luogo che X sia una variabile casuale che assume valori in un sottinsieme S di Rn con mn(S) = 0. È possibile che X abbia distribuzione continua, ma X può non avere una densità relativa a mn. In particolare, la proprietà (c) della definizione può non valere, poiché l'integrale di sinistra sarebbe 0 per ogni sottinsieme A di S. Comunque, in molti casi, X può essere definita in termini di variabili casuali continue su spazi di dimensione minore che posseggono densità.

Per esempio, supponiamo che U sia una variabile casuale con distribuzione continua su un sottinsieme T di Rk (dove k < n), e che X = h(U) per qualche funzione continua h da T in Rn. Ogni evento definito in termini di X può essere trasformato in un evento definito in termini di U. L'esercizio seguente illustra questa situazione

Esercizio teorico 36. Supponi che U sia distribuita uniformemente sull'intervallo (0, 2). Sia X = cos(U), Y = sin(U).

  1. Prova che (X, Y) ha distribuzione continua sul cerchio C = {(x, y): x2 + y2 = 1}.
  2. Prova che (X, Y) non ha una funzione di densità su C (rispetto a m2).
  3. Trova P(Y > X).

Un'altra situazione di questo tipo si verifica quando un vettore casuale X appartenente a Rn (n > 1) ha alcuni componenti con distribuzioni discrete e altri con distribuzioni continue. Tali distribuzioni a componenti misti sono studiate più dettagliatamente nel paragrafo sulle distribuzioni miste; l'esercizio seguente, in ogni caso, illustra la situazione.

Esercizio teorico 37. Supponi che X sia distribuita uniformemente su {0, 1, 2}, Y distribuita uniformemente su (0, 2) e che X e Y siano indipendenti.

  1. Prova che (X, Y) ha distribuzione continua su {0, 1, 2} × (0, 2).
  2. Prova che (X, Y) non ha una funzione di densità (a due dimensioni) su S (rispetto a m2).
  3. Trova P(Y > X).

Infine, è possibile anche avere una distribuzione continua su un sottinsieme S di Rn con mn(S) > 0, ma di nuovo senza funzione di densità. Tali distribuzioni si dicono singolari, e si applicano raramente. Per un esempio, in ogni caso, vedi il caso del gioco aggressivo nel capitolo su rosso e nero.