Laboratorio virtuale > Spazi di ProbabilitÓ > 1 2 3 4 [5] 6 7 8

5. ProbabilitÓ condizionata


Definizione

Al solito, iniziamo introducendo un esperimento casuale con spazio campionario S, e misura di probabilitÓ P. Supponiamo inoltre di sapere che un certo evento B si Ŕ verificato. In genere, questa informazione dovrebbe alterare le probabilitÓ che assegniamo agli altri eventi. In particolare, se A Ŕ un altro evento, allora A si verifica se e solo se si verificano sia A che B; di fatto, lo spazio campionario si Ŕ ridotto a B. Quindi, la probabilitÓ di A, data la conoscenza del fatto che B si Ŕ verificato, dovrebbe essere proporzionale a P(A B). In ogni caso, la probabilitÓ condizionata, dato il verificarsi di B dev'essere sempre una misura di probabilitÓ, ovvero deve soddisfare gli assiomi di Kolmogorov. Ci˛ fa sý che la costante di proporzionalitÓ debba essere 1 / P(B). Pertanto, si giunge inesorabilmente alla seguente definizione:

Siano A ae B eventi di un esperimento casuale con P(B) > 0. La probabilitÓ condizionata di A dato B Ŕ definita come

P(A | B) = P(A intersezione B) / P(B).

Ci˛ si basa sulla definizione assiomatica di probabilitÓ. Analizziamo ora il concetto di probabilitÓ condizionata a partire dalla nozione meno formale e pi¨ intuitiva di frequenza relativa. Supponiamo quindi di replicare ripetutamente l'esperimento. Per un certo evento C, sia Nn(C) il numero di volte che C si verifica nelle prime n prove.

Se Nn(B) Ŕ grande, la probabilitÓ condizionata che A si sia verificato dato il verificarsi di B dev'essere prossima alla frequenza relativa condizionata di A dato B, ovvero la frequenza relativa di A per le prove in cui B si Ŕ verificato:

Nn(A intersezione B) / Nn(B).

Ma per un'altra applicazione del concetto di frequenza relativa,

Nn(A intersezione B) / Nn(B) = [Nn(A intersezione B) / n] / [Nn(B) / n] converge a P(A intersezione B) / P(B) as n converge a infinito.

che ci porta di nuovo alla medesima definizione.

In alcuni casi, le probabilitÓ condizionate possono essere calcolate direttamente, riducendo effettivamente lo spazio campionario all'evento dato. In altri casi, la formula sopra Ŕ migliore.

ProprietÓ

Esercizio teorico 1. Dimostra che P(A | B), in funzione di A e per B dato, Ŕ una misura di probabilitÓ.

L'esercizio 1 costituisce la proprietÓ pi¨ importante della probabilitÓ condizionata, poichÚ indica che ogni risultato che vale per le misure di probabilitÓ in generale vale anche per la probabilitÓ condizionata (almeno finchÚ l'evento a cui si condiziona rimane fisso).

Esercizio teorico 2. Supponi che A e B siano eventi di un esperimento casuale con P(B) > 0. Dimostra che:

  1. Se B A allora P(A | B) = 1.
  2. Se A B allora P(A | B) = P(A) / P(B).
  3. Se A e B sono disgiunti allora P(A | B) = 0.

Esercizio teorico 3. Supponi che A e B siano eventi di un esperimento casuale, ciascuno con probabilitÓ positiva. Dimostra che

  1. P(A | B) > P(A) se e solo se P(B | A) > P(B) se e solo se P(A intersezione B) > P(A)P(B)
  2. P(A | B) < P(A) se e solo se P(B | A) < P(B) se e solo se P(A intersezione B) < P(A)P(B)
  3. P(A | B) = P(A) se e solo se P(B | A) = P(B) se e solo se P(A intersezione B) = P(A)P(B)

Nel caso (a), A e B si dicono positivamente correlati. Intuitivamente, il verificarsi di uno dei due eventi implica che l'altro Ŕ pi¨ probabile. Nel caso (b), A e B si dicono negativamente correlati. Intuitivamente, il verificarsi di uno dei due eventi implica che l'altro Ŕ meno probabile. Nel caso (c), A e B si dicono indipendenti. Intuitivamente, il verificarsi di uno dei due eventi non modifica le probabilitÓ dell'altro evento.

A volte le probabilitÓ condizionate sono note e possono essere utilizzate per trovare le probabilitÓ di altri eventi.

Esercizio teorico 4. Supponi che A1, A2, ..., An siano eventi di un esperimento casuale la cui intersezione ha probabilitÓ positiva. Prova la regola del prodotto della probabilitÓ.

P(A1 intersezione A2 intersezione ĚĚĚ intersezione An) = P(A1)P(A2 | A1)P(A3 | A1 intersezione A2) ĚĚĚ P(An | A1 intersezione A2 intersezione ĚĚĚ An-1)

La regola del prodotto Ŕ molto utile negli esperimenti formati da stadi dipendenti, dove Ai Ŕ un evento dell'i-esimo stadio. Confronta la regola del prodotto della probabilitÓ con la regola del prodotto del calcolo combinatorio.

Esercizi

Esercizio teorico 5. Supponi che A e B siano eventi di un esperimento con P(A) = 1 / 3, P(B) = 1 / 4, P(A intersezione B) = 1 / 10. Trova:

  1. P(A | B)
  2. P(B | A)
  3. P(Ac | B)
  4. P(Bc | A)
  5. P(Ac | Bc)

Esercizio teorico 6. Considera l'esperimento consistente nel lanciare due dadi equilibrati e registrare la sequenza di punteggi (X1, X2). Sia Y la somma dei punteggi. Per ciascune delle seguenti coppie di eventi, trova la probabilitÓ di ciascun evento e la probabilitÓ condizionata di ogni evento dato l'altro. Determina se gli eventi sono correlati postiviamente, negativamente oppure sono indipendenti.

  1. {X1 = 3}, {Y = 5}
  2. {X1 = 3}, {Y = 7}
  3. {X1 = 2}, {Y = 5}
  4. {X1 = 2},{X1 = 3}

La correlazione non Ŕ transitiva. Nota per esempio, nell'esercizio precedente, che {X1 = 3}, {Y = 5} sono positivamente correlati, {Y = 5}, {X1 = 2} sono positivamente correlati, ma {X1 = 3}, {X1 = 2} sono negativamente correlati.

Simulazione 7. Nell'esperimento dei dadi, poni n = 2 e simula 500 replicazioni. Calcola le probabilitÓ condizionate empiriche corrispondenti alle condizioni dell'esercizio precedente.

Esercizio teorico 8. Considera l'esperimento delle carte che consiste nell'estrarre 2 carte da un mazzo standard e registrare la sequenza di carte estratte. Per i = 1, 2, sia Qi l'evento in cui la carta i-esima Ŕ una regina e Hi l'evento in cui la carta i-esima Ŕ di cuori. Per ciascuna delle seguenti coppie di eventi, calcola la probabilitÓ di ogni evento e la probabilitÓ condizionata di ciascun evento dato l'altro. Determina se gli eventi sono correlati postiviamente, negativamente oppure sono indipendenti.

  1. Q1, H1.
  2. Q1, Q2.
  3. Q2, H2.
  4. Q1, H2.

Simulazione 9. Nell'esperimento delle carte, poni n = 2 e simula 500 replicazioni. Calcola le probabilitÓ condizionate empiriche corrispondenti alle condizioni dell'esercizio precedente.

Esercizio teorico 10. Considera l'esperimento delle carte con n = 3 cards. Trova la probabilitÓ dei seguenti eventi:

  1. Tutte e tre le carte sono di cuori
  2. Le prime due carte sono di cuori e la terza Ŕ di picche.
  3. La prima e la terza carta sono di cuori e la seconda di picche.

Simulazione 11. Nell'esperimento delle carte, poni n = e simula 1000 replicazioni. Calcola la probabilitÓ empirica di ciascun evento dell'esercizio precedente e confronta con la probabilitÓ teorica.

Esercizio teorico 12. In un certo gruppo di persone, il 30% fuma e l'8% ha una certa malattia cardiaca. Inoltre, il 12% di coloro che fumano hanno la malattia.

  1. Qual'Ŕ la percentuale di soggetti del gruppo che fumano e hanno la malattia?
  2. Quale percentuale di ammalati sono anche fumatori?
  3. Il fumo e la malattia sono negativamente correlati, positivamente correlati o indipendenti?

Esercizio teorico 13. Supponi che A, B e C siano eventi di un esperimento casuale con P(A | C) = 1 / 2, P(B | C) = 1 / 3, e P(A intersezione B | C) = 1 / 4. Trova:

  1. P(A intersezione Bc | C)
  2. P(A unione B | C)
  3. P(Ac intersezione Bc | C).

Esercizio teorico 14. Supponi che A e B siano eventi di un esperimento casuale con P(A) = 1 / 2, P(B) = 1 /3 , P(A | B) = 3 / 4. Trova

  1. P(A intersezione B).
  2. P(A unione B).
  3. P(B unione Ac).
  4. P(B | A).

Esercizio numerico 15. Sui dati M&M, trova la probabilitÓ empirica che un pacchetto contenga almeno 10 pastiglie rosse, dato un peso del pacchetto maggiore di 48 grammi.

Esercizio numerico 16. Sui dati della cicala,

  1. Trova la probabilitÓ empirica che una cicala pesi almeno 0.25 grammi dato il sesso masachile.
  2. Trova la probabilitÓ empirica che una cicala pesi almeno 0.25 grammi data la specie tredecula.

Distribuzioni condizionate

Supponiamo, di nuovo, di avere un esperimento con spazio campionario S e misura di probabilitÓ P. Supponiamo che X sia una variabile casuale a valori in T relativa all'esperimento. Ricorda che la distribuzione di probabilitÓ di X Ŕ la misura di probabilitÓ su T data da

P(X in B) per B T.

Analogamente, se A Ŕ un evento con probabilitÓ positiva, la distribuzione condizionata di X dato A Ŕ la misura di probabilitÓ su T data da

P(X in B | A) per B T.

Esercizio teorico 17. Considera l'esperimento consistente nel lanciare due dadi equilibrati e registrare la sequenza dei punteggi (X1, X2). Sia Y la somma dei punteggi. Trova la distribuzione condizionata di (X1, X2) dato Y = 7.

Esercizio teorico 18. Supponi che il tempo X (in minuti) necessario per eseguire una certa operazione sia distribuito uniformemente sull'intervallo (15, 60).

  1. Trova la probabilitÓ che l'operazione richieda pi¨ di 30 minuti.
  2. Dato che l'operazione non Ŕ terminata dopo 30 minuti, trova la probabilitÓ che essa richieda pi¨ di altri 15 minuti.
  3. Trova la distribuzione condizionata di X dato X > 30.

Esercizio teorico 19. Ricorda che l'esperimento della moneta di Buffon consiste nel lanciare una moneta di raggio r 1/2 su un pavimento coperto di mattonelle quadrate di lato 1. Si registrano le coordinate (X, Y) del centro della moneta, relativamente ad assi che passano attraverso il centro del quadrato e paralleli ai lati.

  1. Trova P(Y > 0 | X < Y)
  2. Trova la distribuzione condizionata di (X, Y), sapendo che la moneta non ha toccato i lati del quadrato.

Simulazione 20. Replica l'esperimento della moneta di Buffon 500 volte. Calcola la probabilitÓ empirica che Y > 0 dato X < Y, e confronta col risultato dell'esercizio precedente.

La legge delle probabilitÓ totali e il teorema di Bayes

Supponiamo che {Aj: j in J} sia una collezione numerabile di eventi che partiziona lo spazio campionario S. Sia B un altro evento, e supponiamo di conoscere P(Aj) e P(B | Aj) per ogni j in J.

Esercizio teorico 21. Prova la legge delle probabilitÓ totali:

P(B) = sommatoriaj P(Aj) P(B | Aj).

Esercizio teorico 22. Prova il teorema di Bayes, che prende nome da Thomas Bayes: per k in J,

P(Ak | B) = P(Ak)P(B | Ak) / sommatoriaj P(Aj) P(B | Aj).

Nel contesto del teorema di Bayes, P(Aj) Ŕ la probabilitÓ a priori di Aj e P(Aj | B) Ŕ la distribuzione a posteriori di Aj. Studieremo delle versioni pi¨ generali della legge delle probabilitÓ totali e del teorema di Bayes nel capitolo sulle distribuzioni.

Esercizio teorico 23. Nell'esperimento dado-moneta, si lancia un dado equilibrato e poi una moneta bilanciata il numero di volte indicato dal dado

  1. Trova la probabilitÓ che tutte le monete siano testa.
  2. Sapendo che tutte le monete sono testa, trova la probabilitÓ che il punteggio del dado sia stato i per ogni i = 1, 2, 3, 4, 5, 6.

Simulazione 24. Simula l'esperimento dado-moneta 200 volte.

  1. Calcola la probabilitÓ empirica che tutte le monete siano testa e confrontala con la probabilitÓ dell'esercizio precedente.
  2. Per i = 1, 2, ..., 6, calcola la probabilitÓ empirica dell'evento in cui il punteggio del dado Ŕ stato i sapendo che tutte le monete sono testa. Confronta col risultato dell'esercizio precedente.

Esercizio teorico 25. Supponi che un sacchetto contenga 12 monete: 5 sono equilibrate, 4 sono sbilanciate con probabilitÓ di testa 1/3 e 3 hanno due teste. Si sceglie a caso una moneta dal sacchetto e la si lancia.

  1. Trova la probabilitÓ che esca testa.
  2. Sapendo che Ŕ uscita testa, trova la probabilitÓ condizionata di ciascun tipo di moneta.

Confronta gli esercizi 23 e 25. Nell'esercizio 23, si lancia una moneta con probabilitÓ prefissata di testa un numero casuale di volte. Nell'esercizio 25, si lancia una moneta con probabilitÓ casuale di testa un numero prefissato di volte.

Esercizio teorico 26. L'esperimento moneta-dado consiste nel lanciare una moneta equilibrata; se esce croce, si lancia un dado equilibrato, se esce testa si lancia un dado piatto uno-sei (1 e 6 hanno probabilitÓ 1/4, mentre 2, 3, 4, 5 hanno probabilitÓ 1/8).

  1. Trova la probabilitÓ che il punteggio del dado sia i, per i = 1, 2, ..., 6.
  2. Sapendo che il punteggio del dado Ŕ 4, trova la probabilitÓ condizionata che esca testa e la probabilitÓ condizionata che esca croce.

Simulazione 27. Simula l'esperimento moneta-dado 500 volte.

  1. Calcola la probabilitÓ empirica dell'evento in cui il punteggio del dado Ŕ i per ciascun i, e confrontala con la probabilitÓ dell'esercizio precedente
  2. Calcola la probabilitÓ empirica dell'evento in cui esce testa, sapendo che il punteggio del dado Ŕ 4, e confrontala con la probabilitÓ dell'esercizio precedente.

Esercizio teorico 28. Una fabbrica ha tre linee produttive che producono chip di memoria. La prima linea produce il 50% dei chip e ha un tasso di pezzi difettosi del 4%, la seconda linea produce il 30% dei chip e ha un tasso di pezzi difettosi del 5% mentre la terza linea produce il 20% dei chip e ha un tasso di pezzi difettosi del 1%. Si estrae casualmente un chip.

  1. Trova la probabilitÓ che il chip sia difettoso
  2. Sapendo che il chip Ŕ difettoso, trova la probabilitÓ condizionata di ciascuna linea produttiva.

Esercizio teorico 29. La forma pi¨ comune di daltonismo (dicromatismo) Ŕ una patologia ereditaria legata al sesso causata da un difetto sul cromosoma X; Ŕ quindi pi¨ comune nei maschi che nelle femmine: il 7% dei maschi sono daltonici, mentre solo lo 0.5% delle femmine lo sono. (Per ulteriori approfondimenti sulle patologie ereditarie legate al sesso, confronta la trattazione dell'emofilia.) In un certo gruppo di persone, il 50% sono maschi e il 50% femmine.

  1. Trova la percentuale di daltonici del gruppo.
  2. Trova la percentuale di soggetti daltonici maschi.

Esercizio teorico 30. Un'urna contiene inizialmente 6 palline rosse e 4 palline verdi. Si sceglie a caso una pallina e poi la si rimette nell'urna insieme ad altre due palline dello stesso colore; il processo viene poi ripetuto. Questo Ŕ un esempio di schema dell'urna di Pˇlya, che prende il nome da George Pˇlya.

  1. Trova la probabilitÓ che le prime 2 palline siano rosse e che la terza sia verde.
  2. Trova la probabilitÓ che la seconda pallina sia rossa.
  3. Trova la probabilitÓ che la prima pallina sia rossa sapendo che la seconda Ŕ rossa.

Esercizio teorico 31. L'urna 1 contiene 4 palline rosse e 6 verdi, mentre l'urna 2 contiene 7 palline rosse e 3 verdi. Si sceglie a caso un urna e se ne estrae una pallina.

  1. Trova la probabilitÓ che la pallina sia verde
  2. Sapendo che la pallina Ŕ verde, trova la probabilitÓ condizionata di aver scelto l'urna 1.

Esercizio teorico 32. L'urna 1 contiene 4 palline rosse e 6 verdi, mentre l'urna 2 contiene 6 palline rosse e 3 verdi. Si sceglie a caso una pallina dall'urna 1 e la si insierisce nell'urna 2. Si estrae quindi una pallina dall'urna 2.

  1. Trova la probabilitÓ che la pallina estratta dall'urna 2 sia verde.
  2. Sapendo che la pallina estratta dall'urna 2 Ŕ verde, trova la probabilitÓ condizionata che la pallina estratta dall'urna 1 fosse verde.

Test diagnostici

Supponiamo di avere un esperimento casuale con un evento di interesse A. Ovviamente, quando si esegue l'esperimento l'evento A pu˛ verificarsi oppure no. In ogni caso, non possiamo osservare direttamente il verificarsi o il non verificarsi di A. Disponiamo invece di un test progettato per indicare l'occorrenza dell'evento A; il test pu˛ essere o positivo per A o negativo per A. Il test ha inoltre un elemento di aleatorietÓ, e pu˛ dare indicazioni errate. Presentiamo alcuni esempi delle situazioni che vogliamo rappresentare:

Sia T l'evento in cui il test Ŕ positivo per il verificarsi di A. La probabilitÓ condizionata P(T | A) Ŕ detta sensitivitÓ del test. La probabilitÓ complementare

P(Tc | A) = 1 - P(T | A)

Ŕ la probabilitÓ di un falso negativo. La probabilitÓ condizionata P(Tc | Ac) Ŕ detta specificitÓ del test. La probabilitÓ complementare

P(T | Ac) = 1 - P(Tc | Ac)

Ŕ la probabilitÓ di un falso positivo. In molti casi, sensitivitÓ e specificitÓ del test sono note e sono un risultato della costruzione dello stesso. In ogni caso, l'utente del test Ŕ interessato alle probabilitÓ condizionate opposte:

P(A | T), P(Ac|Tc).

Esercizio teorico 33. Usa il teorema di Bayes per dimostrare che

P(A | T) = P(T | A)P(A) / [P(T | A)P(A) + P(T | Ac)P(Ac)].

Per fare un esempio concreto, supponiamo che la sensitivitÓ del test sia 0.99 e la specificitÓ sia 0.95. A occhio, il test sembra buono.

Esercizio teorico 34. Trova P(A | T) in funzione di p = P(A). Mostra che il grafico ha la seguente forma:

P(A | T) in funzione di p = P(A)

Esercizio teorico 35. Dimostra che P(A | T) in funzione di P(A) ha i valori riportati nella seguente tabella:

P(A) P(A | T)
0.001 0.019
0.01 0.167
0.1 0.688
0.2 0.832
0.3 0.895

Il valore modesto di P(A | T) per valori piccoli di P(A) cattura l'attenzione. La morale, ovviamente, Ŕ che P(A | T) dipende anche da P(A), non solo dalla sensitivitÓ e specificitÓ del test. Inoltre, il confronto corretto Ŕ P(A | T) con P(A), come nella tabella, non P(A | T) con P(T | A).