Laboratorio virtuale > Modelli di campionamento finito > [1] 2 3 4 5 6 7 8 9 10
Supponiamo di avere una popolazione D di N unità. La popolazione può essere un mazzo di carte, un insieme di persone, un'urna piena di palline, o qualsiasi altro tipo di collezione. In molti casi, indichiamo semplicemente le unità con numeri da 1 a N, per cui D = {1, 2, ..., N}. In altri casi (ad esempio in quello delle carte) può essere più naturale indicare le unità con vettori. In ogni caso, D è un sottinsieme di Rk per qualche k.
L'esperimento di base consiste nell'estrarre a caso n unità dalla popolazione D e registrare la sequenza di unità estratte:
X = (X1, X2, ..., Xn), dove Xi appartenente a D è l'i-esima unità estratta.
Se l'estrazione avviene con reinserimento, la dimensione campionaria n può essere qualsiasi intero positivo. In questo caso, lo spazio campionario S è
S = Dn = {(x1, x2, ..., xn): x1, x2, ..., xn in D}.
Se l'estrazione avviene senza reinserimento, la dimensione campionaria n non può essere maggior della dimensione della popolazione N. In questo caso, lo spazio campionario S è costituito da tutte le permutazioni di dimensione n estratte da D:
S = Dn = {(x1, x2, ..., xn): x1, x2, ..., xn in D sono distinti}.
1. Prova che
In entrambe le modalità di estrazione assumiamo che i campioni siano equiprobabili e quindi che la variabile esito X sia distribuita uniformemente su S; tale è il significato del termine campione casuale:
P(X A) = #(A) / #(S) per A S.
Siamo particolarmente interessati ai seguenti modelli speciali:
Torniamo al modello generale consistente nell'estrarre a caso n unità dalla popolazione D, con o senza reinserimento.
2. Mostra che ogni permutazione di (X1, X2, ..., Xn) ha la medesima distribuzione di (X1, X2, ..., Xn) stesso (cioè uniforme sullo spazio campionario appropriato S).
Una sequenza di variabili casuali che godono di tale proprietà è detta scambiabile. Anche se il concetto è molto semplice da afferrare, sia intuitivamente che formalmente, è in ogni caso estremamente importante. Useremo spesso nel corso di questo capitolo la proprietà di scambiabilità.
3. Mostra che ogni sequenza di m delle n variabili esito è distribuita uniformemente sullo spazio campionario appropriato:
In particolare, per ciascun modello di campionamento, Xi è distribuita uniformemente su D per ogni i.
4. Mostra che, se l'estrazione è con reinserimento, X1, X2, ..., Xn sono indipendenti.
Pertanto, nel caso di campionamento con reinserimento, le variabili del campione formano un campione casuale dalla distribuzione uniforme, in senso tecnico.
5. Mostra che, se l'estrazione è senza reinserimento, allora la distribuzione condizionata della sequenza di m delle variabili esito data una sequenza di altre j variabili esito è la distribuzione uniforme sull'insieme delle permutazioni di dimensione m estratte dalla popolazione quando le j unità note sono rimosse (ovviamente, m + j non può essere maggiore di n).
In particolare, Xi e Xj sono dipendenti per i e j distinti se il campionamento è senza reinserimento.
In molti casi, in particolare se il campionamento è senza reinserimento, l'ordine in cui le unità vengono estratte non è rilevante, ciò che importa è l'insieme (non ordinato) di unità:
W = {X1, X2, ..., Xn}.
Supponiamo in primo luogo che l'estrazione avvenga senza reinserimento. In questo caso, W assume valori nell'insieme di combinazioni di dimensione n estratte da D:
T = {{x1, x2, ..., xn}: x1, x2, ..., xn in D sono distinti}.
6. Mostra che #(T) = C(N, n)
7. Prova che W è distribuita uniformemente su T:
P(W B) = #(B) / #(T) = #(B) / C(N, n) per B T.
Suggerimento: Per ogni combinazione di dimensione n da D, esistono n! permutazioni di dimensione n.
Se l'estrazione è con reinserimento, W assume valori nella collezioni di sottinsiemi di D, di dimensione da 1 a n:
T = {{x1, x2, ..., xn}: x1, x2, ..., xn in D}.
8. Prova che #(T) = C(N + n - 1, n).
9. Mostra che W non è distribuita uniformemente su T.
10. Supponi di estrarre un campione di dimensione 2 dalla popolazione {1, 2, 3, 4, 5, 6}. Fai la lista di tutti i campioni
11. Nell'esperimento delle carte con n = 5 carte (poker), mostra che ci sono
12. Nell'esperimento delle carte con n = 13 carte (bridge), mostra che ci sono
13. Nell'esperimento delle carte, poni n = 3. Simula 5 replicazioni e ogni volta segna le sequenza (ordinate) di carte che darebbero la stessa mano non ordinata che hai ottenuto.
14. Nell'esperimento delle carte, mostra che
15. Nell'esperimento delle carte, mostra che Yi e Zj sono indipendenti per ogni i e j.
16. Nell'esperimento delle carte, mostra che (Y1, Y2), (Z1, Z2) sono dipendenti. Confronta questo risultato con quello dell'esercizio precedente.
17. Supponi di estrarre una sequenza di 5 carte.
18. Replica l'esperimento delle carte 500 volte, aggiornando ogni volta. Calcola la frequenza relativa che corrisponde a ciascun valore di probabilità nell'esercizio precedente.
19. Trova la probabilità che una mano di bridge non contega "10", jack, regine, re o assi. Tale mano si dice Yarborough, in onore di Earl of Yarborough.
Supponiamo che una persona abbia n chiavi, di cui solo una apre una certa porta. La persona prova a caso le chiavi. Indicheremo con N il numero di prova alla quale la persona trova la chiave giusta.
20. Supponi che le chiavi che non aprono vengano scartate (il che è la cosa più razionale da fare, ovviamente). Prova che
21. Supponi che le chiavi che non aprono non vengano scartate (magari la persona ha bevuto un po' troppo). Prova che