Laboratorio virtuale > Campioni casuali > 1 2 3 4 5 6 7 [8] 9
Supponiamo di osservare dati a valori reali
x1, x2, ..., xn
da un campione casuale di dimensione n. Siamo interessati a sapere se i dati possono ragionevolmente provenire da una distribuzione continua (a valori in un certo intervallo) con funzione di ripartizione F.
Per prima cosa, ordiniamo i dati dal più piccolo al più grande (i valori osservati delle statistiche d'ordine)
x(1) < x(2) < ··· < x(n).
1. Prova che x(i) è il quantile del campione di ordine i / (n + 1). .
2. Dimostra che il quantile di ordine i/ (n + 1) della distribuzione è
yi = F-1[i / (n + 1)]
Se i dati provengono relamente dalla distribuzione ipotizzata, allora ci si deve attendere che i punti
(x(i), yi); i = 1, 2, ..., n
giacciano nei pressi della diagonale y = x; al contrario, deviazioni marcate da questa linea indicano che i dati non sono stati generati da quella distribuzione. Il grafico di questi punti è noto come grafico quantile-quantile.
Negli esercizi che seguono, analizzeremo i grafici quantile-quantile per le distribuzioni normale, esponenziale, e uniforme.
3. Nell'applet quantile-quantile, scegli la distribuzione normale standardizzata e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
4. Nell'applet quantile-quantile, scegli la distribuzione uniforme (0, 1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
5. Nell'applet quantile-quantile, scegli la distribuzione esponenziale (1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
In genere non si cerca di adattare i dati a una distribuzione specifica, ma piuttosto a una famiglia parametrica di distribuzioni (come la normale, l'uniforme o l'esponenziale). Normalmente infatti non possiamo lavorare con una distribuzione specifica perché non ne conosciamo i parametri. Fortunatamente, il metodo del grafico quantile-quantile è semplicemente estendibile alle famiglie di posizione e scala di distribuzioni.
Supponi che G sia una funzione di ripartizione data. Ricorda che la famiglia di posizione e scala associata a G ha funzione di ripartizione
F(x) = G[(x - a) / b],
dove a è il parametro di posizione e b > 0 è il parametro di scala.
6. Per p appartenente a (0, 1), sia zp il quantile di ordine p per G e yp il quantile di ordine p per F. Prova che
yp = a + b zp.
Dall'esercizio 6 segue che se il grafico costruito con la funzione di ripartizione F è quasi lineare (e in particolare, se è prossimo alla diagonale), allora il disegno probabilistico costruito con la funzione di ripartizione G sarà anch'esso quasi lineare. Pertanto, possiamo usare la funzione di ripartizione G anche senza conoscere i parametri.
7. Nell'esperimento quantile-quantile, scegli la distribuzione normale con media 5 e deviazione standard 2 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
8. Nell'esperimento quantile-quantile, scegli la distribuzione uniforme sull'intervallo (4, 10) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
9. Nell'esperimento quantile-quantile, scegli la distribuzione esponenziale con parametro 3 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.
10. Traccia il disegno probabilistico normale coi dati di Michelson sulla velocità della luce. Interpreta i risultati.
11. Traccia il disegno probabilistico normale coi dati di Cavendish sulla densità della terra. Interpreta i risultati.
12. Traccia il disegno probabilistico normale coi dati sulla parallasse solare di Short. Interpreta i risultati.
13. Traccia il disegno probabilistico normale per la variabile lunghezza dei petali sui dati di Fisher sugli iris, nei casi seguenti. Confronta i risultati.
Ci aspettiamo che tu abbia tratto alcune conclusioni da questi esperimenti. In primo luogo, il metodo del disegno probabilistico è di poca utilità se si dispone di campioni di piccola dimensione. Se si hanno solo cinque punti, ad esempio, è quasi impossibile valutare la linearità del grafico risultante. Anche con campioni più grandi, tuttavia, i risultati possono essere ambigui. Per esempio, un campione estratto da una distribuzione normale di solito sembra adattarsi bene anche a una distribuzione uniforme. Per trarre conclusioni adeguate è di grande aiuto la pratica con diversi tipi di distribuzione.