Grafici quantile-quantile

8. Grafici quantile-quantile

Derivazione del test

Supponiamo di osservare dati a valori reali

x₁, x₂, ..., x_n

da un campione casuale di dimensione n. Siamo interessati a sapere se i dati possono ragionevolmente provenire da una distribuzione continua (a valori in un certo intervallo) con funzione di ripartizione F.

Per prima cosa, ordiniamo i dati dal più piccolo al più grande (i valori osservati delle statistiche d'ordine)

x₍₁₎ < x₍₂₎ < ··· < x_(n).

$Esercizio teorico$ 1. Prova che x_(i) è il quantile del campione di ordine i / (n + 1). .

$Esercizio teorico$ 2. Dimostra che il quantile di ordine i/ (n + 1) della distribuzione è

y_i = F^-1[i / (n + 1)]

Se i dati provengono relamente dalla distribuzione ipotizzata, allora ci si deve attendere che i punti

(x_(i), y_i); i = 1, 2, ..., n

giacciano nei pressi della diagonale y = x; al contrario, deviazioni marcate da questa linea indicano che i dati non sono stati generati da quella distribuzione. Il grafico di questi punti è noto come grafico quantile-quantile.

Negli esercizi che seguono, analizzeremo i grafici quantile-quantile per le distribuzioni normale, esponenziale, e uniforme.

3. Nell'applet quantile-quantile, scegli la distribuzione normale standardizzata e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

4. Nell'applet quantile-quantile, scegli la distribuzione uniforme (0, 1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

5. Nell'applet quantile-quantile, scegli la distribuzione esponenziale (1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

Famiglie di posizione e scala

In genere non si cerca di adattare i dati a una distribuzione specifica, ma piuttosto a una famiglia parametrica di distribuzioni (come la normale, l'uniforme o l'esponenziale). Normalmente infatti non possiamo lavorare con una distribuzione specifica perché non ne conosciamo i parametri. Fortunatamente, il metodo del grafico quantile-quantile è semplicemente estendibile alle famiglie di posizione e scala di distribuzioni.

Supponi che G sia una funzione di ripartizione data. Ricorda che la famiglia di posizione e scala associata a G ha funzione di ripartizione

F(x) = G[(x - a) / b],

dove a è il parametro di posizione e b > 0 è il parametro di scala.

$Esercizio teorico$ 6. Per p appartenente a (0, 1), sia z_p il quantile di ordine p per G e y_p il quantile di ordine p per F. Prova che

y_p = a + b z_p.

Dall'esercizio 6 segue che se il grafico costruito con la funzione di ripartizione F è quasi lineare (e in particolare, se è prossimo alla diagonale), allora il disegno probabilistico costruito con la funzione di ripartizione G sarà anch'esso quasi lineare. Pertanto, possiamo usare la funzione di ripartizione G anche senza conoscere i parametri.

7. Nell'esperimento quantile-quantile, scegli la distribuzione normale con media 5 e deviazione standard 2 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

8. Nell'esperimento quantile-quantile, scegli la distribuzione uniforme sull'intervallo (4, 10) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

9. Nell'esperimento quantile-quantile, scegli la distribuzione esponenziale con parametro 3 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

Normale standardizzata
Uniforme (0, 1)
Esponenziale (1)

Esercizi numerici

10. Traccia il disegno probabilistico normale coi dati di Michelson sulla velocità della luce. Interpreta i risultati.

11. Traccia il disegno probabilistico normale coi dati di Cavendish sulla densità della terra. Interpreta i risultati.

12. Traccia il disegno probabilistico normale coi dati sulla parallasse solare di Short. Interpreta i risultati.

13. Traccia il disegno probabilistico normale per la variabile lunghezza dei petali sui dati di Fisher sugli iris, nei casi seguenti. Confronta i risultati.

Tutte le varietà
Solo la Setosa
Solo la Verginica
Solo la Versicolor

Interpretazione dei risultati

Ci aspettiamo che tu abbia tratto alcune conclusioni da questi esperimenti. In primo luogo, il metodo del disegno probabilistico è di poca utilità se si dispone di campioni di piccola dimensione. Se si hanno solo cinque punti, ad esempio, è quasi impossibile valutare la linearità del grafico risultante. Anche con campioni più grandi, tuttavia, i risultati possono essere ambigui. Per esempio, un campione estratto da una distribuzione normale di solito sembra adattarsi bene anche a una distribuzione uniforme. Per trarre conclusioni adeguate è di grande aiuto la pratica con diversi tipi di distribuzione.