Laboratorio virtuale > Campioni casuali > 1 2 3 4 5 6 7 [8] 9

8. Grafici quantile-quantile


Derivazione del test

Supponiamo di osservare dati a valori reali

x1, x2, ..., xn

da un campione casuale di dimensione n. Siamo interessati a sapere se i dati possono ragionevolmente provenire da una distribuzione continua (a valori in un certo intervallo) con funzione di ripartizione F.

Per prima cosa, ordiniamo i dati dal più piccolo al più grande (i valori osservati delle statistiche d'ordine)

x(1) < x(2) < ··· < x(n).

Esercizio teorico 1. Prova che x(i) è il quantile del campione di ordine i / (n + 1). .

Esercizio teorico 2. Dimostra che il quantile di ordine i/ (n + 1) della distribuzione è

yi = F-1[i / (n + 1)]

Se i dati provengono relamente dalla distribuzione ipotizzata, allora ci si deve attendere che i punti

(x(i), yi); i = 1, 2, ..., n

giacciano nei pressi della diagonale y = x; al contrario, deviazioni marcate da questa linea indicano che i dati non sono stati generati da quella distribuzione. Il grafico di questi punti è noto come grafico quantile-quantile.

Negli esercizi che seguono, analizzeremo i grafici quantile-quantile per le distribuzioni normale, esponenziale, e uniforme.

Simulazione 3. Nell'applet quantile-quantile, scegli la distribuzione normale standardizzata e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Simulazionee 4. Nell'applet quantile-quantile, scegli la distribuzione uniforme (0, 1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Simulation Exercise 5. Nell'applet quantile-quantile, scegli la distribuzione esponenziale (1) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Famiglie di posizione e scala

In genere non si cerca di adattare i dati a una distribuzione specifica, ma piuttosto a una famiglia parametrica di distribuzioni (come la normale, l'uniforme o l'esponenziale). Normalmente infatti non possiamo lavorare con una distribuzione specifica perché non ne conosciamo i parametri. Fortunatamente, il metodo del grafico quantile-quantile è semplicemente estendibile alle famiglie di posizione e scala di distribuzioni.

Supponi che G sia una funzione di ripartizione data. Ricorda che la famiglia di posizione e scala associata a G ha funzione di ripartizione

F(x) = G[(x - a) / b],

dove a è il parametro di posizione e b > 0 è il parametro di scala.

Esercizio teorico 6. Per p appartenente a (0, 1), sia zp il quantile di ordine p per G e yp il quantile di ordine p per F. Prova che

yp = a + b zp.

Dall'esercizio 6 segue che se il grafico costruito con la funzione di ripartizione F è quasi lineare (e in particolare, se è prossimo alla diagonale), allora il disegno probabilistico costruito con la funzione di ripartizione G sarà anch'esso quasi lineare. Pertanto, possiamo usare la funzione di ripartizione G anche senza conoscere i parametri.

Simulazione 7. Nell'esperimento quantile-quantile, scegli la distribuzione normale con media 5 e deviazione standard 2 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Simulazione 8. Nell'esperimento quantile-quantile, scegli la distribuzione uniforme sull'intervallo (4, 10) e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Simulazione 9. Nell'esperimento quantile-quantile, scegli la distribuzione esponenziale con parametro 3 e poni la dimensione del campione a n = 20. Per ciascuna delle distribuzioni sottoindicate, genera 50 replicazioni e osserva la forma del disegno probabilistico.

  1. Normale standardizzata
  2. Uniforme (0, 1)
  3. Esponenziale (1)

Esercizi numerici

Esercizio numerico 10. Traccia il disegno probabilistico normale coi dati di Michelson sulla velocità della luce. Interpreta i risultati.

Esercizio numerico 11. Traccia il disegno probabilistico normale coi dati di Cavendish sulla densità della terra. Interpreta i risultati.

Esercizio numerico 12. Traccia il disegno probabilistico normale coi dati sulla parallasse solare di Short. Interpreta i risultati.

Esercizio numerico 13. Traccia il disegno probabilistico normale per la variabile lunghezza dei petali sui dati di Fisher sugli iris, nei casi seguenti. Confronta i risultati.

  1. Tutte le varietà
  2. Solo la Setosa
  3. Solo la Verginica
  4. Solo la Versicolor

Interpretazione dei risultati

Ci aspettiamo che tu abbia tratto alcune conclusioni da questi esperimenti. In primo luogo, il metodo del disegno probabilistico è di poca utilità se si dispone di campioni di piccola dimensione. Se si hanno solo cinque punti, ad esempio, è quasi impossibile valutare la linearità del grafico risultante. Anche con campioni più grandi, tuttavia, i risultati possono essere ambigui. Per esempio, un campione estratto da una distribuzione normale di solito sembra adattarsi bene anche a una distribuzione uniforme. Per trarre conclusioni adeguate è di grande aiuto la pratica con diversi tipi di distribuzione.