Laboratorio virtuale > Modelli di campionamento finito > 1 2 3 4 5 [6] 7 8 9 10

6. Il problema della concordanza


Il problema della concordanza è un esperimento casuale che può essere formulato in molti modi coloriti:

Tali esperimenti sono ovviamente equivalenti dal punto di vista formale, e corrispondono ad estrarre l'intera popolazione, senza reinserimento, dalla popolazione D = {1, 2, ..., n}. Quindi la variabile esito

X = (X1, X2, ..., Xn)

è distribuita uniformemente sullo spazio campionario di permutazioni di D. Il numero di unità n è il parametro dell'esperimento.

Concordanze

Diremo che si ha una concordanza alla posizione i se Xi = i. Quindi il numero di concordanze è la variabile casuale Nn definita formalmente come

Nn = I1 + I2 + ··· + In dove Ij = 1 se Xj = j e Ij = 0 altrimenti.

Per trovare la funzione di densità discreta del numero di concordanze, dobbiamo contare il numero di permutazioni con un numero specificato di concordanze. Ciò è facile una volta contato il numero di permutazioni senza concordanze che si dicono discordanze di {1, 2, ..., n}. Indicheremo il numero di permutazioni che presentano esattamente k concordanze con

bn(k) = #{Nn = k} for k in {0, 1, ..., n}.

Discordanze

Esercizio teorico 1. Usa le proprietà della misura di conteggio per mostrare che

bn(0) = n! - #{Xi = i per qualche i}.

Esercizio teorico 2. Usa la formula di inclusione-esclusione del calcolo combinatorio per mostrare che

bn(0) = n! - sommatoriaj = 1, ..., n (-1)j nj.

dove nj = sommatoria{J: #(J) = j} #{Xi = i per i in J}.

Esercizio teorico 3. Prova che se #(J) = j allora

#{Xi = i per i appartenente a J} = (n - j)!.

Esercizio teorico 4. Usa i risultati degli esercizi 2 e 3 per mostrare che

bn(0) = n! sommatoriaj = 0, ..., n (-1)j / j!.

Esercizio teorico 5. Calcola il numero di discordanze di 10 unità.

Permutazioni con k concordanze

Esercizio teorico 6. Mostra che la seguente procedura a due passo genera tutte le permutazioni con esattamente k concordanze.

  1. Seleziona i k interi che concordano.
  2. Seleziona una permutazione dei restanti n - k interi che non concordano.

Esercizio teorico 7. Prova che il numero di modi di eseguire i passi dell'esercizio 6 sono, rispettivamente,

  1. C(n, k)
  2. bn - k(0)

Esercizio teorico 8. Usa la regola del prodotto del calcolo combinatorio per mostrare che

bn(k) = (n! / k!) sommatoriaj = 0, ..., n - k (-1)j / j!.

Esercizio teorico 9. Con n = 5, calcola il numero di permutazioni con k concordanze, per k = 0, ..., 5.

La funzione di densità

Esercizio teorico 10. Usa il risultato dell'esercizio 8 per mostrare che la funzione di densità di Nn è

P(Nn = k) = (1 / k!) sommatoriaj = 0, ..., n - k (-1)j / j! per k = 0, 1, ..., n.

Simulazione 11. Nell'esperimento della concordanza, inizia con n = 2 e clicca ripetutamente sulla barra a scorrimento per incrementare n, osservando come cambia il grafico della funzione di densità. Con n = 10, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della densità empirica a quella teorica.

Esercizio teorico 12. Calcola esplicitamente la funzione di densità di N5.

Esercizio teorico 13. Mostra che P(Nn = n - 1) = 0. Dai una dimostrazione probabilistica mostrando che l'evento è impossibile e una dimostrazione algebrica utilizzando la funzione di densità dell'esercizio 8.

L'approssimazione di Poisson

Esercizio teorico 14. Prova che

P(Nn = k) converge a e-1 / k! as n converge a infinito.

Come funzione di k, il membro di destra dell'espressione dell'esercizio 1 è la funzione di densità di Poisson con parametro 1. Pertanto, la distribuzione del numero di concordanze converge alla distribuzione di Poisson con parametro 1 al crescere di n. La convergenza è molto rapida: la distribuzione del numero di concordanze con n = 10 è più o meno la stessa del caso in cui n = 1000000!

Simulazione 15. Nell'esperimento della concordanza, poni n = 10. Simula 1000 replicazioni, aggiornando ogni 10. Confronta le frequenze relative, le probabilità vere e le probabilità-limite di Poisson per il numero di concordanze.

Momenti

Media e varianza del numero di concordanze possono essere ricavate direttamente dalla distribuzioni. Tuttavia, è molto più comoda la rappresentazione in termini di variabili indicatore. La proprietà di scambiabilità è molto importante in questo contesto.

Esercizio teorico 16. Mostra che E(Ij) = 1 / n per ogni j.

Esercizio teorico 17. Prova che E(Nn) = 1. Suggerimento: Usa il risultato dell'esercizio 1 e le proprietà del valore atteso.

Segue quindi che il numero atteso di concordanze è 1, indipendentemente dalla dimensione della permutazione n.

Simulazione 18. Nell'esperimento della concordanza, inizia con n = 2 e clicca ripetutamente sulla barra a scorrimento per incrementare n, osservando come la media non cambi. Con n = 10, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della media campionaria alla media della distribuzione.

Esercizio teorico 19. Prova che var(Ij) = (n - 1) / n2 per ogni j.

Una concordanza in una posizione dovrebbe rendere più probabili una concordanza in un'altra. Possiamo quindi immaginare che le variabili indicatore siano positivamente correlate.

Esercizio teorico 20. Prova che se j e k sono distinti allora

  1. cov(Ij, Ik) = 1 / [n2(n - 1)].
  2. cor(Ij, Ik) = 1 / (n - 1)2.

Dall'esercizio 20, per n = 2, l'evento in cui c'è una concordanza alla posizione 1 è perfettamente correlato con la concordanza alla posizione 2. Ti sembra ragionevole?

Esercizio teorico 21. Mostra che var(Nn) = 1. Suggerimento: Usa gli esercizi 4 e 5 e la proprietà della covarianza.

Segue che la varianza del numero di concordanze è 1, indipendentemente dalla dimensione della permutazione n.

Esercizio teorico 22. Per n = 5, calcola la covarianza e la correlazione tra una concordanza alla posizione j e una alla posizione k, dove j e k sono distinti.

Simulazione 23. Nell'esperimento della concordanza, inizia con n = 2 e clicca ripetutamente sulla barra a scorrimento per incrementare n, osservando come la deviazione standard non cambi. Con n = 10, simula 1000 replicazioni, aggiornando ogni 10. Osserva la convergenza della deviazione standard campionaria alla deviazione standard della distribuzione.

Esercizio teorico 24. Mostra che, per j e k distinti,

cov(Ij, Ik) 0 per n .

Segue che l'evento concordanza alla posizione j è praticamente indipendente dalla concordanza alla posizione k se n è grande. Per n sufficientemente grande, le variabili indicatore si comportano quasi come n prove Bernoulliane con probabilità di successo 1 / n. Ciò dà ulteriori indizi sulla convergenza della distribuzione del numero di concordanze alla distribuzione di Poisson al crescere di n. Nota inoltre che la distribuzione limite di Poisson ha media 1 e varianza 1.