statistics

La distribuzione geometrica

Dopo aver visto in altri post la più famosa distribuzione discreta, la Binomiale, nonchè la distribuzione di Poisson e la distribuzione Beta, è giunto il momento di gettare uno sguardo alla distribuzione geometrica.

Quanti tentativi servono per avere un primo risultato positivo?

Si usa quando si fanno tentativi indipendenti, ciascuno dei quali può avere come esito il successo o il fallimento, e si è interessati a conoscere quanti tentativi occorrono per avere un primo risultato positivo.

In simboli:

\( X \sim Geo(p) \\ \\ \)
  • \(X\) è il numero di tentativi necessari per avere un primo risultato positivo.
  • \(r\) è il numero dei tentativi.
  • \(P\) è la probabilità di successo nel tentativo.
  • diciamo poi, come è ovvio, che: q=1-p
Qui viene il bello. Abbiamo infatti: \(\\ P(X=r) = p \times q ^ {r-1} \\ \)

P indica quindi la probabilità che il primo successo avvenga al tentativo numero r.
Continuiamo nel ragionamento:

\(P(X > r) = q ^ {r}\)

il che ci consente di calcolare la probabilità che servano più di r tentativi per avere il primo successo, nonchè:

\(P(X \leq r) = 1 – q ^ {r} \\ \)

che ci aiuta a trovare qual è la probabilità che servano r tentativi o meno per avere il primo successo. Il valore atteso è:

\(E(X) = \frac{1}{P} \\ \)

La varianza è:

\(Var(X) = \frac{q}{P^{2}}\)

E’ giunto il momento degli esempi…

Sappiamo che la probabilità che un pattinatore completi un percorso senza incidenti è 0,4. Quindi:

\( X \sim Geo(0,4) \\ \)

X è il numero di tentativi che il nostro pattinatore deve fare per riuscire a completare un percorso senza alcun incidente.

Siamo pronti ad applicare le nostre nuove conoscenze. 

Calcoliamo il numero di tentativi che mi aspetto di fare prima di avere un successo:

\( E(X) = \frac{1}{P}\\\) dunque \(\frac{1}{0,4} = 2,5 \)

La varianza nel numero dei tentativi è presto calcolata:

\( Var(X) \frac{q}{p^{2}} \\ \) cioè \(\frac{0,6}{0,4^{2}} = \frac{0,6}{0,16} = 3,75 \\ \)

La probabilità di aver successo al secondo tentativo, dopo aver fallito il primo…

\( P(X=2) = P \times q = 0,4 \times 0,6 = 0,24 \\\) vale a dire 24%

La probabilità di aver successo in 4 tentativi o meno? Facile!

\(P(X \leq 4) = 1-q^{4} = 1 – 0,6^{4} = 1 – 0,1296 \\ \) Cioè 0,8704

Vale a dire 87%

La probabilità di aver bisogno di più di 4 tentativi? Calcolarla è uno scherzo:

\( P(X > 4) = q^{4} = 0,6^{4}\\ \)

Cioè 0,1296, ossia circa il 13%


Usiamo R o la TI 83

Ora che abbiamo un po’ di formule ben presenti, possiamo lasciare campo alla nostra pigrizia e tirare fuori la TI-83.

Per calcolare la probabilità di aver successo al secondo tentativo, dopo aver fallito il primo mi basterà calcolare:

geometpdf(0.4,2) 

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per trovare la probabilità di aver successo in 4 tentativi o meno:

geometcdf(0,4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per calcolare la probabilità di aver bisogno di più di 4 tentativi:

1-geometcdf(0.4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

lo stesso risultato in R

Con P(X=2) e P=0,4

dgeom(1,0.4)

dove 1 è il numero dei fallimenti prima del successo…

P(X<=4) e P=0,4

pgeom(3,0.4)

Tutto molto semplice, molto rapido, molto divertente!

Potrebbe interessarti anche


Per approfondire

Le distribuzioni discrete come la geometrica sono trattate con esempi accessibili in Finalmente ho capito la statistica di Maurizio De Pra, una lettura adatta a chi vuole costruirsi le basi senza affrontare un manuale universitario.

paolo

View Comments

Recent Posts

Il peeking problem: perché sbirciare l’A/B test gonfia i falsi positivi

Il 21 gennaio 2015 Optimizely — una delle piattaforme di A/B testing più usate al…

2 giorni ago

Regressione verso la media: l’ottimizzazione SEO che ha funzionato… per caso

Nell'aeronautica militare israeliana, racconta Daniel Kahneman, gli istruttori erano convinti di una cosa: lodare un…

3 giorni ago

Correlazione: Pearson, Spearman e Kendall (e perché non è causazione)

Chi guarda i dati di un sito lo fa di continuo, spesso senza nemmeno accorgersene,…

6 giorni ago

Effect size e power analysis: quanto è grande l’effetto (e quanti dati servono)

Abbiamo chiuso l'articolo sul calcolatore di significatività con una promessa. Dicevamo che il p-value risponde…

1 settimana ago

Calcolatore di Significatività per A/B Test

Il nostro A/B test è arrivato alla fine: la variante B mostra un tasso di…

2 settimane ago

La biblioteca di Statistica e SEO: i libri che consiglio (e perché)

C'è una domanda che torna, puntuale, ogni volta che pubblico un articolo di questo percorso:…

2 settimane ago