statistics

La distribuzione geometrica

Dopo aver visto in altri post la più famosa distribuzione discreta, la Binomiale, nonchè la distribuzione di Poisson e la distribuzione Beta, è giunto il momento di gettare uno sguardo alla distribuzione geometrica.

Di cosa parleremo

Quanti tentativi servono per avere un primo risultato positivo?
E' giunto il momento degli esempi…
Usiamo R o la TI 83
- lo stesso risultato in R
Potrebbe interessarti anche

Quanti tentativi servono per avere un primo risultato positivo?

Si usa quando si fanno tentativi indipendenti, ciascuno dei quali può avere come esito il successo o il fallimento, e si è interessati a conoscere quanti tentativi occorrono per avere un primo risultato positivo.

In simboli:

\( X \sim Geo(p) \\ \\ \)

\(X\) è il numero di tentativi necessari per avere un primo risultato positivo.
\(r\) è il numero dei tentativi.
\(P\) è la probabilità di successo nel tentativo.
diciamo poi, come è ovvio, che: q=1-p

Qui viene il bello. Abbiamo infatti: \(\\ P(X=r) = p \times q ^ {r-1} \\ \)

P indica quindi la probabilità che il primo successo avvenga al tentativo numero r.
Continuiamo nel ragionamento:

\(P(X > r) = q ^ {r}\)

il che ci consente di calcolare la probabilità che servano più di r tentativi per avere il primo successo, nonchè:

\(P(X \leq r) = 1 – q ^ {r} \\ \)

che ci aiuta a trovare qual è la probabilità che servano r tentativi o meno per avere il primo successo. Il valore atteso è:

\(E(X) = \frac{1}{P} \\ \)

La varianza è:

\(Var(X) = \frac{q}{P^{2}}\)

E’ giunto il momento degli esempi…

Sappiamo che la probabilità che un pattinatore completi un percorso senza incidenti è 0,4. Quindi:

\( X \sim Geo(0,4) \\ \)

X è il numero di tentativi che il nostro pattinatore deve fare per riuscire a completare un percorso senza alcun incidente.

Siamo pronti ad applicare le nostre nuove conoscenze.

Calcoliamo il numero di tentativi che mi aspetto di fare prima di avere un successo:

\( E(X) = \frac{1}{P}\\\) dunque \(\frac{1}{0,4} = 2,5 \)

La varianza nel numero dei tentativi è presto calcolata:

\( Var(X) \frac{q}{p^{2}} \\ \) cioè \(\frac{0,6}{0,4^{2}} = \frac{0,6}{0,16} = 3,75 \\ \)

La probabilità di aver successo al secondo tentativo, dopo aver fallito il primo…

\( P(X=2) = P \times q = 0,4 \times 0,6 = 0,24 \\\) vale a dire 24%

La probabilità di aver successo in 4 tentativi o meno? Facile!

\(P(X \leq 4) = 1-q^{4} = 1 – 0,6^{4} = 1 – 0,1296 \\ \) Cioè 0,8704

Vale a dire 87%

La probabilità di aver bisogno di più di 4 tentativi? Calcolarla è uno scherzo:

\( P(X > 4) = q^{4} = 0,6^{4}\\ \)

Cioè 0,1296, ossia circa il 13%

Usiamo R o la TI 83

Ora che abbiamo un po’ di formule ben presenti, possiamo lasciare campo alla nostra pigrizia e tirare fuori la TI-83.

Per calcolare la probabilità di aver successo al secondo tentativo, dopo aver fallito il primo mi basterà calcolare:

geometpdf(0.4,2)

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per trovare la probabilità di aver successo in 4 tentativi o meno:

geometcdf(0,4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

Per calcolare la probabilità di aver bisogno di più di 4 tentativi:

1-geometcdf(0.4,4)

e poi ovviamente x 100 se voglio avere il valore percentuale…

lo stesso risultato in R

Con P(X=2) e P=0,4

dgeom(1,0.4)

dove 1 è il numero dei fallimenti prima del successo…

P(X<=4) e P=0,4

pgeom(3,0.4)

Tutto molto semplice, molto rapido, molto divertente!

View Comments

gerardo graniero says:

at

ottima stesura
ottimo articolo

Calcolatore Sample Size per A/B Test

Una delle domande più ricorrenti quando si progetta un A/B test è: quanti utenti mi…

2 settimane ago

statistica

Anomaly detection: come identificare valori anomali nei dati

Tre metodi statistici per identificare valori anomali nei dati: z-score, IQR di Tukey e test…

3 settimane ago

statistica

Statistica bayesiana: come imparare dai dati, un passo alla volta

Abbiamo avuto modo di esaminare, nel corso dei precedenti articoli, l'inferenza statistica da una prospettiva…

3 settimane ago

statistica

A/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)

Abbiamo avuto modo di esaminare, nel corso dei precedenti articoli, come funziona il test delle…

3 settimane ago

statistica

Il Teorema del Limite Centrale: perché la statistica funziona (anche quando i dati non sono normali)

Abbiamo avuto modo di esaminare, nel corso dei precedenti articoli, la distribuzione normale e le…

4 settimane ago

statistica

Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)

Abbiamo avuto modo di esaminare, nel corso dei precedenti articoli, come funziona il test delle…

4 settimane ago

La distribuzione geometrica

Quanti tentativi servono per avere un primo risultato positivo?

E’ giunto il momento degli esempi…

Usiamo R o la TI 83

lo stesso risultato in R

Potrebbe interessarti anche

Related Posts

View Comments

Recent Posts

Calcolatore Sample Size per A/B Test

Anomaly detection: come identificare valori anomali nei dati

Statistica bayesiana: come imparare dai dati, un passo alla volta

A/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)

Il Teorema del Limite Centrale: perché la statistica funziona (anche quando i dati non sono normali)

Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)

La distribuzione geometrica

Quanti tentativi servono per avere un primo risultato positivo?

E’ giunto il momento degli esempi…

Usiamo R o la TI 83

lo stesso risultato in R

Potrebbe interessarti anche

Related Posts

View Comments

Related Post

Recent Posts

Calcolatore Sample Size per A/B Test

Anomaly detection: come identificare valori anomali nei dati

Statistica bayesiana: come imparare dai dati, un passo alla volta

A/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)

Il Teorema del Limite Centrale: perché la statistica funziona (anche quando i dati non sono normali)

Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)

Headline