statistica

I primi passi nel mondo della probabilità: spazio campionario, eventi, permutazioni e combinazioni

La probabilità e la combinatoria sono due concetti fondamentali nella matematica e nella statistica, che ci aiutano a comprendere e a interpretare molti fenomeni della vita quotidiana. In questo post introduttivo”sfioriamo” insieme i concetti principali vedendo come possano essere applicati in diversi contesti.

La Probabilità

La probabilità è una misura matematica che ci indica la possibilità che un evento si verifichi. In altre parole, la probabilità ci dice quanti casi favorevoli ci sono rispetto a tutti i casi possibili.

La probabilità si basa su due concetti fondamentali: lo spazio campionario e l’evento.

Lo spazio campionario è l’insieme di tutti i possibili risultati di un esperimento casuale.
Ad esempio, se lanciamo una moneta, lo spazio campionario è {testa, croce}. Se lanciamo due dadi, lo spazio campionario è {(1,1), (1,2), …, (6,6)}.

Un evento è un sottoinsieme dello spazio campionario che ci interessa.
Per esempio, se lanciamo una moneta e ci interessa sapere se uscirà testa o croce, l’evento è {testa} o {croce}. Se lanciamo due dadi e vogliamo sapere se la somma dei numeri è pari o dispari, l’evento è {(2,2), (2,4), …, (6,6)} o {(1,2), (1 ,4), …, (5 ,6)}.

La probabilità di un evento si calcola dividendo il numero dei casi favorevoli al verificarsi dell’evento per il numero dei casi possibili nello spazio campionario.

Per esempio:

se abbiamo un dado a sei facce e vogliamo sapere la probabilità di ottenere un 4 tirando il dado, abbiamo 1 caso favorevole (la faccia con il numero 4) rispetto a 6 casi possibili (le sei facce del dado).
Quindi, la probabilità di ottenere un 4 è di 1/6.

Altri possibili e semplici esempi:

  • La probabilità che esca testa lanciando una moneta è 1/2
  • La probabilità che la somma dei numeri sia pari lanciando due dadi è 18/36 = 1/2

La probabilità si esprime in numeri compresi tra 0 e 1, dove 0 indica l’impossibilità dell’evento e 1 indica la certezza dell’evento.

Un valore di probabilità vicino a 0 indica una bassa possibilità che l’evento si verifichi, mentre un valore di probabilità vicino a 1 indica una alta possibilità che l’evento si verifichi.

Il principio di additività delle probabilità per eventi incompatibili

Il principio di additività delle probabilità per eventi incompatibili afferma che la probabilità dell’unione di due o più eventi incompatibili è uguale alla somma delle loro probabilità.

Gli eventi incompatibili sono eventi che non possono verificarsi contemporaneamente, ovvero se uno si verifica, l’altro non può verificarsi.
Ad esempio, nel lancio di un dado, gli eventi “uscita del numero 3” e “uscita del numero 5” sono incompatibili. In questo caso, la probabilità dell’unione degli eventi (cioè l’uscita del numero 3 o del numero 5) è pari alla somma delle loro probabilità (1/6 + 1/6 = 1/3).

Il principio di moltiplicazione delle probabilità

Il principio di moltiplicazione delle probabilità afferma che la probabilità dell’intersezione di due eventi è uguale al prodotto delle loro probabilità individuali, se gli eventi sono indipendenti.

In altre parole, se A e B sono due eventi indipendenti in un esperimento di probabilità, allora la probabilità che entrambi si verifichino contemporaneamente è data dal prodotto delle loro singole probabilità:

P(A ∩ B) = P(A) x P(B). 


Per calcolare la probabilità di eventi più complessi o combinati tra loro si usano le regole della combinatoria, che studia le modalità con cui si possono formare gruppi di oggetti secondo determinati criteri.

Due concetti importanti della combinatoria sono le permutazioni e le combinazioni.

La Permutazione

Le permutazioni sono i modi in cui si possono ordinare n oggetti distinti in n posizioni diverse. Per esempio:

  • Le permutazioni delle lettere A,B,C sono ABC ACB BAC BCA CAB CBA
  • Il numero delle permutazioni di n oggetti distinti si calcola con il fattoriale n!, cioè il prodotto dei numeri naturali da 1 a n
  • Il numero delle permutazioni di A,B,C è 3! = 3 x 2 x 1 = 6

Vediamo un po’ di altri esempi:

Quanti modi diversi ci sono per disporre 4 libri su una mensola?

La risposta è: n!
Ricordo ancora che “!” indica il fattoriale, cioè il prodotto di tutti i numeri interi positivi da 1 a n.

Soluzione: 4! (4 fattoriale) = 24 modi diversi

Quante permutazioni posso effettuare in un insieme di 5 lettere?

5! = 5 x 4 x 3 x 2 x 1 = 120

Ci sono 120 permutazioni possibili di 5 lettere.

Quante permutazioni sono possibili tra 5 lettere prese a gruppi di 3 ?

n! / (n – r)!

dove “n” rappresenta il numero di oggetti totali (in questo caso, le 5 lettere), e “r” rappresenta il numero di oggetti che desideriamo scegliere e disporre in un ordine specifico (in questo caso, 3 lettere).

Quindi, sostituendo i valori, otteniamo:

5! / (5 – 3)! = 5! / 2! = (5 x 4 x 3 x 2 x 1) / (2 x 1) = 60

Quindi, ci sono 60 permutazioni possibili di 5 lettere prese a gruppi di 3.

È importante notare che, quando si sceglie un gruppo di oggetti da un insieme più grande, l’ordine in cui gli oggetti vengono scelti conta. Se invece non ci interessasse l’ordine, dovremmo utilizzare la formula delle combinazioni.

Il concetto di Combinazione

Le combinazioni sono i modi in cui si possono scegliere k oggetti tra n oggetti distinti senza tener conto dell’ordine. Per esempio,

  • Le combinazioni di due lettere tra A,B,C sono AB AC BC
  • Il numero delle combinazioni di k oggetti tra n oggetti distinti si calcola con il coefficiente binomiale C(n,k) = n! / (k! x (n-k)!)
  • Il numero delle combinazioni di due lettere tra A,B,C è C(3 ,2) = 3! / (2! x (3 -2)!) = 3

Vediamo qualche altro esempio:

Quante sono le combinazioni possibili per un insieme di 10 persone prese a gruppi di 3?

Per calcolare il numero di combinazioni possibili per un insieme di 10 persone prese a gruppi di 3, possiamo utilizzare la formula delle combinazioni:

n! / (k! * (n – k)!)

dove “n” rappresenta il numero di oggetti totali (in questo caso, le 10 persone) e “k” rappresenta il numero di oggetti che vogliamo scegliere senza preoccuparci dell’ordine (in questo caso, 3 persone).

Quindi, sostituendo i valori, otteniamo:

10! / (3! * (10 – 3)!) = (10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1) / ((3 x 2 x 1) * (7 x 6 x 5 x 4 x 3 x 2 x 1)) = 120

Una classe è composta da 12 ragazzi e 4 ragazze. Tra i sedici allievi se ne scelgono tre a caso: qual è la probabilità che essi siano tutti maschi?

Questo esempio è preso dall’ Esame di stato, tema di matematica n 1 (PNI, a. s. 2000-2001- Corso di ordinamento. Liceo scientifico)

La probabilità di scegliere tre allievi tutti maschi può essere calcolata come il rapporto tra il numero di modi in cui possiamo scegliere tre maschi (se vogliamo scegliere tre allievi tutti maschi, dobbiamo infatti considerare tutti i possibili gruppi di 3 allievi maschi che possono essere formati scegliendoli tra i 12 ragazzi maschi) e il numero totale di modi in cui possiamo scegliere tre studenti tra tutti i sedici.

Il numero di modi in cui possiamo scegliere tre maschi dalla classe di 12 ragazzi è dato dalla combinazione di 3 elementi scelti tra i 12 ragazzi maschi. Possiamo calcolare questo numero utilizzando la formula della combinazione:

C(12, 3) = 12! / (3! * (12-3)!) = 220

Il numero totale di modi in cui possiamo scegliere tre allievi dalla classe di 16 studenti è dato dalla combinazione di 3 elementi scelti tra i 16 allievi.

C(16, 3) = 16! / (3! * (16-3)!) = 560

Quindi, la probabilità di scegliere tre allievi tutti maschi è data da:

P(tre maschi) = C(12, 3) / C(16, 3) = 220 / 560 = 11 / 28

La distribuzione binomiale come esempio di applicazione della probabilità e della combinatoria

In un post specificamente dedicato alle distribuzioni di probabilità ho esaminato in dettaglio le proprietà della distribuzione binomiale. Rimando ovviamente al post per tutti i dettagli.
In questa sede, vorrei però introdurre brevemente in maniera diretta e pratica la binomiale, al solo scopo di rispondere a quesiti del tipo:

  • Voglio conoscere la probabilità che in 10 lanci di una moneta esca testa 5 volte o meno.
  • Voglio calcolare la probabilità che in 20 domande a risposta multipla (ogni domanda ha 4 scelte) si risponda correttamente a 15 domande o più, rispondendo totalmente a caso.
  • Voglio trovare la probabilità che in 100 estrazioni (con reinserimento) da un’urna contenente 10 palline bianche e 90 nere se ne estraggano meno di 20 bianche.

Vediamo il primo quesito. Voglio sapere la probabilità che in 10 lanci di una moneta esca 5 volte o meno testa.
Procedendo per logica, dovrei calcolare la somma delle probabilità binomiali per k = 0, 1, 2, 3, 4 e 5. Cioè:

P(X <= 5) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)

Usando la formula della probabilità binomiale e sostituendo n = 10 e p = 1/2, si ottiene:

P(X <= 5) = C(10 ,0) x (1/2)^0 x (1/2)^10 + C(10 ,1) x (1/2)^1 x (1/2)^9 + … + C(10 ,5) x (1/2)^5 x (1/2)^5

Semplificando i calcoli e usando una calcolatrice si ottiene:

P(X <= 5) = <0.001 + <0.01 + <0.04 + <0.12 + <0.21 + <0.25

P(X <= 5) = 0.63

Quindi la probabilità che in 10 lanci di una moneta esca testa al massimo cinque volte è circa il 63%.

Esiste un metodo più semplice per arrivare al risultato corretto?

Possiamo introdurre la funzione di ripartizione della distribuzione binomiale.

La funzione di ripartizione è una funzione che calcola la probabilità che la variabile aleatoria X sia minore o uguale a un certo valore k. Si indica con F(k) e si definisce come:

F(k) = P(X <= k) = somma delle probabilità binomiali per i = 0, 1, …, k

Questa funzione può essere calcolata con una formula approssimata o con una tabella precompilata. Per esempio, usando una tabella online come questa:

https://www.statisticshowto.com/tables/binomial-distribution-table/

dove si può trovare il valore di F(5) per n = 10 e p = 1/2.

Basta cercare nella riga corrispondente a n = 10 e nella colonna corrispondente a p = 0.5 e leggere il valore in corrispondenza di k = 5. Il valore è 0.623.

Ovviamente, è molto più comodo usare R oppure Python, specialmente per numeri più elevati.

In R, basta usare la funzione pbinom che calcola la probabilità cumulativa di ottenere un certo numero di successi in un certo numero di prove. Per esempio:

# Probabilità di ottenere 5 o meno teste in 10 lanci
pbinom(5, size = 10, prob = 0.5)
# Risultato: 0.6230469

Per usare Python, basterà sfruttare la libreria scipy.stats e la classe binom che rappresenta una variabile casuale binomiale. Per esempio:

# Importare la libreria
from scipy.stats import binom

# Probabilità di ottenere 5 o meno teste in 10 lanci
binom.cdf(5, n = 10, p = 0.5)
# Risultato: 0.623046875

Veniamo al secondo quesito.

Vogliamo calcolare la probabilità che in 20 domande a risposta multipla si risponda correttamente a 15 domande o più. Se assumiamo che ogni domanda abbia 4 opzioni e solo una sia corretta, allora la probabilità di successo è p = 0.25. Quindi si deve calcolare:

P(X >= 15) = P(X = 15) + P(X = 16) + P(X = 17) + P(X = 18) + P(X = 19) + P(X = 20)

La formula della probabilità binomiale è:

\( P(X = x) = {n \choose x} p^x (1-p)^{n-x} \\ \)

Usando la formula della probabilità binomiale, otteniamo:

\( P(X \geq 15) \approx 0.0002 \)

Quindi la probabilità è molto, molto bassa…meglio studiare!

Veniamo al terzo quesito.

Voglio trovare la probabilità che in 100 estrazioni da un’urna contenente 10 palline bianche e 90 nere se ne estraggano meno di 20 bianche. Se assumiamo che le estrazioni siano con reinserimento, allora la probabilità di successo (estrarre una pallina bianca) è p = 0.1. Quindi devo calcolare:

$$ P(X < 20) = P(X \leq 19) = \sum_{x=0}^{19} {100 \choose x} (0.1)^x (0.9)^{100-x} $$ e ottengo: $$ P(X < 20) \approx 0.9988 $$

Quindi in questo caso la probabilità è molto alta.

paolo

Recent Posts

Come usare gli Alberi Decisionali per classificare i dati

Gli Alberi Decisionali sono un tipo di algoritmo di apprendimento automatico che utilizza una struttura…

2 mesi ago

L’algoritmo di Discesa del Gradiente spiegato semplice

Immaginiamo di voler trovare il percorso più veloce per raggiungere una destinazione in auto. Si…

7 mesi ago

La Discesa del Gradiente: un nuovo studio mette in discussione un assunto base sull’ottimizzazione

Nel 1847, il matematico francese Augustin-Louis Cauchy stava lavorando su calcoli astronomici, quando ideò un…

7 mesi ago

Il Metodo Montecarlo spiegato in modo semplice e applicato a casi reali

La simulazione Monte Carlo è un metodo utilizzato per quantificare il rischio associato a un…

12 mesi ago

La distribuzione ipergeometrica

Abbiamo visto che la distribuzione binomiale si basa sull’ipotesi di una popolazione infinita N, condizione che si…

12 mesi ago

La distribuzione binomiale negativa (o distribuzione di Pascal)

La distribuzione binomiale negativa descrive il numero di prove necessarie per ottenere un certo numero…

12 mesi ago