{"id":3111,"date":"2024-03-14T10:53:42","date_gmt":"2024-03-14T09:53:42","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/?p=3111"},"modified":"2026-06-18T14:20:33","modified_gmt":"2026-06-18T13:20:33","slug":"guida-ai-test-statistici-per-analisi-a-b","status":"publish","type":"post","link":"https:\/\/www.gironi.it\/blog\/guida-ai-test-statistici-per-analisi-a-b\/","title":{"rendered":"Guida ai Test Statistici per analisi A\/B"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">I&nbsp;<strong>test statistici&nbsp;<\/strong>sono strumenti fondamentali per l\u2019analisi dei dati e la presa di decisioni informate. Scegliere il test appropriato dipende dalle caratteristiche dei dati, dalle ipotesi da testare e dalle assunzioni sottostanti.<\/p>\n\n\n\n<!--more-->\n\n\n\n<p class=\"wp-block-paragraph\">In questo blog, ho trattato separatamente, con appositi articoli, ciascuno dei principali test statistici. \u00c8 infatti decisivo comprendere le condizioni di applicabilit\u00e0 di ciascun test per ottenere risultati affidabili e interpretazioni corrette.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ci\u00f2 che mi ripropongo in questo articolo \u00e8 una \u201cvisione d\u2019insieme\u201d, uno accanto all\u2019altro, dei pi\u00f9 comuni test che possono trovare applicabilit\u00e0 quotidiana per una moltitudine di analisi relative al mondo del web marketing e per A\/B test efficaci. Si tratta di un primo sguardo comparativo, che idealmente dovrebbe spingere al necessario approfondimento per ogni singolo tema, ma che ho voluto corredare di semplicissimi esempi pratici, al fine di stimolare la curiosit\u00e0 del lettore.<\/p>\n\n\n\t\t\t\t<div class=\"wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-1e8b188e      \"\n\t\t\t\t\tdata-scroll= \"1\"\n\t\t\t\t\tdata-offset= \"30\"\n\t\t\t\t\tstyle=\"\"\n\t\t\t\t>\n\t\t\t\t<div class=\"uagb-toc__wrap\">\n\t\t\t\t\t\t<div class=\"uagb-toc__title\">\n\t\t\t\t\t\t\tI Test di cui tratteremo\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<div class=\"uagb-toc__list-wrap \">\n\t\t\t\t\t\t<ol class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#il-test-z\" class=\"uagb-toc-link__trigger\">Il Test Z<\/a><li class=\"uagb-toc__list\"><a href=\"#il-test-t-di-student\" class=\"uagb-toc-link__trigger\">Il Test t di Student<\/a><li class=\"uagb-toc__list\"><a href=\"#il-test-t-di-welch\" class=\"uagb-toc-link__trigger\">Il Test t di Welch<\/a><li class=\"uagb-toc__list\"><a href=\"#il-test-del-chi-quadrato\" class=\"uagb-toc-link__trigger\">Il Test del chi-quadrato<\/a><li class=\"uagb-toc__list\"><a href=\"#lanalisi-della-varianza-anova\" class=\"uagb-toc-link__trigger\">L&#039;Analisi della varianza (ANOVA)<\/a><li class=\"uagb-toc__list\"><a href=\"#il-test-u-di-mann-whitney\" class=\"uagb-toc-link__trigger\">Il Test U di Mann-Whitney<\/a><li class=\"uagb-toc__list\"><a href=\"#il-test-esatto-di-fisher\" class=\"uagb-toc-link__trigger\">Il Test esatto di Fisher<\/a><li class=\"uagb-toc__list\"><a href=\"#uno-sguardo-dinsieme-in-una-tabella\" class=\"uagb-toc-link__trigger\">Uno sguardo d&#039;insieme in una tabella<\/a><li class=\"uagb-toc__list\"><a href=\"#potrebbe-interessarti-anche\" class=\"uagb-toc-link__trigger\">Potrebbe interessarti anche<\/a><li class=\"uagb-toc__list\"><a href=\"#per-approfondire\" class=\"uagb-toc-link__trigger\">Per approfondire<\/a><\/ol>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\n\n\n<h3 class=\"wp-block-heading\">Il Test Z<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test Z \u00e8 un test statistico di ipotesi utilizzato per <strong>verificare se la media campionaria differisce in modo significativo dalla media della popolazione<\/strong>, quando la varianza della popolazione \u00e8 nota e la dimensione del campione \u00e8 grande (di solito maggiore di 30).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test Z si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>La dimensione del campione \u00e8 grande (n &gt; 30)<\/li>\n\n\n\n<li>La varianza della popolazione \u00e8 nota<\/li>\n\n\n\n<li>I dati sono approssimativamente normalmente distribuiti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test Z viene utilizzato per determinare se esiste una differenza significativa tra due medie di proporzioni, come ad esempio i tassi di clic. Pu\u00f2 essere utilizzato, ad esempio, per verificare se l&#8217;introduzione di una nuova funzionalit\u00e0 su un sito web ha portato a un aumento significativo del tasso di conversione.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un sito di e-commerce vuole testare se una nuova versione del carrello ha migliorato il tasso di conversione. Il tasso di conversione precedente \u00e8 del 5% con una varianza nota di 0,0025. Dopo aver raccolto un campione di 500 utenti, il nuovo tasso di conversione osservato \u00e8 del 6%. Verifichiamo se la differenza \u00e8 statisticamente significativa utilizzando il test Z.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Tasso di conversione originale\np0 &lt;- 0.05\n# Varianza originale\nvar0 &lt;- 0.0025\n# Dimensione del campione\nn &lt;- 500\n# Tasso di conversione osservato\np1 &lt;- 0.06\n\n# Calcolo del test Z\nz &lt;- (p1 - p0) \/ sqrt(var0\/n)\nz\n<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">[1] 4.472136<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il valore z osservato \u00e8 4,47. Assumendo un livello di significativit\u00e0 di 0,05, il valore critico di z \u00e8 1,96. Poich\u00e9 il valore osservato \u00e8 superiore a 1,96, possiamo respingere l&#8217;ipotesi nulla e concludere che la differenza nel tasso di conversione \u00e8 statisticamente significativa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Test t di Student<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test t di Student \u00e8 un test statistico di ipotesi utilizzato per <strong>verificare se la media di un campione differisce in modo significativo da un valore ipotetico o se due campioni hanno medie significativamente diverse.<\/strong> Questo test si applica quando la <strong>varianza della popolazione non \u00e8 nota e la dimensione del campione \u00e8 piccola <\/strong>(di solito minore di 30).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Student si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>La dimensione del campione \u00e8 piccola (n &lt; 30)<\/li>\n\n\n\n<li>La varianza della popolazione non \u00e8 nota<\/li>\n\n\n\n<li>I dati sono approssimativamente normalmente distribuiti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Student viene utilizzato per confrontare le medie di due gruppi distinti, come ad esempio il tempo medio trascorso sul sito per gli utenti che hanno visto una variante A rispetto a quelli che hanno visto una variante B.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un&#8217;azienda vuole testare se una nuova pagina di destinazione ha un impatto sul tempo medio trascorso sul sito. Viene condotto un esperimento A\/B con 20 utenti per ogni gruppo. Il tempo medio trascorso sul sito per il gruppo di controllo \u00e8 di 3 minuti, mentre per il gruppo di test \u00e8 di 4 minuti. Verifichiamo se la differenza \u00e8 statisticamente significativa utilizzando il test t di Student.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati gruppo di controllo\ncontrol &lt;- c(2.5, 3.1, 2.8, 3.2, 2.9, 3.5, 3.0, 2.7, 3.3, 2.6, 3.4, 3.1, 2.8, 2.9, 3.2, 3.0, 3.1, 2.7, 3.3, 2.8)\n\n# Dati gruppo di test\ntest &lt;- c(3.8, 4.2, 3.9, 4.1, 4.3, 3.7, 4.5, 4.0, 3.6, 4.2, 4.1, 3.9, 4.3, 3.8, 4.0, 4.2, 3.7, 4.4, 4.1, 3.9)\n\n# Test t di Student\nt.test(test, control, alternative = \"greater\")\n\ndata:  test and control\nt = 12.585, df = 37.611, p-value = 2.354e-15\nalternative hypothesis: true difference in means is greater than 0\n95 percent confidence interval:\n 0.900641      Inf\nsample estimates:\nmean of x mean of y \n    4.035     2.995 <\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Student fornisce un valore p inferiore al livello di significativit\u00e0 di 0,05; dunque possiamo respingere l&#8217;ipotesi nulla e concludere che la differenza nel tempo medio trascorso sul sito tra i due gruppi \u00e8 statisticamente significativa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Test t di Welch<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test t di Welch \u00e8 una variante del test t di Student che<strong> non richiede l&#8217;assunzione di uguaglianza delle varianze tra i due campioni<\/strong>. Questo test si applica quando le dimensioni dei campioni e le varianze sono diverse.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Welch si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Le dimensioni dei campioni sono diverse<\/li>\n\n\n\n<li>Le varianze dei campioni sono diverse<\/li>\n\n\n\n<li>I dati sono approssimativamente normalmente distribuiti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Welch viene utilizzato per confrontare le medie di due gruppi distinti, come ad esempio il reddito medio degli utenti che hanno effettuato un acquisto in un sito di e-commerce rispetto a quelli che non hanno effettuato acquisti.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un&#8217;azienda vuole testare se il reddito medio degli utenti che hanno effettuato un acquisto differisce da quello degli utenti che non hanno effettuato acquisti. Viene condotto un esperimento con 30 utenti che hanno effettuato un acquisto e 20 utenti che non hanno effettuato acquisti. Il reddito medio degli utenti che hanno effettuato un acquisto \u00e8 di $50.000, mentre quello degli utenti che non hanno effettuato acquisti \u00e8 di $40.000. Verifichiamo se la differenza \u00e8 statisticamente significativa utilizzando il test t di Welch.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati gruppo di acquirenti\nbuyers &lt;- c(48000, 52000, 49000, 51000, 47000, 55000, 53000, 50000, 46000, 54000,\n            49000, 52000, 51000, 48000, 53000, 47000, 54000, 50000, 49000, 52000,\n            48000, 51000, 53000, 47000, 52000, 49000, 50000, 51000, 48000, 53000)\n\n# Dati gruppo di non acquirenti\nnon_buyers &lt;- c(38000, 42000, 39000, 41000, 37000, 43000, 40000, 39000, 42000, 38000,\n                41000, 40000, 39000, 42000, 37000, 41000, 38000, 39000, 40000, 41000)\n\n# Test t di Welch\nt.test(buyers, non_buyers, alternative = \"greater\", var.equal = FALSE)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">Welch Two Sample t-test\n\ndata:  buyers and non_buyers\nt = 17.811, df = 47.626, p-value &lt; 2.2e-16\nalternative hypothesis: true difference in means is greater than 0\n95 percent confidence interval:\n 9556.368      Inf\nsample estimates:\nmean of x mean of y \n    50400     39850 <\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il test t di Welch fornisce un valore p pari a 2.2e-16. Poich\u00e9 questo valore \u00e8 inferiore al livello di significativit\u00e0 di 0,05, possiamo respingere l&#8217;ipotesi nulla e concludere che la differenza nel reddito medio tra gli utenti che hanno effettuato un acquisto e quelli che non hanno effettuato acquisti \u00e8 statisticamente significativa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Test del chi-quadrato<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test del chi-quadrato \u00e8 un <strong>test statistico non parametrico<\/strong> utilizzato per verificare <strong>se esiste una relazione significativa tra due variabili categoriche <\/strong>o <strong>se la distribuzione osservata di una variabile categorica differisce dalla distribuzione attesa<\/strong>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test del chi-quadrato si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Le variabili sono categoriche<\/li>\n\n\n\n<li>I campioni sono indipendenti<\/li>\n\n\n\n<li>Le frequenze attese in ogni cella della tabella di contingenza sono maggiori di 5<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test del chi-quadrato viene utilizzato per analizzare l&#8217;associazione tra due variabili categoriche, come ad esempio la relazione tra il genere degli utenti e la preferenza per un determinato prodotto.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un negozio di abbigliamento vuole capire se c&#8217;\u00e8 una relazione tra il genere degli utenti e la preferenza per una particolare linea di prodotti. Viene condotto un sondaggio su 200 utenti, di cui 100 uomini e 100 donne. I risultati mostrano che 60 uomini e 40 donne preferiscono la linea di prodotti A, mentre 40 uomini e 60 donne preferiscono la linea di prodotti B. Verifichiamo se c&#8217;\u00e8 una relazione significativa tra genere e preferenza utilizzando il test del chi-quadrato.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati osservati\nobserved &lt;- matrix(c(60, 40, 40, 60), nrow = 2, byrow = TRUE)\nrownames(observed) &lt;- c(\"Uomini\", \"Donne\")\ncolnames(observed) &lt;- c(\"Linea A\", \"Linea B\")\nobserved<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">##        Linea A Linea B\n## Uomini      60      40\n## Donne       40      60<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\"># Test del chi-quadrato\nchisq.test(observed)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">## Pearson's Chi-squared test with Yates' continuity correction\n\n## data:  observed\n## X-squared = 7.22, df = 1, p-value = 0.00721\n<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il test del chi-quadrato fornisce un valore p pari a 0,00721. Poich\u00e9 questo valore \u00e8 inferiore al livello di significativit\u00e0 di 0,05, possiamo respingere l&#8217;ipotesi nulla e concludere che esiste una relazione significativa tra il genere degli utenti e la preferenza per una particolare linea di prodotti.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">L&#8217;Analisi della varianza (ANOVA)<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">L&#8217;analisi della varianza (ANOVA) \u00e8 un test statistico utilizzato per <strong>confrontare le medie di tre o pi\u00f9 gruppi <\/strong>e determinare se esistono differenze significative tra di essi.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;analisi della varianza si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>I dati sono approssimativamente normalmente distribuiti<\/li>\n\n\n\n<li>Le varianze dei gruppi sono uguali (<em>omoschedasticit\u00e0<\/em>)<\/li>\n\n\n\n<li>I campioni sono indipendenti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;analisi della varianza viene utilizzata per confrontare le medie di diverse versioni di un prodotto, di diverse strategie di marketing o di diverse tecniche di vendita.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un&#8217;azienda vuole testare l&#8217;efficacia di tre diverse strategie di marketing (A, B e C) sul fatturato medio mensile. Vengono selezionati 15 negozi per ciascuna strategia e il fatturato medio mensile viene registrato per un periodo di 6 mesi. Verifichiamo se esiste una differenza significativa tra le strategie di marketing utilizzando l&#8217;analisi della varianza.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati\nfatturato_A &lt;- c(120000, 115000, 130000, 125000, 110000, 135000, 118000, 122000, 127000, 115000, 128000, 120000, 124000, 117000, 121000)\nfatturato_B &lt;- c(112000, 118000, 110000, 115000, 122000, 108000, 120000, 114000, 116000, 119000, 111000, 117000, 113000, 121000, 109000)\nfatturato_C &lt;- c(105000, 110000, 108000, 112000, 107000, 115000, 111000, 109000, 113000, 106000, 108000, 114000, 110000, 112000, 107000)\n\n# Analisi della varianza\nanova_result &lt;- aov(c(fatturato_A, fatturato_B, fatturato_C) ~ rep(c(\"A\", \"B\", \"C\"), each = 15))\nsummary(anova_result)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">                                 Df    Sum Sq   Mean Sq F value   Pr(&gt;F)    \nrep(c(\"A\", \"B\", \"C\"), each = 15)  2 1.086e+09 543200000    22.7 2.07e-07 ***\nResiduals                        42 1.005e+09  23923810                     \n---\nSignif. codes:  0 \u2018***\u2019 0.001 \u2018**\u2019 0.01 \u2018*\u2019 0.05 \u2018.\u2019 0.1 \u2018 \u2019 1<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;analisi della varianza fornisce un valore p pari a 2.07e-07. Poich\u00e9 questo valore \u00e8 inferiore al livello di significativit\u00e0 di 0,05, possiamo respingere l&#8217;ipotesi nulla e concludere che esiste una differenza significativa nel fatturato medio mensile tra le tre strategie di marketing.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Test U di Mann-Whitney<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test U di Mann-Whitney \u00e8 un test non parametrico utilizzato per <strong>confrontare le medie di due gruppi indipendenti quando i dati non soddisfano i requisiti di normalit\u00e0 o di uguaglianza delle varianze <\/strong>richiesti per il test t di Student.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test U di Mann-Whitney si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>I dati non sono normalmente distribuiti<\/li>\n\n\n\n<li>Le varianze dei gruppi non sono uguali<\/li>\n\n\n\n<li>I campioni sono indipendenti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test U di Mann-Whitney viene utilizzato per confrontare le medie di due gruppi distinti, come ad esempio i ricavi medi di due diverse campagne pubblicitarie.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un&#8217;azienda vuole confrontare i ricavi medi di due diverse campagne pubblicitarie, A e B. Vengono raccolti i dati sui ricavi di 15 negozi per ciascuna campagna. Verifichiamo se esiste una differenza significativa tra le due campagne utilizzando il test U di Mann-Whitney.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati campagna A\nricavi_A &lt;- c(12000, 15000, 10000, 13000, 11000, 14000, 12500, 13500, 11500, 14500, 12200, 13800, 11800, 12700, 13200)\n\n# Dati campagna B\nricavi_B &lt;- c(11000, 14000, 13000, 12000, 15000, 11500, 13500, 12500, 14500, 11800, 13200, 12700, 14200, 11600, 13800)\n\n# Test U di Mann-Whitney\nwilcox.test(ricavi_A, ricavi_B, alternative = \"two.sided\", correct = FALSE)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">\tWilcoxon rank sum test\n\ndata:  ricavi_A and ricavi_B\nW = 102.5, p-value = 0.6779\nalternative hypothesis: true location shift is not equal to 0<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il test U di Mann-Whitney fornisce un valore p pari a 0,6779. Poich\u00e9 questo valore \u00e8 superiore al livello di significativit\u00e0 di 0,05, non possiamo respingere l&#8217;ipotesi nulla e non possiamo concludere che esista una differenza significativa nei ricavi medi tra le due campagne pubblicitarie.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Il Test esatto di Fisher<\/h3>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">Il test esatto di Fisher \u00e8 un test statistico non parametrico utilizzato per<strong> analizzare l&#8217;associazione tra due variabili categoriche in tabelle di contingenza 2&#215;2, soprattutto quando le dimensioni campionarie sono piccole<\/strong>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il test esatto di Fisher si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Le variabili sono categoriche<\/li>\n\n\n\n<li>I campioni sono indipendenti<\/li>\n\n\n\n<li>Le dimensioni campionarie sono piccole (una o pi\u00f9 celle della tabella di contingenza hanno valori attesi inferiori a 5)<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Il test esatto di Fisher viene utilizzato per analizzare l&#8217;associazione tra due variabili categoriche, come ad esempio la relazione tra l&#8217;uso di un determinato farmaco e l&#8217;insorgenza di un effetto collaterale.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> In uno studio clinico su un nuovo farmaco per il trattamento dell&#8217;ipertensione, vengono osservati 15 pazienti che hanno assunto il farmaco e 10 pazienti che hanno assunto un placebo. Dei 15 pazienti che hanno assunto il farmaco, 3 hanno sperimentato un effetto collaterale, mentre dei 10 pazienti che hanno assunto il placebo, 1 ha sperimentato l&#8217;effetto collaterale. Verifichiamo se c&#8217;\u00e8 un&#8217;associazione significativa tra l&#8217;assunzione del farmaco e l&#8217;insorgenza dell&#8217;effetto collaterale utilizzando il test esatto di Fisher.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati\neffetto_collaterale &lt;- c(3, 12, 1, 9)\ndim(effetto_collaterale) &lt;- c(2, 2)\nrownames(effetto_collaterale) &lt;- c(\"Farmaco\", \"Placebo\")\ncolnames(effetto_collaterale) &lt;- c(\"Effetto collaterale\", \"No effetto collaterale\")\neffetto_collaterale<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">        Effetto collaterale No effetto collaterale\nFarmaco                   3                      1\nPlacebo                  12                      9<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\"># Test esatto di Fisher\nfisher.test(effetto_collaterale)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">\tFisher's Exact Test for Count Data\n\ndata:  effetto_collaterale\np-value = 0.6265\nalternative hypothesis: true odds ratio is not equal to 1\n95 percent confidence interval:\n   0.145667 130.928066\nsample estimates:\nodds ratio \n  2.183137 <\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Il test esatto di Fisher fornisce un valore p pari a 0,6265. Poich\u00e9 questo valore \u00e8 superiore al livello di significativit\u00e0 di 0,05, non possiamo respingere l&#8217;ipotesi nulla e non possiamo concludere che esista un&#8217;associazione significativa tra l&#8217;assunzione del farmaco e l&#8217;insorgenza dell&#8217;effetto collaterale.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">L&#8217;Analisi di regressione<\/h2>\n\n\n\n<p class=\"has-light-gray-background-color has-background wp-block-paragraph\">L&#8217;analisi di regressione \u00e8 un insieme di tecniche statistiche utilizzate per <strong>modellare la relazione tra una variabile dipendente (o di risposta) e una o pi\u00f9 variabili indipendenti (o esplicative)<\/strong>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;analisi di regressione si applica quando si soddisfano le seguenti condizioni:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Esiste una relazione lineare tra la variabile dipendente e le variabili indipendenti<\/li>\n\n\n\n<li>I residui sono normalmente distribuiti e omoschedastici (hanno cio\u00e8 varianza costante)<\/li>\n\n\n\n<li>Le osservazioni sono indipendenti<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">L&#8217;analisi di regressione viene utilizzata per comprendere l&#8217;impatto di diverse variabili indipendenti su una variabile dipendente, come ad esempio l&#8217;effetto dell&#8217;et\u00e0, del reddito e del livello di istruzione sul consumo di una determinata categoria di prodotti.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Caso d&#8217;esempio:<\/strong> Un&#8217;azienda di abbigliamento vuole analizzare l&#8217;impatto dell&#8217;et\u00e0, del reddito e del livello di istruzione sul consumo annuale di abbigliamento. Vengono raccolti i dati su un campione di 100 individui. Utilizziamo l&#8217;analisi di regressione lineare multipla per modellare la relazione tra il consumo annuale di abbigliamento (variabile dipendente) e l&#8217;et\u00e0, il reddito e il livello di istruzione (variabili indipendenti).<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"># Dati\nconsumo &lt;- c(1200, 1500, 2000, 1800, 2200, 1700, 2100, 1900, 1600, 2300, 1400, 1800, 2100, 1700, 2000, 1600, 1900, 2200, 1500, 1800)\neta &lt;- c(25, 35, 42, 30, 38, 28, 45, 33, 27, 40, 22, 31, 39, 26, 37, 24, 32, 41, 29, 36)\nreddito &lt;- c(35000, 45000, 60000, 50000, 55000, 40000, 65000, 48000, 38000, 70000, 32000, 46000, 58000, 42000, 52000, 37000, 49000, 62000, 40000, 51000)\nistruzione &lt;- c(2, 3, 4, 3, 4, 2, 4, 3, 2, 4, 2, 3, 4, 2, 3, 2, 3, 4, 3, 3)\n\n# Modello di regressione lineare multipla\nmodello &lt;- lm(consumo ~ eta + reddito + istruzione)\nsummary(modello)<\/pre>\n\n\n\n<pre class=\"wp-block-preformatted\">Call:\nlm(formula = consumo ~ eta + reddito + istruzione)\n\nResiduals:\n    Min      1Q  Median      3Q     Max \n-261.06  -93.14   39.80   66.26  223.24 \n\nCoefficients:\n              Estimate Std. Error t value Pr(&gt;|t|)   \n(Intercept) 639.775078 165.734340   3.860  0.00139 **\neta         -13.127175  14.699870  -0.893  0.38509   \nreddito       0.030875   0.008645   3.571  0.00255 **\nistruzione   34.426950 107.969978   0.319  0.75396   \n---\nSignif. codes:  0 \u2018***\u2019 0.001 \u2018**\u2019 0.01 \u2018*\u2019 0.05 \u2018.\u2019 0.1 \u2018 \u2019 1\n\nResidual standard error: 128.1 on 16 degrees of freedom\nMultiple R-squared:  0.8404,\tAdjusted R-squared:  0.8105 \nF-statistic: 28.08 on 3 and 16 DF,  p-value: 1.302e-06<\/pre>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Coefficienti<\/strong>: L&#8217;output mostra i coefficienti per ogni variabile indipendente nel modello. In questo caso, le variabili indipendenti sono &#8216;eta&#8217;, &#8216;reddito&#8217; e &#8216;istruzione&#8217;. Il coefficiente di intercetta \u00e8 639.775078.<\/li>\n\n\n\n<li><strong>Significativit\u00e0<\/strong>: La variabile &#8216;reddito&#8217; \u00e8 statisticamente significativa al livello di significativit\u00e0 del 5% (poich\u00e9 il p-value \u00e8 inferiore a 0.05), mentre le variabili &#8216;eta&#8217; e &#8216;istruzione&#8217; non lo sono. Ci\u00f2 suggerisce che solo il &#8216;reddito&#8217; ha un impatto significativo sul &#8216;consumo&#8217;.<\/li>\n\n\n\n<li><strong>R-squared<\/strong>: Il valore di R-squared \u00e8 0.8404, il che indica che circa l&#8217;84% della variazione nel &#8216;consumo&#8217; pu\u00f2 essere spiegata dalle variabili &#8216;eta&#8217;, &#8216;reddito&#8217; e &#8216;istruzione&#8217;. Tuttavia, il valore di R-squared adjusted \u00e8 0.8105, il che suggerisce che quando si tiene conto del numero di variabili indipendenti nel modello, circa l&#8217;81% della variazione nel &#8216;consumo&#8217; pu\u00f2 essere spiegata da queste variabili.<\/li>\n\n\n\n<li><strong>F-statistic<\/strong>: Il valore F-statistic \u00e8 28.08 con un p-value di 1.302e-06, il che indica che il modello complessivo \u00e8 statisticamente significativo.<\/li>\n<\/ol>\n\n\n\n<p class=\"wp-block-paragraph\">Il modello ci suggerisce che il &#8216;reddito&#8217; \u00e8 l&#8217;unico predittore significativo del &#8216;consumo&#8217;. Tuttavia, il modello nel suo insieme \u00e8 significativo e spiega una grande parte della variazione nel &#8216;consumo&#8217;. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Uno sguardo d&#8217;insieme in una tabella<\/h3>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><th>Test Statistico<\/th><th class=\"has-text-align-left\" data-align=\"left\">Condizioni di Applicabilit\u00e0<\/th><th>Vantaggi<\/th><th>Svantaggi<\/th><\/tr><tr><td><strong>Test Z<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Dimensione campione grande (n &gt; 30).<br><br>Varianza della popolazione nota <br>Dati normalmente distribuiti.    <\/td><td>Semplice da calcolare e interpretare. <br><br>Adatto per grandi campioni.   <\/td><td>Richiede la conoscenza della varianza della popolazione. <br><br>Non adatto per piccoli campioni.    <\/td><\/tr><tr><td><strong>Test t di Student<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Dimensione campione piccola (n &lt; 30).<br><br>Varianza della popolazione sconosciuta. <br><br>Dati normalmente distribuiti.    <\/td><td>Adatto per piccoli campioni.<br><br>Non richiede la conoscenza della varianza della popolazione.     <\/td><td>\nPresuppone la normalit\u00e0 dei dati.\n    <\/td><\/tr><tr><td><strong>Test t di Welch<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Dimensioni campionarie diverse. <br><br>Varianze diverse. <br><br>Dati normalmente distribuiti.     <\/td><td>Non richiede l&#8217;assunzione di uguaglianza delle varianze.     <\/td><td>Presuppone la normalit\u00e0 dei dati.     <\/td><\/tr><tr><td><strong>Test del Chi-quadrato<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Variabili categoriche. <br><br>Campioni indipendenti. <br><br>Frequenze attese &gt; 5 per cella.     <\/td><td>Adatto per variabili categoriche. <br><br>Non richiede assunzioni sulla distribuzione.     <\/td><td>Pu\u00f2 essere inaccurato se le frequenze attese sono troppo basse.     <\/td><\/tr><tr><td><strong>ANOVA<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Dati normalmente distribuiti. <br>Omoschedasticit\u00e0 (varianze uguali). <br><br>Campioni indipendenti.     <\/td><td>Permette di confrontare pi\u00f9 di due gruppi contemporaneamente.     <\/td><td>\nRichiede l&#8217;assunzione di normalit\u00e0 e omoschedasticit\u00e0.\n    <\/td><\/tr><tr><td><strong>Test U di Mann-Whitney<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Dati non normalmente distribuiti. <br><br>Varianze diverse. Campioni indipendenti.     <\/td><td>Non richiede assunzioni sulla distribuzione o l&#8217;uguaglianza delle varianze.     <\/td><td>Meno potente dei test parametrici se le assunzioni sono soddisfatte.     <\/td><\/tr><tr><td><strong>Test esatto di Fisher<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Variabili categoriche. <br><br>Campioni indipendenti. <br><br>Piccole dimensioni campionarie.     <\/td><td>Accurato per piccoli campioni. <br><br>Adatto per tabelle di contingenza 2&#215;2.     <\/td><td>Non adatto per grandi campioni o tabelle di contingenza pi\u00f9 grandi.     <\/td><\/tr><tr><td><strong>Analisi di Regressione<\/strong><\/td><td class=\"has-text-align-left\" data-align=\"left\">Relazione lineare tra variabili. <br><br>Residui normalmente distribuiti e omoschedastici. <br><br>Osservazioni indipendenti.     <\/td><td>Permette di modellare la relazione tra variabili.<br><br>Identifica i predittori significativi.            <\/td><td>\nRichiede assunzioni sui residui e sulla linearit\u00e0.\n    <\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n<!-- internal-links-section -->\n<h3>Potrebbe interessarti anche<\/h3>\n<ul>\n<li><a href=\"https:\/\/www.gironi.it\/blog\/ab-testing\/\">A\/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)<\/a><\/li>\n<li><a href=\"https:\/\/www.gironi.it\/blog\/intervalli-di-confidenza\/\">Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)<\/a><\/li>\n<\/ul>\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">Per approfondire<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Per chi vuole fare sul serio con gli esperimenti online, <a href=\"https:\/\/www.amazon.it\/dp\/1108724264?tag=consulenzeinf-21&#038;ascsubtag=guida-ai-test-statistici-per-analisi-a-b\" rel=\"nofollow sponsored noopener\" target=\"_blank\"><em>Trustworthy Online Controlled Experiments<\/em><\/a> di Kohavi, Tang e Xu &egrave; il libro di riferimento sull&#8217;A\/B testing, scritto da chi ha guidato la sperimentazione in Microsoft e Google. Per i fondamenti statistici dei test, <a href=\"https:\/\/www.amazon.it\/dp\/8891910651?tag=consulenzeinf-21&#038;ascsubtag=guida-ai-test-statistici-per-analisi-a-b\" rel=\"nofollow sponsored noopener\" target=\"_blank\"><em>Statistica<\/em><\/a> di Newbold, Carlson e Thorne resta il manuale pi&ugrave; completo.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>I&nbsp;test statistici&nbsp;sono strumenti fondamentali per l\u2019analisi dei dati e la presa di decisioni informate. Scegliere il test appropriato dipende dalle caratteristiche dei dati, dalle ipotesi da testare e dalle assunzioni sottostanti.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[629],"tags":[631],"class_list":["post-3111","post","type-post","status-publish","format-standard","hentry","category-statistica-it","tag-test-statistici-it"],"lang":"it","translations":{"it":3111,"en":3248},"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"paolo","author_link":"https:\/\/www.gironi.it\/blog\/author\/paolo\/"},"uagb_comment_info":40,"uagb_excerpt":"I&nbsp;test statistici&nbsp;sono strumenti fondamentali per l\u2019analisi dei dati e la presa di decisioni informate. Scegliere il test appropriato dipende dalle caratteristiche dei dati, dalle ipotesi da testare e dalle assunzioni sottostanti.","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/3111","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=3111"}],"version-history":[{"count":5,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/3111\/revisions"}],"predecessor-version":[{"id":3741,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/3111\/revisions\/3741"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=3111"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/categories?post=3111"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/tags?post=3111"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}