{"id":2225,"date":"2021-07-22T16:37:11","date_gmt":"2021-07-22T15:37:11","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/?p=2225"},"modified":"2024-09-20T13:57:02","modified_gmt":"2024-09-20T12:57:02","slug":"regressione-multipla-spiegata-semplice","status":"publish","type":"post","link":"https:\/\/www.gironi.it\/blog\/regressione-multipla-spiegata-semplice\/","title":{"rendered":"L&#8217;analisi di regressione multipla, spiegata semplice."},"content":{"rendered":"\n<p>I fenomeni cui assistiamo, e che vogliamo studiare per approfondirne la comprensione, raramente si presentano in maniera cos\u00ec semplice da potersi definire attraverso due sole variabili, di cui una <strong>predittiva<\/strong> (<em>indipendente<\/em>) e una <strong>responso<\/strong> (<em>dipendente<\/em>).<\/p>\n\n\n\n<p>Per questo, se pure l&#8217;<a href=\"https:\/\/www.gironi.it\/blog\/regressione-lineare-semplice\/\" data-type=\"post\" data-id=\"1807\">analisi di regressione lineare<\/a> presenta una fondamentale importanza teorica, nella pratica fornisce poca informazione in pi\u00f9 rispetto allo studio attraverso il semplice coefficiente di correlazione.<\/p>\n\n\n\n<!--more-->\n\n\n\n<p>E&#8217; per questo che in letteratura scientifica \u00e8 la <strong>regressione multipla<\/strong> a svolgere un ruolo preponderante, potendo fornire un set completo di strumenti in grado di spiegare la variazione della nostra variabile dipendente per ogni diversa variabile predittiva presente nel modello, e per il complesso delle interazioni delle variabili indipendenti.<\/p>\n\n\n\t\t\t\t<div class=\"wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-6b5b67d3      \"\n\t\t\t\t\tdata-scroll= \"1\"\n\t\t\t\t\tdata-offset= \"30\"\n\t\t\t\t\tstyle=\"\"\n\t\t\t\t>\n\t\t\t\t<div class=\"uagb-toc__wrap\">\n\t\t\t\t\t\t<div class=\"uagb-toc__title\">\n\t\t\t\t\t\t\tDi cosa parleremo\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<div class=\"uagb-toc__list-wrap \">\n\t\t\t\t\t\t<ol class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#lequazione-della-regressione-multipla\" class=\"uagb-toc-link__trigger\">L&#039;equazione della regressione multipla<\/a><li class=\"uagb-toc__list\"><a href=\"#quali-informazioni-posso-ricavare\" class=\"uagb-toc-link__trigger\">Quali informazioni posso ricavare?<\/a><li class=\"uagb-toc__list\"><a href=\"#un-po-di-requisiti-per-cominciare\" class=\"uagb-toc-link__trigger\">Un po&#039; di requisiti per cominciare<\/a><li class=\"uagb-toc__list\"><a href=\"#in-pratica-come-procedere\" class=\"uagb-toc-link__trigger\">In pratica, come procedere?<\/a><li class=\"uagb-toc__list\"><a href=\"#mettiamoci-allopera\" class=\"uagb-toc-link__trigger\">Mettiamoci all&#039;opera!<\/a><li class=\"uagb-toc__list\"><a href=\"#quanto-\u00e8-valido-il-mio-modello\" class=\"uagb-toc-link__trigger\">Quanto \u00e8 valido il mio modello?<\/a><li class=\"uagb-toc__list\"><a href=\"#sintesi-finale\" class=\"uagb-toc-link__trigger\">Sintesi finale<\/a><li class=\"uagb-toc__list\"><a href=\"#risorse-gratuite-per-approfondire\" class=\"uagb-toc-link__trigger\">Risorse gratuite per approfondire<\/a><\/ol>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\n\n\n<h2 class=\"wp-block-heading\">L&#8217;equazione della regressione multipla<\/h2>\n\n\n\n<p>Partiamo dall&#8217;equazione di regressione multipla, che ovviamente si presenta come una &#8220;espansione&#8221; di quella della regressione lineare semplice, ed ha questa forma generale:<\/p>\n\n\n\n\\(\n\\\\\ny = a_1 x_1 + a_2 x_2 + &#8230; + a_i x_i + b\n\\\\\n\\)\n\n\n\n<p>dove <br>y \u00e8 la variabile responso (n.b. : \u00e8 <strong>unica<\/strong>)<br>a<sub>1,<\/sub>a<sub>2<\/sub>&#8230;a<sub>i<\/sub> sono i coefficienti di regressione per le variabili predittive<br>x<sub>1<\/sub>,x<sub>2<\/sub>&#8230;x<sub>i<\/sub> sono le variabili predittive<br>b \u00e8 l&#8217;intercetta (ed \u00e8 anch&#8217;essa <strong>unica<\/strong>)<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Quali informazioni posso ricavare?<\/h2>\n\n\n\n<p>Posso e devo, in prima istanza, <strong>capire quanto le mie variabili predittive, combinate, siano relate in maniera significativa alla variabile dipendente. E quanta parte del risultato \u00e8 spiegata dalla combinazione delle variabili predittive usate nel modello<\/strong>.<\/p>\n\n\n\n<p>Poi devo capire quanto ciascuna variabile predittiva sia legata alla variabile dipendente, mentre controllo l&#8217;altra variabile indipendente (suppongo per semplicit\u00e0 che le variabili predittive siano solo due).<\/p>\n\n\n\n<p>Devo poi capire quale dei miei due predittori sia quello pi\u00f9 &#8220;forte&#8221; nello stimare la variabile dipendente.<\/p>\n\n\n\n<p>Queste e molte altre cose possono essere esaminate con gli strumenti messi a disposizione dall&#8217;analisi di regressione multipla e questi primi accenni mostrano gi\u00e0 la potenza e l&#8217;utilit\u00e0 pratica di questa tecnica.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Un po&#8217; di requisiti per cominciare<\/h2>\n\n\n\n<p>L&#8217;analisi di regressione multipla \u00e8 una tecnica potente e di ampio utilizzo, ma per poterla utilizzare in maniera corretta \u00e8 necessario che siano rispettate alcune assunzioni fondamentali:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>La variabile dipendente deve essere misurata su una scala di tipo intervallo o rapporto, e la variabile predittiva deve essere anch&#8217;essa di tipo intervallo\/rapporto, oppure dicotomica.<\/li>\n\n\n\n<li>Deve esserci una relazione di tipo lineare tra la variabile predittiva e la variabile dipendente.<\/li>\n\n\n\n<li>Tutte le variabili nell&#8217;analisi di regressione devono presentare una distribuzione di tipo normale.<\/li>\n\n\n\n<li>Le variabili predittive non devono essere strettamente correlate tra loro (si parla di <a href=\"https:\/\/www.gironi.it\/blog\/multicollinearita-eteroschedasticita-autocorrelazione-tre-concetti-dai-nomi-difficili-spiegati-semplici\/\" target=\"_blank\" data-type=\"post\" data-id=\"2404\" rel=\"noreferrer noopener\">multicollinearit\u00e0<\/a>). Gli errori nella previsione devono essere tra loro indipendenti.<\/li>\n\n\n\n<li>Si assume l&#8217;<a href=\"https:\/\/www.gironi.it\/blog\/multicollinearita-eteroschedasticita-autocorrelazione-tre-concetti-dai-nomi-difficili-spiegati-semplici\/\" target=\"_blank\" data-type=\"post\" data-id=\"2404\" rel=\"noreferrer noopener\">eteroschedasticit\u00e0<\/a>. Gli errori nella previsione di Y sono cio\u00e8 circa gli stessi, in grandezza e direzione, a tutti i livelli di X.<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">In pratica, come procedere?<\/h2>\n\n\n\n<p>Il mio suggerimento per impratichirsi \u00e8 quello di procedere per passaggi. Io suggerisco questi:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Tracciamo i grafici di dispersione (<em>scatterplot<\/em>) per ogni variabile predittiva rispetto alla variabile responso, per valutare l&#8217;esistenza o meno di correlazione. <\/li>\n\n\n\n<li>Calcoliamo l&#8217;equazione di regressione multipla. <\/li>\n\n\n\n<li>Verifichiamo che siamo rispettate le assunzioni di normalit\u00e0 e omoschedasticit\u00e0.<\/li>\n\n\n\n<li>Analizziamo il coefficiente di determinazione.<\/li>\n<\/ol>\n\n\n\n<p>Per ognuno di questi passaggi, R si dimostra come di consueto un compagno fidatissimo, capace di fornirci le elaborazioni richieste con pochi comandi.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Mettiamoci all&#8217;opera!<\/h2>\n\n\n\n<p>Scaldiamo i motori di R e vediamo un esempio pratico, sia pur semplificando al massimo. Ovviamente, sfioriamo solo la superficie dell&#8217;argomento. Lo scopo infatti \u00e8 quello di gettare le prime basi per iniziare la navigazione in un argomento sterminato. Star\u00e0 alla passione di chi legge continuare ad approfondire&#8230;<br><br>Basta con i preamboli: scegliamo un dataset di esempio.<br>R ci fornisce tra gli altri il <em>Longley&#8217;s Economic Regression Data<\/em>, che user\u00f2 in questo articolo.<br>Di cosa si tratta? Di un <em>data frame<\/em> che contiene 7 variabili di tipo economico, dall&#8217;anno 1947 al 1962.<\/p>\n\n\n\n<p>Apriamo R Studio, carichiamo il dataset e diamogli una prima occhiata:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">data(longley)\ndim(longley)\nhead(longley)<\/pre>\n\n\n\n<p>Vediamo le varie metriche. Per il nostro esempio, andremo a testare come variabile responso il numero degli occupati, e come variabili predittive indipendenti il GNP (<em>Gross National Product<\/em>, il prodotto interno lordo) e la popolazione. <\/p>\n\n\n\n<p>Ok, vediamo come si presentano gli scatterplot:<br><\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">plot(longley$Employed, longley$GNP)<\/pre>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"855\" height=\"540\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-gnp.png\" alt=\"\" class=\"wp-image-2240\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-gnp.png 855w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-gnp-300x189.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 1362px) 62vw, 840px\" \/><figcaption class=\"wp-element-caption\">impiegati \/prodotto interno lordo<\/figcaption><\/figure>\n<\/div>\n\n\n<pre class=\"wp-block-preformatted\">plot(longley$Employed, longley$Population)<\/pre>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-popolazione.png\" alt=\"Residui regressione multipla\" class=\"wp-image-2241\" width=\"632\" height=\"398\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-popolazione.png 855w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/impiegati-popolazione-300x189.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><figcaption class=\"wp-element-caption\">impiegati \/ popolazione<\/figcaption><\/figure>\n<\/div>\n\n\n<p>La correlazione crescente di tipo lineare appare evidente.  Procediamo con la regressione multipla. Il comando lo conosciamo gi\u00e0: \u00e8 lm(). La sintassi per pi\u00f9 variabili predittive \u00e8 la seguente:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">regressione = lm(Employed ~ GNP + Population, data=longley)\nsummary(regressione)<\/pre>\n\n\n\n<p>Il risultato \u00e8 una miniera di informazioni!<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">Call:\nlm(formula = Employed ~ GNP + Population, data = longley)\n\nResiduals:\n     Min       1Q   Median       3Q      Max \n-0.80899 -0.33282 -0.02329  0.25895  1.08800 \n\nCoefficients:\n            Estimate Std. Error t value Pr(&gt;|t|)    \n(Intercept) 88.93880   13.78503   6.452 2.16e-05 ***\nGNP          0.06317    0.01065   5.933 4.96e-05 ***\nPopulation  -0.40974    0.15214  -2.693   0.0184 *  \n---\nSignif. codes:  0 \u2018***\u2019 0.001 \u2018**\u2019 0.01 \u2018*\u2019 0.05 \u2018.\u2019 0.1 \u2018 \u2019 1\n\nResidual standard error: 0.5459 on 13 degrees of freedom\nMultiple R-squared:  0.9791,\tAdjusted R-squared:  0.9758 \nF-statistic: 303.9 on 2 and 13 DF,  p-value: 1.221e-11<\/pre>\n\n\n\n<p>Notiamo per prima cosa il valore p della Statistica F. E&#8217; un valore molto piccolo (1.211e-11), altamente significante. Quindi, almeno una delle nostre variabili predittive \u00e8 relata in maniera statisticamente significativa alla variabile risultato. Dunque, procediamo.<\/p>\n\n\n\n<p>Tracciamo anche il grafico dei residui:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">plot(longley$Year, summary(regressione)$res, type='o')\nabline(h=0, lty=2, col=\"red\", lwd=2)<\/pre>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"855\" height=\"540\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/res.png\" alt=\"\" class=\"wp-image-2242\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/res.png 855w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/res-300x189.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 1362px) 62vw, 840px\" \/><\/figure>\n\n\n\n<p>Idealmente, la somma dei residui, cio\u00e8 le differenze tra i valori reali e quelli predetti, dovrebbe tendere a zero, o quantomeno essere la pi\u00f9 bassa possibile. Uno sguardo a questa sezione dell&#8217;output del comando summary ci dice che in questo caso la condizione \u00e8 rispettata:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"377\" height=\"83\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/residuals.png\" alt=\"\" class=\"wp-image-2247\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/residuals.png 377w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/residuals-300x66.png 300w\" sizes=\"auto, (max-width: 377px) 85vw, 377px\" \/><figcaption class=\"wp-element-caption\">la mediana dei residui \u00e8 vicina allo 0, vero?<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Controlliamo graficamente l&#8217;assunzione di normalit\u00e0 dei residui:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">hist(resid(regressione),main='Istogramma dei residui',xlab='Residui Standardizzati',ylab='Frequenza')<\/pre>\n\n\n\n<p>Il grafico che otteniamo ci mostra che l&#8217;assunzione di normalit\u00e0 \u00e8 rispettata:<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"607\" height=\"383\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/istogramma_dei_residui.png\" alt=\"\" class=\"wp-image-2291\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/istogramma_dei_residui.png 607w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/istogramma_dei_residui-300x189.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><figcaption class=\"wp-element-caption\">i residui rispettano l&#8217;assunzione di normalit\u00e0<\/figcaption><\/figure>\n\n\n\n<p>E&#8217; giunto il momento di andare a vedere in dettaglio cosa ci dice l&#8217;output del comando summary relativo alla nostra regressione.<\/p>\n\n\n\n<p>La mediana \u00e8 vicina allo 0, i residui sono distribuiti in maniera approssimativamente normale. Quindi possiamo procedere.<\/p>\n\n\n\n<p>I valori dei coefficienti angolari per le nostre due variabili predittive e quello dell&#8217;intercetta li troviamo nel nostro output:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"528\" height=\"155\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficienti.png\" alt=\"\" class=\"wp-image-2248\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficienti.png 528w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficienti-300x88.png 300w\" sizes=\"auto, (max-width: 528px) 85vw, 528px\" \/><figcaption class=\"wp-element-caption\">R ci fornisce&#8230;la pappa pronta!<\/figcaption><\/figure>\n<\/div>\n\n\n<p>La retta di regressione \u00e8 dunque:<\/p>\n\n\n\n\\(\n\\\\\ny = 0.06317x_1 &#8211; 0.40974 x_2 + 88.9388\n\\\\\n\\)\n\n\n\n<p>Prestiamo attenzione ai valori p per quanto riguarda i coefficienti angolari. L&#8217;output ci dice che le nostre variabili indipendenti sono significative per predire il valore della variabile dipendente. I p-value infatti sono inferiori al valore standard 0.05.  Il prodotto nazionale lordo ha addirittura un valore inferiore al livello  dello 0.001. <strong>Possiamo dunque rigettare l&#8217;ipotesi nulla (le variabili predittive non sono significative) e ritenere valido il nostro modello, notando come il GNP sia l&#8217;elemento pi\u00f9 &#8220;fedele&#8221; per la stima rispetto alla popolazione<\/strong>. Molto utile la rappresentazione con gli asterischi restituita dal nostro output, capace di fornirci subito il colpo d&#8217;occhio del risultato.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/pvalue-1.png\" alt=\"\" class=\"wp-image-2251\" width=\"528\" height=\"156\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/pvalue-1.png 528w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/pvalue-1-300x89.png 300w\" sizes=\"auto, (max-width: 528px) 85vw, 528px\" \/><figcaption class=\"wp-element-caption\">Occhio agli asterischi!<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Possiamo anche chiedere a R il calcolo dell&#8217;intervallo di confidenza per il nostro modello, con il comando:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">confint(regressione)<\/pre>\n\n\n\n<p>Nel nostro esempio otterremo questo output:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">                  2.5 %       97.5 %\n(Intercept) 59.15805807 118.71953854\nGNP          0.04017053   0.08617434\nPopulation  -0.73841447  -0.08107138<\/pre>\n\n\n\n<h2 class=\"wp-block-heading\">Quanto \u00e8 valido il mio modello?<\/h2>\n\n\n\n<p> A questo punto entra in scena un protagonista che abbiamo gi\u00e0 incontrato nei precedenti articoli, il <strong>coefficiente di determinazione<\/strong>, o r<sup>2<\/sup><\/p>\n\n\n\n<p>E&#8217; proprio lui a dirci una cosa fondamentale, cio\u00e8 quanto vicini sono i dati alla nostra retta di regressione. In altri termini pi\u00f9 pratici, quale percentuale dei &#8220;movimenti&#8221; della variabile dipendente sono spiegati dalle nostre variabili predittive. Il valore \u00e8 standardizzato tra 0 e 1, ed \u00e8 superfluo notare come il nostro modello sia tanto pi\u00f9 utile quanto pi\u00f9 questo valore si avvicina a 1.<\/p>\n\n\n\n<p>R, come al solito formidabile, ci ha gi\u00e0 dato in output questo utilissimo valore. Eccolo:<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"494\" height=\"24\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficiente_di_determinazione.png\" alt=\"\" class=\"wp-image-2255\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficiente_di_determinazione.png 494w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2021\/07\/coefficiente_di_determinazione-300x15.png 300w\" sizes=\"auto, (max-width: 494px) 85vw, 494px\" \/><figcaption class=\"wp-element-caption\">quando due variabili spiegano tutto&#8230;o quasi!<\/figcaption><\/figure>\n<\/div>\n\n\n<p>Ok, ma cos&#8217;\u00e8 il valore Adjusted R-squared? E&#8217; il valore da considerare, per superare un paradosso del valore r<sup>2<\/sup>, che ha un valore sempre crescente al crescere del numero delle variabili (anche se quelle variabili non sono affatto significative).  Il valore r quadro adjusted corregge questa anomalia e restituisce un valore (sempre inferiore a r quadro) perfettamente utilizzabile. <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Sintesi finale<\/h2>\n\n\n\n<p>Sar\u00f2 brevissimo: <strong>un valore elevato di r quadrato e un valore molto basso, tendente a zero, dei residui indicano che il modello \u00e8 buono<\/strong>.<\/p>\n\n\n\n<p>Non \u00e8 tutto, anzi \u00e8 solo l&#8217;inizio. Ma \u00e8 il primo passo per iniziare a padroneggiare uno strumento, come l&#8217;analisi di regressione lineare multipla, che ha grandissima utilit\u00e0 pratica. Vi lascio, spero, la curiosit\u00e0 di approfondire e andare oltre (e qua sotto alcune utile risorse gratuite online). Buon lavoro!<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">Risorse gratuite per approfondire<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Puoi <a href=\"https:\/\/hastie.su.domains\/ISLR2\/ISLRv2_website.pdf\" target=\"_blank\" rel=\"noopener\">scaricare liberamente<\/a> la seconda edizione dell&#8217;ottimo testo &#8220;An Introduction to Statistical Learning&#8221; di <a href=\"http:\/\/faculty.marshall.usc.edu\/gareth-james\/\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Gareth James<\/strong><\/a> e altri (Springer). E&#8217; un &#8220;robusto&#8221; file pdf di oltre 600 pagine, in lingua inglese.<\/li>\n\n\n\n<li>Puoi consultare gratuitamente il sito &#8220;<a href=\"http:\/\/www.cookbook-r.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">Cookbook for R<\/a>&#8220;, che contiene anche sezioni dedicate alle analisi di regressione.<\/li>\n\n\n\n<li>Sul sito <a href=\"https:\/\/www.r-bloggers.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">R-bloggers<\/a> potrai trovare articoli e spunti di ogni genere su qualsiasi argomento della statistica e del ML, con esempi e codice R. <\/li>\n<\/ul>\n\n\n\n<div class=\"wp-block-uagb-icon-list uagb-block-c0703fce\"><div class=\"uagb-icon-list__wrap\">\n<div class=\"wp-block-uagb-icon-list-child uagb-block-3b4d8c93\"><span class=\"uagb-icon-list__source-wrap\"><svg xmlns=\"https:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 512 512\"><path d=\"M256 0C114.6 0 0 114.6 0 256c0 141.4 114.6 256 256 256s256-114.6 256-256C512 114.6 397.4 0 256 0zM406.6 278.6l-103.1 103.1c-12.5 12.5-32.75 12.5-45.25 0s-12.5-32.75 0-45.25L306.8 288H128C110.3 288 96 273.7 96 256s14.31-32 32-32h178.8l-49.38-49.38c-12.5-12.5-12.5-32.75 0-45.25s32.75-12.5 45.25 0l103.1 103.1C414.6 241.3 416 251.1 416 256C416 260.9 414.6 270.7 406.6 278.6z\"><\/path><\/svg><\/span><span class=\"uagb-icon-list__label\">List item<\/span><\/div>\n\n\n\n<div class=\"wp-block-uagb-icon-list-child uagb-block-f59379cb\"><span class=\"uagb-icon-list__source-wrap\"><svg xmlns=\"https:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 512 512\"><path d=\"M256 0C114.6 0 0 114.6 0 256c0 141.4 114.6 256 256 256s256-114.6 256-256C512 114.6 397.4 0 256 0zM406.6 278.6l-103.1 103.1c-12.5 12.5-32.75 12.5-45.25 0s-12.5-32.75 0-45.25L306.8 288H128C110.3 288 96 273.7 96 256s14.31-32 32-32h178.8l-49.38-49.38c-12.5-12.5-12.5-32.75 0-45.25s32.75-12.5 45.25 0l103.1 103.1C414.6 241.3 416 251.1 416 256C416 260.9 414.6 270.7 406.6 278.6z\"><\/path><\/svg><\/span><span class=\"uagb-icon-list__label\">List item<\/span><\/div>\n\n\n\n<div class=\"wp-block-uagb-icon-list-child uagb-block-0317fead\"><span class=\"uagb-icon-list__source-wrap\"><svg xmlns=\"https:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 512 512\"><path d=\"M256 0C114.6 0 0 114.6 0 256c0 141.4 114.6 256 256 256s256-114.6 256-256C512 114.6 397.4 0 256 0zM406.6 278.6l-103.1 103.1c-12.5 12.5-32.75 12.5-45.25 0s-12.5-32.75 0-45.25L306.8 288H128C110.3 288 96 273.7 96 256s14.31-32 32-32h178.8l-49.38-49.38c-12.5-12.5-12.5-32.75 0-45.25s32.75-12.5 45.25 0l103.1 103.1C414.6 241.3 416 251.1 416 256C416 260.9 414.6 270.7 406.6 278.6z\"><\/path><\/svg><\/span><span class=\"uagb-icon-list__label\">List item<\/span><\/div>\n<\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>I fenomeni cui assistiamo, e che vogliamo studiare per approfondirne la comprensione, raramente si presentano in maniera cos\u00ec semplice da potersi definire attraverso due sole variabili, di cui una predittiva (indipendente) e una responso (dipendente). Per questo, se pure l&#8217;analisi di regressione lineare presenta una fondamentale importanza teorica, nella pratica fornisce poca informazione in pi\u00f9 &hellip; <a href=\"https:\/\/www.gironi.it\/blog\/regressione-multipla-spiegata-semplice\/\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;L&#8217;analisi di regressione multipla, spiegata semplice.&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[629],"tags":[689],"class_list":["post-2225","post","type-post","status-publish","format-standard","hentry","category-statistica-it","tag-regressione-multipla-it"],"lang":"it","translations":{"it":2225,"en":3311},"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"paolo","author_link":"https:\/\/www.gironi.it\/blog\/author\/paolo\/"},"uagb_comment_info":363,"uagb_excerpt":"I fenomeni cui assistiamo, e che vogliamo studiare per approfondirne la comprensione, raramente si presentano in maniera cos\u00ec semplice da potersi definire attraverso due sole variabili, di cui una predittiva (indipendente) e una responso (dipendente). Per questo, se pure l&#8217;analisi di regressione lineare presenta una fondamentale importanza teorica, nella pratica fornisce poca informazione in pi\u00f9&hellip;","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2225","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=2225"}],"version-history":[{"count":5,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2225\/revisions"}],"predecessor-version":[{"id":2916,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2225\/revisions\/2916"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=2225"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/categories?post=2225"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/tags?post=2225"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}