  {"id":2404,"date":"2021-10-17T17:35:46","date_gmt":"2021-10-17T16:35:46","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/?p=2404"},"modified":"2024-09-20T13:56:41","modified_gmt":"2024-09-20T12:56:41","slug":"multicollinearita-eteroschedasticita-autocorrelazione","status":"publish","type":"post","link":"https:\/\/www.gironi.it\/blog\/multicollinearita-eteroschedasticita-autocorrelazione\/","title":{"rendered":"Multicollinearit\u00e0, eteroschedasticit\u00e0, autocorrelazione: tre concetti dai nomi difficili (spiegati semplici)"},"content":{"rendered":"\n<p>Nel corso dei vari post, e in particolar in quelli riferiti all&#8217;<a href=\"https:\/\/www.gironi.it\/blog\/lanalisi-di-regressione-multipla-spiegata-semplice\/\" target=\"_blank\" data-type=\"post\" data-id=\"2225\" rel=\"noreferrer noopener\">analisi di regressione<\/a>, all&#8217;<a href=\"https:\/\/www.gironi.it\/blog\/lanalisi-della-varianza-anova-spiegata-semplice\/\" target=\"_blank\" data-type=\"post\" data-id=\"2342\" rel=\"noreferrer noopener\">analisi della varianza<\/a> e alle <a href=\"https:\/\/www.gironi.it\/blog\/analisi-delle-serie-storiche0-e-previsioni-di-serie-temporali-in-r-con-il-metodo-holt-winters\/\" target=\"_blank\" data-type=\"post\" data-id=\"1496\" rel=\"noreferrer noopener\">serie temporali<\/a>, abbiamo incontrato dei termini che sembrano fatti appositamente per spaventare il lettore. <br>Lo scopo di questi miei articoli \u00e8 proprio quello di spiegare con semplicit\u00e0 i concetti chiave, al di l\u00e0 dell&#8217;apparente complessit\u00e0 (\u00e8 ci\u00f2 che avrei tanto voluto quando ero studente, anzich\u00e8 confrontarmi con testi dalla forma volutamente &#8211; e inutilmente &#8211; involuta) . <br>E&#8217; giunto dunque il momento di spendere qualche parola per tre importantissimi concetti che ricorrono assai spesso nelle analisi statistiche, e che dunque devono essere ben compresi. La realt\u00e0 \u00e8 molto, molto pi\u00f9 chiara rispetto all&#8217;apparente complessit\u00e0, dunque&#8230; nessuna paura!<\/p>\n\n\n\n<!--more-->\n\n\n\t\t\t\t<div class=\"wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-d89388c6      \"\n\t\t\t\t\tdata-scroll= \"1\"\n\t\t\t\t\tdata-offset= \"30\"\n\t\t\t\t\tstyle=\"\"\n\t\t\t\t>\n\t\t\t\t<div class=\"uagb-toc__wrap\">\n\t\t\t\t\t\t<div class=\"uagb-toc__title\">\n\t\t\t\t\t\t\tDi cosa parleremo\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<div class=\"uagb-toc__list-wrap \">\n\t\t\t\t\t\t<ol class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#la-multicollinearit\u00e0\" class=\"uagb-toc-link__trigger\">La multicollinearit\u00e0<\/a><ul class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#come-ridurre-il-problema\" class=\"uagb-toc-link__trigger\">Come ridurre il problema?<\/a><\/li><\/ul><\/li><li class=\"uagb-toc__list\"><a href=\"#eteroschedasticit\u00e0\" class=\"uagb-toc-link__trigger\">Eteroschedasticit\u00e0<\/a><li class=\"uagb-toc__list\"><a href=\"#autocorrelazione\" class=\"uagb-toc-link__trigger\">Autocorrelazione<\/a><ul class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#ma-come-faccio-a-verificare-la-presenza-di-autocorrelazione\" class=\"uagb-toc-link__trigger\">Ma come faccio a verificare la presenza di autocorrelazione?<\/a><\/ul><\/ul><\/ol>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\n\n\n<h2 class=\"wp-block-heading\">La multicollinearit\u00e0<\/h2>\n\n\n\n<p>Se mi avete seguito nel corso dei vari post, ricorderete forse che abbiamo citato questo termine approcciando l&#8217;analisi di regressione.<\/p>\n\n\n\n<p class=\"has-light-gray-background-color has-background\">Parliamo di <strong>multicollinearit\u00e0<\/strong> quando <strong>esiste una forte correlazione tra due o pi\u00f9 variabili esplicative del nostro modello di correlazione<\/strong>.<\/p>\n\n\n\n<p>Quello della multicollinearit\u00e0 \u00e8 un problema piuttosto insidioso, perch\u00e8 pu\u00f2 inficiare la validit\u00e0 dell&#8217;analisi di regressione, <strong>pur in presenza di un valore del <a href=\"https:\/\/www.gironi.it\/blog\/regressione-lineare-semplice\/#il-coefficiente-di-determinazione-r2\" target=\"_blank\" rel=\"noreferrer noopener\">coefficiente di determinazione<\/a> R<sup>2<\/sup>  elevato<\/strong>, e quindi apparentemente significativo.<br>Se esiste multicollinearit\u00e0, \u00e8 difficile isolare l&#8217;effetto che le variabili dipendenti hanno sulla variabile indipendente, e i coefficienti che abbiamo stimato con il metodo dei minimi quadrati possono risultare statisticamente non significanti.<\/p>\n\n\n\n<h5 class=\"wp-block-heading\"><strong>Come ridurre il problema?<\/strong><\/h5>\n\n\n\n<p>Abbiamo una serie di possibilit\u00e0:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Usando una maggior quantit\u00e0 di dati. Cio\u00e8 ampliando la dimensione del nostro campione.<\/li>\n\n\n\n<li>Trasformando la relazione funzionale.<\/li>\n\n\n\n<li>Utilizzando informazioni a priori.<\/li>\n\n\n\n<li>Escludendo una delle variabili che mostrano di essere fortemente collineari.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Eteroschedasticit\u00e0<\/h2>\n\n\n\n<p>Beh, questo termine sembra fatto apposta per spaventare. Se volete rafforzare in qualcuno la convinzione (il pregiudizio) circa l&#8217;intrinseca, spaventosa complessit\u00e0 della statistica, questa \u00e8 la parola magica da utilizzare! \ud83d\ude42<br><br>Sorpresa: il concetto, invece, non \u00e8 poi cos\u00ec complicato. <\/p>\n\n\n\n<p class=\"has-light-gray-background-color has-background\"><strong>Eteroschedasticit\u00e0<\/strong> in pratica significa <strong>dispersione ineguale<\/strong>. <br>Si riferisce al caso in cui la <strong>varianza del termine che costituisce l&#8217;errore non sia costante per tutti i valori della variabile indipendente<\/strong>. <\/p>\n\n\n\n<p>Nell&#8217;analisi di regressione l&#8217;eteroschedasticit\u00e0 \u00e8 un problema, perch\u00e9 <strong>la regressione dei minimi quadrati ordinari presuppone che tutti i residui siano tratti da una popolazione che ha una varianza costante (<em>omoschedasticit\u00e0<\/em>)<\/strong>.<br>L&#8217;omoschedasticit\u00e0 \u00e8 dunque il contrario della eteroschedasticit\u00e0&#8230;<\/p>\n\n\n\n<p>Ritorniamo per un attimo all&#8217;argomento della regressione: l&#8217;assunzione di eteroschedasticit\u00e0 presuppone che gli errori nelle previsioni di Y siano circa gli stessi, a tutti i livelli di X, in grandezza e dimensione.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Autocorrelazione<\/h2>\n\n\n\n<p>Abbiamo parlato di autocorrelazione nel <a href=\"https:\/\/www.gironi.it\/blog\/analisi-delle-serie-storiche0-e-previsioni-di-serie-temporali-in-r-con-il-metodo-holt-winters\/\" target=\"_blank\" rel=\"noreferrer noopener\">lungo post sull&#8217;analisi delle serie temporali<\/a>, vedendo anche un esempio pratico. <\/p>\n\n\n\n<p>Volendo dare una definizione del caso pi\u00f9 comune, possiamo dire che<\/p>\n\n\n\n<p class=\"has-light-gray-background-color has-background\">si ha autocorrelazione positiva di primo ordine, allorch\u00e8 il termine che rappresenta l&#8217;errore di un periodo \u00e8 correlato positivamente con lo stesso termine del periodo immediatamente precedente.<\/p>\n\n\n\n<p>Nelle serie temporali \u00e8 uno scenario abbastanza comune e d\u00e0 luogo a errori tipici di distorsione, con conseguenti risultati di test statistici e intervalli di confidenza scorretti.<\/p>\n\n\n\n<p>L&#8217;autocorrelazione, che \u00e8 detta anche in alcuni testi <strong>correlazione seriale<\/strong>, pu\u00f2 anche essere di ordine pi\u00f9 elevato (\u00e8 di secondo grado se l&#8217;errore di un periodo \u00e8 correlato con lo stesso termine di due periodi precedenti, ecc.), ed essere anche negativa.<\/p>\n\n\n\n<h5 class=\"wp-block-heading\">Ma come faccio a verificare la presenza di autocorrelazione?<\/h5>\n\n\n\n<p>Nel mio post sull&#8217;analisi delle serie temporali abbiamo sfruttato la preziosa funzione acf() di R, e parlato del <a href=\"https:\/\/en.wikipedia.org\/wiki\/Ljung%E2%80%93Box_test\" target=\"_blank\" rel=\"noreferrer noopener\">test di Ljung-Box<\/a>. <br>Un modo &#8220;classico&#8221; di operare, prevede la verifica della presenza di autocorrelazione usando la <a href=\"https:\/\/it.wikipedia.org\/wiki\/Statistica_di_Durbin-Watson\" target=\"_blank\" rel=\"noreferrer noopener\">statistica di Durbin-Watson<\/a>, computando il valore <em>d<\/em> e confrontandolo ai valori dell&#8217;apposita tabella al livello di significativit\u00e0 voluto, in genere del 5% o dell&#8217;1%.<\/p>\n\n\n\n<p>In presenza di autocorrelazione le <strong>stime<\/strong> ottenute con il metodo dei minimi quadrati ordinari sono ancora consistenti e non risultano affette da errore sistemico, ma gli <strong>errori tipici <\/strong>dei parametri stimati della regressione sono purtroppo interessati da errori sistemici, potendo dare luogo a test statistici e intervalli di confidenza inesatti.<\/p>\n\n\n\n<p>Un metodo per correggere l&#8217;autocorrelazione positiva di primo ordine (la pi\u00f9 comune) \u00e8 dato dal metodo a due stati di Durbin, che non tratteremo in questa sede ma che sar\u00e0 probabilmente oggetto di un approfondimento futuro.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nel corso dei vari post, e in particolar in quelli riferiti all&#8217;analisi di regressione, all&#8217;analisi della varianza e alle serie temporali, abbiamo incontrato dei termini che sembrano fatti appositamente per spaventare il lettore. Lo scopo di questi miei articoli \u00e8 proprio quello di spiegare con semplicit\u00e0 i concetti chiave, al di l\u00e0 dell&#8217;apparente complessit\u00e0 (\u00e8 &hellip; <a href=\"https:\/\/www.gironi.it\/blog\/multicollinearita-eteroschedasticita-autocorrelazione\/\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;Multicollinearit\u00e0, eteroschedasticit\u00e0, autocorrelazione: tre concetti dai nomi difficili (spiegati semplici)&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[629],"tags":[667,669,671,673,675,677,679],"class_list":["post-2404","post","type-post","status-publish","format-standard","hentry","category-statistica-it","tag-autocorrelazione-it","tag-errore-it","tag-eteroschedasticita-it","tag-multicollinearita-it","tag-omoschedasticita-it","tag-regressione-it","tag-serie-temporali-it"],"lang":"it","translations":{"it":2404,"en":3299},"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"paolo","author_link":"https:\/\/www.gironi.it\/blog\/author\/paolo\/"},"uagb_comment_info":0,"uagb_excerpt":"Nel corso dei vari post, e in particolar in quelli riferiti all&#8217;analisi di regressione, all&#8217;analisi della varianza e alle serie temporali, abbiamo incontrato dei termini che sembrano fatti appositamente per spaventare il lettore. Lo scopo di questi miei articoli \u00e8 proprio quello di spiegare con semplicit\u00e0 i concetti chiave, al di l\u00e0 dell&#8217;apparente complessit\u00e0 (\u00e8&hellip;","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2404","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=2404"}],"version-history":[{"count":5,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2404\/revisions"}],"predecessor-version":[{"id":2927,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/2404\/revisions\/2927"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=2404"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/categories?post=2404"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/tags?post=2404"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}