  {"id":633,"date":"2018-05-15T06:53:46","date_gmt":"2018-05-15T05:53:46","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/?p=633"},"modified":"2024-09-20T14:03:12","modified_gmt":"2024-09-20T13:03:12","slug":"indice-di-gini-come-calcolarlo","status":"publish","type":"post","link":"https:\/\/www.gironi.it\/blog\/indice-di-gini-come-calcolarlo\/","title":{"rendered":"L&#8217;indice di Gini: cos&#8217;\u00e8, perch\u00e8 \u00e8 importante, come calcolarlo in R"},"content":{"rendered":"\n<p>Il coefficiente di Gini \u00e8 un i<strong>ndice del grado di diseguaglianza di una distribuzione<\/strong>, ed \u00e8 comunemente utilizzato per <strong>misurare la distribuzione del reddito<\/strong>.<\/p>\n\n\n\n<p>Bastano queste poche parole per intuire l&#8217;importanza straordinaria di questo indice per gli studi economici-politici e perch\u00e8 \u00e8 importante conoscerlo un po&#8217; pi\u00f9 da vicino.<\/p>\n\n\n\n<!--more-->\n\n\n\t\t\t\t<div class=\"wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-ff400676 wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-undefined uagb-block-89dfe8fd     \"\n\t\t\t\t\tdata-scroll= \"1\"\n\t\t\t\t\tdata-offset= \"30\"\n\t\t\t\t\tstyle=\"\"\n\t\t\t\t>\n\t\t\t\t<div class=\"uagb-toc__wrap\">\n\t\t\t\t\t\t<div class=\"uagb-toc__title\">\n\t\t\t\t\t\t\tDi cosa parleremo<br><br>\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<div class=\"uagb-toc__list-wrap \">\n\t\t\t\t\t\t<ol class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#la-curva-di-lorenz\" class=\"uagb-toc-link__trigger\">La curva di Lorenz<\/a><li class=\"uagb-toc__list\"><a href=\"#ma-spiegarsi-con-un-esempio-chiaro\" class=\"uagb-toc-link__trigger\">Ma spiegarsi con un esempio chiaro?<\/a><li class=\"uagb-toc__list\"><a href=\"#la-definizione-dellindice-di-concentrazione-r\" class=\"uagb-toc-link__trigger\">La definizione dell&#039;indice di concentrazione R<\/a><li class=\"uagb-toc__list\"><a href=\"#calcoliamo-il-valore-di-r-in-r\" class=\"uagb-toc-link__trigger\">Calcoliamo il valore di R&#8230; in R!<\/a><li class=\"uagb-toc__list\"><a href=\"#e-se-non-uso-r\" class=\"uagb-toc-link__trigger\">E se non uso R?<\/a><li class=\"uagb-toc__list\"><a href=\"#uno-sguardo-al-valore-dellindice-di-gini-nel-mondo-in-europa-e-in-italia\" class=\"uagb-toc-link__trigger\">Uno sguardo al valore dell&#039;indice di Gini nel mondo, in Europa e in Italia.<\/a><\/ol>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\n\n\n<div style=\"height:36px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<div style=\"border: 1px solid silver; padding: 8px; background-color: #f8f8f8; font-size: small;\">Prima di tutto una nota:<br><strong>Il reddito \u00e8 una variabile trasferibile<\/strong>.<br>Una variabile quantitativa si dice trasferibile quando l&#8217;aumentare complessivo del fenomeno registrato su una popolazione prefissata pu\u00f2 essere distribuito tra le unit\u00e0 statistiche senza cambiarne l&#8217;ammontare complessivo.<\/div><br>\n\n\n\n<p>L&#8217;indice \u00e8 uno dei pi\u00f9 grandi risultati ottenuti da <a rel=\"noopener noreferrer\" class=\"rank-math-link\" href=\"https:\/\/it.wikipedia.org\/wiki\/Corrado_Gini\" target=\"_blank\">Corrado Gini<\/a>, uno dei massimi statistici italiani (purtroppo personalmente legato al regime fascista. Fu l&#8217;ispiratore del famoso discorso &#8220;<em>dell&#8217;Ascensione<\/em>&#8221; di Mussolini del 1927 sulle questioni della natalit\u00e0 e dell&#8217;<a rel=\"noopener noreferrer\" href=\"https:\/\/it.wikipedia.org\/wiki\/Eugenetica\" target=\"_blank\">eugenetica<\/a>).<\/p>\n\n\n<div class=\"wp-block-image is-style-rounded\">\n<figure class=\"aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"249\" height=\"326\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2020\/11\/Corrado_Gini-1.jpg\" alt=\"Corrado Gini - indice di Gini\" class=\"wp-image-1925\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2020\/11\/Corrado_Gini-1.jpg 249w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2020\/11\/Corrado_Gini-1-229x300.jpg 229w\" sizes=\"auto, (max-width: 249px) 85vw, 249px\" \/><\/figure>\n<\/div>\n\n\n<p>E&#8217; nel 1912 che Gini pubblica l&#8217;articolo &#8220;<em><strong>Variabilit\u00e0 e mutabilit\u00e0<\/strong><\/em>&#8220;, nel quale amplia il lavoro di <a href=\"https:\/\/it.wikipedia.org\/wiki\/Max_O._Lorenz\" target=\"_blank\" aria-label=\"Max Otto Lorenz (opens in a new tab)\" rel=\"noreferrer noopener nofollow\" class=\"rank-math-link\">Max Otto Lorenz<\/a>, che gi\u00e0 nel 1905 aveva introdotto le famose curve (oggi &#8220;curve di Lorenz&#8221;) che descrivono le percentuali della ricchezza possedute da percentuali crescenti della popolazione.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">La curva di Lorenz<\/h2>\n\n\n\n<p>Lorenz aveva introdotto una rappresentazione grafica molto efficace, ponendo in ascissa i punti P<sub>i<\/sub> (vale a dire la frazione cumulata dei primi i redditieri P<sub>i<\/sub> = i \/ n) e in ordinata i valori corrispondenti Q<sub>i<\/sub> (la frazione cumulata del reddito posseduto dai primi i redditieri). Unendo tali punti si ottiene la <strong>spezzata di concentrazione<\/strong>, nota come <a href=\"https:\/\/it.wikipedia.org\/wiki\/Indice_di_concentrazione#Curva_di_Lorenz\" target=\"_blank\" rel=\"noopener noreferrer\"><strong>curva di Lorenz<\/strong><\/a>.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter\"><img loading=\"lazy\" decoding=\"async\" width=\"609\" height=\"346\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/Lorenz-curve1.png\" alt=\"Curva di Lorenz\" class=\"wp-image-693\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/Lorenz-curve1.png 609w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/Lorenz-curve1-300x170.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><\/figure>\n<\/div>\n\n\n<p>La differenza tra P<sub>i<\/sub> e Q<sub>i<\/sub> misura in proporzione la quota del reddito complessivo che manca ai primi i individui per trovarsi in una posizione di equidistribuzione.<br>Maggiore \u00e8 tale differenza, pi\u00f9 i rimanenti n-i individui concentrano su di loro una porzione rilevante dell&#8217;ammontare complessivo.<\/p>\n\n\n\n<p>La misura della diseguaglianza dei redditi \u00e8 la media aritmetica delle differenze normalizzate (vale a dire delle quantit\u00e0 P<sub>i<\/sub> &#8211; Q<sub>i&nbsp;<\/sub>\/ P<sub>i<\/sub>, i=1,2,3&#8230;n-1)<\/p>\n\n\n\n<p>Gini riesce quindi a elaborare nel suo lavoro del 1912 e poi nel 1914 il &#8220;suo&#8221; coefficiente, che <strong>misura la percentuale dell\u2019area compresa tra la curva data e quella a 45 gradi, rispetto all\u2019area compresa tra quest\u2019ultima e la curva piatta<\/strong>.<\/p>\n\n\n\n<p>In pratica, indica quanto la corrispondente curva di Lorenz si discosta dalla completa uguaglianza nella distribuzione della ricchezza.<\/p>\n\n\n\n<p>In una frase: il rapporto tra la misura dell&#8217;area della concentrazione ed il suo massimo (che \u00e8 0.5) coincide esattamente con R.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ma spiegarsi con un esempio chiaro?<\/h2>\n\n\n\n<p>Ci provo: costruiamo la curva di Lorenz: l&#8217;asse verticale indica le percentuali di reddito delle famiglie, sull&#8217;asse orizzontale mettiamo invece le percentuali di famiglie.<br>Se il 30% delle famiglie percepisse il 30% del reddito, il 40% delle famiglie il 40% del reddito e cos\u00ec via avremmo una distribuzione perfettamente uguale. Vale a dire una retta a 45 gradi.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"644\" height=\"372\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/gini-lorenz.png\" alt=\"Grafico della curva di Lorentz e indice di Gini\" class=\"wp-image-688\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/gini-lorenz.png 644w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/05\/gini-lorenz-300x173.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><\/figure>\n\n\n\n<p>La curva di Lorenz invece rappresenta la distribuzione effettiva del reddito: lo scarto della curva di Lorenz dalla curva di perfetta eguaglianza (cio\u00e8 dalla retta a 45 gradi), costituisce la misura della diseguaglianza nella distribuzione del reddito.<\/p>\n\n\n\n<p>Il rapporto tra l&#8217;area compresa tra la curva di perfetta eguaglianza e la curva di Lorenz (vale a dire l&#8217;area celestina della figura) e l&#8217;area del triangolo 0AB \u00e8 il coefficiente di Gini.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">La definizione dell&#8217;indice di concentrazione R<\/h2>\n\n\n\n<p>R pu\u00f2 essere definito indipendentemente dalla curva di Lorenz: coincide con la differenza semplice media <strong>normalizzata<\/strong> rispetto al suo massimo, cio\u00e8:<\/p>\n\n\n\\( R = \\frac {differenza \\ media \\ assoluta}{2 \\times media \\ valori}\\\\ \\)\n\n\n\n<p>R \u00e8 dunque un indice espresso da un numero compreso tra i valori teorici 0 e 1, teorici poich\u00e8 corrispondono rispettivamente al caso di una perfetta equit\u00e0 nella distribuzione della ricchezza (tutti possiedono lo stesso reddito) e al caso di massima diseguaglianza (una sola unit\u00e0 possiede la totalit\u00e0 del reddito). E&#8217; un valore &#8220;puro&#8221; che consente un raffronto tra differenti paesi o aree territoriali, rivelandosi di <strong>straordinaria utilit\u00e0 nel campo delle analisi socio-economiche<\/strong>.<\/p>\n\n\n\n<p><iframe loading=\"lazy\" style=\"border: none;\" src=\"https:\/\/rcm-eu.amazon-adsystem.com\/e\/cm?o=29&amp;p=13&amp;l=ur1&amp;category=kindle_unlimited&amp;banner=16JCN7YPD5D9BYDRYW82&amp;f=ifr&amp;linkID=77780c4c5a4ce124c905524f44ad433f&amp;t=consulenzeinf-21&amp;tracking_id=consulenzeinf-21\" width=\"468\" height=\"60\" frameborder=\"0\" marginwidth=\"0\" scrolling=\"no\"><\/iframe><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Calcoliamo il valore di R&#8230; in R!<\/h2>\n\n\n\n<p>Innumerevoli librerie R contengono la funzione per calcolare l&#8217;indice di Gini (il pacchetto pi\u00f9 usato \u00e8 probabilmente &#8220;<em>ineq<\/em>&#8221; facilmente reperibile con una ricerca in CRAN), che non \u00e8 presente nelle funzioni base di R.<\/p>\n\n\n\n<p>Dal momento, tuttavia, che il calcolo dello stesso non \u00e8 particolarmente complesso, ritengo utile presentare di seguito una versione della funzione.<\/p>\n\n\n\n<p><strong>1 &#8211; Partiamo dal calcolo della differenza media assoluta<\/strong><\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">Delta &lt;- function (variabile) {\nn=length(variabile)\nmedia=mean(variabile)\nvariabile_ordinata=sort(variabile)\n(4 * sum((1:n)*variabile_ordinata)\/n-2*media*(n+1))\/(n-1)\n}\n<\/pre>\n\n\n\n<p><strong>2 &#8211; Ora ricavare il rapporto di concentrazione di Gini \u00e8 questione di una riga!<\/strong><\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">gini=Delta(variabile)\/(2*mean(variabile))\n<\/pre>\n\n\n\n<h2 class=\"wp-block-heading\">E se non uso R?<\/h2>\n\n\n\n<p>Ok, capisco l&#8217;obiezione. R \u00e8 uno strumento fantastico, ma non tutti lo usano. Un indice importante come quello di Gini pu\u00f2 servire a moltissime persone che non hanno a che fare ogni giorno con la statistica e non hanno dimestichezza con R. Il linguaggio di programmazione pi\u00f9 universale e diffuso anche tra i non informatici \u00e8 python. Ovviamente, come per R, esistono tante possibili implementazioni del coefficiente di Gini, ma anche in questo caso fare da soli \u00e8 semplice e istruttivo.<\/p>\n\n\n\n<p>La soluzione che pi\u00f9 mi \u00e8 piaciuta l&#8217;ho trovata in un post: <a href=\"https:\/\/planspace.org\/2013\/06\/21\/how-to-calculate-gini-coefficient-from-raw-data-in-python\/\" target=\"_blank\" rel=\"noopener noreferrer\">eccolo<\/a>, ed ecco la funzione, 8 righe in tutto:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">def gini(list_of_values):\n    sorted_list = sorted(list_of_values)\n    height, area = 0, 0\n    for value in sorted_list:\n        height += value\n        area += height - value \/ 2.\n    fair_area = height * len(list_of_values) \/ 2.\n    return (fair_area - area) \/ fair_area\n<\/pre>\n\n\n\n<p>Innanzitutto, la funzione ordina la lista di valori in ordine crescente. <br>Quindi, la funzione utilizza un ciclo for per calcolare l&#8217;altezza e l&#8217;area della curva di Lorenz. <\/p>\n\n\n\n<p>L&#8217;altezza viene calcolata come la somma cumulativa dei valori nella lista, mentre l&#8217;area viene calcolata come l&#8217;area del trapezio tra il valore corrente e il valore precedente nella lista. L&#8217;area totale della curva di Lorenz viene quindi calcolata come la met\u00e0 dell&#8217;altezza totale della curva moltiplicata per la lunghezza della lista. <\/p>\n\n\n\n<p>Infine, l&#8217;indice di Gini viene calcolato come la differenza tra la &#8220;fair area&#8221; (la met\u00e0 dell&#8217;area totale della curva di Lorenz se non ci fosse disuguaglianza) e l&#8217;area effettiva della curva di Lorenz, diviso per la fair area.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Uno sguardo al valore dell&#8217;indice di Gini nel mondo, in Europa e in Italia.<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Per uno sguardo generale si pu\u00f2 <a href=\"http:\/\/www.oecd.org\/social\/income-distribution-database.htm\" target=\"_blank\" rel=\"noopener noreferrer\">visitare il sito<\/a> della<br>Organisation for Economic Co-operation and Development (OECD)<\/li>\n\n\n\n<li>Un confronto tra i valori degli stati europei ce lo fornisce&nbsp;<a href=\"http:\/\/appsso.eurostat.ec.europa.eu\/nui\/show.do?dataset=ilc_di12\" target=\"_blank\" rel=\"noopener noreferrer\">Eurostat<\/a>.<\/li>\n\n\n\n<li>Sul <a href=\"http:\/\/dati.istat.it\/Index.aspx?QueryId=4836\" target=\"_blank\" rel=\"noopener noreferrer\">sito dell&#8217;Istat<\/a> \u00e8 possibile confrontare i dati dell&#8217;indice di Gini relativi alle varie regioni italiane.<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Il coefficiente di Gini \u00e8 un indice del grado di diseguaglianza di una distribuzione, ed \u00e8 comunemente utilizzato per misurare la distribuzione del reddito. Bastano queste poche parole per intuire l&#8217;importanza straordinaria di questo indice per gli studi economici-politici e perch\u00e8 \u00e8 importante conoscerlo un po&#8217; pi\u00f9 da vicino.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[629],"tags":[837],"class_list":["post-633","post","type-post","status-publish","format-standard","hentry","category-statistica-it","tag-statistica-it"],"lang":"it","translations":{"it":633,"en":3483},"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"paolo","author_link":"https:\/\/www.gironi.it\/blog\/author\/paolo\/"},"uagb_comment_info":5,"uagb_excerpt":"Il coefficiente di Gini \u00e8 un indice del grado di diseguaglianza di una distribuzione, ed \u00e8 comunemente utilizzato per misurare la distribuzione del reddito. Bastano queste poche parole per intuire l&#8217;importanza straordinaria di questo indice per gli studi economici-politici e perch\u00e8 \u00e8 importante conoscerlo un po&#8217; pi\u00f9 da vicino.","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/633","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=633"}],"version-history":[{"count":1,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/633\/revisions"}],"predecessor-version":[{"id":2975,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/633\/revisions\/2975"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=633"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/categories?post=633"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/tags?post=633"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}