  <?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>statistica &#8211; paologironi blog</title>
	<atom:link href="https://www.gironi.it/blog/tag/statistica-it/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.gironi.it/blog</link>
	<description>Appunti sparsi di (retro) informatica, analisi dei dati, statistica, seo, e cose che cambiano</description>
	<lastBuildDate>Fri, 20 Sep 2024 13:03:31 +0000</lastBuildDate>
	<language>it-IT</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	
	<item>
		<title>L&#8217;indice di Gini: cos&#8217;è, perchè è importante, come calcolarlo in R</title>
		<link>https://www.gironi.it/blog/indice-di-gini-come-calcolarlo/</link>
					<comments>https://www.gironi.it/blog/indice-di-gini-come-calcolarlo/#comments</comments>
		
		<dc:creator><![CDATA[paolo]]></dc:creator>
		<pubDate>Tue, 15 May 2018 05:53:46 +0000</pubDate>
				<category><![CDATA[statistica]]></category>
		<guid isPermaLink="false">https://www.gironi.it/blog/?p=633</guid>

					<description><![CDATA[Il coefficiente di Gini è un indice del grado di diseguaglianza di una distribuzione, ed è comunemente utilizzato per misurare la distribuzione del reddito. Bastano queste poche parole per intuire l&#8217;importanza straordinaria di questo indice per gli studi economici-politici e perchè è importante conoscerlo un po&#8217; più da vicino. Prima di tutto una nota:Il reddito &#8230; <a href="https://www.gironi.it/blog/indice-di-gini-come-calcolarlo/" class="more-link">Leggi tutto<span class="screen-reader-text"> "L&#8217;indice di Gini: cos&#8217;è, perchè è importante, come calcolarlo in R"</span></a>]]></description>
										<content:encoded><![CDATA[
<p>Il coefficiente di Gini è un i<strong>ndice del grado di diseguaglianza di una distribuzione</strong>, ed è comunemente utilizzato per <strong>misurare la distribuzione del reddito</strong>.</p>



<p>Bastano queste poche parole per intuire l&#8217;importanza straordinaria di questo indice per gli studi economici-politici e perchè è importante conoscerlo un po&#8217; più da vicino.</p>



<span id="more-633"></span>


				<div class="wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-ff400676 wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-undefined uagb-block-89dfe8fd     "
					data-scroll= "1"
					data-offset= "30"
					style=""
				>
				<div class="uagb-toc__wrap">
						<div class="uagb-toc__title">
							Di cosa parleremo<br><br>						</div>
																						<div class="uagb-toc__list-wrap ">
						<ol class="uagb-toc__list"><li class="uagb-toc__list"><a href="#la-curva-di-lorenz" class="uagb-toc-link__trigger">La curva di Lorenz</a><li class="uagb-toc__list"><a href="#ma-spiegarsi-con-un-esempio-chiaro" class="uagb-toc-link__trigger">Ma spiegarsi con un esempio chiaro?</a><li class="uagb-toc__list"><a href="#la-definizione-dellindice-di-concentrazione-r" class="uagb-toc-link__trigger">La definizione dell&#039;indice di concentrazione R</a><li class="uagb-toc__list"><a href="#calcoliamo-il-valore-di-r-in-r" class="uagb-toc-link__trigger">Calcoliamo il valore di R&#8230; in R!</a><li class="uagb-toc__list"><a href="#e-se-non-uso-r" class="uagb-toc-link__trigger">E se non uso R?</a><li class="uagb-toc__list"><a href="#uno-sguardo-al-valore-dellindice-di-gini-nel-mondo-in-europa-e-in-italia" class="uagb-toc-link__trigger">Uno sguardo al valore dell&#039;indice di Gini nel mondo, in Europa e in Italia.</a></ol>					</div>
									</div>
				</div>
			


<div style="height:36px" aria-hidden="true" class="wp-block-spacer"></div>



<div style="border: 1px solid silver; padding: 8px; background-color: #f8f8f8; font-size: small;">Prima di tutto una nota:<br><strong>Il reddito è una variabile trasferibile</strong>.<br>Una variabile quantitativa si dice trasferibile quando l&#8217;aumentare complessivo del fenomeno registrato su una popolazione prefissata può essere distribuito tra le unità statistiche senza cambiarne l&#8217;ammontare complessivo.</div><br>



<p>L&#8217;indice è uno dei più grandi risultati ottenuti da <a rel="noopener noreferrer" class="rank-math-link" href="https://it.wikipedia.org/wiki/Corrado_Gini" target="_blank">Corrado Gini</a>, uno dei massimi statistici italiani (purtroppo personalmente legato al regime fascista. Fu l&#8217;ispiratore del famoso discorso &#8220;<em>dell&#8217;Ascensione</em>&#8221; di Mussolini del 1927 sulle questioni della natalità e dell&#8217;<a rel="noopener noreferrer" href="https://it.wikipedia.org/wiki/Eugenetica" target="_blank">eugenetica</a>).</p>


<div class="wp-block-image is-style-rounded">
<figure class="aligncenter size-large"><img fetchpriority="high" decoding="async" width="249" height="326" src="https://www.gironi.it/blog/wp-content/uploads/2020/11/Corrado_Gini-1.jpg" alt="Corrado Gini - indice di Gini" class="wp-image-1925" srcset="https://www.gironi.it/blog/wp-content/uploads/2020/11/Corrado_Gini-1.jpg 249w, https://www.gironi.it/blog/wp-content/uploads/2020/11/Corrado_Gini-1-229x300.jpg 229w" sizes="(max-width: 249px) 85vw, 249px" /></figure>
</div>


<p>E&#8217; nel 1912 che Gini pubblica l&#8217;articolo &#8220;<em><strong>Variabilità e mutabilità</strong></em>&#8220;, nel quale amplia il lavoro di <a href="https://it.wikipedia.org/wiki/Max_O._Lorenz" target="_blank" aria-label="Max Otto Lorenz (opens in a new tab)" rel="noreferrer noopener nofollow" class="rank-math-link">Max Otto Lorenz</a>, che già nel 1905 aveva introdotto le famose curve (oggi &#8220;curve di Lorenz&#8221;) che descrivono le percentuali della ricchezza possedute da percentuali crescenti della popolazione.</p>



<h2 class="wp-block-heading">La curva di Lorenz</h2>



<p>Lorenz aveva introdotto una rappresentazione grafica molto efficace, ponendo in ascissa i punti P<sub>i</sub> (vale a dire la frazione cumulata dei primi i redditieri P<sub>i</sub> = i / n) e in ordinata i valori corrispondenti Q<sub>i</sub> (la frazione cumulata del reddito posseduto dai primi i redditieri). Unendo tali punti si ottiene la <strong>spezzata di concentrazione</strong>, nota come <a href="https://it.wikipedia.org/wiki/Indice_di_concentrazione#Curva_di_Lorenz" target="_blank" rel="noopener noreferrer"><strong>curva di Lorenz</strong></a>.</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="609" height="346" src="https://www.gironi.it/blog/wp-content/uploads/2018/05/Lorenz-curve1.png" alt="Curva di Lorenz" class="wp-image-693" srcset="https://www.gironi.it/blog/wp-content/uploads/2018/05/Lorenz-curve1.png 609w, https://www.gironi.it/blog/wp-content/uploads/2018/05/Lorenz-curve1-300x170.png 300w" sizes="(max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px" /></figure>
</div>


<p>La differenza tra P<sub>i</sub> e Q<sub>i</sub> misura in proporzione la quota del reddito complessivo che manca ai primi i individui per trovarsi in una posizione di equidistribuzione.<br>Maggiore è tale differenza, più i rimanenti n-i individui concentrano su di loro una porzione rilevante dell&#8217;ammontare complessivo.</p>



<p>La misura della diseguaglianza dei redditi è la media aritmetica delle differenze normalizzate (vale a dire delle quantità P<sub>i</sub> &#8211; Q<sub>i&nbsp;</sub>/ P<sub>i</sub>, i=1,2,3&#8230;n-1)</p>



<p>Gini riesce quindi a elaborare nel suo lavoro del 1912 e poi nel 1914 il &#8220;suo&#8221; coefficiente, che <strong>misura la percentuale dell’area compresa tra la curva data e quella a 45 gradi, rispetto all’area compresa tra quest’ultima e la curva piatta</strong>.</p>



<p>In pratica, indica quanto la corrispondente curva di Lorenz si discosta dalla completa uguaglianza nella distribuzione della ricchezza.</p>



<p>In una frase: il rapporto tra la misura dell&#8217;area della concentrazione ed il suo massimo (che è 0.5) coincide esattamente con R.</p>



<h2 class="wp-block-heading">Ma spiegarsi con un esempio chiaro?</h2>



<p>Ci provo: costruiamo la curva di Lorenz: l&#8217;asse verticale indica le percentuali di reddito delle famiglie, sull&#8217;asse orizzontale mettiamo invece le percentuali di famiglie.<br>Se il 30% delle famiglie percepisse il 30% del reddito, il 40% delle famiglie il 40% del reddito e così via avremmo una distribuzione perfettamente uguale. Vale a dire una retta a 45 gradi.</p>



<figure class="wp-block-image"><img decoding="async" width="644" height="372" src="https://www.gironi.it/blog/wp-content/uploads/2018/05/gini-lorenz.png" alt="Grafico della curva di Lorentz e indice di Gini" class="wp-image-688" srcset="https://www.gironi.it/blog/wp-content/uploads/2018/05/gini-lorenz.png 644w, https://www.gironi.it/blog/wp-content/uploads/2018/05/gini-lorenz-300x173.png 300w" sizes="(max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px" /></figure>



<p>La curva di Lorenz invece rappresenta la distribuzione effettiva del reddito: lo scarto della curva di Lorenz dalla curva di perfetta eguaglianza (cioè dalla retta a 45 gradi), costituisce la misura della diseguaglianza nella distribuzione del reddito.</p>



<p>Il rapporto tra l&#8217;area compresa tra la curva di perfetta eguaglianza e la curva di Lorenz (vale a dire l&#8217;area celestina della figura) e l&#8217;area del triangolo 0AB è il coefficiente di Gini.</p>



<h2 class="wp-block-heading">La definizione dell&#8217;indice di concentrazione R</h2>



<p>R può essere definito indipendentemente dalla curva di Lorenz: coincide con la differenza semplice media <strong>normalizzata</strong> rispetto al suo massimo, cioè:</p>


\( R = \frac {differenza \ media \ assoluta}{2 \times media \ valori}\\ \)



<p>R è dunque un indice espresso da un numero compreso tra i valori teorici 0 e 1, teorici poichè corrispondono rispettivamente al caso di una perfetta equità nella distribuzione della ricchezza (tutti possiedono lo stesso reddito) e al caso di massima diseguaglianza (una sola unità possiede la totalità del reddito). E&#8217; un valore &#8220;puro&#8221; che consente un raffronto tra differenti paesi o aree territoriali, rivelandosi di <strong>straordinaria utilità nel campo delle analisi socio-economiche</strong>.</p>



<p><iframe loading="lazy" style="border: none;" src="https://rcm-eu.amazon-adsystem.com/e/cm?o=29&amp;p=13&amp;l=ur1&amp;category=kindle_unlimited&amp;banner=16JCN7YPD5D9BYDRYW82&amp;f=ifr&amp;linkID=77780c4c5a4ce124c905524f44ad433f&amp;t=consulenzeinf-21&amp;tracking_id=consulenzeinf-21" width="468" height="60" frameborder="0" marginwidth="0" scrolling="no"></iframe></p>



<h2 class="wp-block-heading">Calcoliamo il valore di R&#8230; in R!</h2>



<p>Innumerevoli librerie R contengono la funzione per calcolare l&#8217;indice di Gini (il pacchetto più usato è probabilmente &#8220;<em>ineq</em>&#8221; facilmente reperibile con una ricerca in CRAN), che non è presente nelle funzioni base di R.</p>



<p>Dal momento, tuttavia, che il calcolo dello stesso non è particolarmente complesso, ritengo utile presentare di seguito una versione della funzione.</p>



<p><strong>1 &#8211; Partiamo dal calcolo della differenza media assoluta</strong></p>



<pre class="wp-block-preformatted">Delta &lt;- function (variabile) {
n=length(variabile)
media=mean(variabile)
variabile_ordinata=sort(variabile)
(4 * sum((1:n)*variabile_ordinata)/n-2*media*(n+1))/(n-1)
}
</pre>



<p><strong>2 &#8211; Ora ricavare il rapporto di concentrazione di Gini è questione di una riga!</strong></p>



<pre class="wp-block-preformatted">gini=Delta(variabile)/(2*mean(variabile))
</pre>



<h2 class="wp-block-heading">E se non uso R?</h2>



<p>Ok, capisco l&#8217;obiezione. R è uno strumento fantastico, ma non tutti lo usano. Un indice importante come quello di Gini può servire a moltissime persone che non hanno a che fare ogni giorno con la statistica e non hanno dimestichezza con R. Il linguaggio di programmazione più universale e diffuso anche tra i non informatici è python. Ovviamente, come per R, esistono tante possibili implementazioni del coefficiente di Gini, ma anche in questo caso fare da soli è semplice e istruttivo.</p>



<p>La soluzione che più mi è piaciuta l&#8217;ho trovata in un post: <a href="https://planspace.org/2013/06/21/how-to-calculate-gini-coefficient-from-raw-data-in-python/" target="_blank" rel="noopener noreferrer">eccolo</a>, ed ecco la funzione, 8 righe in tutto:</p>



<pre class="wp-block-preformatted">def gini(list_of_values):
    sorted_list = sorted(list_of_values)
    height, area = 0, 0
    for value in sorted_list:
        height += value
        area += height - value / 2.
    fair_area = height * len(list_of_values) / 2.
    return (fair_area - area) / fair_area
</pre>



<p>Innanzitutto, la funzione ordina la lista di valori in ordine crescente. <br>Quindi, la funzione utilizza un ciclo for per calcolare l&#8217;altezza e l&#8217;area della curva di Lorenz. </p>



<p>L&#8217;altezza viene calcolata come la somma cumulativa dei valori nella lista, mentre l&#8217;area viene calcolata come l&#8217;area del trapezio tra il valore corrente e il valore precedente nella lista. L&#8217;area totale della curva di Lorenz viene quindi calcolata come la metà dell&#8217;altezza totale della curva moltiplicata per la lunghezza della lista. </p>



<p>Infine, l&#8217;indice di Gini viene calcolato come la differenza tra la &#8220;fair area&#8221; (la metà dell&#8217;area totale della curva di Lorenz se non ci fosse disuguaglianza) e l&#8217;area effettiva della curva di Lorenz, diviso per la fair area.</p>



<h2 class="wp-block-heading">Uno sguardo al valore dell&#8217;indice di Gini nel mondo, in Europa e in Italia.</h2>



<ul class="wp-block-list">
<li>Per uno sguardo generale si può <a href="http://www.oecd.org/social/income-distribution-database.htm" target="_blank" rel="noopener noreferrer">visitare il sito</a> della<br>Organisation for Economic Co-operation and Development (OECD)</li>



<li>Un confronto tra i valori degli stati europei ce lo fornisce&nbsp;<a href="http://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=ilc_di12" target="_blank" rel="noopener noreferrer">Eurostat</a>.</li>



<li>Sul <a href="http://dati.istat.it/Index.aspx?QueryId=4836" target="_blank" rel="noopener noreferrer">sito dell&#8217;Istat</a> è possibile confrontare i dati dell&#8217;indice di Gini relativi alle varie regioni italiane.</li>
</ul>
]]></content:encoded>
					
					<wfw:commentRss>https://www.gironi.it/blog/indice-di-gini-come-calcolarlo/feed/</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>Il tacchino di Russell</title>
		<link>https://www.gironi.it/blog/il-tacchino-di-russell/</link>
					<comments>https://www.gironi.it/blog/il-tacchino-di-russell/#respond</comments>
		
		<dc:creator><![CDATA[paolo]]></dc:creator>
		<pubDate>Mon, 06 Nov 2017 10:00:48 +0000</pubDate>
				<category><![CDATA[pensieri]]></category>
		<category><![CDATA[fallacia]]></category>
		<category><![CDATA[Hume]]></category>
		<category><![CDATA[induzione]]></category>
		<category><![CDATA[logica]]></category>
		<category><![CDATA[Russell]]></category>
		<category><![CDATA[statistica]]></category>
		<guid isPermaLink="false">https://www.gironi.it/blog/?p=549</guid>

					<description><![CDATA[L&#8217;approccio contemporaneo all&#8217;informazione mi ha fatto tornare in mente la storia del tacchino induttivista di Bertrand Russell, sempre attuale, ora più che mai. Ricordo di averlo trovato qualche anno fa in un libro di Taleb. La storia suona così. Un tacchino decide di formarsi una visione del mondo basata sul metodo scientifico. Fin dal primo &#8230; <a href="https://www.gironi.it/blog/il-tacchino-di-russell/" class="more-link">Leggi tutto<span class="screen-reader-text"> "Il tacchino di Russell"</span></a>]]></description>
										<content:encoded><![CDATA[<p>L&#8217;approccio contemporaneo all&#8217;informazione mi ha fatto tornare in mente la storia del tacchino induttivista di Bertrand Russell, sempre attuale, ora più che mai. <span id="more-549"></span>Ricordo di averlo trovato qualche anno fa in un libro di Taleb.</p>
<p>La storia suona così.<br />
Un tacchino decide di formarsi una visione del mondo basata sul metodo scientifico. Fin dal primo giorno questo tacchino osservò che gli veniva dato il cibo alle 9 del mattino. E da buon induttivista eseguì altre osservazioni in un<span class="text_exposed_show">a vasta gamma di circostanze: di mercoledì e di giovedì, nei giorni caldi e nei giorni freddi, sia che piovesse sia che splendesse il sole. Così arricchiva ogni giorno il suo elenco di una proposizione osservativa in condizioni più disparate. Finché elaborò un&#8217;inferenza precisa: &#8220;Mi danno sempre il cibo e sempre alle 9 del mattino&#8221;.<br />
Era quindi una regola generale della vita quella di essere sfamati quotidianamente da membri amichevoli della razza umana che, come direbbe un politico, &#8220;pensavano al suo interesse&#8221;.<br />
Alla vigilia del giorno del ringraziamento, accadde una cosa imprevista, che spinse il tacchino a rivedere le sue idee&#8230;</span></p>
<div class="text_exposed_show">
<p>La fiducia del tacchino si è rafforzata con il crescere dei pasti amichevoli, e questo senso di sicurezza ha raggiunto il massimo proprio nel momento in cui il rischio era maggiore.</p>
<p>Questa storia mostra quello che viene chiamato &#8220;problema dell&#8217;inferenza&#8221;, un pallino del buon vecchio Hume.<br />
Sembra una storiella per appassionati di filosofia o statistica, io penso sia molto, molto reale.</p>
</div>
<h4>Per approfondire</h4>
<div style="float: left; padding-right: 22px;"><iframe loading="lazy" style="width: 120px; height: 240px;" src="https://rcm-eu.amazon-adsystem.com/e/cm?ref=qf_sp_asin_til&amp;t=consulenzeinf-21&amp;m=amazon&amp;o=29&amp;p=8&amp;l=as1&amp;IS2=1&amp;asins=884282027X&amp;linkId=e8b75c19f5a8b8bd1d6b8c4adacf79ee&amp;lt1=_blank&amp;fc1=333333&amp;lc1=0066c0&amp;bg1=ffffff&amp;f=ifr" width="300" height="150" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"><br />
</iframe></div>
<div style="float: left;"><iframe loading="lazy" style="width: 120px; height: 240px;" src="https://rcm-eu.amazon-adsystem.com/e/cm?ref=qf_sp_asin_til&amp;t=consulenzeinf-21&amp;m=amazon&amp;o=29&amp;p=8&amp;l=as1&amp;IS2=1&amp;asins=8842050784&amp;linkId=53f0ec5d9fdf12cd3b498b79c20819a7&amp;lt1=_blank&amp;fc1=333333&amp;lc1=0066c0&amp;bg1=ffffff&amp;f=ifr" width="300" height="150" frameborder="0" marginwidth="0" marginheight="0" scrolling="no"><br />
</iframe></div>
<div style="clear: both;"></div>
<div></div>
]]></content:encoded>
					
					<wfw:commentRss>https://www.gironi.it/blog/il-tacchino-di-russell/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
