  {"id":1001,"date":"2018-10-10T15:41:18","date_gmt":"2018-10-10T14:41:18","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/?p=1001"},"modified":"2026-02-25T09:22:43","modified_gmt":"2026-02-25T08:22:43","slug":"statistica-descrittiva-misure-di-posizione","status":"publish","type":"post","link":"https:\/\/www.gironi.it\/blog\/statistica-descrittiva-misure-di-posizione\/","title":{"rendered":"Statistica descrittiva: misure di posizione e tendenza centrale."},"content":{"rendered":"\n<p>Le misure di posizione, o <strong>indici di posizione<\/strong>, o  anche <strong>misure di tendenza centrale<\/strong>, sono valori che sintetizzano la&nbsp;<strong>posizione di<\/strong>&nbsp;una distribuzione&nbsp;<strong>statistica<\/strong>, fornendo un valore che ne riassume gli aspetti ritenuti pi\u00f9 importanti. In questa breve discussione vedremo alcuni degli indici pi\u00f9 comuni e di uso pratico, quali le varie tipologie di media, la mediana, i quartili e i percentili.<\/p>\n\n\n\t\t\t\t<div class=\"wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-b694d2c6      \"\n\t\t\t\t\tdata-scroll= \"1\"\n\t\t\t\t\tdata-offset= \"30\"\n\t\t\t\t\tstyle=\"\"\n\t\t\t\t>\n\t\t\t\t<div class=\"uagb-toc__wrap\">\n\t\t\t\t\t\t<div class=\"uagb-toc__title\">\n\t\t\t\t\t\t\tGli argomenti trattati\t\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t<div class=\"uagb-toc__list-wrap \">\n\t\t\t\t\t\t<ol class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#le-misure-di-tendenza-centrale\" class=\"uagb-toc-link__trigger\">Le misure di tendenza centrale<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-aritmetica\" class=\"uagb-toc-link__trigger\">La media aritmetica<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-di-dati-raggruppati\" class=\"uagb-toc-link__trigger\">La media di dati raggruppati<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-ponderata\" class=\"uagb-toc-link__trigger\">La media ponderata<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-geometrica\" class=\"uagb-toc-link__trigger\">La media geometrica<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-armonica\" class=\"uagb-toc-link__trigger\">La media armonica<\/a><li class=\"uagb-toc__list\"><a href=\"#la-media-troncata\" class=\"uagb-toc-link__trigger\">La media troncata<\/a><li class=\"uagb-toc__list\"><a href=\"#la-mediana\" class=\"uagb-toc-link__trigger\">La mediana<\/a><ul class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#la-mediana-di-dati-raggruppati\" class=\"uagb-toc-link__trigger\">La mediana di dati raggruppati<\/a><\/li><\/ul><\/li><li class=\"uagb-toc__list\"><a href=\"#la-moda\" class=\"uagb-toc-link__trigger\">La moda<\/a><ul class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#moda-di-dati-raggruppati\" class=\"uagb-toc-link__trigger\">Moda di dati raggruppati<\/a><\/li><\/ul><\/li><\/ul><\/li><li class=\"uagb-toc__list\"><a href=\"#relazione-tra-media-mediana-e-moda\" class=\"uagb-toc-link__trigger\">Relazione tra media, mediana e moda<\/a><li class=\"uagb-toc__list\"><a href=\"#quartili-decili-e-percentili\" class=\"uagb-toc-link__trigger\">Quartili, decili e percentili<\/a><ul class=\"uagb-toc__list\"><li class=\"uagb-toc__list\"><a href=\"#quartili-decili-e-percentili-di-dati-raggruppati\" class=\"uagb-toc-link__trigger\">Quartili, decili e percentili di dati raggruppati<\/a><\/li><\/ul><\/li><\/ul><\/li><\/ul><\/li><li class=\"uagb-toc__list\"><a href=\"#uno-sguardo-dinsieme-gli-utilissimi-5-numeri\" class=\"uagb-toc-link__trigger\">Uno sguardo d&#039;insieme: gli utilissimi 5 numeri<\/a><li class=\"uagb-toc__list\"><a href=\"#aiutiamoci-con-un-grafico-furbo-il-box-plot\" class=\"uagb-toc-link__trigger\">Aiutiamoci con un grafico furbo: il box-plot\u00a0<\/a><\/ul><\/ul><\/ul><\/ol>\t\t\t\t\t<\/div>\n\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\n\n\n<!--more-->\n\n\n\n<h4 class=\"wp-block-heading\">Le misure di tendenza centrale<\/h4>\n\n\n\n<p class=\"has-light-gray-background-color has-background\"> Una media \u00e8 una misura della tendenza centrale di un insieme di valori. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediaaritmetica\">La media aritmetica<\/h4>\n\n\n\n<p>La media aritmetica, come tutti sappiamo fin da bambini, \u00e8 la somma dei valori presenti nel gruppo di dati, divisa per il numero dei valori.<br><br>In statistica, un parametro della <strong>popolazione<\/strong> \u00e8 rappresentato da una <strong>lettera greca<\/strong>, mentre una misura descrittiva di un <strong>campione<\/strong> si rappresenta con una <strong>lettera romana<\/strong>.<\/p>\n\n\n\nPer la media, avremo il simbolo \\( \\mu \\) per la media di una popolazione di valori, e useremo invece la lettera \\( \\overline X \\) (si legge &#8220;x segnato&#8221;) per la media di un campione di valori.\n\n\n\n<p>N.B. Per la nostra esposizione, da qui in avanti, faremo sempre riferimento a parametri della popolazione.<\/p>\n\n\n\n<p>Ed allora, ecco la formula per calcolare la media della popolazione:<\/p>\n\n\n\n\\( \n\\mu = \\frac {\\Sigma X}{N} \\\\ \\\\ \n\\)\n<p>\nIn R la funzione \u00e8 <strong>mean()<\/strong>.\nUn semplicissimo esempio:\n<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">variabile = c(-3,1,2,4,5,2,8);\nmean(variabile);\n\n[1] 2.714286<\/pre>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediaragg\">La media di dati raggruppati<\/h4>\n\n\n\n<p>Immaginiamo di avere <em>n<\/em> dati raggruppati in un numero <em>k<\/em> classi. Chiamiamo x<sub>c<\/sub> il valore centrale di ciascuna classe e <em>f<\/em><sub>i<\/sub> la frequenza osservata di ciascuna classe.<\/p>\n\n\n\n<p>La formula per calcolare la media in questo caso \u00e8:<\/p>\n\n\n\n\\( \n\\bar x = \\frac{\\sum^{k}_{i=1} x_c f_i}{N} \\\\ \\\\ \n\\)\n\n\n\n<p>Facciamo un esempio:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>Classe<\/td><td>x<sub>c<\/sub><\/td><td>f<sub>i<\/sub><\/td><td>x<sub>c<\/sub> * f<sub>i<\/sub><\/td><\/tr><tr><td>4&lt;x<strong>\u2264<\/strong>8<\/td><td>6<\/td><td>5<\/td><td>30<\/td><\/tr><tr><td>8&lt;x<strong>\u2264<\/strong>12<\/td><td>10<\/td><td>11<\/td><td>110<\/td><\/tr><tr><td>12&lt;x<strong>\u2264<\/strong>20<\/td><td>16<\/td><td>14<\/td><td>224<\/td><\/tr><tr><td>20&lt;x<strong>\u2264<\/strong>28<\/td><td>24<\/td><td>7<\/td><td>168<\/td><\/tr><tr><td>Tot<\/td><td><\/td><td><strong>37<\/strong><\/td><td><strong>532<\/strong><\/td><\/tr><\/tbody><\/table><figcaption class=\"wp-element-caption\">i nostri dati di esempio<\/figcaption><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>Usiamo la formula e calcoliamo la media:<\/p>\n\n\n\n\\( \n\\bar x = \\frac{(6*5) + (10*11) + (16*14) + (24*7)}{37} \\\\ \\\\ = \\frac{532}{37} = 14.38\n\\)\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<iframe loading=\"lazy\" src=\"https:\/\/rcm-eu.amazon-adsystem.com\/e\/cm?o=29&amp;p=13&amp;l=ur1&amp;category=kindle_unlimited&amp;banner=16JCN7YPD5D9BYDRYW82&amp;f=ifr&amp;linkID=77780c4c5a4ce124c905524f44ad433f&amp;t=consulenzeinf-21&amp;tracking_id=consulenzeinf-21\" width=\"468\" height=\"60\" scrolling=\"no\" border=\"0\" marginwidth=\"0\" style=\"border:none;\" frameborder=\"0\"><\/iframe>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediaponderata\">La media ponderata<\/h4>\n\n\n\n<p>La <strong>media ponderata<\/strong>, o <strong>media pesata<\/strong>, \u00e8 una media aritmetica in cui <strong>ogni valore \u00e8 pesato a seconda della sua importanza<\/strong> nel complesso del gruppo. <br>Ciascun valore del gruppo (X) viene moltiplicato per il fattore di peso appropriato \\( \\omega \\) e i vari prodotti vengono sommati e divisi per la somma dei pesi:<\/p>\n\n\n\n\\(\n\\mu_{w} = \\frac{\\Sigma(w X)}{\\Sigma w}\n\\)\n\n\n\n<div style=\"height:26px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Facciamo un esempio. Immaginiamo il caso di una disciplina sportiva in cui il punteggio dato dalla giuria per ogni esercizio \u00e8 &#8220;pesato&#8221; con un certo coefficiente di difficolt\u00e0. Avremo ad esempio questi punteggi per i vari esercizi:<br> <\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>Voto della giuria<\/td><td>Coefficiente<\/td><\/tr><tr><td>9.3<\/td><td>4<\/td><\/tr><tr><td>9.8<\/td><td>2.8<\/td><\/tr><tr><td>8.8<\/td><td>3.3<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Moltiplichiamo ciascun voto per il relativo coefficiente:<\/p>\n\n\n\n<p>(9.3 * 4) + (9.8 * 2.8) + (8.8 * 3.3) = 93.68<\/p>\n\n\n\n<p>La somma dei coefficienti (cio\u00e8 dei &#8220;pesi&#8221;) \u00e8:<\/p>\n\n\n\n<p>4 + 2.8 + 3.3 = 10.1<\/p>\n\n\n\n<p>E calcolo la media ponderata:<\/p>\n\n\n\n<p>93.68 \/ 10.1 = 9.275<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediageometrica\">La media geometrica<\/h4>\n\n\n\nDato un insieme di numeri positivi x<sub>1<\/sub>,x<sub>2<\/sub>,&#8230;,x<sub>n<\/sub> la media geometrica \u00e8 la <i>radice ennesima<\/i> del prodotto degli <i>n<\/i> numeri. In formula:\n<br><br>\n\n\n\n\\(\n\\\\ \n\\newcommand{\\vc}[3]{\\overset{#2}{\\underset{#3}{#1}}}\nMedia \\ geometrica = \\sqrt[n]{\\vc{\\Pi}{n}{i=i} \\ x_{i}}\n\\)\n<br><br>\n<p>\nn.b.\tLa lettera pi maiuscola greca \u00e8 il simbolo di <strong>produttoria<\/strong>. La formula quindi equivale a questa:\n<\/p>\n\\(\n\\\\ \nMedia \\ geometrica = \\sqrt[n]{x_{1} x_{1} &#8230; x_{n}} \\\\ \\\\\n\\)\n\n\n\n<p>R non ha di base una funzione <em>ad hoc<\/em> per calcolare, la media geometrica, ma il calcolo di questa misura di posizione \u00e8 molto semplice. Facciamo un esempio:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">dato = c(2,9,12) # I miei valori\nn = length(dato) # il numero di valori\n \n# prod calcola prodotto elementi di un vettore\n# Calcolo la media geometrica\nprod(dato)^(1\/n)<\/pre>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediaarmonica\">La media armonica<\/h4>\n\n\n\n<p>La media armonica di un insieme di dati x<sub>1<\/sub>,x<sub>2<\/sub>,&#8230;,x<sub>n<\/sub> \u00e8 il <strong>reciproco della media aritmetica dei reciproci dei dati<\/strong>. In formula:<\/p>\n\n\n\n\\(\nMedia \\ armonica = \\frac{1}{\\frac{1}{n} \\vc{\\Sigma}{n}{i=i} \\frac{1}{x_{i}}} \\\\ \\\\\n\\)\n\n\n\n<p>Anche per la media armonica non abbiamo a disposizione una funzione specifica, ma sappiamo che la media armonica \u00e8 il reciproco della media dei reciproci dei dati, quindi il calcolo \u00e8 banale:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"> 1\/mean(1\/dato)<\/pre>\n\n\n\n<p>Riprendendo il semplicissimo esempio sopra:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">dato = c(2,9,12) # I miei valori\nn = length(dato) # il numero di valori\n\n# Calcolo la media armonica\n1\/mean(1\/dato)\n<\/pre>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediatroncata\">La media troncata<\/h4>\n\n\n\n<p>Una media troncata (ad esempio al 5%) \u00e8 una media aritmetica di tutte le modalit\u00e0 ordinate dopo aver eliminato dalla popolazione il 5% dei valori pi\u00f9 bassi e il 5% dei valori pi\u00f9 alti. Quindi, nell&#8217;esempio che abbiamo scelto, questa media \u00e8 ottenuta calcolando la media aritmetica del 90% della popolazione di posto centrale nella serie ordinata delle osservazioni.<\/p>\n\n\n\n<p>In R, possiamo ottenerla indicando nella funzione <strong>mean()<\/strong> l&#8217;opzione <strong>trim=<em>quotadaescludere<\/em><\/strong>, dove <em>quotadaescludere<\/em> \u00e8 la proporzione, tra 0 e 1, delle modalit\u00e0 pi\u00f9 piccole e pi\u00f9 grandi da escludere prima di calcolare la media aritmetica.<br><br>Un semplice esempio in R per chiarire meglio le idee:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">variabile = c(-3,1,2,4,5,2,5,0.8,2.4,6,8);\nmean(variabile, trim=0.05);  ### media troncata al 5%\n\n[1] 3.018182<\/pre>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<iframe style=\"width:120px;height:240px;\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\" frameborder=\"0\" src=\"https:\/\/rcm-eu.amazon-adsystem.com\/e\/cm?ref=tf_til&amp;t=consulenzeinf-21&amp;m=amazon&amp;o=29&amp;p=8&amp;l=as1&amp;IS1=1&amp;asins=8860081238&amp;linkId=9b331810f953cca3b30a3223038629ca&amp;bc1=000000&amp;lt1=_blank&amp;fc1=333333&amp;lc1=0066c0&amp;bg1=ffffff&amp;f=ifr\">\n    <\/iframe>&nbsp;&nbsp;&nbsp;\n<iframe style=\"width:120px;height:240px;\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\" frameborder=\"0\" src=\"https:\/\/rcm-eu.amazon-adsystem.com\/e\/cm?ref=tf_til&amp;t=consulenzeinf-21&amp;m=amazon&amp;o=29&amp;p=8&amp;l=as1&amp;IS2=1&amp;asins=8834886720&amp;linkId=dd7c1000f06e769b94b89353d8aedd15&amp;bc1=FFFFFF&amp;lt1=_blank&amp;fc1=333333&amp;lc1=0066C0&amp;bg1=FFFFFF&amp;f=ifr\">\n    <\/iframe>&nbsp;&nbsp;&nbsp;\n<iframe style=\"width:120px;height:240px;\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\" frameborder=\"0\" src=\"https:\/\/rcm-eu.amazon-adsystem.com\/e\/cm?ref=tf_til&amp;t=consulenzeinf-21&amp;m=amazon&amp;o=29&amp;p=8&amp;l=as1&amp;IS2=1&amp;asins=8821308154&amp;linkId=3e829fc46795cc8f0a0f34e0c0b396b9&amp;bc1=FFFFFF&amp;lt1=_blank&amp;fc1=333333&amp;lc1=0066C0&amp;bg1=FFFFFF&amp;f=ifr\">\n    <\/iframe>\n\n\n\n<hr class=\"wp-block-separator has-css-opacity\"\/>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"mediana\">La mediana<\/h4>\n\n\n\n<p>La mediana di un gruppo di elementi \u00e8 il valore dell&#8217;elemento centrale quando tutti gli elementi del gruppo sono disposti in ordine ascendente o discendente di valore.<\/p>\n\n\n\n<p>In pratica, <strong>la mediana dei dati \u00e8 il valore che divide la serie in due parti uguali<\/strong>: tanti valori sopra la mediana quanti valori sotto.<br><br>Per trovare la mediana si usa la regola detta <em>pari-dispari:<br><\/em><\/p>\n\n\n\n<div class=\"wp-block-uagb-info-box uagb-block-773258b2 uagb-infobox__content-wrap  uagb-infobox-icon-left-title uagb-infobox-left uagb-infobox-image-valign-middle uagb-infobox__outer-wrap\"><div class=\"uagb-ifb-content\"><div class=\"uagb-ifb-left-title-image\"><div class=\"uagb-ifb-icon-wrap\"><svg xmlns=\"https:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 384 512\"><path d=\"M384 48V512l-192-112L0 512V48C0 21.5 21.5 0 48 0h288C362.5 0 384 21.5 384 48z\"><\/path><\/svg><\/div><div class=\"uagb-ifb-title-wrap\"><h3 class=\"uagb-ifb-title\">Regola pari-dispari<\/h3><\/div><\/div><p class=\"uagb-ifb-desc\"><em><strong>Se in una serie c&#8217;\u00e8 un numero dispari di valori, la mediana \u00e8 il valore intermedio della serie; se c&#8217;\u00e8 un numero pari di valori, la mediana \u00e8 la media artimetica dei due valori intermedi.<\/strong><\/em><\/p><\/div><\/div>\n\n\n\n<p><br>In pratica, la formula per trovare la mediana si pu\u00f2 sintetizzare cos\u00ec:<\/p>\n\n\n\n\\(\nMed = X_{(n\/2)+(1\/2)}\n\\)\n\n\n\n<p><br>La mediana si calcola in R con la funzione <strong>median()<\/strong>:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">var = c(0,1,2,3,6,7,11,14);\nmedian(var);\n\n[1] 4.5<\/pre>\n\n\n\n<h5 class=\"wp-block-heading\">La mediana di dati raggruppati<\/h5>\n\n\n\n<p>Nel caso di dati raggruppati, si deve:<br>1. stabilire <strong>quale classe contenga il valore mediano<\/strong> <br>e poi <br>2. determinare <strong>per interpolazione<\/strong> la posizione della mediana all&#8217;interno di quella classe.&nbsp;<br><br>La classe che contiene la mediana \u00e8 la prima classe la cui frequenza cumulativa uguaglia o supera la met\u00e0 del numero totale di osservazioni. Una volta individuata questa classe, il valore specifico della mediana si determina con la formula:<\/p>\n\n\n\n\\(\nMed = C_{I} + (\\frac{\\frac{N}{2}- fc_{p}}{f_{c}})i\n\\)\n<br><br>\ndove:\n<br><br>\n<b>C<sub>I<\/sub><\/b> = confine inferiore della classe contenente la mediana\n<br>\n<b>N<\/b> = numero totale di osservazioni della distribuzione di frequenza\n<br>\n<b><i>f<\/i>c<sub>p<\/sub><\/b> = frequenza cumulativa della classe che precede quella contenente la mediana\n<br>\n<b><i>f<\/i>c<\/b> = numero di osservazioni della classe contenente la mediana\n<br>\n<b><i>i<\/i><\/b> = ampiezza dell&#8217;intervallo di classe\n<br>\n\n\n\n<div style=\"height:10px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Come sempre, \u00e8 un esempio a mostrare come la realt\u00e0 operativa sia pi\u00f9 semplice di come appaia un primo sguardo. Prendiamo una distribuzione suddivisa in classi di frequenza. Nel nostro esempio parliamo di classi di altezze:<\/p>\n\n\n\n<figure class=\"wp-block-table aligncenter\"><table><tbody><tr><td class=\"has-text-align-center\" data-align=\"center\"><strong>Altezza (cm)<\/strong><\/td><td class=\"has-text-align-center\" data-align=\"center\"><strong>Frequenze<\/strong><\/td><td class=\"has-text-align-center\" data-align=\"center\"><strong>Frequenze cumulate<\/strong><\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\">150 &#8211; 160<\/td><td class=\"has-text-align-center\" data-align=\"center\">4<\/td><td class=\"has-text-align-center\" data-align=\"center\">4<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\">160 &#8211; 170<\/td><td class=\"has-text-align-center\" data-align=\"center\">8<\/td><td class=\"has-text-align-center\" data-align=\"center\">12<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\">170 &#8211; 180<\/td><td class=\"has-text-align-center\" data-align=\"center\">10<\/td><td class=\"has-text-align-center\" data-align=\"center\">22<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\">180 &#8211; 190<\/td><td class=\"has-text-align-center\" data-align=\"center\">8<\/td><td class=\"has-text-align-center\" data-align=\"center\">30<\/td><\/tr><tr><td class=\"has-text-align-center\" data-align=\"center\">190 &#8211; 200<\/td><td class=\"has-text-align-center\" data-align=\"center\">4<\/td><td class=\"has-text-align-center\" data-align=\"center\">34<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p>La classe che contiene la mediana \u00e8 la prima classe la cui frequenza cumulata uguaglia o supera la met\u00e0 del numero totale di osservazioni, che come si evince dalla tabella \u00e8 34\/2 = 17.<\/p>\n\n\n\n<p>La nostra classe mediana, che contiene il valore 17 \u00e8 dunque quella 170 -180.<\/p>\n\n\n\n<p>Possiamo quindi ricavare facilmente tutti i valori da inserire nella nostra formula di interpolazione:<\/p>\n\n\n\n<p><strong>C<sub>I<\/sub><\/strong>&nbsp;= confine inferiore della classe contenente la mediana = 170<br><strong>N<\/strong>&nbsp;= numero totale di osservazioni della distribuzione di frequenza = 34<br><strong><em>f<\/em>c<sub>p<\/sub><\/strong>&nbsp;= frequenza cumulativa della classe che precede quella contenente la mediana = 12<br><strong><em>f<\/em>c<\/strong>&nbsp;= numero di osservazioni della classe contenente la mediana = 10<br><strong><em>i<\/em><\/strong>&nbsp;= ampiezza dell\u2019intervallo di classe = (180 &#8211; 170) = 10<\/p>\n\n\n\n\\(\nMed = C_{I} + (\\frac{\\frac{N}{2}- fc_{p}}{f_{c}})i \\\\\n\\)\n<p>quindi<\/p>\n\\(\nMed = 170 + (\\frac{(34\/2) &#8211; 12}{10}) * 10 = 175 cm\n\\)\n\n\n\n<div style=\"height:10px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Il valore mediano della classe mediana ( 170-180 cm ) \u00e8 pari a 175cm.<\/p>\n\n\n\n<div style=\"height:40px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<div class=\"wp-block-uagb-info-box uagb-block-97a35f5a uagb-infobox__content-wrap  uagb-infobox-icon-left-title uagb-infobox-left uagb-infobox-image-valign-middle uagb-infobox__outer-wrap\"><div class=\"uagb-ifb-content\"><div class=\"uagb-ifb-left-title-image\"><div class=\"uagb-ifb-icon-wrap\"><svg xmlns=\"https:\/\/www.w3.org\/2000\/svg\" viewBox=\"0 0 384 512\"><path d=\"M384 48V512l-192-112L0 512V48C0 21.5 21.5 0 48 0h288C362.5 0 384 21.5 384 48z\"><\/path><\/svg><\/div><div class=\"uagb-ifb-title-wrap\"><h3 class=\"uagb-ifb-title\">La mediana \u00e8 resistente a valori estremi<\/h3><\/div><\/div><p class=\"uagb-ifb-desc\">La mediana \u00e8 un indice di estrema utilit\u00e0 in statistica, per via di una preziosissima caratteristica: \u00e8 infatti <strong>resistente a valori estremi<\/strong>. La media \u00e8 una misura estremamente sensibile ai valori estremi (gli <strong>outliers<\/strong>), mentre la mediana assai meno.&nbsp;<\/p><\/div><\/div>\n\n\n\n<p><br>Per questo, ad esempio, <strong>nel caso di una <a href=\"https:\/\/www.gironi.it\/blog\/statistica-descrittiva-misure-di-dispersione-o-variabilita\/\" data-type=\"post\" data-id=\"1003\">distribuzione asimmetrica<\/a> la mediana \u00e8 un indice maggiormente affidabile della media<\/strong>, che sar\u00e0 sempre &#8220;trascinata&#8221; verso la coda della distribuzione. In una distribuzione asimmetrica, la mediana cadr\u00e0 sempre tra la media e la moda.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\" id=\"moda\">La moda<\/h4>\n\n\n\n<p>La moda di un insieme di dati \u00e8 <strong>il valore che si presenta pi\u00f9 frequentemente<\/strong>.<\/p>\n\n\n\n<p>Ad esempio, consideriamo la frequenza dei voti in un test:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>voto<\/td><td class=\"has-text-align-left\" data-align=\"left\">frequenza<\/td><\/tr><tr><td>5<\/td><td class=\"has-text-align-left\" data-align=\"left\">5<\/td><\/tr><tr><td>6  <em><span class=\"has-inline-color has-bright-red-color\">&lt;&lt; <strong>questa \u00e8 la moda<\/strong><\/span><\/em><\/td><td class=\"has-text-align-left\" data-align=\"left\">11     <\/td><\/tr><tr><td>7<\/td><td class=\"has-text-align-left\" data-align=\"left\"><span class=\"has-inline-color has-dark-gray-color\">8 <\/span><\/td><\/tr><tr><td>8<\/td><td class=\"has-text-align-left\" data-align=\"left\">7<\/td><\/tr><tr><td>9<\/td><td class=\"has-text-align-left\" data-align=\"left\">3<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Una distribuzione del genere \u00e8 detta <em><strong>unimodale<\/strong><\/em>. <br>Nel caso di un piccolo insieme di dati in cui <strong>nessun valore misurato si ripete<\/strong>,<strong> non esiste moda<\/strong>. <br>Quando due valori non adiacenti presentano entrambi lo stesso numero massimo di frequenza, si dice che la distribuzione \u00e8 <em><strong>bimodale<\/strong><\/em>. <br>Le distribuzioni di misurazioni con parecchie mode sono dette <em><strong>multimodali<\/strong><\/em>.<\/p>\n\n\n\n<p>In R possiamo trovare la moda in maniera molto semplice, sfruttando l&#8217;istruzione <strong>which.max()<\/strong>:<br><\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">var = c(3,6,7,7,9,11,12,12,12,14,15,16,17,22,29,31);\nfrequenza=tabulate(var);\nwhich.max(frequenza);\n\n[1] 12<\/pre>\n\n\n\n<h5 class=\"wp-block-heading\">Moda di dati raggruppati<\/h5>\n\n\n\n<p>Nel caso di dati raggruppati in una distribuzione di frequenza con intervalli di classe uguali, si stabilisce dapprima quale classe contenga la moda individuando la classe con il maggior numero di osservazioni. Poi si usa la formula:<\/p>\n\n\n\n\\(\nModa = C_{I} + (\\frac{d_{1}}{d_{1}+d_{2}})i\n\\)\n<br><br>\ndove:\n<br><br>\n<b>C<sub>I<\/sub><\/b> = confine inferiore della classe contenente la moda\n<br>\n<b>d<sub>1<\/sub><\/b> = differenza tra la frequenza della classe modale e la frequenza della classe precedente\n<br>\n<b>d<sub>2<\/sub><\/b> = differenza tra la frequenza della classe modale e la frequenza della classe successiva\n<br>\n<b><i>i<\/i><\/b> = ampiezza dell&#8217;intervallo di classe\n\n\n\n<h4 class=\"wp-block-heading\">Relazione tra media, mediana e moda<\/h4>\n\n\n\n<p>Nel caso dei dati raggruppati rappresentati da una curva di frequenza, <strong>la differenza fra i valori della media, della mediana e della moda rivela la forma della curva in termini di simmetria<\/strong>.<\/p>\n\n\n\n<p>Per una distribuzione unimodale simmetrica, la media, la mediana e la moda coincidono, ossia hanno identico valore.<\/p>\n\n\n\n<p>Nel caso della <em><strong>distribuzione asimmetrica positiva<\/strong><\/em>, la <strong>media ha il valore pi\u00f9 grande e la mediana \u00e8 pi\u00f9 grande della moda<\/strong>.<br>Quindi:<br><br><em><strong>Asimmetria positiva = coda a destra = Media &gt; Mediana &gt; Moda<\/strong><\/em><br><\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"679\" height=\"432\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-positiva.png\" alt=\"\" class=\"wp-image-1041\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-positiva.png 679w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-positiva-300x191.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><\/figure>\n\n\n\n<p>Nel caso dell&#8217;<em><strong>asimmetria negativa<\/strong><\/em>, la <strong>media ha il valore minimo e la mediana \u00e8 minore della moda<\/strong>.<br>Quindi, in sintesi:<\/p>\n\n\n\n<p><em><strong>Asimmetria negativa = coda a sinistra = Media &lt; Mediana &lt; Moda<\/strong><\/em><\/p>\n\n\n\n<figure class=\"wp-block-image is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-negativa.png\" alt=\"\" class=\"wp-image-1045\" width=\"647\" height=\"413\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-negativa.png 863w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/asimmetria-negativa-300x192.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><\/figure>\n\n\n\n<p>Una misura molto nota dell&#8217;asimmetria, che utilizza la differenza osservata fra la media e la mediana di un gruppo di valori, \u00e8 l&#8217;<strong>indice di asimmetria di Pearson,<\/strong>&nbsp;che vedremo pi\u00f9 in dettaglio quando introdurremo il concetto di misure di variabilit\u00e0, poich\u00e8 presenta al denominatore il valore della deviazione standard, ma che possiamo anticipare:<\/p>\n\n\n\n\\(\nAsimmetria = \\frac{3(\\mu &#8211; Med)}{\\sigma}\n\\)\n\n\n\n<h4 class=\"wp-block-heading\" id=\"decili\">Quartili, decili e percentili<\/h4>\n\n\n\n<p>I quartili, i decili e i percentili sono analoghi alla mediana in quanto <strong>suddividono <\/strong>anch&#8217;essi <strong>una distribuzione di misurazioni a seconda della proporzione delle frequenze osservate<\/strong>.<\/p>\n\n\n\n<p>Mentre la mediana divide la distribuzione in due met\u00e0, i quartili la dividono in quattro quarti; i decili in dieci decimi; i percentili in 100 centesimi. Nel caso di dati non raggruppati, la formula della mediana viene modificata a seconda della frazione desiderata:<\/p>\n\n\n\n\\(\nQ_{1} \\ (primo\\ quartile) = X_{(\\frac{n}{4} + \\frac{1}{2})} \\\\\nD_{3} \\ (terzo\\ decile) = X_{(\\frac{3n}{10} + \\frac{1}{2})} \\\\\nP_{60} \\ (sessantesimo\\ percentile) = X_{(\\frac{60n}{100} + \\frac{1}{2})} \\\\\n\\)\n\n\n\n<p>In R possiamo calcolarli cos\u00ec:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">var = c(3,6,7,7,9,11,12,12,14,15,16,17,22,29,31);\nquantile(var, probs=c(0.25,0.50,0.75)); ### quartili\n\n 25%  50%  75% \n 8.0 12.0 16.5 \n\nquantile(var, probs=c(1:9)\/10); ### decili\n\n 10%  20%  30%  40%  50%  60%  70%  80%  90% \n 6.4  7.0  9.4 11.6 12.0 14.4 15.8 18.0 26.2 <\/pre>\n\n\n\n<h5 class=\"wp-block-heading\">Quartili, decili e percentili di dati raggruppati<\/h5>\n\n\n\n<p>In questo caso si deve prima determinare la classe contenente il punto corrispondente alla frazione desiderata, con riferimento alle frequenza cumulative, poi interpolare. Ad esempio:<\/p>\n\n\n\n\\(\nQ_{1} \\ (primo\\ quartile) = C_{1} + (\\frac{\\frac{n}{4} &#8211; fc_{p}}{f_{c}})i \\\\\nD_{2} \\ (terzo\\ decile) = C_{1} + (\\frac{\\frac{3n}{10} &#8211; fc_{p}}{f_{c}})i \\\\\nP_{60} \\ (sessantesimo\\ percentile) = C_{1} + (\\frac{\\frac{60n}{100} &#8211; fc_{p}}{f_{c}})i \\\\\n\\)\n\n\n\n<h4 class=\"wp-block-heading\" id=\"5numeri\">Uno sguardo d&#8217;insieme: gli utilissimi 5 numeri<\/h4>\n\n\n\n<p>Esiste una descrizione sintetica dai dati che ci consente di avere immediatamente sott&#8217;occhio misure fondamentali:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Il valore minimo dei nostri dati<\/li>\n\n\n\n<li>il valore del primo quartile<\/li>\n\n\n\n<li>la mediana<\/li>\n\n\n\n<li>il valore del terzo quartile<\/li>\n\n\n\n<li>il valore massimo<\/li>\n<\/ol>\n\n\n\n<p>I 5 numeri costituiscono spesso un ottimo punto di partenza per analizzare le caratteristiche di una distribuzione. In R abbiamo un apposito comando, chiamato (ovviamente) <strong>fivenum()<\/strong>:<br><\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">var = c(3,6,7,7,9,11,12,12,14,15,16,17,22,29,31);\nfivenum(var);\n\n[1]  3.0  8.0 12.0 16.5 31.0<\/pre>\n\n\n\n<h4 class=\"wp-block-heading\">Aiutiamoci con un grafico furbo: il box-plot&nbsp;<\/h4>\n\n\n\n<p>Il <strong>boxplot<\/strong> (o <em>diagramma a scatola<\/em>) \u00e8 un tipo di grafico inventato dal grande <a href=\"https:\/\/it.wikipedia.org\/wiki\/John_Wilder_Tukey\" target=\"_blank\" rel=\"noreferrer noopener\">John Tukey<\/a> al fine di poter avere una buona visione d&#8217;insieme di un insieme di dati in un unico colpo d&#8217;occhio.&nbsp;<\/p>\n\n\n\n<p>Il boxplot pu\u00f2 essere orientato orizzontalmente o verticalmente e si presenta come un rettangolo diviso in due parti, da cui escono due segmenti. Il rettangolo (la &#8220;scatola&#8221;) \u00e8 delimitato dal primo e dal terzo quartile ed \u00e8 diviso al suo interno dalla mediana. I &#8220;baffi&#8221; rapresentano il minimo e il massimo&nbsp;dei valori.&nbsp;<\/p>\n\n\n\n<p>n.b. proprio la presenza dei &#8220;baffi&#8221; fa s\u00ec che questo diagramma sia spesso chiamato <em><strong>box-and-whisker plot<\/strong><\/em> o<em> <strong>diagramma a scatola e baffi<\/strong>.<\/em><\/p>\n\n\n\n<p>In questo modo vengono rappresentati graficamente i quattro intervalli ugualmente popolati delimitati dai quartili.<br>Uso una semplice distribuzione di dati e mostro in R come richiamare la funzione boxplot:<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">dati <- c(24,17,21,23,15,30,24,21,24,19,25,28,22,20,14,19,26,29,23,25,24,18,27,21);\nboxplot(dati,ylab=\"\",col=gray(0.8));<\/pre>\n\n\n\n<p>Aggiungendo qualche testo qua e l\u00e0 per una maggior comprensibilit\u00e0, il risultato che ottengo \u00e8 questo:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"679\" height=\"432\" src=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/esempio-boxplot.png\" alt=\"\" class=\"wp-image-1082\" srcset=\"https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/esempio-boxplot.png 679w, https:\/\/www.gironi.it\/blog\/wp-content\/uploads\/2018\/10\/esempio-boxplot-300x191.png 300w\" sizes=\"auto, (max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px\" \/><\/figure>\n\n\n\n<p>Un \"colpo d'occhio\" estremamente efficace sulla distribuzione dei valori osservati.<\/p>\n\n\n\n<p><\/p>\n\n\n<!-- internal-links-section -->\n<h3>Potrebbe interessarti anche<\/h3>\n<ul>\n<li><a href=\"https:\/\/www.gironi.it\/blog\/teorema-del-limite-centrale\/\">Il Teorema del Limite Centrale: perch\u00e9 la statistica funziona (anche quando i dati non sono normali)<\/a><\/li>\n<li><a href=\"https:\/\/www.gironi.it\/blog\/anomaly-detection\/\">Anomaly detection: come identificare valori anomali nei dati<\/a><\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>Le misure di posizione, o indici di posizione, o anche misure di tendenza centrale, sono valori che sintetizzano la&nbsp;posizione di&nbsp;una distribuzione&nbsp;statistica, fornendo un valore che ne riassume gli aspetti ritenuti pi\u00f9 importanti. In questa breve discussione vedremo alcuni degli indici pi\u00f9 comuni e di uso pratico, quali le varie tipologie di media, la mediana, i &hellip; <a href=\"https:\/\/www.gironi.it\/blog\/statistica-descrittiva-misure-di-posizione\/\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;Statistica descrittiva: misure di posizione e tendenza centrale.&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_uag_custom_page_level_css":"","footnotes":""},"categories":[629],"tags":[811,813,815,817,819,821],"class_list":["post-1001","post","type-post","status-publish","format-standard","hentry","category-statistica-it","tag-centrale-it","tag-descrittiva-it","tag-media-it","tag-mediana-it","tag-medie-it","tag-moda-it"],"lang":"it","translations":{"it":1001,"en":3324},"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"paolo","author_link":"https:\/\/www.gironi.it\/blog\/author\/paolo\/"},"uagb_comment_info":7,"uagb_excerpt":"Le misure di posizione, o indici di posizione, o anche misure di tendenza centrale, sono valori che sintetizzano la&nbsp;posizione di&nbsp;una distribuzione&nbsp;statistica, fornendo un valore che ne riassume gli aspetti ritenuti pi\u00f9 importanti. In questa breve discussione vedremo alcuni degli indici pi\u00f9 comuni e di uso pratico, quali le varie tipologie di media, la mediana, i&hellip;","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/1001","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=1001"}],"version-history":[{"count":6,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/1001\/revisions"}],"predecessor-version":[{"id":3437,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/posts\/1001\/revisions\/3437"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=1001"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/categories?post=1001"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/tags?post=1001"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}