  <?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>test delle ipotesi &#8211; paologironi blog</title>
	<atom:link href="https://www.gironi.it/blog/tag/test-delle-ipotesi-it/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.gironi.it/blog</link>
	<description>Appunti sparsi di (retro) informatica, analisi dei dati, statistica, seo, e cose che cambiano</description>
	<lastBuildDate>Wed, 25 Feb 2026 08:22:32 +0000</lastBuildDate>
	<language>it-IT</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	
	<item>
		<title>La distribuzione t e il test delle ipotesi</title>
		<link>https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi/</link>
					<comments>https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi/#respond</comments>
		
		<dc:creator><![CDATA[paolo]]></dc:creator>
		<pubDate>Sat, 09 Nov 2019 15:10:02 +0000</pubDate>
				<category><![CDATA[statistica]]></category>
		<category><![CDATA[alpha]]></category>
		<category><![CDATA[distribuzione t]]></category>
		<category><![CDATA[intervallo di confidenza]]></category>
		<category><![CDATA[student]]></category>
		<category><![CDATA[test delle ipotesi]]></category>
		<guid isPermaLink="false">https://www.gironi.it/blog/?p=1131</guid>

					<description><![CDATA[In un precedente post ho presentato in modo (spero) molto semplice il concetto di test delle ipotesi, un metodo statistico ampiamente utilizzato per determinare la validità di una determinata affermazione basata su un campione di dati. Negli esempi che ho proposto, tuttavia, ero a conoscenza del valore della deviazione standard, il sigma, della popolazione.Nella pratica &#8230; <a href="https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi/" class="more-link">Leggi tutto<span class="screen-reader-text"> "La distribuzione t e il test delle ipotesi"</span></a>]]></description>
										<content:encoded><![CDATA[
<p>In un <a href="https://www.gironi.it/blog/il-test-delle-ipotesi/">precedente post</a> ho presentato in modo (spero) molto semplice il concetto di test delle ipotesi, un metodo statistico ampiamente utilizzato per determinare la validità di una determinata affermazione basata su un campione di dati. </p>



<p>Negli esempi che ho proposto, tuttavia, ero a conoscenza del valore della deviazione standard, il <strong>sigma</strong>, della popolazione.<br>Nella pratica si tratta di un caso abbastanza raro, che mi consente di usare la <strong>distribuzione normale</strong>, calcolando lo <strong>Z-score</strong>. </p>



<p>Se invece non conosco il valore del sigma della popolazione, oppure se <strong>sto lavorando con piccoli campioni</strong> devo ricorrere a un tipo di distribuzione differente, chiamata <strong>distribuzione t</strong> o <strong>distribuzione di Student</strong>.</p>



<p>Detta più semplicemente e più chiaramente:</p>



<p class="has-light-gray-background-color has-background"><strong>La distribuzione t di Student è una distribuzione di probabilità utilizzata per valutare l&#8217;importanza statistica dei risultati in caso di campioni di dimensioni piccole e incertezza sulla varianza.</strong></p>



<span id="more-1131"></span>



<hr class="wp-block-separator has-css-opacity"/>


				<div class="wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-ca751fa6 wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-undefined uagb-block-8677d63c     "
					data-scroll= "1"
					data-offset= "30"
					style=""
				>
				<div class="uagb-toc__wrap">
						<div class="uagb-toc__title">
							Di cosa parleremo						</div>
																						<div class="uagb-toc__list-wrap ">
						<ol class="uagb-toc__list"><li class="uagb-toc__list"><a href="#una-breve-digressione-storica" class="uagb-toc-link__trigger">Una breve digressione storica</a><li class="uagb-toc__list"><a href="#un-esempio-vale-mille-spiegazioni" class="uagb-toc-link__trigger">Un esempio vale mille spiegazioni</a><li class="uagb-toc__list"><a href="#unalternativa-alle-regioni-critiche-guardare-al-valore-p" class="uagb-toc-link__trigger">Un&#039;alternativa alle regioni critiche: guardare al valore p</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#il-t-test-con-la-calcolatrice-ti-83" class="uagb-toc-link__trigger">Il T-Test Con la calcolatrice ti-83</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#calcolare-il-p-value-con-la-calcolatrice-casio-fx" class="uagb-toc-link__trigger">Calcolare il p-value con la calcolatrice Casio FX</a></li></ul></li><li class="uagb-toc__list"><a href="#stima-margine-di-errore-e-intervallo-di-confidenza-controlliamo-il-risultato-del-test-delle-ipotesi" class="uagb-toc-link__trigger">Stima, margine di errore e intervallo di confidenza: controlliamo il risultato del test delle ipotesi</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#lintervallo-di-confidenza-con-la-ti-83" class="uagb-toc-link__trigger">L&#039;intervallo di confidenza con la TI-83</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#lintervallo-di-confidenza-con-la-casio" class="uagb-toc-link__trigger">L&#039;intervallo di confidenza con la Casio</a></li></ul></li></ul></li><li class="uagb-toc__list"><a href="#il-t-test-il-calcolo-del-p-value-e-lintervallo-di-confidenza-con-r" class="uagb-toc-link__trigger">Il t-test, il calcolo del p-value e l&#039;intervallo di confidenza con R</a><li class="uagb-toc__list"><a href="#in-conclusione" class="uagb-toc-link__trigger">In conclusione</a><li class="uagb-toc__list"><a href="#alcuni-link-utili-e-autorevoli-per-approfondire" class="uagb-toc-link__trigger">Alcuni link utili e autorevoli per approfondire</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#potrebbe-interessarti-anche" class="uagb-toc-link__trigger">Potrebbe interessarti anche</a></ul></ul></ul></ol>					</div>
									</div>
				</div>
			


<hr class="wp-block-separator has-css-opacity"/>



<h2 class="wp-block-heading has-text-align-center">Una breve digressione storica</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img fetchpriority="high" decoding="async" width="360" height="464" src="https://www.gironi.it/blog/wp-content/uploads/2019/11/William_Sealy_Gosset.jpg" alt="Foto di William Gosset - lo scopritore della distribuzione t" class="wp-image-1369" srcset="https://www.gironi.it/blog/wp-content/uploads/2019/11/William_Sealy_Gosset.jpg 360w, https://www.gironi.it/blog/wp-content/uploads/2019/11/William_Sealy_Gosset-233x300.jpg 233w" sizes="(max-width: 360px) 85vw, 360px" /><figcaption class="wp-element-caption">William Sealy Gosset (Student)</figcaption></figure>
</div>


<p>Nei primi anni del 1900, il chimico e studioso di statistica William Sealy Gosset, impiegato nel birrificio Guiness (e collaboratore di un gigante della statistica, <a aria-label="Karl Pearson (apre in una nuova scheda)" href="https://en.wikipedia.org/wiki/Karl_Pearson" target="_blank" rel="noreferrer noopener">Karl Pearson</a>), scoprì che quando lavorava con piccolissimi campioni, le distribuzioni della media differivano significativamente dalla distribuzione normale. </p>



<p>Fatto ancora più interessante, al variare delle dimensioni del campione la forma della distribuzione cambiava, e aumentando il campione la distribuzione approssimava via via sempre più la normale. </p>



<p>Non potendo rivelare la sua identità per non favorire i concorrenti, pubblicò i suoi risultati con lo pseudonimo &#8220;Studente&#8221; e per questo le distribuzioni per campioni di piccole dimensioni sono ora note come &#8220;distribuzioni a T di Student&#8221;.<br>Se volete <a aria-label="leggere tutta la storia (apre in una nuova scheda)" href="https://en.wikipedia.org/wiki/William_Sealy_Gosset" target="_blank" rel="noreferrer noopener">leggere tutta la storia</a>, Wikipedia, come sempre, è una buona fonte.</p>



<hr class="wp-block-separator has-css-opacity"/>



<p>La distribuzione t è simmetrica rispetto al suo zero, ma risulta più &#8220;piatta&#8221; della distribuzione normale standardizzata, cosicchè una maggiore parte della sua area è compresa nelle code. </p>



<p><strong>Un campione più numeroso fa sì che la distribuzione t approssimi sempre più fedelmente la distribuzione normale. <br>Le differenze tra la distribuzione t e la normale sono maggiori quando abbiamo meno gradi di libertà.</strong> </p>



<figure class="wp-block-image"><img decoding="async" width="614" height="371" src="https://www.gironi.it/blog/wp-content/uploads/2019/11/distribuzionitcompara.png" alt="Test delle ipotesi - comparazione delle distribuzioni t" class="wp-image-1381" srcset="https://www.gironi.it/blog/wp-content/uploads/2019/11/distribuzionitcompara.png 614w, https://www.gironi.it/blog/wp-content/uploads/2019/11/distribuzionitcompara-300x181.png 300w" sizes="(max-width: 709px) 85vw, (max-width: 909px) 67vw, (max-width: 984px) 61vw, (max-width: 1362px) 45vw, 600px" /><figcaption class="wp-element-caption">Le curve delle distribuzioni t per vari gradi di libertà e comparate con la normale.</figcaption></figure>



<p><br>Ma cosa intendiamo per <strong>gradi di libertà? </strong>Il numero di campioni che hanno la &#8220;libertà&#8221; di cambiare senza modificare la media del campione.</p>



<p>Se il concetto non appare chiaro, si può comunque passare all&#8217;utilizzo pratico, perchè i gradi di libertà, fondamentali nel nostro calcolo, sono semplicemente pari alla numerosità del campione meno uno:</p>



<p class="has-light-gray-background-color has-background"><strong>df = n -1</strong><br><br>dove df = <em>degrees of freedom</em>, gradi di libertà<br>n = numerosità del campione</p>



<p>Il procedimento per svolgere il test delle ipotesi avvalendosi della distribuzione t ricalca in buona parte quello che abbiamo già visto nel caso del sigma noto e dell&#8217;uso della normale.</p>



<p><strong>Stabilisco dunque l&#8217;ipotesi nulla, H<sub>0</sub>, e l&#8217;ipotesi alternativa, H<sub>a</sub>. </strong></p>



<p>Per calcolare la statistica del t-test uso la formula:</p>



\(
t = \frac{\bar{x} &#8211; \mu}{\frac{s}{\sqrt{n}}} \\
\)



\(
\frac{s}{\sqrt{n}} \ è\ l&#8217;errore\ standard\ stimato,\ che\ possiamo\ anche\ indicare\ con\ SE{\bar{x}}
\)



<h2 class="wp-block-heading">Un esempio vale mille spiegazioni</h2>



<p>Un&#8217;azienda di lampadine ritiene che il proprio prodotto abbia una durata media di almeno 4200 ore.</p>



<p>Viene preso un campione di n=10 lampadine e si riscontra una media di durata del campione pari a 4000 ore. <br>La deviazione standard del campione è pari a 200 ore.</p>



<p>Quindi, riassumendo:</p>



\(
n=10\\
\bar{x}=4000\\
s=200\\
\)



<p>Pongo allora le mie condizioni per effettuare un test:</p>



<p>
H<sub>0</sub> &ge; 4200
<br>
H<sub>a</sub> < 4200
</p>



<p>Scelgo  un<strong> livello di significatività pari al 95%</strong> (cioè <strong>alpha=0,05</strong>).<br><br>Nella tabella dei valori critici della distribuzione t andrò a cercare il valore che corrisponde a 9 gradi di libertà (<em>guardo la riga</em>) e alpha 0,05 (<em>incrocio con la colonna</em>). <br><strong>Tale valore risulta essere 1.833</strong></p>



<p><strong>Rigetteremo allora l&#8217;ipotesi nulla qualora il valore t che andiamo a calcolare risulti inferiore a 1.833</strong>.</p>



<p>Il valore dell&#8217;errore standard è:</p>



\(
\frac{s}{\sqrt{n}}=\frac{200}{\sqrt{10}}=\frac{200}{3.16}=63,3 \\
\)



<p>Calcolo t:</p>



\(
t=\frac{\bar{x} &#8211; \mu}{SE\bar{x}}=\frac{4000-4200}{63,3}=\frac{-200}{63,3}=-3,16\\
\)



<p>Il<strong> valore di t cade nell&#8217;area critica</strong>: <strong>si rigetta allora l&#8217;ipotesi nulla</strong> e si accetta con un livello di significatività del 95% che la durata media delle lampadine sia minore delle 4200 ore dichiarate dal produttore.</p>



<h2 class="wp-block-heading">Un&#8217;alternativa alle regioni critiche: guardare al valore p</h2>



<p>Possiamo anche valutare una ipotesi chiedendoci: &#8220;<em>Qual è la probabilità di ottenere il valore del test statistico che abbiamo riscontrato se è vera l&#8217;ipotesi nulla?</em>&#8220;. Questa probabilità è chiamata <strong>valore p</strong>.</p>



<p>Questa, in effetti, è la strada più comoda da seguire avendo a disposizione strumenti quali una calcolatrice con funzioni statistiche oppure R: l&#8217;interpretazione del risultato risulta infatti immediata. Vediamo il nostro esempio.</p>



<h3 class="wp-block-heading">Il T-Test Con la calcolatrice ti-83</h3>



<pre class="wp-block-preformatted">Schiaccio STAT<br>Poi TESTS e scelgo<br>2:T-Test e confermo con ENTER<br>Scelgo STATS e inserisco i dati<br>Scelgo CALCULATE e confermo con ENTER</pre>



<p>Ottengo il valore t=-3.16 e il valore di p=0.00575.</p>



<p>Questo significa che c&#8217;è appena una probabilità dello 0,575% che sotto l&#8217;ipotesi nulla si verifichi il risultato che abbiamo riscontrato. </p>



<p><strong>p è minore del livello di significatività</strong> alpha che abbiamo scelto (p &lt; 0,05).</p>



<p>Dunque, <strong>l&#8217;ipotesi nulla è da rigettare</strong> a favore dell&#8217;ipotesi alternativa.</p>



<h3 class="wp-block-heading">Calcolare il p-value con la calcolatrice Casio FX</h3>



<p>Lo stesso calcolo posso eseguirlo semplicemente anche con una calcolatrice scientifica Casio:</p>



<pre class="wp-block-preformatted">MENU<br>STAT<br>F3 (TEST)<br>F2 (t)<br>F1 (1-s)<br>DATA: Variable<br>inserisco i miei dati<br>Vado con la freccia verso il basso fino ad EXECUTE<br>F1 (calc)</pre>



<p>La calcolatrice mi restituisce il valore di t e di p</p>



<h2 class="wp-block-heading">Stima, margine di errore e intervallo di confidenza: controlliamo il risultato del test delle ipotesi</h2>



<p>Quando una ipotesi è scartata, è certamente utile operare una stima per cercare di capire quale sia il vero valore della media. Nel nostro esempio abbiamo scartato l&#8217;affermazione del produttore che le sue lampadine durino in media più di 4200 ore. Ma allora, quanto durano in realtà?</p>



<p>Per calcolare l&#8217;intervallo di confidenza, abbiamo bisogno di conoscere 3 cose:</p>



<ol class="wp-block-list">
<li><strong>La media del nostro campione</strong></li>



<li>L<strong>&#8216;errore standard</strong></li>



<li><strong>Il valore critico</strong></li>
</ol>



<p>La formula per ottenere l&#8217;intervallo di confidenza è:</p>



\(
\bar{x}\ \pm \ Margine\ Di\ Errore \\
\)



<p>e il Margine di Errore è:</p>



\(
ME\ =\ t\ critico \times\ SE\bar{x} \\
\)



<p>Nel nostro caso:<br>ME = 1,833 x 63,3 = circa 116</p>



<p>Quindi possiamo dire che il nostro intervallo di confidenza al 95% è tra 3884 e 4116.</p>



<p>Come si può notare, il valore indicato dal produttore, 4200 ore, si trova come ci aspettavamo fuori all&#8217;intervallo di confidenza.</p>



<h3 class="wp-block-heading">L&#8217;intervallo di confidenza con la TI-83</h3>



<p>Ecco la sequenza di comandi necessaria per calcolare l&#8217;intervallo di confidenza:</p>



<pre class="wp-block-preformatted">STAT<br>TESTS<br>8TInterval<br>STATS<br>inserisco i dati<br>CALCULATE</pre>



<h3 class="wp-block-heading">L&#8217;intervallo di confidenza con la Casio</h3>



<p>Questa invece è la sequenza dei comandi sulla mia Casio serie fx:</p>



<pre class="wp-block-preformatted">MENU<br>STAT<br>F4 (Intr)<br>F2 (t)<br>F1 (1-s)<br>inserisco i dati<br>EXECUTE</pre>



<h2 class="wp-block-heading">Il t-test, il calcolo del p-value e l&#8217;intervallo di confidenza con R</h2>



<p>R è come sempre il nostro migliore alleato, consentendoci di effettuare il test in maniera semplicissima e fornendoci tutte le informazioni utili.<br>Preparo dunque un vettore che contiene 10 misure che hanno per media 4000 e lo do&#8217; in pasto alla funzione <strong><em>t.test</em></strong> di R, indicando che la media per l&#8217;ipotesi nulla, chiamata <em><strong>mu</strong></em>, è 4200, e che l&#8217;ipotesi alternativa è che il valore reale sia inferiore &#8211; <strong><em>alternative=&#8221;less&#8221;</em></strong> :</p>



<pre class="wp-block-preformatted">vitalampadine &lt;- c(4100,3900,3800,4200,4000,4100,3900,3800,4200,4000)
t.test(vitalampadine,mu=4200,alternative="less")</pre>



<p>R ci fornisce in output tutte le informazioni che ci servono.</p>



<h2 class="wp-block-heading">In conclusione</h2>



<p>In generale, la distribuzione t di Student è uno strumento potente e flessibile che può essere utilizzato per valutare l&#8217;importanza statistica dei risultati in molti contesti diversi. Con una comprensione approfondita della distribuzione t e l&#8217;uso di software come R, è possibile costruire test delle ipotesi efficaci e prendere decisioni informate sulla base dei dati raccolti.</p>



<p class="has-light-gray-background-color has-background">Nota a margine: Qualora il campione sia poco numeroso (n&lt;30) e la popolazione non sia distribuita in maniera approssimativamente normale, posso applicare il <a href="https://www.gironi.it/blog/la-distribuzione-normale/#chebishev">Teorema di Chebishev.</a></p>



<h2 class="wp-block-heading">Alcuni link utili e autorevoli per approfondire</h2>



<ul class="wp-block-list">
<li><a href="https://statisticsbyjim.com/hypothesis-testing/t-tests-t-values-t-distributions-probabilities/" target="_blank" rel="noreferrer noopener">How t-Tests Work: t-Values, t-Distributions, and Probabilities &#8211; <em>statisticsbyjim.com</em></a></li>



<li><a href="https://sixsigmastudyguide.com/one-sample-t-hypothesis-test/" target="_blank" rel="noreferrer noopener">One Sample T Hypothesis Test (Student&#8217;s T Test) &#8211; <em>sixsigmastudyguide.com</em></a></li>
</ul>


<!-- internal-links-section -->
<h3>Potrebbe interessarti anche</h3>
<ul>
<li><a href="https://www.gironi.it/blog/ab-testing/">A/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)</a></li>
<li><a href="https://www.gironi.it/blog/intervalli-di-confidenza/">Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)</a></li>
</ul>]]></content:encoded>
					
					<wfw:commentRss>https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Il test delle ipotesi</title>
		<link>https://www.gironi.it/blog/il-test-delle-ipotesi/</link>
					<comments>https://www.gironi.it/blog/il-test-delle-ipotesi/#respond</comments>
		
		<dc:creator><![CDATA[paolo]]></dc:creator>
		<pubDate>Fri, 14 Dec 2018 15:12:23 +0000</pubDate>
				<category><![CDATA[statistica]]></category>
		<category><![CDATA[alpha]]></category>
		<category><![CDATA[errore di seconda specie]]></category>
		<category><![CDATA[potenza]]></category>
		<category><![CDATA[test delle ipotesi]]></category>
		<guid isPermaLink="false">https://www.gironi.it/blog/?p=1190</guid>

					<description><![CDATA[Nella vita di tutti i giorni, dobbiamo spesso prendere decisioni basate su informazioni incomplete. Può darsi ad esempio che si debba decidere se una certa procedura educativa sia più efficace di un&#8217;altra, se un nuovo farmaco abbia risultati realmente positivi sull&#8217;evoluzione di una malattia, e via dicendo. Il test delle ipotesi è una procedura statistica &#8230; <a href="https://www.gironi.it/blog/il-test-delle-ipotesi/" class="more-link">Leggi tutto<span class="screen-reader-text"> "Il test delle ipotesi"</span></a>]]></description>
										<content:encoded><![CDATA[
<p>Nella vita di tutti i giorni, dobbiamo spesso prendere decisioni basate su informazioni incomplete.</p>



<p>Può darsi ad esempio che si debba decidere se una certa procedura educativa sia più efficace di un&#8217;altra, se un nuovo farmaco abbia risultati realmente positivi sull&#8217;evoluzione di una malattia, e via dicendo.</p>



<p>Il <strong>test delle ipotesi</strong> è una procedura statistica che ci consente di porre un quesito sulla base di informazioni campionarie, al fine di raggiungere una decisione statisticamente significativa.</p>



<p class="has-light-gray-background-color has-background">In termini più chiari e diretti: la mia scoperta sperimentale è dovuta al caso? <br><strong>Il test delle ipotesi è proprio una procedura statistica per verificare se il caso sia una spiegazione plausibile di un risultato sperimentale.</strong></p>



<span id="more-1190"></span>



<h2 class="wp-block-heading">Una premessa&#8230;</h2>


				<div class="wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-1  uagb-block-5b7f4ef7 wp-block-uagb-table-of-contents uagb-toc__align-left uagb-toc__columns-undefined uagb-block-e0835d49     "
					data-scroll= "1"
					data-offset= "30"
					style=""
				>
				<div class="uagb-toc__wrap">
						<div class="uagb-toc__title">
							Di cosa parleremo						</div>
																						<div class="uagb-toc__list-wrap ">
						<ol class="uagb-toc__list"><li class="uagb-toc__list"><a href="#una-premessa" class="uagb-toc-link__trigger">Una premessa&#8230;</a><li class="uagb-toc__list"><a href="#ipotesi-statistiche" class="uagb-toc-link__trigger">Ipotesi statistiche</a><li class="uagb-toc__list"><a href="#errori-di-i-e-ii-tipo" class="uagb-toc-link__trigger">Errori di I e II tipo</a><li class="uagb-toc__list"><a href="#una-o-due-code-questo-è-il-problema" class="uagb-toc-link__trigger">Una o due code? Questo è il problema&#8230;</a><li class="uagb-toc__list"><a href="#riassumiamo-per-punti" class="uagb-toc-link__trigger">Riassumiamo per punti</a><li class="uagb-toc__list"><a href="#cè-bisogno-di-un-esempio" class="uagb-toc-link__trigger">C&#039;è bisogno di un esempio</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#1-stabilisco-lipotesi-nulla-e-lipotesi-alternativa" class="uagb-toc-link__trigger">1 &#8211; Stabilisco l&#039;ipotesi nulla e l&#039;ipotesi alternativa</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#2-fisso-il-livello-di-significatività-alpha-level" class="uagb-toc-link__trigger">2 &#8211; Fisso il livello di significatività (alpha level)</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#3-e-4-scelgo-la-distribuzione-e-raccolgo-e-analizzo-i-dati" class="uagb-toc-link__trigger">3 e 4 &#8211; Scelgo la distribuzione e Raccolgo e analizzo i dati</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#5-finalmente-traggo-le-conclusioni" class="uagb-toc-link__trigger">5 &#8211; (finalmente) Traggo le conclusioni</a></li></ul></li><li class="uagb-toc__list"><a href="#semplificarsi-la-vita-scrivo-una-funzione-in-r" class="uagb-toc-link__trigger">Semplificarsi la vita: scrivo una funzione in R</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#se-sto-usando-una-ti-83" class="uagb-toc-link__trigger">Se sto Usando una TI-83:</a><li class="uagb-toc__list"><li class="uagb-toc__list"><a href="#con-la-casio" class="uagb-toc-link__trigger">Con la casio</a></li></ul></li></ul></li><li class="uagb-toc__list"><a href="#la-probabilità-di-un-errore-della-seconda-specie" class="uagb-toc-link__trigger">La probabilità di un errore della seconda specie</a><li class="uagb-toc__list"><a href="#potenza-ma-non-era-una-città" class="uagb-toc-link__trigger">Potenza? Ma non era una città?</a><li class="uagb-toc__list"><a href="#determinare-la-dimensione-che-il-campione-deve-avere-per-il-test-della-media" class="uagb-toc-link__trigger">Determinare la dimensione che il campione deve avere per il test della media</a><li class="uagb-toc__list"><a href="#al-termine-di-tutto-questoe-se-non-conosco-i-dati-della-popolazione" class="uagb-toc-link__trigger">Al termine di tutto questo&#8230;E se non conosco i dati della popolazione?</a><ul class="uagb-toc__list"><li class="uagb-toc__list"><a href="#potrebbe-interessarti-anche" class="uagb-toc-link__trigger">Potrebbe interessarti anche</a></ul></ul></ul></ol>					</div>
									</div>
				</div>
			


<hr class="wp-block-separator has-css-opacity"/>



<p>Bisogna capire la differenza tra <strong>probabilità</strong> e <strong>inferenza</strong>.<br></p>



<ul class="wp-block-list">
<li>Se <strong>conosco i dati della popolazione</strong> e voglio sapere qual è la probabilità di avere un dato risultato, ci troviamo nel campo della <strong><em>probabilità</em></strong>.<br></li>



<li>Se da un <strong>campione</strong> cerco di inferire i valori della popolazione, siamo nei territori dell&#8217;<strong><em>inferenza</em></strong>.</li>
</ul>



<h2 class="wp-block-heading">Ipotesi statistiche</h2>



<p>Nel test delle ipotesi abbiamo sempre da &#8220;soppesare&#8221; due ipotesi. Lo <em>status quo</em> è chiamato <strong>ipotesi nulla</strong> ed ha simbolo H<sub>0</sub></p>



<p>Quello che faremo è di andare a testare l&#8217;ipotesi nulla contro un&#8217;<strong>ipotesi alternativa</strong>, a cui diamo il simbolo H<sub>a</sub></p>



<p class="has-very-light-gray-background-color has-background"><em>N.B. In genere, l&#8217;ipotesi alternativa è quella a cui crediamo!</em></p>



<p>Scegliamo poi un <strong>livello di significatività</strong> o <strong>alpha level</strong> α.<br>Lo standard comune è α = 0.05, cioè un <strong>livello di significatività al 95%</strong>.<br>In base all&#8217;alpha level possiamo stabilire la o le <strong>regioni critiche</strong>.</p>



<p><strong>Se il valore che otteniamo con il nostro test cade in una regione critica, respingeremo l&#8217;ipotesi nulla, accogliendo l&#8217;ipotesi alternativa.</strong><br><br>Un semplice esempio grafico di rappresentazione. Ipotizzo un test in cui stabilisco l&#8217;ipotesi alternativa che la media risulti maggiore della media dell&#8217;ipotesi nulla. Si tratta di un caso in cui ho una sola zona critica, in questo caso quella a destra del valore α. Per rigettare l&#8217;ipotesi nulla il valore del mio test dovrà cadere nell&#8217;area grigia:</p>



<figure class="wp-block-image"><img decoding="async" width="500" height="400" src="https://www.gironi.it/blog/wp-content/uploads/2019/01/regione-critica.gif" alt="regione critica" class="wp-image-1204"></figure>



<h2 class="wp-block-heading">Errori di I e II tipo</h2>



<p>Il risultato raggiunto, ovviamente, non costituisce una certezza.</p>



<p>Il livello di significatività del test (nel nostro primo esempio il 95%) ci indica la probabilità di incorrere in un <strong>errore di I tipo</strong>, cioè di <strong>rifiutare erroneamente l&#8217;ipotesi nulla</strong>, che era vera, accettando l&#8217;ipotesi alternativa.</p>



<p class="has-very-light-gray-background-color has-background">Come si vede, possiamo determinare il livello di significatività del nostro test, cioè possiamo fissare la probabilità massima con cui accettiamo di rischiare l&#8217;errore di I tipo.</p>



<p>Se invece <strong>accettiamo come valida l&#8217;ipotesi nulla, quando doveva essere rifiutata in quanto falsa</strong>, compiamo un errore di <strong>II tipo</strong>.</p>



<p>Il modo più chiaro che ho trovato per spiegare il concetto è questo&#8230; </p>



<div class="wp-block-uagb-image uagb-block-ab6037e8 wp-block-uagb-image--layout-default wp-block-uagb-image--effect-static wp-block-uagb-image--align-none"><figure class="wp-block-uagb-image__figure"><img decoding="async" srcset="https://www.gironi.it/blog/wp-content/uploads/2024/03/typeItypeIIerrors-1024x412.png ,https://www.gironi.it/blog/wp-content/uploads/2024/03/typeItypeIIerrors.png 780w, https://www.gironi.it/blog/wp-content/uploads/2024/03/typeItypeIIerrors.png 360w" sizes="auto, (max-width: 480px) 150px" src="https://www.gironi.it/blog/wp-content/uploads/2024/03/typeItypeIIerrors-1024x412.png" alt="typeItypeIIerrors" class="uag-image-3142" width="1549" height="623" title="typeItypeIIerrors" loading="lazy" role="img"></figure></div>



<p></p>



<p>Il calcolo della probabilità di incorrere in un errore di tipo II non è così diretto come nel caso dell&#8217;errore di tipo I, e lo <a href="https://www.gironi.it/blog/il-test-delle-ipotesi#2specie">affronterò in maniera un po&#8217; semplificata più avanti</a>.</p>



<h2 class="wp-block-heading">Una o due code? Questo è il problema&#8230;</h2>



<p>Il test può essere a <strong>1 coda,&nbsp;</strong>ad esempio se l&#8217;ipotesi alternativa è che una media sia maggiore della media che rappresenta l&#8217;ipotesi nulla:</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="320" height="220" src="https://www.gironi.it/blog/wp-content/uploads/2018/11/una-coda.gif" alt="test ipotesi a una coda" class="wp-image-1170"/><figcaption class="wp-element-caption">La regione critica &#8211; ipotesi a una coda</figcaption></figure>
</div>


<p>oppure a <strong>2 code </strong>(se l&#8217;ipotesi alternativa è che la media che ipotizzo sia diversa dall&#8217;ipotesi nulla).</p>



<p>Nell&#8217;ipotesi a 2 code avremo 2 regioni critiche ai due estremi della curva, ciascuna delle quali rappresenta un livello&nbsp;α/2:</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="320" height="206" src="https://www.gironi.it/blog/wp-content/uploads/2018/11/due-code.gif" alt="due code" class="wp-image-1173"><figcaption class="wp-element-caption">Le regioni critiche. Ipotesi a due code con livello di significatività del 95%</figcaption></figure>
</div>


<h2 class="wp-block-heading">Riassumiamo per punti</h2>



<ol class="wp-block-list">
<li>Stabilisco l&#8217;ipotesi nulla e l&#8217;ipotesi alternativa.</li>



<li>Fisso il livello di significatività (alpha level).</li>



<li>Quale distribuzione usare: normale o t?</li>



<li>Raccolgo e analizzo i dati.</li>



<li>Traggo le conclusioni.</li>
</ol>



<p>Devo pormi una domanda fondamentale: ma <strong>quale distribuzione devo utilizzare</strong>?</p>



<p>La risposta può essere trovata <strong>guardando al sigma</strong> (la<a href="https://www.gironi.it/blog/statistica-descrittiva-misure-di-dispersione-o-variabilita#sqm"> deviazione standard o scarto quadratico medio</a>) e la numerosità del campione. Mi chiedo:</p>



<p><strong>Conosco il sigma della popolazione?</strong> (nella realtà un caso abbastanza raro&#8230;). Ho un campione sufficientemente numeroso (n&gt;30) ?</p>



<p>Se la risposta è <strong>SI</strong>, allora uso la <strong>distribuzione normale</strong> (e calcolo lo Z-score).</p>



<p>Se la risposta è <strong>NO</strong>, cioè se non conosco il valore del sigma della popolazione (o se sto lavorando con campioni numericamente esigui), allora userò la <strong>distribuzione t</strong> o <strong>distribuzione di Student</strong>.</p>



<p>n.b. <em>quando il campione diventa numeroso, la distribuzione t approssima sempre di più la normale&#8230;</em></p>



<h2 class="wp-block-heading">C&#8217;è bisogno di un esempio</h2>



<p>Voglio condurre un test delle ipotesi in una situazione nella quale conosco il sigma della popolazione.</p>



<p>Seguiamo i nostri passaggi.</p>



<h4 class="wp-block-heading">1 &#8211;&nbsp;Stabilisco l&#8217;ipotesi nulla e l&#8217;ipotesi alternativa</h4>



<p>Se:</p>



\(
H_{0}: \mu = x \\
H_{a}: \mu \neq X \\
\)



<p>allora siamo di fronte a un test a 2 code. Avremo cioè due zone critiche da considerare.<br><br>Se invece:</p>



\(
H_{0}: \mu = x \\
H_{a}: \mu &gt; X \\
\)



<p>allora il test è a una coda.</p>



<h4 class="wp-block-heading">2 &#8211;&nbsp;Fisso il livello di significatività (alpha level)</h4>



<p>Scegliamo il caso più tipico, un livello di significatività pari al 95%, quindi:</p>



\(
\alpha = 0,05
\)



<h4 class="wp-block-heading">3 e 4 &#8211;&nbsp;Scelgo la distribuzione e Raccolgo e analizzo i dati</h4>



<p>Suppongo di avere raccolgo i dati. Mi chiedo ora quale tipo di distribuzione devo usare per il mio test. La domanda è sempre quella:</p>



<p>Conosco il sigma della popolazione?</p>



<p>Nel mio esempio diciamo di sì, e allora usiamo la normale&#8230;</p>



<p>Calcoliamo lo Z-score. Trovo:</p>



\(
\sigma_{\bar{x}}= \frac{\sigma}{\sqrt{n}} \\
\)



<p>ora posso trovare Z:</p>



\(
Z = \frac{\bar{x} &#8211; \mu}{\sigma_{\bar{x}}} \\
\)



<h4 class="wp-block-heading">5 &#8211; (finalmente) Traggo le conclusioni</h4>



<p>Mettiamo che il test sia con :</p>



\(
H_{0}: \mu = x \\
H_{a}: \mu \neq X \\
\)



<p>quindi a 2 code. Il livello di significatività prescelto è il 95%, dunque vado a cercare 2,5% (5%/2) sulla tavola, e trovo il valore 1.96.</p>



<p><em>n.b. avrei potuto usare R con la funzione:&nbsp;</em></p>



<pre class="wp-block-preformatted">qnorm(0.025)</pre>



<p>Se invece non ho la tabella a portata di mano e non voglio scomodare R, posso trovare al volo il valore con la fidata calcolatrice Casio:</p>



<pre class="wp-block-preformatted">Shift CATALOG
InvNormCD(0.975)</pre>



<p>Se uso una gloriosa TI-83 potrò ottenere il valore facilmente così:</p>



<pre class="wp-block-preformatted">2nd DISTR
3 (invNorm)
invNorm(0,975)</pre>



<p>Qualunque strumento io abbia utilizzato, il valore che troverò sarà di (arrotondando) 1.96.</p>



<p><strong>Quindi -1,96 e +1.96 sono i valori critici.</strong></p>



<p>Se il mio Z-score risulta, per esempio, di 2.50, noto immediatamente che il valore risulta compreso nella zona critica. <strong>Allora posso rigettare l&#8217;ipotesi nulla e accettare quella alternativa.</strong></p>



<p class="has-light-gray-background-color has-background">Due consigli al volo:<br>1) <strong>Disegniamo sempre il grafico</strong>. Ci aiuterà moltissimo a non commettere errori.<br>2) I livelli di significatività più comunemente usati sono quelli al <strong>5%</strong> e all&#8217;<strong>1%</strong>. I valori critici nel caso di test a una coda oppure a due code che più spesso troveremo e che quindi possiamo imparare sono:</p>



<figure class="wp-block-table"><table><tbody><tr><td><strong>livello significatività</strong></td><td><strong>una coda</strong></td><td><strong>due code</strong></td></tr><tr><td><strong>5%</strong> (alpha 0,05)</td><td>1.65 (+ oppure -)</td><td>+/- 1.96</td></tr><tr><td><strong>1%</strong> (alpha 0,01)</td><td>2.33 (+ oppure -)</td><td>+/- 2.58</td></tr></tbody></table></figure>



<h2 class="wp-block-heading">Semplificarsi la vita: scrivo una funzione in R</h2>



<p>Mi semplifico la vita e mi preparo una funzione in R, che chiamerò z-test:</p>



<pre class="wp-block-preformatted">z.test = function (x,mu,popvar) {
  one.tail.p &lt;- NULL
  z.score &lt;- round((mean(x)-mu)/(popvar/sqrt(length(x))),3)
  one.tail.p &lt;- round(pnorm(abs(z.score),lower.tail=FALSE),3)
  cat("z=",z.score,"\n","one-tailed probability =",one.tail.p,"\n","two- tailed probability =",2*one.tail.p)
}</pre>



<h4 class="wp-block-heading">Se sto Usando una TI-83:</h4>



<p>Con la TI-83 scelgo:</p>



<pre class="wp-block-preformatted">STAT   poi<br>TESTS   quindi<br>Z-TEST   a seguire<br>STATS<br></pre>



\(
\mu_{0} = media \\
\sigma = sigma \\
\bar{x} = media\ del \ mio \ campione \\
n = numero \ campioni \\
\mu \neq \mu_{0} \ se\ il\ mio\ test\ è\ a\ due\ code \\ \\
CALCULATE \\
\)



<h4 class="wp-block-heading">Con la casio</h4>



<pre class="wp-block-preformatted">MENU / STAT
F3 TEST
F1 Z
F1 1-s

inserisco i dati e poi scelgo

CALC</pre>



<h2 class="wp-block-heading" id="2specie">La probabilità di un errore della seconda specie</h2>



<p>Come abbiamo visto, la probabilità di incorrere in un errore della prima specie è fissato a priori nel nostro test scegliendo il livello di significatività, l&#8217;alpha.</p>



<p>Ipotizziamo, ad esempio, che una certa rilevazione relativa a un valore ipotizzato della media abbia come ipotesi nulla un valore pari o superiore a 260. <br>La mia ipotesi alternativa è dunque che questo valore medio sia minore di 260. <br>Stabilisco poi che un valore di 240 0 meno costituirebbe uno scostamento importante.<br>Nel mio esempio, il livello di significatività è fissato al 95% (alpha=0.05), il campione consta di 36 osservazioni, lo scostamento medio è di 43.</p>



\(
\bar{X}_{critico}=\mu_0 + z\sigma_{\bar{x}}=\\
260+(-1.65)(7.17)=248.17\\
\)



<p>dove</p>



\(
\sigma_{\bar{x}}=\frac{\sigma}{\sqrt{n}}=\frac{43}{\sqrt{36}}=\frac{43}{6}=7.17\\ \\
\)



<p>Come abbiamo più volte ripetuto la probabilità dell&#8217;errore di 1 specie è uguale al livello di significatività, dunque 0.05 (il 5%).</p>



<p>La probabilità di errore della seconda specie è la probabilità che la media del campione casuale sia &gt;= 248.17.<br><br>Se faccio la mia rilevazione e trovo una media di 240: </p>



<p></p>



\(
z=\frac{\bar{X}_{critico}-\sigma_1}{\sigma_{\bar{x}}}=\\
\frac{248.17-240}{7.17}=\frac{8.17}{7.17}=1.14\\ \\
\)



<p>Quindi:<br> <br>P(errore seconda specie) = P(z&gt;=1.14)= 0.1271 <br>cioè circa 0.13, il 13%.</p>



<p>Se mantengo costante il livello di significatività e la dimensione del campione, ma fisso lo specifico valore alternativo della media in modo da allontanarlo dal valore fissato nell&#8217;ipotesi nulla, allora la probabilità di errore del 2°tipo diminuisce; al contrario, il valore di tale probabilità aumenterà qualora il valore alternativo venisse fissato in modo da avvicinarsi a quello dell&#8217;ipotesi nulla.</p>



<h2 class="wp-block-heading">Potenza? Ma non era una città?</h2>



<p>Nel test delle ipotesi la nozione di <strong>potenza</strong> si riferisce alla probabilità di rifiutare una ipotesi nulla, dato uno specifico valore alternativo del parametro (nel nostro esempio, la media della popolazione).</p>



Indicando con β la probabilità di errore del 2°tipo, la potenza del test è sempre 1-β



<p>Un grafico costruito in modo da rappresentare i vari livelli di potenza, dati i vari valori alternativi della media, è chiamato <strong>curva di potenza</strong>.</p>



<p>Riprendendo il nostro esempio, con il valore alternativo alla media di 240.</p>



<strong>β</strong> = P<sub>(errore seconda specie)</sub> = 0.13
<br>
<strong>potenza</strong> = 1 &#8211; β = 1 &#8211; 0.13 = 0.87
<br>
Questa è la probabilità di rifiutare correttamente l&#8217;ipotesi nulla quando μ=240.



<h2 class="wp-block-heading">Determinare la dimensione che il campione deve avere per il test della media</h2>



<p>Prima di prelevare un campione, posso determinare la dimensione che tale campione deve avere specificando:</p>



<ol class="wp-block-list">
<li>Il valore ipotizzato della media</li>



<li>Il valore alternativo della media, tale che la sua differenza dal valore dell&#8217;ipotesi nulla sia considerato importante</li>



<li>Il livello di significatività del test</li>



<li>La probabilità ammessa di errore di tipo II</li>



<li>Scarto quadratico medio sigma della popolazione.</li>
</ol>



<p>In formula:</p>



\(
n=\frac{(z_0-z_1)^2\sigma^2}{(\mu_1-\mu_0)^2}\\ \\
\)



<p><br>Nell&#8217;esempio fisso come livelli accettabili</p>



<p>Errore I specie: 0.05<br>Errore II specie: 0.10<br>sigma=43</p>



\(
n=\frac{(z_0-z_1)^2\sigma^2}{(\mu_1-\mu_0)^2}=\\
\frac{(-1.65-1.28)^2(43)^2}{(240-260)^2}=\\
\frac{(8.5849 \cdot 1849)}{400}= 39.68 \approx 40 \\
\)



<p><strong>Il valore che stavo cercando è (circa) 40.</strong></p>



<p></p>



<h2 class="wp-block-heading">Al termine di tutto questo&#8230;E se non conosco i dati della popolazione?</h2>



<p>Se non conosco il valore del sigma della popolazione, oppure se sto lavorando con piccoli campioni (meno di 30 valori) uso la <strong><a href="https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi">distribuzione t </a></strong><a href="https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi">o </a><strong><a href="https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi">distribuzione di Student</a></strong><a href="https://www.gironi.it/blog/la-distribuzione-t-e-il-test-delle-ipotesi">. Ma questo sarà l&#8217;oggetto di un prossimo articolo&#8230;</a></p>


<!-- internal-links-section -->
<h3>Potrebbe interessarti anche</h3>
<ul>
<li><a href="https://www.gironi.it/blog/ab-testing/">A/B Testing: come condurre esperimenti statisticamente validi (e gli errori da evitare)</a></li>
<li><a href="https://www.gironi.it/blog/intervalli-di-confidenza/">Intervalli di confidenza: cosa sono, come calcolarli (e cosa NON significano)</a></li>
</ul>]]></content:encoded>
					
					<wfw:commentRss>https://www.gironi.it/blog/il-test-delle-ipotesi/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
