  {"id":3863,"date":"2026-06-24T11:15:32","date_gmt":"2026-06-24T10:15:32","guid":{"rendered":"https:\/\/www.gironi.it\/blog\/percorso-machine-learning\/"},"modified":"2026-06-24T12:08:45","modified_gmt":"2026-06-24T11:08:45","slug":"percorso-machine-learning","status":"publish","type":"page","link":"https:\/\/www.gironi.it\/blog\/percorso-machine-learning\/","title":{"rendered":"Machine learning e regressione: il percorso completo, dalla retta agli algoritmi"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">C&#8217;\u00e8 un confine che molti immaginano netto e che invece non esiste: quello tra la statistica &#8220;di sempre&#8221; e il <em>machine learning<\/em>. Da una parte la regressione, che a scuola si presenta come una retta tirata in mezzo a una nuvola di punti; dall&#8217;altra gli algoritmi che apprendono dai dati, circondati da un&#8217;aura quasi misteriosa. <strong>In realt\u00e0 il machine learning non \u00e8 un mondo a parte: \u00e8 il proseguimento naturale della stessa idea che muove la regressione \u2014 usare ci\u00f2 che abbiamo osservato per dire qualcosa su ci\u00f2 che ancora non abbiamo visto.<\/strong> Una retta che prevede le vendite a partire dalla spesa pubblicitaria e un albero decisionale che classifica i visitatori in clienti e non clienti rispondono, in fondo, alla stessa domanda: dato quello che so, cosa \u00e8 ragionevole aspettarmi?<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Capire questo legame, per\u00f2, non significa saltare a pi\u00e8 pari sugli algoritmi pi\u00f9 alla moda. Significa percorrere una strada che parte dalla relazione pi\u00f9 semplice tra due grandezze \u2014 la correlazione \u2014 sale fino ai modelli di regressione che mettono in conto pi\u00f9 variabili insieme, impara a riconoscere quando quei modelli scricchiolano, e solo allora attraversa il confine verso gli algoritmi che chiamiamo machine learning veri e propri. Affrontati in quest&#8217;ordine, gli alberi decisionali, la discesa del gradiente e la riduzione delle dimensioni smettono di sembrare magia e si rivelano per quello che sono: estensioni ingegnose di idee che gi\u00e0 conoscevamo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Questa pagina \u00e8 quella strada, ordinata. Non rispieghiamo qui la teoria: ogni tappa \u00e8 un articolo del blog, e l&#8217;ordine in cui le abbiamo messe \u00e8 l&#8217;ordine in cui conviene leggerle. Chi parte da zero pu\u00f2 seguirle in sequenza; chi ha gi\u00e0 delle basi pu\u00f2 saltare al gruppo che gli serve. Le due sezioni che seguono \u2014 prima la regressione, poi il machine learning \u2014 sono i due versanti di un unico crinale. Cominciamo dal versante che conosciamo meglio.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">La regressione<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Prima degli algoritmi che apprendono serve padroneggiare il modo pi\u00f9 antico e collaudato di legare le variabili tra loro: spiegare o prevedere una grandezza a partire da una o pi\u00f9 altre. \u00c8 il cuore della statistica applicata, ed \u00e8 anche il terreno su cui poggiano, spesso senza dirlo, molti modelli di machine learning.<br> <strong>Chi sa leggere davvero una regressione ha gi\u00e0 in mano met\u00e0 degli strumenti concettuali che gli serviranno pi\u00f9 avanti.<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/correlazione\/\">La correlazione<\/a> \u00e8 il punto di partenza non negoziabile. Misura se e quanto due grandezze si muovono insieme \u2014 la spesa in annunci e le conversioni, il tempo sulla pagina e il tasso di acquisto \u2014 riassumendo in un solo numero la forza del loro legame. \u00c8 la prima domanda da porsi davanti a due variabili, e capirla bene insegna anche la lezione pi\u00f9 importante di tutto il percorso: correlazione non \u00e8 causa.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/regressione-lineare-semplice\/\">La regressione lineare semplice<\/a> compie il passo successivo: dalla constatazione che due grandezze si muovono insieme alla costruzione di un modello che usa l&#8217;una per <em>prevedere<\/em> l&#8217;altra. \u00c8 la retta tirata tra i punti, s\u00ec, ma soprattutto \u00e8 il primo modello predittivo vero, quello da cui ogni cosa pi\u00f9 complessa prende le mosse. Qui si imparano i concetti \u2014 coefficienti, residui, bont\u00e0 di adattamento \u2014 che torneranno in ogni tappa successiva.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/regressione-multipla-spiegata-semplice\/\">La regressione multipla<\/a> generalizza l&#8217;idea al caso realistico: non una sola causa, ma molte che agiscono insieme. Le vendite non dipendono solo dal budget pubblicitario, ma anche dalla stagione, dal prezzo, dal canale. Imparare a far convivere pi\u00f9 predittori nello stesso modello \u2014 e a interpretarne i pesi senza ingannarsi \u2014 \u00e8 il salto che porta dalla statistica da manuale ai problemi reali.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/multicollinearita-eteroschedasticita-autocorrelazione\/\">Multicollinearit\u00e0, eteroschedasticit\u00e0 e autocorrelazione<\/a> sono i tre modi pi\u00f9 comuni in cui una regressione, all&#8217;apparenza impeccabile, ci tradisce. Variabili troppo legate tra loro, errori che non si comportano come dovrebbero, residui che si trascinano nel tempo: riconoscere questi sintomi \u00e8 ci\u00f2 che distingue chi applica un modello a occhi chiusi da chi sa quando fidarsene. \u00c8 la tappa che insegna la prudenza.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/la-regressione-logistica\/\">La regressione logistica<\/a> chiude la sezione spostando il tiro dal <em>quanto<\/em> al <em>se<\/em>: non pi\u00f9 prevedere un valore numerico, ma la probabilit\u00e0 che un evento accada \u2014 un clic, una conversione, un abbandono. \u00c8 il modello che fa da cerniera verso il machine learning, perch\u00e9 \u00e8 al tempo stesso una regressione a tutti gli effetti e uno dei classificatori pi\u00f9 usati in assoluto. Chi la padroneggia ha gi\u00e0 messo un piede sull&#8217;altro versante.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Il machine learning<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Superata la regressione, il confine si attraversa quasi senza accorgersene. Gli algoritmi di questa sezione condividono lo stesso obiettivo \u2014 imparare dai dati per prevedere o classificare \u2014 ma lo perseguono con strumenti pi\u00f9 flessibili, capaci di cogliere relazioni che una retta non vedrebbe mai.<br> Qui il vocabolario cambia un po&#8217; (<em>training<\/em>, <em>feature<\/em>, <em>overfitting<\/em>), ma la logica di fondo resta quella che abbiamo costruito fin qui.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/machine-learning-una-guida-per-i-principianti\/\">I concetti di base del machine learning<\/a> sono la mappa d&#8217;ingresso a questo territorio. Cosa significa davvero &#8220;addestrare&#8221; un modello, qual \u00e8 la differenza tra apprendimento supervisionato e non supervisionato, perch\u00e9 un modello che va benissimo sui dati di addestramento pu\u00f2 fallire miseramente su quelli nuovi: sono le idee che danno senso a tutto ci\u00f2 che segue, e conviene fissarle prima di toccare un singolo algoritmo.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/come-usare-gli-alberi-decisionali-per-classificare-i-dati\/\">Gli alberi decisionali<\/a> sono spesso il primo algoritmo di machine learning che conviene incontrare, perch\u00e9 ragionano nel modo pi\u00f9 umano che ci sia: una sequenza di domande s\u00ec\/no che, passo dopo passo, separa i casi in gruppi sempre pi\u00f9 omogenei. Sono intuitivi, si leggono a colpo d&#8217;occhio, e costituiscono il mattone con cui si costruiscono modelli ben pi\u00f9 potenti come le foreste casuali. Sono il ponte ideale tra la regressione e gli algoritmi pi\u00f9 astratti.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/lalgoritmo-di-discesa-del-gradiente-gradient-descent-spiegato-semplice\/\">La discesa del gradiente<\/a> \u00e8 il motore che, dietro le quinte, fa funzionare una quantit\u00e0 enorme di modelli \u2014 dalla stessa regressione fino alle reti neurali. \u00c8 il metodo con cui un algoritmo <em>impara<\/em>: aggiustando i propri parametri un piccolo passo alla volta, scendendo lungo la superficie dell&#8217;errore fino al punto pi\u00f9 basso che riesce a raggiungere. Capirne l&#8217;idea, semplice e potente, svela cosa accade davvero quando diciamo che &#8220;il modello si addestra&#8221;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/www.gironi.it\/blog\/una-introduzione-allanalisi-delle-componenti-principali-pca\/\">L&#8217;analisi delle componenti principali (PCA)<\/a> affronta il problema opposto rispetto alla previsione: non aggiungere informazione, ma ridurla senza perderne l&#8217;essenziale. Quando le variabili in gioco sono decine, la PCA le comprime in poche dimensioni nuove che ne catturano la maggior parte della variabilit\u00e0, rendendo i dati leggibili e i modelli pi\u00f9 snelli. \u00c8 l&#8217;esempio pi\u00f9 elegante di apprendimento non supervisionato, e chiude il percorso mostrando che il machine learning non serve solo a prevedere, ma anche a <em>vedere<\/em> meglio ci\u00f2 che abbiamo davanti.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Da dove cominciare<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Se questo \u00e8 il primo contatto con la materia, il punto d&#8217;ingresso \u00e8 uno solo: <a href=\"https:\/\/www.gironi.it\/blog\/correlazione\/\">la correlazione<\/a> e, subito dopo, <a href=\"https:\/\/www.gironi.it\/blog\/regressione-lineare-semplice\/\">la regressione lineare semplice<\/a>. Sono le due tappe da cui tutto il resto prende senso; affrontati gli algoritmi pi\u00f9 sofisticati senza questa base, prima o poi si torna sempre qui, alla domanda elementare di come una grandezza dipenda da un&#8217;altra.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Questo \u00e8 uno dei percorsi tematici che stiamo costruendo per orientarsi tra gli articoli del blog: la regressione e il machine learning sono il modo in cui i dati passano dalla descrizione alla previsione. Chi vuole le fondamenta che vengono prima \u2014 descrivere e riassumere i dati \u2014 le trova nel percorso di <a href=\"https:\/\/www.gironi.it\/blog\/statistica-di-base\/\">statistica di base<\/a>; chi vuole capire come si stabilisce se un effetto \u00e8 reale o solo apparente \u2014 il terreno su cui ogni modello, prima o poi, va messo alla prova \u2014 pu\u00f2 passare al percorso dedicato alla <a href=\"https:\/\/www.gironi.it\/blog\/statistica-inferenziale\/\">statistica inferenziale<\/a>, la cassetta degli attrezzi da cui anche il machine learning, presto o tardi, finisce per attingere.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>C&#8217;\u00e8 un confine che molti immaginano netto e che invece non esiste: quello tra la statistica &#8220;di sempre&#8221; e il machine learning. Da una parte la regressione, che a scuola si presenta come una retta tirata in mezzo a una nuvola di punti; dall&#8217;altra gli algoritmi che apprendono dai dati, circondati da un&#8217;aura quasi misteriosa. &hellip; <a href=\"https:\/\/www.gironi.it\/blog\/percorso-machine-learning\/\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;Machine learning e regressione: il percorso completo, dalla retta agli algoritmi&#8221;<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_uag_custom_page_level_css":"","footnotes":""},"class_list":["post-3863","page","type-page","status-publish","hentry"],"uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"post-thumbnail":false},"uagb_author_info":{"display_name":"Paolo Gironi","author_link":"https:\/\/www.gironi.it\/blog\/author\/autore-articoli\/"},"uagb_comment_info":0,"uagb_excerpt":"C&#8217;\u00e8 un confine che molti immaginano netto e che invece non esiste: quello tra la statistica &#8220;di sempre&#8221; e il machine learning. Da una parte la regressione, che a scuola si presenta come una retta tirata in mezzo a una nuvola di punti; dall&#8217;altra gli algoritmi che apprendono dai dati, circondati da un&#8217;aura quasi misteriosa.&hellip;","_links":{"self":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/pages\/3863","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/comments?post=3863"}],"version-history":[{"count":1,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/pages\/3863\/revisions"}],"predecessor-version":[{"id":3870,"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/pages\/3863\/revisions\/3870"}],"wp:attachment":[{"href":"https:\/\/www.gironi.it\/blog\/wp-json\/wp\/v2\/media?parent=3863"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}