Fare scraping dei meta dati in Google Sheet

Google Sheets è uno strumento semplice quanto versatile, capace di automatizzare la risoluzione di noiose operazioni di routine in maniera rapida ed efficace.

Esistono soluzioni interessantissime che si integrano in Fogli come risorse aggiuntive (penso a cose come Supermetrics, o Analytics Canvas per citare due esempi notissimi). Eppure, Fogli consente di fare mille cose già con le funzioni base.

Veniamo dunque all’esempio. Parto dall’esigenza di ricavare, data una lista di URL, il contenuto dei tags Titolo, Meta Description e Meta Keywords. Fare cioè un po’ di scraping di base, come si dice nel gergo seo…

In Fogli la soluzione è di una semplicità disarmante.

Apro un nuovo foglio e lo chiamo come voglio.
In A1,B1,C1,D1 metto i titoli “URL”,”Titolo”,”Descrizione”,”Meta Keywords”.
Ora mi posiziono in A2 e incollo la lista delle URL da analizzare.

In B2 ecco la formula magica :). E’ proprio semplice come sembra, e funziona.

=IMPORTXML (A2;“//title/text ()”)

Analogamente in C2:

=IMPORTXML(A2; “//meta[@name=’description’]/@content”)

E in D2:

=IMPORTXML(A2;“//meta[@name=’keywords’]/@content”)

Ora evidenzio le celle B1,C1,D1, vado nell’angolo in basso a destra. Mi compare il simbolo del +
Trascino verso il basso fino ad arrivare all’ultima riga dove è presente una URL.

Fatto! I campi si popoleranno in pochi secondi con i dati richiesti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *