Google Sitemap è uno strumento che lo stesso Google
mette a disposizione dei webmaster per tenere sotto controllo e sensibilizzare
il passaggio degli spider sul sito web. E' un tool che permette di
attirare l'attenzione degli spider quando effettuiamo
una modifica o aggiungiamo una risorsa nel sito. Google sitemap offre
anche servizi di diagnostica e di statistica, ma in questo corso ci
concentreremo sulla sitemap.
Come si attiva la Google Sitemap?
1- Occore aprire un' account sitemap impostando user e password.
2- Nella pagina iniziale denominata "Bacheca"
c'è un campo di testo nella quale dovete inserire l'indirizzo
del vostro sito web e poi cliccare sul bottone "aggiungi sito"
il sito apparirà in elenco.
3- Cliccare nell'indirizzo del sito in elenco e individuate
la voce "Verifica il tuo sito" e nella pagina
successiva cliccate la voce "Scegli il modo di verifica"
dal menù a tendina selezionare "Carica file html"
4- Annotare il numero seriale che dovrà essere
il nome di una pagina web vuota caricata nella _root del vostro dominio
(dove si trova la index.html)
5- Una volta che il sito è verificato occorre
creare la sitemap.xml potete utilizzare questo
tool
lasciando per il momento i parametri di default scaricare
la sitemap nella cartella del vostro sito e caricatela nella root
del dominio.
6- Ritornate in Google Sitemap, nella sezione Sitemap
cliccare su "aggiungere una sitemap" e come tipo scegliere
"sitemap generale" ed il giuoco è fatto!
7- Attendere il responso di avvenuto caricamento,
ma seguendo correttamente la procedura è matematico.
D' ora in poi quando effettuerete un'aggiornamento dovete ritornare sul tool nella sezione "sitemap" e cliccare su "reinvia selezione"; se invece aggiungete nuove pagine dovete ricreare l'xml e ricliccare il medesimo tasto. Nonostante in qualche Forum alcuni Seo dubitano di questo servizio, qualche beneficio noi lo abbiamo riscontrato, sopratutto nell'indicizzazione delle nuove pagine... con un unico passaggio le memorizza tutte. Comunque considerate sempre che il passaggio dello spider avviene automaticamente ed intensificato da Google in base al traffico sul vostro sito... nel sito della CNN, ad esempio, passa addirittura più volte al giorno.
Ma il file robots non serve più?
Il file robots.txt serve e come! Soprattutto quando non volete che una certa directory o pagina web venga messa in cache dagli spider... quindi indicizzata e visibile nei risultati. Se si trattasse di dati personali sarebbe un pò scocciante ritrovarli nelle serp non trovate? Il file robots.txt è la prima risorsa che gli spider vanno a cercare, una volta entrati nel dominio, per seguire le istruzioni del webmaster; quali pagine indicizzare e quali no. La sintassi è questa:
User-agent: * Fà riferimento a tutti gli spider di tutti i motori, lasciato così significa tutto ok!
User-agent: *
Disallow: contatti.html Gli spider non devono indicizzare
il file o la cartella indicata in Disallow
Disallow: /images
Per scriverlo serve il comune Notepad del sistema operativo e ricordate di salvare il file come "robots.txt"
| Condividi |

