COME FUNZIONANO I MOTORI DI RICERCA?

Cosa sono gli spider e come vengono indicizzate le pagine web

I motori di ricerca, come trovano le pagine web ?

Cominciamo nello spiegare come funzionano i motori di ricerca sorvolando sulla loro importanza nel web in quanto riteniamo sia chiara ormai a tutti. Prendendo ad esempio Google, il motore di ricerca più utilizzato del web, possiamo comprendere che ciò che caratterizza un motore di ricerca è il sistema automatico con il quale trova nella rete nuove pagine web da memorizzare nei suoi archivi. Un motore di ricerca come Google utilizza dei programmi chiamati "spider" (ragni) programmati a scansionare la rete per trovare nuove pagine da memorizzare nei propri database (datacenter). Gli spider periodicamente visitano tutti i link dei siti memorizzati fino a trovare nuovi link di nuove pagine da includere nel datacenter.

Come vengono memorizzate le pagine web?

Il web è composto da una miriade di pagine web collegate tra loro attraverso i "link" collegamenti ipertestuali (composti da testo) e ipermediali (composti da immagini). Gli spider, seguendo appunto i link, riescono ad individuare tutte le nuove pagine web presenti nella rete, e una volta trovate ne memorizza una copia (detta copia cache) nei Datacenter. La copia cache viene utilizzata quando il sito originale per qualche motivo tecnico non è reperibile, ma i risultati delle ricerche (serp) sono sempre collegati ai siti principali. Google ha molti datacenter sparsi sul pianeta utili a smistare la notevole mole di ricerche effettuate dagli utenti di internet.

Come si verifica l'indicizzazione di un sito web?

Starete già pensando che la cosa si complica... non scoraggiatevi; Questo è solo l'inizio!
Quando lo spider lanciato da Google trova il vostro sito web (grazie ad un eventuale link ricevuto da un sito già presente nel motore) e memorizza una copia (cache) delle pagine negli archivi, si dice che il sito è stato "indicizzato"; per fare subito il primo esperimento potete inserire nel campo di ricerca di Google la stringa: site:www.vostrosito.it per verificare quante pagine del nostro sito sono memorizzate negli archivi di Google; considerate che a volte servono più passaggi dello spider per memorizzarle tutte le pagine di un sito web.

Quanto tempo occorre perchè un sito web venga indicizzato?

Il tempo di indicizzazione varia a seconda dei casi. Se riuscite a ricevere un link da un sito autorevole che riceve molte visite e viene frequentemente aggiornato i tempi saranno brevi in quanto gli spider passano con più frequenza sul sito che vi linka, trovando anche il vostro. In alternativa potreste richiedere l'inserimento del sito attraverso il metodo manuale che trovate nella sezione "aggiunta e rimozione di un URL" ma per esperienza provata i tempi sono più lunghi; meglio cercare di convincere qualche web master o directory a lincarvi.

Come avviene il posizionamento nei motori di ricerca ?

Fino a qui si evince che il motore di ricerca fa tutto in automatico e con i suoi sofisticati algoritmi riesce a classificare nei primi posti quei siti che ritiene autorevoli ed atteninenti all'argomento richiesto dall'utente; ma questo lo tratteremo più avanti nella lezione classificazione dei siti.

La posizione di un sito nei risultati di ricerca viene stabilita dall'algoritmo e nessuno può manipolarla; l'unico intervento umano avviene quando un sito deve essere rimosso (Ban) dagli archivi perchè ritenuto non idoneo alle direttive del motore di ricerca, questa operazione viene effettuata dagli amministratori detti Quality Rater.

I risultati dei motori di ricerca sono composti dai posizionamenti "Organici" e "Sponsorizzati"; i primi sono ottenuti dalla qualità del sito e dalla popolarità ottenuta nel web, mentre il link sponsorizzato è un posizionamento a pagamento, ogni volta che si riceve una visita si paga al motore una quota prestabilita (PpC).

Tra i più importanti motori di ricerca troviamo:
Google - Yahoo - Msn

Condividi