come funzionano i motori di ricerca

Come funziona un motore di ricerca?

Indice: Come funziona un motore di ricerca?

Come funziona un motore di ricerca ? E’ una delle prime domande che un professionista che opera nel mondo del web dovrebbe porsi. Dal nostro punto di vista è però importante che anche chi è alla ricerca di un esperto in web design o di un valido consulente SEO (Search Engine Optimization) per l’ottimizzazione del proprio sito web, possegga alcune nozioni di base per poter valutare meglio il lavoro svolto dall’agenzia web.
Il presente articolo di approfondimento (liberamente tratto da Wikipedia) non è chiaramente rivolto a chi mastica già un po’ di SEO ma all’utente medio della rete desideroso di conoscere qualcosa in più sull’argomento.

come funzionano i motori di ricerca

Un motore di ricerca (in inglese Search Engine) è un software che analizza un insieme di dati e restituisce un indice dei contenuti disponibili classificandoli in modo automatico in base ad algoritmi e formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca.
Il campo in cui motori di ricerca trovano maggiore utilizzo è quello del web.

Motori di ricerca per internet

Sono tantissimi i motori di ricerca attivi sul web. Il più utilizzato su scala mondiale è sicuramente Google; poi abbiamo Yahoo, il cinese Baidu e anche Live e Bing (motori di ricerca di Microsoft). Esistono poi motori utilizzati prevalentemente solo in alcune zone geografiche, come il motore di ricerca russo Yandex.
Fra i motori di ricerca nati in Italia ricordiamo Arianna, inglobato nei portali Libero e Virgilio anche se oggi questi motori di ricerca si limitano a riutilizzare i risultati di Google.
La maggior parte dei motori di ricerca utilizzano algoritmi proprietari e database tenuti segreti.

Il lavoro dei motori di ricerca si divide principalmente in tre fasi:

1) L’analisi delle pagine presenti sul web (tramite l’uso di crawler o spider appositi);
2) L’archiviazione e catalogazione del materiale ottenuto;
3) La risposta alle richieste dell’utente;

Archiviazione e Catalogazione

Dopo l’analisi delle pagine, alcune di esse vengono inserite nel database e nell’indice del motore di ricerca.
Il testo delle pagine archiviato durante la fase di analisi, verrà in seguito analizzato per fornire le risposte alle ricerche degli utenti. Alcuni Search Engine mettono a disposizione una copia dei dati testuali di ogni pagina archiviata: questa funzione è detta cache della pagina.

Risposta

L’utente immette una ricerca e riceve un elenco di risultati.
La rilevanza di una pagina web viene stabilita innanzitutto dalla presenza della parola chiave inserita dall’utente, dopodiché ogni motore di ricerca sfrutta i propri algoritmi per posizionare le pagine, controllando, per esempio una serie di altri fattori tra cui: quanti link riceve quel documento, in quali punti della pagina sono poste le parole chiave, quanti siti del database contengono link verso quella pagina e tanti altri fattori di posizionamento.

Risultati sponsorizzati

Insieme ai risultati che scaturiscono dal posizionamento naturale, i motori di ricerca forniscono anche risultati sponsorizzati, ovvero mostrano nelle SERP (Search Engine Result Pages) anche le pagine web di aziende che pagano per risultare tra i primi risultati quando si cercano determinate keyword o parole chiave che sono in relazione all’ambito di competenza dell’azienda stessa.

Opzioni di ricerca e raffinamento

La possibilità di raffinare la ricerca varia da motore a motore, ma la maggior parte permette di utilizzare operatori booleani oppure a seconda della lingua del documento, delle parole o frasi presenti o assenti, del formato dei file (Microsoft Word, PDF, PostScript, ecc.), a seconda della data di ultimo aggiornamento, e altro ancora.

Lo sviluppo e il futuro dei motori di ricerca

L’evoluzione degli algoritmi e dei sistemi di Information Retrieval si basano sull’analisi semantica dei termini e sulla conseguente creazione di reti semantiche. Lo stesso Google ha adottato sistemi per la prevenzione dell’errore e la contestualizzazione dei risultati.
Già oggi i motori di ricerca basano le proprie tecnologie sia sull’analisi quantitativa dei contenuti (le parole in sé), sia soprattutto su quella qualitativa (la semantica, il senso delle parole) basandosi anche sul contesto in cui le parole sono inserite.

Un altro concetto molto importante che sta acquisendo una rilevanza sempre maggiore è che internet è sempre più uno strumento a misura d’utente. I motori di ricerca già oggi sono in grado di proporre in maniera autonoma alcuni “contenuti su misura” per il fruitore. Nel prossimo futuro questa tendenza verrà esasperata e, addirittura prima di essere interpellati dagli utenti, i motori di ricerca saranno in grado di selezionare le notizie più consone allo stile di vita, agli interessi ed alle attitudini del visitatore. Ciò presuppone che il motore di ricerca dovrà “conoscerci” sempre di più … dovrà analizzare con efficacia una considerevole mole di dati personali degli utenti (dalla cronologia dei browser fino agli immancabili profili social: Facebook, Twitter, Linkedin, ecc.) con le conseguenti problematiche relative alla tutela e trattamento dei dati personali degli utenti.

Si tratta di un argomento in notevole fermento e dove i motori di ricerca si sono già mossi. Dal nostro punto di vista: aggiorniamoci per non rimanere tagliati fuori.

Condividi articolo

Tag