Con 200 milioni di pagine web esistenti, diventa di fondamentale importanza
avere a disposizione strumenti di ricerca che ci permettano di individuare
le informazioni che cerchiamo in tale mare magnum.
Le aziende scelgono il nome del loro dominio in modo da rendersi facilmente
raggiungibili anche senza l'utilizzo di Motori di ricerca, quindi il sito
ibm lo troveremo a www.ibm.com, mentre quello
della telecom italia è, guarda caso,
www.telecomitalia.it.
Se però quello che stiamo cercando sono tutte le informazioni relative,
p.e. alla tecnologia ATM, allora il problema è diverso, non stiamo
cercando una particolare ditta, ma dobbiamo effettuare una ricerca orizzontale
attraverso tutte le pagine del web.
Ecco quindi che entrano in campo i motori di ricerca che ci permettono di
specificare i criteri di ricerca con cui selezionare le pagine di nostro
interesse.
Ci sono molti server che offrono questo servizio, ripagandosi con la
pubblicità che compare nelle pagine di ricerca.
Un modo per avere in una sola pagina i più importanti motori di ricerca
è quello di andare alla pagina
home.microsoft.com/intl/it/access/allinone.asp.
È importante notare che ricerche effettuate con le stesse parole chiavi,
ma con motori diversi, possono dare risultati diversi, a causa della
dinamicità di Internet (pagine tolte, spostate o appena inserite)
e ai differenti criteri di indicizzazione.
Chi vuole controllare con esattezza il modo di indicizzazione delle proprie
pagine può usare i tag:
<META name="description"
content="L'A.I.P. è un'associazione che
si pone lo scopo di rappresentare gli Informatici
Professionisti">
<META name="keywords" content="AIP, A.I.P.
Associazione, Informatici,
Professionisti">
Le parole contenute in ambedue i tag vengono utilizzate come chiavi di accesso,
ed il contenuto del primo tag viene usato come descrizione nella pagina di
risultato restituita dal motore di ricerca.
Se si vogliono escludere alcune pagine dall'azione di indicizzazione portata
avanti automaticamente dai motori di ricerca, è possibile utilizzare
il file
robots.txt.
Ultimo aggiornamento effettuato il 07 - Jan - 1998