News originale Yahoo introduce nuove funzioni per il file robots.txt

Internet
Yahoo introduce nuove funzioni per il file robots.txt

Yahoo ora permette ai webmaster di bloccare l'accesso degli spiders su specifiche url badandosi sui parametri frequentemente utilizzati nei siti dinamici.

Il riferimento che viene utilizzato è relativo alle landing pages pubblicitarie (le pagine web utilizzate cioè come pagine di accesso per le campagne di web marketing o pay per click del sito) ma lo stesso riferimento può allo stesso modo essere utilizzato per CMS o shopping cart per la prevenzione di contenuti duplicati che, in caso di indicizzazione, genererebbe una pericolosa fattispecie di spam, punibile dai motori di ricerca.

Facciamo un esempio di una url dinamica che un sito desidera NON indicizzare. Questo parametro sarebbe stato utilizzato per la funzione “stampa questa pagina” e sarebbe stato visto come contenuto duplicato dai motori di ricerca in quanto pagina portatrice del medesimo contenuto di un'altra presente nel sito:

esempio:
http://www.sito.com/cat/prod.do?product_it=123%tp=print


Il seguente comando contenuto nel file robots.txt previene il problema impedendo a Yahoo! di indicizzare tutte le pagine presenti nel sito, del tipo descritto nell'esempio di cui sopra.

Ecco il codice:
User-Agent: Yahoo! Slurp
Disallow: /*tp=print


Tutte le url che contengono al loro interno il testo: “tp=print” non verranno indicizzate da Yahoo!.

Stefano Mc Vey Cduweb.com in esclusiva per pc-facile.com


Internet: steve65 [19 Luglio 07 @ 12:00 pm]

Lascia un commento

Insulti, volgarità e commenti ritenuti privi di valore verranno modificati e/o cancellati.
Nome:

Commento:Il commento è stato inserito correttamente.
Conferma visiva:

Inserisci la lettera che vedi nell'immagine.

Login | Iscriviti

Username:

Password: