Site map

I links con cui le persone possono passare da una pagina all’altra sono una caratteristica fondamentale di Internet. Il lavoro di ricerca del robot  di Yandex  si basa su operazioni sui  links e analizza questi collegamenti. Quasi tutti i documenti noti al Yandex vengono inseriti nel database di ricerca come risultato di ricerca del robot seguendo i links, e solo pochi di essi vengono aggiunti manualmente dai webmaster utilizzando il modulo “Nuova notifica site”. Se il tuo sito contiene dei documenti che sono privi di links di collegamento da pagine del sito stesso, il robot  di Yandex non saprà mai che esistono, e questi documenti non saranno quindi inclusi nella ricerca.. Per questo motivo è importante che le pagine del sito siano ben collegate tra di loro. Qui ci sono diverse raccomandazioni su come strutturare il vostro sito

1)Mantenere  una struttura di links  chiara all’interno del sito web.

Ciascun documento deve appartenere a  una sezione specifica. Assicurarsi che i visitatori possono accedere ad ogni documento utilizzando un collegamento semplice definito dal tag <A> HTML: <a href=…> … </a>. In generale, il tempo necessario dal robot di Yandex  per indicizzare una pagina interna  al sito dipende, tra le altre cose, dal suo livello di nidificazione.  Più profondo è il livello di nidificazione della pagina e più lungo può essere il tempo necessario per poterla includere nell’indice.
Durante la creazione di collegamenti da un documento all’altro sul tuo sito, si dovrebbe prendere una cosa in considerazione. La pagina principale è spesso la “landing page”. E ‘molto più facile per gli utenti del sito  memorizzare il nome del sito (nome di dominio)  piuttosto che quello di una particolare pagina interna il cui URL potrebbe  essere molto complicato. La  navigazione nel sito deve consentire all’utente di comprendere la sua struttura in modo rapido, e trovare i documenti necessari con facilità, al fine di evitare la situazione in cui l’utente, non essendo riuscito a trovare ciò che desidera abbandona il sito deluso.
2)Utilizzare  una mappa del sito;

Per i siti di grandi dimensioni con molte pagine, si consiglia di creare una mappa del sito che può essere scaricata nella sezione dei servizi di Yandex.Webmaster, o  si consiglia di includere un link alla mappa stessa  nel file robots.txt. Questo aiuterà il robot di ricerca a indicizzare e analizzare i documenti pubblicati sul tuo sito.
3)Limitare l’indicizzazione delle informazioni riservate.

Molte pagine duplicate, risultati di ricerca del sito,  statistiche delle visite e altre pagine simili possono costituire un  carico inutile per le  risorse del robot ed impedire l’indicizzazione di contenuti importanti. Tali pagine non hanno alcun valore per un motore di ricerca, in quanto non forniscono informazioni uniche per gli utenti. Si consiglia di  Impedire  la indicizzazione di tali pagine utilizzando il file robots.txt. Se non escludete  tali pagine dalla indicizzazione, può accadere che le sopra citate  pagine ausiliarie,  poichè vengano aggiornate regolarmente , saranno indicizzate bene, ma l’aggiornamento delle informazioni importanti sulle pagine più importanti del sito passerà inosservata al robot.
4)Ogni pagina deve avere un indirizzo univoco, o un URL univoco.

Sarebbe  auspicabile che l’URL  dia  un’idea del contenuto della pagina. Utilizzando un sistema di   traslitterazione degli indirizzi delle pagine aiuta anche il robot ad avere un’idea riguardo al contenuto della pagina. Ad esempio, diamo uno sguardo al seguente URL:   http://download.yandex.ru/company/experience/searchconf/Searchconf_Algoritm_MatrixNet_Gulin.pdf. Questo url  fornisce al robot di ricerca con informazioni in abbondanza sul documento: è scaricabile; molto probabilmente è in formato PDF; probabilmente è rilevante per una query che contiene parole chiave “MatrixNet”, etc.
5)Fare in modo che i link testuali  che portano ad altre sezioni delsito possano fornire  al robot ulteriori informazioni sui documenti a cui  conducono.

6)Controllare che i link simbolici siano corretti, in modo che seguendoli all’interno del sito non generino un URL che cresce all’infinito. Le pagine il cui percorso contiene più ripetizioni della stessa parte, ad esempio site.com/page/page/page/page/, dovrebbero essere escluse dall’indicizzazione.
Nota.
Utilizzando il file robots.txt, vietare l’indicizzazione delle pagine che non sono destinate agli utenti.