Il file xml della mappa del sito di cui hai bisogno. Come creare e inviare mappe del sito. Requisiti generali per la mappa del sito

Scopriamo come creare una Sitemap, in cosa consiste, quali sono i requisiti per una Sitemap per i motori di ricerca. Materiale aggiornato.

Sitemap o Sitemap è un file creato appositamente con un elenco di pagine di risorse che devono essere indicizzate.


Perché hai bisogno di una Sitemap

Esistono due tipi di Sitemap, che differiscono per formato e scopo:

Mappa HTML

È compilato per gli utenti per facilitare loro la navigazione nelle pagine del sito. Questo è un elemento facoltativo, tale mappa può essere compilata su un sito di grandi dimensioni con una gerarchia complessa per la comodità degli utenti.

Mappa XML

È necessario per i bot di ricerca, è importante per la SEO, in quanto aiuta i bot a indicizzare le pagine di una risorsa.La presenza di questo file dice ai robot di ricerca esattamente come è organizzata la struttura del sito. Di conseguenza, Yandex, Google, Bing e altri motori di ricerca hanno l'opportunità di indicizzare meglio il progetto.

In questo articolo analizzeremo la creazione Mappe XML.

A cosa serve la mappa del sito:

  1. Velocizza l'intero processo di indicizzazione.
    I crawler di Google possono saltare le pagine create o modificate di recente e la mappa ti aiuterà a esplorarle.
  2. Fornisci ulteriori informazioni.
    Ulteriori raccomandazioni per il robot sono indicate nella Mappa: prendono nota dell'importanza della pagina, della frequenza e della data degli aggiornamenti.
  3. Visualizza il numero di URL indicizzati
    I segnali dalla Sitemap sono necessari anche per visualizzare i link indicizzati in Search Console.
  4. Velocizza il processo di deindicizzazione batch.
    Per fare ciò, crea una mappa del sito temporanea, che includa le pagine da eliminare. Su questo, consiglia di assicurarsi di indicare la data dell'ultima modifica delle pagine, quando è stato assegnato loro un codice di errore 404 o l'attributo noindex. Questo dirà a Google di eseguire nuovamente la scansione del contenuto del sito. Dopo alcuni mesi, questa mappa del sito temporanea può essere rimossa.

Allo stesso tempo, anche se Google trova un link nella Sitemap, ma non è nella navigazione, non gli darà alcun peso e indice. I link nella Sitemap sono consigli, la cosa più importante è crearne uno competente, in cui il robot di ricerca troverà tutte le pagine necessarie.

Nella maggior parte dei casi, un collegamento esterno e interno competente delle pagine è sufficiente per consentire ai robot di ricerca di conoscere tutti i contenuti del sito. Le pagine di destinazione, i piccoli siti aziendali di un paio di pagine, i biglietti da visita di una pagina non hanno bisogno di una mappa del sito: il bot capirà le pagine senza difficoltà. Le mappe sono necessarie per i siti difficili da scansionare, quindi si consiglia di crearle per altri progetti.

Una mappa è sicuramente necessaria per i siti con le seguenti caratteristiche:

  • Il progetto è stato creato di recente, ha pochi link esterni. In questo caso, è più difficile per un bot di ricerca trovare un sito.
  • Nella struttura del sito sono presenti molti archivi di documenti web non correlati tra loro.
  • Il progetto ha un gran numero di pagine, sezioni e sottosezioni;
  • La struttura è dominata da pagine dinamiche.
  • Il sito ha contenuti multimediali. Il bot sarà in grado di ottenere ulteriori informazioni dalla Sitemap per la visualizzazione nei risultati di ricerca.

I motori di ricerca potrebbero non indicizzare tutte le pagine richieste di tali siti se non offrono ai crawler un file Sitemap. Vediamo come crearlo.


Criteri di base per la creazione di una mappa del sito

I motori di ricerca hanno i propri requisiti per la preparazione di una Sitemap che un webmaster deve tenere a mente.

Requisiti generali per la mappa del sito:

  1. Il numero di URL in un file mappa del sito non deve superare i 50 mila. Se ce ne sono più, è necessario creare più sitemap separate, che vengono registrate nel file indice Sitemap. Per questo, è sufficiente creare diversi file Sitemap separati, non più di 50 mila collegamenti ciascuno, e il totale dei collegamenti può superare il limite. Successivamente, viene creato un file Sitemap padre comune per diverse mappe.
  2. La dimensione massima del file è 50 MB. Il file può essere ridotto utilizzando la compressione, ma deve comunque essere inferiore a 50 MB non compresso.
  3. La mappa del sito deve trovarsi nello stesso dominio del sito Web per il quale è stata creata.
  4. Puoi utilizzare la codifica UTF-8, nonché lettere e numeri latini.
  5. per accedere al file Sitemap, deve essere presente uno stato HTTP con codice 200 OK.
  6. Gli identificatori dell'URL di sessione non devono essere nella Sitemap.
  7. I collegamenti devono avere la stessa sintassi.
  8. La mappa contiene solo URL canonici.
  9. La mappa non è in conflitto con le informazioni in robots.txt: se alcune pagine in robots.txt vengono chiuse dall'indicizzazione, non dovrebbero essere nella mappa.

Alcuni webmaster sono preoccupati per l'ordine dei link nel file, ma il rappresentante di Google dice che l'ordine non ha importanza, l'importante è inserire i link canonici più importanti nella Sitemap.


Formati di Sitemap accettabili

C'è un requisito speciale per il formato del file della mappa del sito. Puoi creare una mappa del sito come file XML, file di testo o tramite RSS, mRSS e Atom 1.0. Yandex sottolinea che la ricerca non supporta la trasmissione di feed RSS e Atom tramite Sitemap. Se scegli come target motori di ricerca diversi, usa il formato XML. Le regole per la creazione di un file sono descritte nello standard.

Tag della mappa del sito del servizio

Tag richiesti per la mappa del sito:

  • - contenitore indicante lo standard del protocollo;
  • - il tag genitore per ogni voce URL;
  • - specificando un URL, inizia con un prefisso, ad esempio http o https.

Tag aggiuntivi:

  • - la frequenza di aggiornamento di un documento web con gli attributi mai, sempre, annuale, mensile e così via;
  • - data dell'ultimo aggiornamento della pagina;
  • - un'indicazione della diversa importanza delle pagine delle risorse da 0.1 a 1, determina l'ordine di elaborazione dell'URL su questo sito. Google non lo supporta. La priorità può essere data alle pagine più importanti e non ha senso indicare priorità alta a tutti i link, quindi il tag non influenzerà assolutamente nulla.

Altre versioni linguistiche del sito sono specificate utilizzando l'attributo hreflang.

Esempio di Sitemap XML

La mappa del sito per un sito, se fosse costituita da una pagina e contenesse i tag menzionati, potrebbe avere il seguente aspetto:

http://www.сайт/ 2016-03-21 daily 0.8

Come creare e dove posizionare una mappa del sito?

Se lo desideri, puoi creare manualmente una Sitemap, ma è troppo laborioso e inutile - la Sitemap dovrebbe essere dinamica se aggiorni regolarmente il sito - pubblicare nuovi post sul blog, sviluppare un negozio online. È meglio creare automaticamente la tua mappa del sito utilizzando servizi online gratuiti e plug-in CMS.

Una mappa del sito è una pagina sitemap.html (per i visitatori, aiuta a navigare e trovare più facilmente qualsiasi pagina su un sito di grandi dimensioni) o un file sitemap.xml (per i motori di ricerca) che contiene un elenco dettagliato di tutte le pagine su un sito web.

Sitemap ti consente di ridurre il numero di transizioni durante la ricerca della pagina desiderata su qualsiasi sito, anche il più grande. Una mappa del sito ben sintonizzata può aumentare l'indicizzazione delle pagine del sito web.

Quali sono le caratteristiche di una mappa del sito?

I motori di ricerca sono in grado di eseguire la scansione di tutti gli indirizzi dei siti da soli, ma la creazione di una mappa del sito li aiuterà a sapere come farlo al meglio.

La mappa del sito ti consente di:

  • trovare nuove pagine sulla risorsa e indicizzarle;
  • dare priorità alle pagine;
  • tenere traccia delle modifiche recenti sulle pagine indicizzate;
  • ricordare la frequenza di aggiornamento delle pagine indicizzate.

Cosa sono le mappe del sito?

In generale, ci sono due varianti di una mappa del sito: web sitemap.html e il file sitemap.xml. Consideriamoli in modo più dettagliato.

Che cos'è Sitemap.html?

Questa è una pagina HTML statica che elenca i collegamenti a tutte le pagine principali del sito. Questo formato della mappa del sito è focalizzato sui visitatori del sito e ti consente di accedere a qualsiasi pagina con 1 clic.

Sitemap.html ha una struttura ad albero con sezioni espanse.


Per i siti con una struttura HTML molto complessa, la mappa del sito può essere costituita da pagine con un livello di annidamento aggiuntivo.
Un esempio è la mappa del sito di TripAdvisor.

Che cos'è sitemap.xml?

Questo è un file situato nella directory principale del sito, che viene letto da tutti i motori di ricerca esistenti. Il suo ruolo è quello di mostrare ai motori di ricerca tutti gli indirizzi delle pagine che devono essere indicizzati; quando sono apparsi o sono stati aggiornati; quanto spesso ricontrollare le pagine per gli aggiornamenti.

Un file sitemap.xml può contenere fino a 50.000 collegamenti. Con un numero maggiore di collegamenti, ci saranno diversi file di questo tipo. Ulteriori vantaggi: la possibilità di specificare la frequenza di aggiornamento della pagina e la priorità dell'indicizzazione. La codifica corretta del file sitemap.xml deve essere UTF-8 e la sua dimensione è limitata a 10 MB.
Ecco un esempio di mappa del sito in formato .xml:



http://mysite.ru/
2017-09-18T18:54:13+04:00
always
1.0


http://mysite.ru/category/
2017-09-18T18:57:09+04:00
hourly
0.8


http://mysite.ru/page/
2017-09-18T18:59:37+04:00
daily
0.6

Come creare una mappa del sito?

Esistono diversi metodi per creare una mappa del sito per la tua risorsa:

  • Staticamente manualmente. Questo metodo è adatto per utenti avanzati che hanno familiarità con i tag di base e il sito Web è costituito da un numero limitato di pagine.
  • Attraverso il generatore di mappe del sito. Se non vuoi fare il lavoro faticoso e noioso di generare manualmente una mappa del sito, un programma per la creazione di una mappa del sito è al tuo servizio. Ci sono opzioni gratuite e a pagamento: e molte altre.
  • Plugin per CMS o strumenti del motore. Un altro buon modo per generare una mappa del sito. Molti vantaggi sotto forma di configurazione flessibile per i parametri richiesti e gli indirizzi massimi possibili, oltre a un notevole risparmio di tempo. Inoltre, quando apporti modifiche a una pagina o crei nuove pagine, la mappa del sito verrà aggiornata automaticamente, a differenza di una mappa del sito creata in modo diverso. Ogni sistema ha il suo plugin:
    • per CMS WordPress ha sviluppato plugin seo con la funzione di creare una mappa del sito;
    • Xmap esiste per Joomla;
    • DLE - c'è un modulo integrato.

Una sfumatura utile!

Se escludi dalla mappa del sito pagine che non sono di beneficio commerciale o informativo (ad esempio, alcune pagine che non sono pagine di destinazione, alcune ausiliarie, di transito), il robot di ricerca spenderà meno delle sue risorse per la scansione del sito.

E poiché la risorsa è limitata, diventa più probabile che il robot aggiri le pagine di cui abbiamo bisogno. Creando una mappa del sito tramite un plug-in, puoi escludere immediatamente determinati tipi di pagine da lì. Puoi aggiungerli in seguito, se necessario. Rilevante per siti di grandi dimensioni.

Con quale frequenza deve essere aggiornata la mappa del sito?

Non esiste un unico standard per il numero di aggiornamenti. Tutto dipende dalla frequenza di creazione di nuove pagine di risorse, dalla modifica degli indirizzi o dal contenuto e dai collegamenti delle pagine esistenti.

Vale la pena ricordare che i dati specificati nella mappa del sito vengono percepiti dal robot di ricerca come raccomandazione: se imposti la frequenza degli aggiornamenti, ad esempio, una volta all'anno, il robot verrà più spesso e se una volta all'ora, il robot non indicizzerà la pagina così spesso.

Come collegarsi correttamente a sitemap.xml in robots.txt

Per cominciare, la sitemap xml deve essere creata e caricata sul server, quindi è possibile aggiungere un'indicazione della presenza del file.

Per fare ciò, aggiungi la seguente riga in robots.txt:

Sitemap: (url-sitemap),
dove (url-file-sitemap) è l'URL completo della tua sitemap.

Di conseguenza, robots.txt avrà il seguente aspetto:

Agente utente: *
Mappa del sito: httr: //mysite.com/sitemap.xml.

Errori frequenti nella mappa del sito

Gli errori più comuni sono:

  • collegamenti interrotti;
  • reindirizzamenti;
  • Data di pubblicazione o aggiornamento errata per i contenuti.

Gli errori non avranno un impatto critico su come i motori di ricerca percepiscono il tuo sito. Tuttavia, eliminarli ti consentirà di indirizzare le risorse liberate del robot di ricerca per la scansione di pagine importanti.

Come verificare la correttezza della mappa del sito

Per verificare la correttezza della mappa del sito, sono stati sviluppati numerosi servizi online che lo faranno per te in automatico e ti indicheranno tutti gli errori commessi: validità del file, puntamento ad un url di un altro dominio, superamento della dimensione del file, e conduzione di diagnostica online di indicizzazione . Tali programmi sono gratuiti e funzionano con tutti i principali motori di ricerca (Google, Yandex, Yahoo).

Per verificarne la correttezza è necessario aprire la pagina del servizio, scaricare il file xml oppure inserire l'URL corrispondente nel campo e cliccare sul pulsante di spunta. Se il programma rileva errori, ti dirà quali indirizzi stanno dando una risposta errata.

Prova sitemap.xml in Yandex * - https://webmaster.yandex.ru/tools/sitemap/
Prova utilizzando il servizio Pixel Plus - https://webmaster.yandex.ru/tools/sitemap/
Servizio in lingua inglese - https://sitemapkoala.com/

* - per un test in Yandex, è necessario.

Totale

Una sitemap è un pratico strumento pensato per semplificare la trasmissione della struttura delle pagine principali sia al visitatore che al motore di ricerca.

Puoi farne a meno. Il motore di ricerca prima o poi raggiungerà la maggior parte delle pagine web, ma con una mappa del sito, la scansione o l'indicizzazione di nuove pagine sarà più efficace.

Sei solo un idiota se una volta non hai dato alla mappa del sito l'attenzione necessaria. È sufficiente capire il problema una volta ed evitare un gran numero di errori in futuro, cosa che facciamo ora.

Il tuo umile servitore nei suoi anni più giovani era anche un tale idiota quando ha appena iniziato a promuovere siti in un ufficio. A quel tempo mi sono imbattuto in un sito web per la promozione, che, devo dire, era solo una merda. E questa merda ha avuto problemi con l'indicizzazione. Naturalmente, se il sito fosse di qualità sufficiente, entrambi i motori di ricerca lo indicizzerebbero nonostante eventuali problemi, ma i proprietari hanno premuto su un normale designer, layout designer e programmatore, e in questo caso il SEO deve solo aprire la bottiglia con le forbici, quindi parlare. Ho provato di tutto su di esso - sia l'ultima impostazione modificata, sia l'accelerazione dell'indicizzazione da parte del fastbot alla moda in quel momento, e l'acquisto di collegamenti. E solo in seguito si è scoperto che il problema era che la mappa del sito non veniva aggiornata automaticamente lì! Quando l'ho aggiornato, tutte le pagine sono volate nell'indice.

Che cos'è una mappa del sito e perché è necessaria

Che cos'è una mappa del sito? Questo è un file con le informazioni sulle pagine del sito che devono essere indicizzate. Di solito, viene creata una mappa del sito per Yandex e Google per notificare ai robot di ricerca le pagine che devono essere aggiunte all'indice. Inoltre, utilizzando una mappa del sito, controlla la frequenza con cui si verificano gli aggiornamenti e l'indicizzazione di quali documenti Web è più importante. In generale, ne hanno parlato molto bene su Yandex Webmaster:

[yt = INGCBkR26eo] [yt = INGCBkR26eo]

La presenza di una sitemap influisce sulla promozione?

Se non disponi di una mappa del sito, ciò non significa che i motori di ricerca non indicizzeranno la risorsa. I robot di ricerca spesso scansionano bene i siti e li includono nelle ricerche senza di esso. Ma a volte possono verificarsi errori, a causa dei quali a volte è possibile trovare non tutti i documenti Web. I motivi principali sono:

  1. Sezioni del sito, alle quali si accede solo effettuando una lunga catena di transizioni;
  2. URL dinamici.

Quindi, la creazione di un sitemap.xml aiuta molto a risolvere questo problema. Questo file influisce sulla SEO solo nella misura in cui rende l'indicizzazione delle pagine più semplice/veloce. Aumenta anche la possibilità che le pagine web vengano indicizzate prima che i tuoi concorrenti possano copiare il contenuto pubblicandolo sul loro sito.

In quale altro formato è una mappa del sito e perché è realizzata in formato XML

Perché abbiamo bisogno di una mappa del sito, l'abbiamo capito. Ora diamo un'occhiata a quali formati può essere fatto in:

  1. In formato html. Viene creato sotto forma di una normale pagina con indirizzi che portano alle sezioni principali della risorsa. Questo tipo di mappa aiuta a navigare rapidamente ed è progettato più per le persone che per i robot di ricerca. Un numero limitato di link (non più di 100) può essere inserito nella sitemap HTML, perché se ce ne sono di più, non tutti saranno inclusi nell'indice. Oppure, i robot di ricerca possono escludere completamente tale pagina dalla ricerca per un numero eccessivo di URL, anche interni.
  2. Generazione mappa del sito di file xml. Non ci sono restrizioni troppo critiche sul numero di link e i motori di ricerca lo indicizzano meglio, perché il file sitemap in formato xml contiene informazioni complete in una forma comprensibile al robot. È particolarmente importante per i progetti in cui sono presenti centinaia e migliaia di documenti della stessa importanza ed è necessario posizionare tutti i collegamenti ad essi. Questo tipo di mappa del sito ha la capacità di inserire fino a 50 mila URL e inoltre è possibile impostare la frequenza degli aggiornamenti e la priorità approssimativa (priorità), cosa che non si può dire della mappa in formato HTML. È per questi motivi che una sitemap viene quasi sempre creata in xml.

Ecco qualche informazione in più su questo file:

[yt = ti3NKPknHDA] [yt = ti3NKPknHDA]

Come creare una mappa del sito corretta

Vediamo come creare una mappa xml corretta. Qui devono essere soddisfatti i seguenti requisiti:

  1. La dimensione del file non deve essere superiore a 10 MB;
  2. La mappa non deve contenere più di 50.000 collegamenti. Nei casi in cui sono presenti più collegamenti, è possibile creare più mappe e includerle nella mappa xml principale;
  3. L'indirizzo della mappa del sito deve essere registrato in robots.txt;
  4. Carica anche la mappa del sito su Yandex e Google (come aggiungere un file è descritto di seguito);
  5. I motori di ricerca devono poter accedere alla mappa. È necessario utilizzare tag speciali che permettano ai motori di ricerca di capire che questa è una mappa e non qualcos'altro;
  6. La mappa del sito deve essere codificata in UTF-8.

Ecco un semplice esempio di mappa:

http://site.ru/ 2016-11-20T19:45:08+03:00 always 0,9 http://site.ru/category/ 2016-11-20T19:46:38+03:00 monthly 0,6 http://site.ru/page/ 2016-11-20T19:48:41+03:00 yearly 0.4

< url >

< loc >http: //site.ru/

< lastmod >2016 - 11 - 20T19:45:08 + 03:00< / lastmod >

< changefreq >sempre< / changefreq >

< priority > 0 , 9 < / priority >

< / url >

< url >

< loc >http: //site.ru/category/

< lastmod >2016 - 11 - 20T19:46:38 + 03:00< / lastmod >

< changefreq >mensile< / changefreq >

< priority > 0 , 6 < / priority >

< / url >

< url >

< loc >http: //site.ru/page/

< lastmod >2016 - 11 - 20T19:48:41 + 03:00< / lastmod >

< changefreq >annuale< / changefreq >

< priority > 0.4 < / priority >

< / url >

I tag url e loc sono obbligatori. Il primo contiene tutte le informazioni su un URL specifico. Nel secondo, viene scritto l'indirizzo stesso.

I tag lastmod, changefreq, priority sono opzionali, ma comunque consigliati.

Lastmod nella mappa del sito è responsabile della data dell'ultimo aggiornamento.

Changefreq indica la frequenza dei cambi di pagina. I valori possono essere i seguenti:

  1. Ogni ora - aggiorna ogni ora;
  2. Sempre - sempre aggiornato;
  3. Settimanale - aggiornato una volta alla settimana;
  4. Giornaliero: gli aggiornamenti si verificano quotidianamente;
  5. Mensile: gli aggiornamenti vengono effettuati una volta al mese;
  6. Annuale - una volta all'anno;
  7. Mai - non aggiornato (è meglio non usare un tale valore).

La priorità indica ai motori di ricerca quanto sia importante una pagina rispetto alle altre. La priorità può essere impostata da 0,1 (bassa) a 1 (alta).

Questo era solo un esempio di mappa, non è necessario specificare questi valori. In generale, si consiglia di organizzare la priorità come segue: massimo per la pagina principale (1), per i titoli - medio (0,6) e per i post - minimo (0,4).

Ora diamo un'occhiata a un esempio quando ci sono più di 50 mila collegamenti. In questo caso, il file include altre mappe:

http://site.ru/sitemaps/sitemap01.xml 2016-11-20T21: 37: 28 + 03: 00 http://site.ru/sitemaps/sitemap02.xml 2016-11-20T21: 37: 29 + 03: 00

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap01.xml

< lastmod >2016 - 11 - 20T21:37:28 + 03:00< / lastmod >

< / sitemap >

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap02.xml

< lastmod >2016 - 11 - 20T21:37:29 + 03:00< / lastmod >

< / sitemap >

Come creare una mappa del sito

Esistono diversi modi per creare una mappa xml, considerali:

  1. Scarica una mappa utilizzando un generatore online da un'altra risorsa;
  2. Genera con un programma speciale. Ma vale la pena considerare che i programmi di questo tipo sono per lo più a pagamento. Un esempio di tale generatore è Wonder WebWare SiteMap Generatior. Anche Screaming Frog ha questa caratteristica;
  3. Crea manualmente una mappa del sito;
  4. Crea automaticamente una mappa utilizzando CMS (ad esempio, tale funzione è disponibile su WordPress).

Ecco un modo per creare una mappa del sito senza utilizzare i plug-in:

[yt = Tnfy601BUZc] [yt = Tnfy601BUZc]

Plugin per mappe del sito WordPress

Puoi creare una mappa del sito in WordPress utilizzando un plugin speciale chiamato Google XML Sitemaps. Qui tutto è semplice: scarica il plugin, installalo, quindi inizia a creare il file. Per fare ciò, apri le Impostazioni della console e seleziona la mappa del sito XML. Successivamente, impostiamo le impostazioni. Lascia la priorità predefinita.

File Mappa del sitoè un file con informazioni sulle pagine del sito, altrimenti chiamato mappa del sito... Utilizzando un file Sitemap, puoi indicare al motore di ricerca quali pagine del tuo sito indicizzare, con quale frequenza vengono aggiornate le informazioni sulle pagine e quali pagine sono più importanti da indicizzare.

Qui puoi generare il codice XML di Google e Yandex richiesto per la mappa del sito. E crea anche una mappa del sito online visiva che puoi posizionare su una delle tue pagine.

Puoi leggere di più sul file sitemap XML su sitemaps.org

Esperto principiante Informazioni VIP Cronologia della struttura XML Domande frequenti

Dettagli tecnici sulla mappa del sito

I tag nel file sitemap.xml sono:

  • cambiafreq- la frequenza più probabile di modifiche al contenuto dell'URL specificato;
  • lastmod- data effettiva dell'ultimo aggiornamento URL;
  • posizione- l'URL stesso;
  • priorità- la priorità della pagina indicata rispetto ad altre pagine del sito;
  • URL- questo tag funge da genitore dei primi quattro tag specificati;
  • set di indirizzi- Questo tag combina i tag dei primi cinque tipi.

La particolarità dell'utilizzo del formato XML è la necessità di sostituire tutti i caratteri di servizio con la loro rappresentazione sicura. Di seguito è riportata una tabella di caratteri che si trovano nell'URL e devono essere sostituiti:

  • & - e commerciale;
  • " - virgolette singole;
  • " - virgolette;
  • > - segno "maggiore di";
  • < - segno "meno".

La mappa del sito ha un limite di dimensione del file indice di 10 megabyte. Per evitare che questa limitazione colpisca i proprietari di piccoli siti Web, è possibile comprimere i file destinati alla Sitemap utilizzando il formato di archivio aperto gz (gzip archiver).

È possibile specificare la posizione del file Mappa del sito usando file robots.txt... Per fare ciò, basta aggiungere al file robots.txt la seguente riga:

Mappa del sito: http: //DOMEN.ru/sitemap.xml
L'URL deve essere l'URL completo per la mappa del sito.

Per trasferire nuovi motori di ricerca Mappa del sito usa una riga come:
Motore di ricerca/ping? Sitemap = http: //DOMEN.ru/sitemap.xml
Per Google: http://www.google.com/webmasters/sitemaps/ping?sitemap=http://DOMEN.ru/sitemap.xml

Per verificare la correttezza della stesura di una mappa del tuo sito, dovresti prima verificarne la correttezza. Il modo più semplice per farlo è con una delle utility che si trovano sui siti Web o xml.org. A tal fine, è necessario lo schema dei dati XML dell'indice Sitemap. Per specificare un collegamento allo schema di convalida nel file XML, selezionare il " Aggiungi riferimento allo schema XSD per la convalida". Dopodiché, quando apri il file Sitemap.xml in un browser, se ci sono errori nella struttura, riceverai un messaggio corrispondente.

Cronologia dello sviluppo della mappa del sito

Da quando Internet può ricordare, i webmaster hanno sempre cercato di accontentare gli spider di ricerca, per aiutarli a raccogliere informazioni dettagliate sulla struttura del sito promosso.

Il primo, il più antico e del tutto naturale, è stato quello di creare una pagina speciale nella quale fossero inseriti tutti i link del sito. Tali pagine erano e sono chiamate mappe del sito... Il principio del loro lavoro è semplice: quando un robot di ricerca visita questa pagina, seguirà automaticamente i link ivi pubblicati e li inserirà nell'indice.

Questo schema era conveniente per il momento. Successivamente, quando i siti hanno cessato di rappresentare esclusivamente pagine statiche con un numero ridotto di pagine, è sorto un nuovo problema legato all'inefficacia del metodo di pubblicazione della versione classica della sitemap. non c'erano abbastanza posti per i collegamenti, le pagine si sono rivelate di grandi dimensioni e scomode.

In alcuni siti il ​​numero di pagine superava le 1.000, naturalmente è diventato impossibile posizionare assolutamente tutti i link sulla mappa del sito. Il tasso di indicizzazione di tali siti ha cominciato a diminuire. Il mondo aveva bisogno di una nuova soluzione efficace al problema che era sorto.

E il problema è stato risolto. Nel giugno 2005 l'azienda Googleè stato creato un nuovo comodo formato per descrivere le nuove pagine del sito per migliorare la qualità della loro indicizzazione da parte dei motori di ricerca.

Lo standard è stato nominato Mappe del sito 0.84... Come base è stato preso il principio di un database XML testuale, che consente di descrivere la struttura del sito in un file di testo compatto, comprese le pagine del sito nuove e precedentemente pubblicate con la possibilità di specificare ulteriori informazioni META. Soluzione efficace Sitemap proposto da Google, è diventato molto popolare.

La popolarità ha influenzato l'opinione di altri motori di ricerca per un nuovo approccio alla creazione di mappe del sito. Così, nel novembre 2006, giganti della ricerca come MSN e Yahoo, e ad aprile e Ask.com... Formato felice Sitemap ho una nuova versione Mappa del sito 0.90 funzionalità in espansione.

Nel maggio 2007, è stato annunciato ufficialmente per supportare la connessione dello standard Sitemap in file robots.txt motori di ricerca Chiedere, Google e Yahoo, ovvero trova una mappa del sito Mappa del sitoè diventato più semplice: basta indicare la sua posizione in questo file e la fonte delle informazioni per Mappa del sito utilizzare feed RSS o file di testo normale.

2 giugno 2008, 3 anni dopo l'annuncio del protocollo Google un messaggio è apparso sul blog Yandex per i webmaster sul supporto di questo protocollo Yandex. ohm.




Come assicurarti che ci sia sempre una mappa fresca sul tuo sito? Per questo è stato creato un servizio gratuito di manutenzione della mappa del sito.

Puoi anche acquistare un universale già pronto

Questo articolo ti mostrerà come creare una mappa del sito e condividerla con Google.

Creazione e invio di sitemap

Formati file mappa del sito

Google supporta diversi formati di mappe del sito, descritti di seguito. Tutti i formati dovrebbero utilizzare un protocollo standard. Google attualmente non supporta l'attributo Mappe del sito.

Tutti i formati sono soggetti alle seguenti restrizioni: un file Sitemap non può contenere più di 50.000 URL e la sua dimensione non compressa non deve superare i 50 MB. Se la dimensione del file o il numero di indirizzi in esso elencati supera questi limiti, suddividerlo in più parti. Puoi creare un file indice della mappa del sito che elenchi tutte le mappe del sito e inviarle a Google tutte in una volta.

File di testo

Se la tua mappa del sito contiene solo URL di pagine, puoi inviare a Google un file di testo normale con tali URL (uno per riga). Esempio:

http://www.example.com/file1.html http://www.example.com/file2.html

  • Devi usare la codifica UTF-8.
  • Il file non deve contenere altro che un elenco di URL.
  • Puoi dare a questo file di testo qualsiasi nome, ma devi usare l'estensione .txt (ad esempio, sitemap.txt).

Siti di Google

Se il sito è stato creato e verificato utilizzando Google Sites, la mappa del sito viene generata automaticamente. Non può essere modificato, ma può essere inviato a Google per ricevere informazioni per le segnalazioni. Tieni presente che se una sottodirectory contiene più di 1000 pagine, la mappa del sito potrebbe non essere visualizzata correttamente.

  • Se le tue pagine sono ospitate su Google Sites, la mappa del sito dovrebbe trovarsi su http://sites.google.com/site/ VashSait / sistema / feed / mappa del sito.
  • Se il sito è stato creato con Google Apps L'URL della mappa del sito dovrebbe essere così: http://sites.google.com/ VashDomen /VashSait / sistema / feed / mappa del sito.

Estensioni file mappa del sito

Google supporta la sintassi estesa della mappa del sito per i tipi di informazioni di seguito. Può essere utilizzato per aggiungere descrizioni per video, immagini e altri contenuti per migliorarne l'indicizzazione.

Pubblicazioni correlate