Quanti tipi di sitemap esistono?

Sono rimasto in perplesso trovare due sitemaps differenti nei siti di Google:

http://sites.google.com/site/(name of the site)/system/feeds/sitemap http://sites.google.com/site/(name of the site)/system/app/pages/sitemap/hierarchy 

Ora, sono pronto a chiedere la domanda sconcertante "Quali sono le sitemaps?" Ho sempre pensato che siano cose che consentono ai crawler di vedere cosa c'è sul sito, come conferma l'esempio precedente. Quest'ultimo esempio ha sfidato le mie conoscenze. Che cosa sono in realtà? È l'ex solo per gli esseri umani, mentre il secondo per i cingoli? Ci sono ancora diversi tipi di sitemap?

  • Come genera Wikipedia la sua Sitemap?
  • 2 Solutions collect form web for “Quanti tipi di sitemap esistono?”

    La Sitemap può essere a) una rappresentazione visiva della struttura del sito intesa per il pubblico umano b) file destinato ai crawler web (google, yahoo) che li informa quali URL sono disponibili per eseguire la scansione. È spesso fornito in congiunzione con il file robots.txt che informa i crawler quali URL possono essere indicizzati e con non possono. Il formato più comune per i sitemaps è l'XML, che consente di specificare l'importnza dell'URL e la frequenza di modifica. È ansible leggere le specifiche in http://www.sitemaps.org/protocol.php . Un formato non comune ma ansible di sitemap è solo un file di text chiaro, che separa gli URL con le nuove righe. Non è così flessibile come il formato XML, quindi il formato XML è più prefetto per gli sforzi di SEO. Puoi avere più sitemap di XML e collegarle nell'indice della Sitemap. Viene spesso utilizzato da siti di grandi size, poiché il protocollo di sitemap limita la dimensione del sitemap a 10 MB. Inoltre, è ansible utilizzare feed RSS o ATOM per informare i crawler sugli URL. Il disagio di questo approccio è che puoi solo avvisare di nuovi URL.

    Il termine sitemap può avere due significati leggermente diversi:

    A) La mappa del sito per gli esseri umani

    Una pagina web per dare agli utenti una panoramica del tuo sito. Questo è il tuo esempio

    http://sites.google.com/site/(name del sito) / system / app / pagine / sitemap / gerarchia

    è. Basta inserirlo nell'URL del tuo browser e vederti.

    B) La mappa del sito per le macchine

    Questo tipo di sitemap è un elenco di URL che comprende un sito web (txt di xml). È il tipo di sitemap che consente ai crawler di vedere cosa c'è sul sito .

    Puoi anche avere più sitemap di questo tipo. La ragione di questo è la stessa cosa perché non abbiamo tutti i codici sorgenti in un file di solito. È più facile gestire se si divide la Sitemap in più file.

    Nel tuo esempio

     http://sites.google.com/site/(name of the site)/system/feeds/sitemap 

    i "feed" indica che si tratta di una sitemap che contiene URL per i soli feed RSS.

    Per apprendere ciò che contiene, dovrai dare un'occhiata più da vicino. Un modo per farlo è quello di scaricare il file come questo

     wget http://sites.google.com/site/(name of the site)/system/feeds/sitemap 

    e aprirlo nel tuo editor di text preferito.

    Al mio sito a google questo file ha il seguente aspetto:

    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    </urlset>

    È quasi vuoto. Il motivo è probabilmente che ho appena creato il sito e non esistono voci di alimentazione.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.