Om je weblog goed te laten indexeren door Google is het goed om een sitemap te hebben. Hoe je dat allemaal kunt doen staat uitvoerig beschreven. Je moet in ieder geval je weblog toevoegen aan je Google Sitemaps account. Dat je natuurlijk eerst aangemaakt moet hebben. Daarna moet je een XML bestand maken waarin alle urls van je weblog in opgenomen zijn. Daarvoor zijn diverse tools. Ze staan in de linkerkolom op deze pagina. Daarna moet je Google vertellen waar die XML ergens staat, zodat de Googlebot daar kan gaan kijken om te indexeren. Telkens als je weblog verandert moet je dus een nieuwe XML maken.
Ik deed dat eerst met XMLEcho, ook zo’n handige tooltje dat een XML bestand maakt van je weblog. Maar vandaag kwam ik een betere optie tegen, waarbij ik dus niet steeds zelf die XML file moet aanmaken. Dat kan dus automatisch. Door een nieuwe index file aan te maken in MovableType. Hieronder leg ik uit wat ik gedaan en vind je de code.


Dit bestandje noem ik sitemap.xml en heb ik dus opgeslagen en gepubliceerd. De url van dit bestand heb ik aan mijn Sitemapaccount toegevoegd, zodat Google dus weet waar dat bestandje staat. Telkens als ik een nieuwe bericht publiceer wordt dat sitemap.xml bestand aangepast. Altijd up-to-date dus.
Het sitemapaccount geeft informatie over hoe je weblog geindexeerd is, welke zoekwoorden hoog scoren, welke links niet bereikt kunnen worden etc. Handig! Zo heb ik toch nog 20 urls aan kunnen passen die niet goed in MovableType terecht waren gekomen ivm underscore probleempje.
Deze aanpak vond ik op de weblog van Neil Kennedy.
Op Cameron’s blog vond ik daarna nog meer code voor de xml file, waarmee je ook je urls van je archieven in het XML bestand krijgt.. En ook Anders Jacobson publiceerde een uitgebreidere versie van het xml bestand waarin ook de reacties meegenomen worden als verandering.
Als ik nu al deze opties samenvoeg krijg ik de volgende xml (in txt). Ik heb daar nog het Weekly archief toegevoegd.
Tot slot nog een XML bestand voor andere zoekrobotten dan Google. Daarvoor kwam ik terecht op de weblog van Lauren Delavaissiere. Hij gebruikt daarvoor de ROR standaard (zie de spec) die een XML oplevert waarmee andere zoekrobots dus ook om kunnen gaan en heeft dat wat aagepast.
Heel veel websites gebruiken de ror.xml.
Ook hier heb ik ook weer het Weekly archief toegevoegd. Hierbij de txt file ror.xml