XML sitemap
Een XML sitemap, is het overzicht van alle pagina’s op je website. Met een XML sitemap, kan een zoekmachine in een oogopslag alle content van je website zien. Google bevestigd zelfs dat je (nieuwe) content hierdoor sneller ontdekt wordt.
In deze blog leg ik je uit wat een XML sitemap is, welke soorten sitemaps er bestaan en hoe je je sitemap kan controleren op SEO fouten. Nieuwsgierig geworden? Lees dan gauw verder.
Wat is een XML sitemap?
Een XML sitemap is een document waar eenvoudig de locaties van je pagina’s, afbeeldingen en video’s terug te vinden zijn voor zoekmachines zoals Google en Bing. In dit document, plaats je de URLs van pagina’s, afbeeldingen en video’s die je in de index van de zoekmachine wilt terug zien. Vaak betekend dit dat niet alle URL’s van een website terug te vinden zijn in een XML sitemap. Bij het opmaken van een XML sitemap, is het van belang dat je je houdt aan de richtlijnen. Doe je dit goed, dan zullen nieuwe of gewijzigde bestanden (pagina’s, video’s etc.) sneller ontdekt worden.
Voorbeeld XML sitemap
Bij de meeste moderne CMS systemen, wordt er automatisch een XML sitemap aangemaakt. Je kan dit ontdekken door te surfen naar: jouwwebsite.nl/sitemap.xml. Mocht dit niet het geval zijn, vraag je webdeveloper of er op een andere locatie al een Sitemap aanwezig is. Het voorbeeld hieronder, kan dan van pas komen.
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”https://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.jouwwebsite.nl</loc>
</url>
<url>
<loc>https://www.jouwwebsite.nl/shop</loc>
</url>
XML sitemap aanmaken
Wanneer je een XML sitemap gaat opmaken, is het van belang dat het minimaal de volgende elementen bevat:
- XML header: Geeft aan dat de sitemap in versie 1.0 is geschreven volgens de standaard richtlijnen. Het stukje encoding geeft aan volgens welke tekencodering is gebruikt. In dit geval is dat UTF-8 (een standaard die door Google begrepen wordt). Door dit aan te geven, begrijpt een zoekmachine hoe hij de tekst moet interpreteren.
- URL set: Geeft aan dat de urls zijn geschreven volgens de xml standaard.
- Individuele urls (loc): Geeft de locatie van de urls aan.
Optionele elementen:
- lastmod: Geeft aan wanneer een document voor het laatst is aangepast ( <lastmod>2018-08-24T10:23:20+02:00</lastmod>)
- Priority: Geeft de prioriteit aan van 0 t/m 1
- Changefreq: geeft aan hoe vaak het stukje content gemiddeld veranderd (per uur, dag week etc)
Goed om te weten: uit een Linkedin conversatie die ik met een medewerker van Google had, blijkt dat iig het optionele element: lastmod, weer relevant is
XML sitemap pingen
Google bekijkt je XML sitemap niet zo vaak als dat het je website uitleest (crawled). Wil je nieuwe wijzigingen sneller doorgeven, dan kan je je sitemap pingen. Dit doe je door de volgende URL in je browser in te vullen:
https://www.google.com/ping?sitemap=URL_Naar_Je_Sitemap
Een medewerker van Google gaf recent aan dat dit zelfs het indexeringsproces kan versnellen (zie de afbeelding hieronder).
Tip: Een alternatief om het indexering proces te versnellen is door de indexering API te gebruiken. Rank Math heeft hier een handige handleiding over geschreven. Alhoewel Google dit tegen spreekt, merken leden van de SEO mastermind dat dit wel werkt.
Alternatieve sitemap formaten
Alhoewel de meeste sitemaps in het XML formaat zijn opgemaakt, is dit niet een vereiste. Je kan ook de volgende indelingen indienen:
- HTML sitemap: Zie toelichting hieronder.
- Sitemap index: Een sitemap van meerdere sitemaps
- RSS sitemap
- ATOM feedindeling
HTML sitemap
Een HTML sitemap, is een sitemap die opgemaakt is in HTML. Het is niet meer dan linkjes naar verschillende pagina’s. Je kan deze opmaak gebruiken als alternatief of toevoeging naast je XML sitemap. Uit ervaring weet ik dat de robots van Google gretig gebruik maken van een HTML sitemap. Een slimme manier dus om pagina’s onder de aandacht te brengen.
Voorbeeld HTML sitemap
Het effect? Dat kan soms best groot zijn. Recent deelde Jan-Willem Bobbink het volgende screenshot, waarin hij laat zien wat het effect was.
Soms is het standaard browsepad van een website niet de meest toereikende manier om Googlebot naar het laagste paginaniveau te krijgen. Relevante pagina’s of blogs met een hoog potentieel raken verloren in eindeloze archieven waar Google door niveaus van paginering moet gaan. Misschien werkt SSR (server side rendering) nog niet goed, dus als een snelle kortetermijnoplossing kan een HTML-sitemap wonderen doen voor het versnellen van de indexering.
Als je een statische HTML-sitemap koppelt aan het voettekstelement op elke pagina, kun je het klikpad verkorten van meerdere of zelfs tonnen stappen tot een stap van 2 klikken naar je belangrijkste pagina’s of blogs.
Sitemap controleren op SEO fouten
Voor SEO is het belangrijk dat je met je sitemap de juiste signalen doorgeeft aan Google. Van belang is dat:
- De URLs in de sitemap staan waar je op gevonden wilt worden.
- Je geen tegengestelde signalen aan Google doorgeeft. Voorbeeld tegengestelde signalen: URL in de XML sitemap plaatsen en een meta no index tag meegeven. In de sitemap vertel je dan aan Google: ik wil hem in de index hebben. Op de URL zelf zeg je d.m.v. een meta tag: ik wil hem niet in de index van Google hebben.
Je sitemap kan je eenvoudig controleren met een webcrawler. Zelf gebruik ik hier Screamingfrog voor. Wil je dit ook met Screaming frog doen? Zet hem dan op “lsite mode” en kies vervolgens voor upload, download XML sitemap. Voeg hier de URL naar je XML sitemap in en klik op ok! Je sitemap wordt nu opgehaald. Nadat je je XML sitemap hebt opgehaald, is het van belang dat je het controleert op de volgende SEO punten:
Controleer je Sitemap op de volgende punten:
- Ik adviseer je XML sitemap altijd naast je “root domein” te plaatsen. dus: jouwwebsite.nl/sitemap.xml.
- Je sitemap mag niet groter zijn dan 50MB of 50.000 urls. Is dit wel het geval? Splits je XML sitemap dan op en maak een sitemap index aan.
- Plaats de URL van je sitemap in je robots.txt.
- Maak alleen een sitemap aan voor je voorkeursdomein (het type dat je in de index van Google wilt hebben, dus: www of non www)
- Voorkom tegengestelde signalen. Voeg de volgende urls niet aan je sitemap toe:
- Url die een canonical verwijzing naar een andere url geven;
- Pagina’s met een robotos meta tag
- Pagina’s geblokkeerd in de robots.txt
- Pagina’s met een 3xx/4xx/5xx statuscode hebben
- Gepagineerde content
- Gearchiveerde pagina’s
- Zorg ervoor dat je XML sitemap up to date is. Het meest eenvoudig is om je sitemap dynamisch te maken.
- Heb je een nieuwswebsite? Verwijder de pagina’s dan na 2 dagen uit je XML sitemap.
Optioneel:
- Als je een internationale website hebt, kan je de alternate lang tags toevoegen.
- Je kan een XML website op een andere locatie plaatsen dan je eigen domein. Voor Google search console wel handig om een redirect op je root domein te plaatsen.
- Je kan een aparte sitemap aanmaken voor video en afbeeldingen. Let op: per 6 aug 2022 zijn XML tag’s zoals: Caption, geo_location, licence, category, player_loc, gallery_loc_price en tvshow overbodig. Volg inplaats daarvan de volgende richtlijnen voor afbeeldingen en video.
- Je kan je XML sitemap alleen beschikbaar maken voor zoekmachines en blokkeren voor gebruikers (bron).
Klopt alles? Voeg je sitemap dan toe aan Google search console.