Die XML-Sitemap bietet eine Übersicht aller URLs (Unterseiten) einer Webseite und hilft den Suchmaschinen beim Crawlen. Sie liegt in der Regel im Hauptverzeichnis einer Domain und kann dort aufgerufen werden. Sie ist kein direkter Ranking-Faktor, hilft den Suchmaschinen aber dabei, Inhalte der Webseite einfacher zu finden und Änderungen schnell zu erkennen. Mit einer XML-Sitemap werden Seiten schneller indexiert und man kann steuern, welche Seiten in den Index sollen.
Google akzeptiert neben dem gängigsten XML-Format auch andere Sitemap-Formate wie zum Beispiel RSS, Textdatei und Google Sites.
Die HTML-Sitemap ist eine Art Inhaltsverzeichnis und dient dazu, dass sich User auf der Seite zurechtfinden. Sie ersetzt nicht die XML-Sitemap, sondern kann als Ergänzung dazu gesehen werden. Anders als die XML-Sitemap ist die HTML-Sitemap eine eigene Unterseite und für den User sichtbar.
Auch wenn die XML-Sitemap nicht für das Ranking relevant ist, bietet sie doch einige Vorteile. So erkennt die Suchmaschine zum Beispiel schneller, wenn neue URLs hinzukommen. Bei einer neuen Webseite, muss die Suchmaschine wissen, dass diese überhaupt existiert – mit einer XML-Sitemap teilt man Google & Co. aktiv mit, dass es etwas Neues gibt.
Sind die Inhaltsseiten nicht untereinander verlinkt, sorgt eine Sitemap dafür, dass sie beim Crawling trotzdem berücksichtigt werden. Auch wenn Rich-Media-Inhalte vorhanden sind oder die Seite bei Google News angezeigt werden soll, kann Google zusätzliche Informationen in der Sitemap berücksichtigen.
Eine Sitemap darf höchstens 50 Megabyte gross sein und kann maximal 50.000 URLs umfassen. Bei grösseren Websites muss die Sitemap aufgeteilt werden. Zudem muss die Sitemap-Datei im UTF-8-Format codiert sein – dabei müssen die entsprechenden Escape-Codes hinterlegt sein.
Wichtig ist auch, dass die Sitemap nur URLs derselben Domain beinhaltet. Bei mehreren Domains bekommt Jede ihre eigene Sitemap. Auch darf die Sitemap nur Inhalte besitzen, die indexiert werden sollen und tatsächlich zugänglich sind. Mögliche Fehler können in der Google Search Console eingesehen werden.
Die meisten Content-Management-Systeme besitzen eine entsprechende Erweiterung, mit der eine Sitemap ganz einfach erstellt werden kann. Der Vorteil ist, dass eine automatisch erstellte Sitemap immer aktuell und weniger fehleranfällig ist.
Wer kein CMS verwendet, kann die XML-Sitemap auch manuell erstellen – der Nachteil hier ist, dass man diese jedes Mal neu erstellen muss, wenn sich etwas an irgendeiner URL ändert. Empfehlenswert ist deswegen die Verwendung eines Tools, da sich sonst schnell Fehler einschleichen, die dann zu Problemen in der Indexierung führen.
Fehlerhafte Seiten oder Weiterleitungen in der Sitemap führen zu Problemen beim Crawling. Deswegen sollten folgende Fehler vermieden werden:
Als Erstes muss die Sitemap in der robots.txt hinterlegt werden. Diese Datei hilft den Crawlern dabei, sich auf Deiner Website zurechtzufinden. Ein Verweis auf die Sitemap in der robots.txt teilt den Crawlern mit, welche URL-Struktur Deine Website besitzt.
Um die Sitemap bei Google einzureichen, benötigt man eine Anbindung der Website zur Google Search Console. Hier kann man die Sitemap unter dem Menüpunkt Sitemaps einreichen. In der Search Console erfährt man auch, ob die eingereichte Sitemap fehlerhaft ist.