Zum Inhalt springen

Interessant: Google ignoriert im HTML-Head verschiedene Meta-Tags künftig

Nachdem die neuen Link-Attribute „sponsored“ und „ugc“ eingeführt wurden, stellt Google nun auch die Behandlung von Meta-Tags im Head-Bereich einer Website um.

Google will das Link-Attribut Nofollow (rel=„nofollow“) zwecks Konkretisierung teils durch die neuen Attribute Sponsored und Ugc ersetzen. Im Rahmen der Vorstellung der neuen Attribute stellte der Suchmaschinenriese klar, dass das Setzen von Nofollow künftig nicht mehr als Anweisung an den Crawler verstanden würde, sondern nur noch als Hinweis.

Kein verbindlicher Meta-Tag Nofollow mehr

Jetzt ergänzt Gary Illyes aus Googles Webmaster-Trends-Team, dass die neue Interpretation auch für Nofollow als Meta-Tag gilt. Das ist insofern eine Veränderung der bisherigen Vorgehensweise, als Google in seinen offiziellen Dokumenten stets vermittelt hat, dass ein Nofollow-Meta-Tag den Crawler vom Indexieren der entsprechend gekennzeichneten Seiten abhalten würde. Illyes indes stellt deutlich klar, dass auch das Setzen des Meta-Tags in Zukunft nur noch als Hinweis betrachtet werden wird.

Noindex verhindert das Crawling ohnehin nicht

Gleiches soll für den Meta-Tag Noindex gelten. Dieser verhindert ebenfalls nicht das Crawling, sondern sorgt lediglich dafür, dass so gekennzeichnete Inhalte nicht in Suchergebnissen erscheinen. Hier gilt es den Unterschied zwischen Indexing und Crawling zu beachten. Während nämlich Google offiziell bei Nofollow stets das Crawling ausgeschlossen hatte, wird bei Noindex lediglich das Indexieren ausgeschlossen.

So verfügt Google über einen nach außen sichtbaren, durchsuchbaren Seitenpool und einen weiteren, nur intern der Maschine bekannten. Das ist aus Sicht der Suchmaschine sinnvoll, denn die Kalkulation der Relevanz von Beiträgen kann sie über beide Bereiche laufen lassen, um dann zu einer Rankingentscheidung zu gelangen.

Last Exit: Robots.txt

Webmastern, die künftig wirklich ausschließen wollen, dass Google bestimmte Inhalte und Seitenbereiche nicht nur nicht indexiert, sondern auch gar nicht erst crawlt, bleibt somit nur der Weg über die robots.txt im Stammverzeichnis der jeweiligen Website.

Published inWebmaster