Noarchive einfach erklärt
Noarchive ist ein Meta-Tag, das Suchmaschinenbots, etwa den Googlebot, anweist, die gecrawlte Seite nicht in den Google-Cache aufzunehmen. Suchmaschinen dürfen dann keine früher gecrawlten Versionen speichern. Die meisten Websites verwenden allerdings kein noarchive-Tag.
Inhalt
Verwendung von noarchive in den Meta-Tags
Wenn Du für Deine SEO-Strategie das noarchive-Tag nutzen willst, verwende das Meta-Tag im Heades HTML-Dokuments der betreffenden Seite.
<meta name="robots" content="noarchive" />
Google hat bestätigt, dass der Tag noarchive keinen Einfluss auf den SEO-Erfolg Deiner Website hat.
Noarchive versus Caching
Um das noarchive-Tag besser zu verstehen, betrachten wir kurz das Thema Cache. Beim Lesen einer Webseite speichern Suchmaschinen wie z.B. Google diese normalerweise und sichern einen Schnappschuss als Seitenkopie. Das nennt man cachen. Auch für die Nutzer kann das Archivieren einer Seite praktisch sein: Wenn ein Ergebnis aus den Google-SERPs langsam lädt oder sich nicht aufrufen lässt, kannst Du den gecachten Schnappschuss der Seite dennoch ansehen.
Wenn eine Seite hingegen ein noarchive-Tag enthält, so ist kein Cache verfügbar. Beide Beispiele findest Du im Screenshot verdeutlicht:
Im Quellcode von GEOlino lässt sich erkennen, dass der Artikel nicht archiviert werden soll:
Solltest Du eine Seite aufrufen wollen, die gerade nicht aufrufbar ist oder das Abrufen etwa aufgrund von Serverproblemen zu lange dauert, dann erscheint üblicherweise ein Hinweis, dass Du die archivierte Version ansehen kannst. Hier kommt das noarchive-Tag ins Spiel: Wenn dieses Tag bei einer Seite hinterlegt ist, ist die Seite nicht in einer gecachten Version verfügbar. Noarchive verbietet die Archivierung.
Gründe für noarchive im SEO
In der Regel macht es Sinn, dass Google Deine Website cached. Deshalb verbieten die meisten Webseiten dies dementsprechend auch nicht mit dem noarchive-Tag. Dennoch kann es Gründe geben, um der Suchmaschine den noarchive Befehl mitzugeben:
- Der Inhalt Deiner Seite ist zeitlich begrenzt oder wechselt schnell. Newsseiten verändern beispielsweise ihre Nachrichten, nachdem diese bereits online publiziert wurden oft noch weiter. Eine gecachte Version würde dann veraltete Informationen enthalten. Daher ist das noarchive-Tag in der News-Branche eine übliche Lösung.
- Du willst aus einem anderen Grund keine archivierten Versionen haben, etwa aus rechtlichen Gründen
Um diese Probleme zu umgehen, kannst Du Suchmaschinen Bots sagen, sie sollen Deine Website nicht archivieren.
Tipp: Auf der Website archive.org (wir SEOs nennen sie auch „WaybackMachine“) lässt sich gut nachvollziehen, wie eine Seite zu einem bestimmten Punkt in der Zeit aussah – sofern die Seite kein noarchive-Tag verwendet.
Verwechslungsgefahr
Mit dem noarchive-Tag kannst Du nicht verhindern, dass Deine Website indexiert wird. Nutze zu diesem Zweck das noindex-tag. Ebenso kannst Du mit noarchive nicht verhindern, dass Suchmaschinen ein Snippet anzeigen. Wenn Du das möchtest, nutze hingegen das Attribut „nosnippet“.