Woher weiß GoogleBot, wenn eine Seite geändert wird?

March 3

Googles Spinne, auch bekannt als Googlebot, durchsucht das Web auf seinen eigenen Zeitplan, die bestimmen, welche Seiten werden geändert und erfordern Neuindizierung durch Vergleich mit den vorhandenen Index. Obwohl dieser Prozess sehr schnell passiert, hilft es um zu wissen, welche Signale Googlebot verwendet, um die Suche für aktualisierte Seiten und die Probleme, die auftreten kann, es.

Googlebot Frequenz

Googles Spinne krabbelt im Web sehr schnell; viele Websites werden täglich besucht. Das bedeutet nicht, den Spinne Crawlen alle aktualisierte Seiten, jedoch. Die Algorithmus verwendete Google Crawling-Frequenz bestimmt enthält Variablen wie PageRank, die Anzahl der Links, die auf der Seite, die Informationen in der Sitemap und auch die Länge der URL. Eine bestimmte Seite kann im Index von Google innerhalb von Stunden aktualisiert werden, während andere möglicherweise nicht für mehrere Tage, je nachdem diese Variablen aktualisiert wird.

XML-Sitemaps

Ein Stichwort, was der Googlebot verwendet, um Ihre Website frische bestimmen ist Ihre Sitemap-Datei, ein XML-Dokument enthält sowohl die wichtigen Seiten auf Ihrer Website und die Häufigkeit, mit der Sie diese aktualisieren, wahrscheinlich. Erstellen Sie eine Sitemap mit einer Reihe von online-Tools, darunter kostenlose Web Services und WordPress-Plugins kann, laden Sie sie auf der Stammebene Ihrer Website und legt ihn Google entweder über Google Webmaster-Tools oder über die folgende URL:

http://www.Google.com/webmasters/sitemaps/Ping?Sitemap=http :// www.YourSite.com/sitemap.xml

If-modified-since-Header

Ein weiteres Stichwort ist im HTTP-Header der Site Web-Server. Genannt den "If-modified-since" Header, wenn der Googlebot auf Ihrer Seite erreicht, fragt es dem Server, wenn die Seite seit dem letzten Besuch aktualisiert wurde. So, oder wenn die Seite ganz neu ist, gibt der Server eine "200 OK" Antwort. Wenn die Seite noch nicht geändert wurde, liefert dieser Header die Antwort "304 nicht geändert," der Googlebot Zeitersparnis und Bandbreite zu sparen. Konfigurationsprobleme mit Ihrem Webserver könnte Probleme mit dieser Kopfzeile verursachen und verhindern, dass die Spinne das Crawlen Ihrer Seite. Sie können für den Header "If-modified-since" mit einem online-Tool unter Feedthebot.com informieren.

Webmaster-Tools

Google entwickelt die Webmaster-Tools-Website, um die Website-Inhaber der Googlebot Besuche auch überwachen, siehe Indizierung Fehler und andere Probleme, die Indizierung aktualisierten Seiten Google verhindert werden können Hilfe. Webmaster-Tools enthält außerdem Tools für die Einreichung Ihrer Sitemaps einreichen einzelne Seiten für die Indizierung und Entfernen von URLs, die nicht im Index von Google angezeigt werden soll. Es gibt sogar ein Tool, sodass Sie überprüfen Sie die Datei "robots.txt", die Spinnen Weg von Seiten warnt, die indizierte nicht erwünscht.

AJAX-Content

Obwohl AJAX dynamisch eine Webseite on-the-Fly aktualisiert, Googlebot sieht nur den HTML-Code auf der Seite und wird nicht den JavaScript-Code ausführen. Wenn Sie Google Indexaktualisierungen mithilfe der AJAX-Funktionen Ihrer Seite möchten, müssen Sie alternativen HTML-Code für die Spinne aufnehmen. Google bietet eine Methode, mit der Sie eine Alternative Version des AJAX Inhalte für den Googlebot anbieten können.