Heute Nacht erhielt ich meinen Google Alert auf meine Meldung zum Astronautenklee. Es dauerte somit über eine Woche von der Veröffentlichung bis zum Alert.
Um mal zu testen, wie schnell die Google-Alerts reagieren, muss ich mal wieder meine Erfindung des Astronautenklees wiederbeleben. Mal schauen, wie schnell ich nun den passenden Alert erhalte.
Bei den Google Webmaster-Tools findet sich nun auch ein Menüpunkt Links. Darüber kann man sich anzeigen lassen, wieviel und (nach einem Klick) welche externen Seiten auf diese eine Seite verlinken. Das konnte man zwar bis jetzt auch mit den passenden Abfragen in Google direkt erfahren. So ist's auf jeden Fall aber bequemer.
Ich stolperte die Tage über diesen Artikel, der den Unterschied zwischen gespidert und im Index zu erklären versucht. Demnach würde eine Abfrage per site:domain.de die Anzahl der URLs im Index zurückliefern, die aber nicht notwendiger Weise auch bei einer Suche nach Keywords ausgegeben würden. Dies wäre erst möglich, wenn die Seiten auch gespidert worden sind.
Wie ist aber dann zu erklären, dass eine Suche nach site:heise.de 1.32 Mio Seiten liefert, eine Suche nach site:heise.de impressum aber 6.61 Mio Seiten liefert? Es ist zu beachten, dass zur Zeit jede dieser Abfragen relativ hohe Sprünge macht. Die Tendenz, dass die speziellere Suche aber mehr Seiten liefert als die allgemeinere, besteht aber immer.
Diese inhaltsleeren Zahlen belegen eigentlich, dass die knackigen Marketing-Sprüche von der Durchdringung einer Site bei Google nichts als heiße Luft sind. Ich wage sogar zu bezweifeln, dass Google selbst genau weiß, nach welchem System Treffer gefunden werden.
Auch die Webmaster-Tools sind in meinen Augen nach anfänglicher Euphorie recht nutzlos. Wären diese Tools wirklich sinnvoll einzusetzen, so dürfte es nicht vorkommen, dass bei zwei von mir betreuten Sites plötzlich keine Begriffe mehr angezeigt werden, die Google für wichtig erachtet (der Punkt Seitenanalyse unter dem Reiter Statistik). Über die Sinnlosigkeit der Abfragestatistik hat ich ja bereits früher geschrieben.
Bei Google ist nun seit einiger Zeit etwas im Gange. Die Anzahl der pro Site gelisteten Seiten schwankt recht häufig, sprich es herrscht eine hohe Varianz. Interessant hierbei ist, dass es (mindestens) zwei verschiedene Klassen von Sites zu geben scheint: Wenn für die eine mehr Seiten im Index ausgewiesen werden, ist es bei der anderen Klasse gerade weniger.
Man betrachte die folgende Grafik:

Geht es bei der schwarzen und grünen Kurve nach unten, steigt's bei der blauen und lila-farbenen an.
Nachdem es die letzten Wochen sehr ruhig war, was die Anzahl der gelisteten Seiten, so kommt doch nun wieder Leben in die Entwicklung. Wie die Grafik zeigt, stürzte zunächst der Wert von Yahoo drastisch ab. Aber auch der Wert bei Google zeigt im Moment eine hohe Veränderlichkeit in kurzen Zeiträumen.

Dieses Verhalten betrifft aber nicht nur diese Site hier, wie die Grafik eines anderen großen Online-Angebotes zeigt:

Hier hat sich der Absturz bei Yahoo aber bereits vorher angedeutet:

Für Verschwörungstheoretiker: Es stellt sich die Frage, ob Yahoo es übel nimmt, wenn es im Header die Google-Tags entdeckt ….
Wie ein Tippfehler doch Folgen haben kann: Vor einiger Zeit habe über die Webmaster Tools von Google berichtet. Allerdings hatte ich mich seinerzeit anfangs vertippt. Statt Webmaster Tools schrieb ich etwas über die "Webmaser Tools" (Alle Freunde von Badesalz denken an den Sketch "Ja, Günni, alle haben mit gemacht, aber ein"T" fehlt ..
Diesen Fehler erkannt ich, als in besagten Tools in der Rubrik Abfragestatisik sah, dass ich recht häufig bei der Suche nach Webmaser tools gefunden wurde. Ich habe daraufhin meinen Artikel korrigiert. Bei Google Analytics taucht aber genau dieses Keyword nun in der Statistik unter Keyword-Conversion insgesamt ganz oben auf. Ich bin also nicht mit meinen Knoten in den Fingern allein…
Ich habe nun für meine Site eine Sitemap eingereicht. Es handelt sich dabei um eine einfache Link-Liste im XML-Format. Bei Angeboten, die ihre Inhalte aus einer Datenbank speisen, ist ein solches File schnell angelegt und man muss sich keine Gedanken mehr machen, dass Google nicht mehr alle News sieht, sollte der Robot zu selten vorbei schauen.
Wie nun auch Golem.de berichtet, lässt sich über die Webmaster Tools von Google steuern, ob der Such-Robot häufiger oder weniger oft vorbeischauen soll.
Wenn das doch bei Yahoo ginge. Hier ist man aber einem hoffnungslos dummen Robot ausgeliefert: Ich hatte schon den Fall, dass er immer wieder nicht vorhandene Seiten abrufen wollte. Daraufhin habe ich ihn über die robots.txt ausgesperrt. Daran hat er sich aber nicht gehalten. Erst mehrere E-Mails an die dem IP-Adressen Bereich zugewiesene Abuse-E-Mail Adresse führte nach mehreren Tagen zum Erfolg. Der Robot fragt nun im Sekunden-Takt die robots.txt ab….
Nachdem in den letzten Wochen die Abfrage auf die bei Google gelisteten Seiten doch große Schwankungen an den Tag brachte, hat sich dies in der letzten Woche doch (auf einem recht niedrigen Niveau) stabilisiert. Interessant ist, dass es in der Vergangenheit Schwankungen gab, die alle von mir beobachteten Lines betraf, es umgekehrt aber auch spezielle Schwankungen gab.
Recent Comments