April 6 2010 von
Holger Rohm in
SEO |
SEO ist keine Quantenphysik. Die Zeiten in denen die Rankingkriterien der großen Suchmaschinen von Google nur Insidern bekannt waren, sind Jahre her. Dennoch gibt es natürlich Fragen, die nicht wirklich geklärt sind. Einige davon werde ich in dieser Serie ansprechen:
Wieviel Javascript liest der Googlebot wirklich?
Seit mindestens 5 Jahren heißt es in unregelmäßigen Abständen immer mal wieder: “Google kann jetzt Javascript lesen”. OK, zugegebenermaßen, seit Google Chrome können die das wirklich AUSGESPROCHEN gut, der Googlebot selbst ist aber im Vergleich dazu ein Legastheniker. Aber das sicher nicht weil Google es nicht anders kann. Welches Interesse sollte Google daran haben Javascript beim Crawlen zu interpretieren? Sie würden Unmengen Rechenpower dafür verschwenden, dass Menüs ausklappen, Tabellen sortiert werden oder jQuery Effekte ablaufen.
Man möge mich eines Besseren belehren, aber der Googlebot folgt doch nicht mal einem location.replace(). Was liest Google also aus Javascripts aus? Google erkennt relativ gut URLs im Code und folgt diesen Links auch, allerdings denke ich nicht, dass irgendwelche Linkpopularität vererbt wird.
Wirkt der rel=”canonical” Tag wirklich wie ein 301 Redirect?
Spätestens seit dem man den canonical Tag auch domainübergreifend einsetzen kann, hört man immer wieder, dass 301 Weiterleitungen zwar vorzuziehen sind, wenn sie aber nicht in Frage kommen der canonical Tag die gleiche Wirkung hat. Abgesehen davon, dass der canonical Tag eben nicht weiterleitet, gibt es einen weiteren entscheidenden Unterschied: Den Canonical Tag kann/sollte man nur einsetzen, wenn ungewünschte URL und kanonische URL gleichen oder ähnlichen Content haben. Die Frage lautet also: Wie inhaltlich gleich müssen die beiden URLs sein, damit der Canonical Tag funktioniert, oder ist das doch völlig egal?
Kann man durch Aussperren von Seiten mittels robots.txt Crawlbudget sparen?
Hierzu gibt es eigentlich eine relativ eindeutige Aussage (ausnahmsweise) von Googles Matt Cutts, in der er sagt, dass das Sperren nicht notwendigerweise Crawlbudget spart (Quelle und Zusammenfassung). Aber…die Google Webmastertools sagen etwas ganz anderes: Wenn es z.B. auf einer Domain sehr viele Seiten mit ähnlichem Content gibt bekommt man regelmäßig die Meldung:
Googlebot hat auf Ihrer Website eine extrem hohe Anzahl von Links entdeckt… Eventuell muss Googlebot unnötigerweise zahlreiche verschiedene URLs crawlen, die auf identischen oder ähnlichen Inhalt verweisen, oder Teile Ihrer Website crawlen, die eigentlich nicht dafür vorgesehen sind. Dadurch kann Googlebot möglicherweise nicht den gesamten Inhalt Ihrer Website indizieren oder verbraucht erheblich mehr Bandbreite als nötig.
Welche Aussage stimmt also?
Wann ist Content ‘duplicate’?
Eine der am häufigsten gestellten Fragen zu dem Thema von Kunden lauten so oder so ähnlich: “Können wir Content XY ins Deutsche übersetzen, ohne das es DC ist?”, “Wird der Content unique wenn wir den Text von XY nehmen und ein paar Worte austauschen?”
Natürlich raten wir unseren Kunden dazu, Inhalte zu erstellen, die dem User Mehrwert bieten, so dass man sich diese Fragen nicht stellen muss (oh Mann, ich hör mich an wie Matt Cutts), aber interessant wäre es natürlich schon zu wissen, wie gut Google inzwischen bei der Erkennung von DC und Near DC geworden ist. Ich kenne eine Agentur die eine zeitlang ganz gut damit gefahren ist z.B. in Hotelbeschreibungen einzelne Wörter auszutauschen, aber nachhaltig ist anders… In Zeiten in denen es mir so vor kommt, als ob jede zweite Webseite Wikipedia Artikel umschreibt um auf der Seite ‘Unique Content’ zu haben, wird die Erkennung von Duplicate Content entscheidend.
CTR, Verweildauer und Bounce Rate – Wie groß ist der Einfluß aufs Ranking?
Sehr schwieriges Thema… Die Click Through Rate aus den SERPs auf eine bestimmte Domain, ist zumindest ein Wert den Google relativ einfach messen kann. Bounce Rate (wie oft kommt ein Besucher nach dem Klicken auf ein Suchergebnis wieder zurück zur Suchergebnisseite) geht auch noch, bei der Verweildauer auf der Webseite wirds schon schwieriger und geht theoretisch nur über die Google Toolbar.
Auf dem Papier sind das sicherlich sehr gute Qualitätskriterien, es gibt aber ein großes Problem: Diese Werte sind zu leicht zu manipulieren! Wenn es sich herumsprechen würde, dass man z.B. über die CTR sein Ranking verbessern kann, würden Armeen von, ich sag mal ‘Klick-Indern’, entsprechende ‘Services’ anbieten – selbst wenn nur Werte von eingeloggten Google Usern verwendet würden (die aufwändiger zu manipulieren wären). Ich bin überzeugt davon, dass Google User Feedback miteinfliessen läst, denke aber, dass der Einfluss überschätzt wird.