SEO, Wordpress
Kommentare 12

WordPress hat ein enormes SEO Problem!

WordPress hat ein enormes Duplicate Content SEO Problem. Es geht um beliebig viele Paginierungsseiten, die hinter die URL jedes Beitrags gehangen werden können und für jede der URLs den selben Inhalt ausgeben. WordPress liefert an dieser Stelle weder ein 404 noch einen Canonical Tag auf die Originalseite des Contents. Auf diese Weise lassen sich unendlich viele Duplikate eines einzelnen Inhalts erzeugen.

Die folgenden Seiten liefern ohne ein SEO Plugin exakt das selbe Ergebnis:

  • A: http://mizine.de/gadgets/raspberry-pi-mit-gehause/
  • B: http://mizine.de/gadgets/raspberry-pi-mit-gehause/18/
  • C: http://mizine.de/gadgets/raspberry-pi-mit-gehause/99/

Alles Quatsch? Die URLs existieren doch gar nicht? Die hast Du doch einfach zum Testen eingegeben.

Ja das ist richtig. Allerdings muss ein System auch dann funktionieren, wenn mal „aus versehen“ eine falsche URL eingegeben wird. Ein System muss eben immer korrekte Ausgaben liefern, egal ob die Eingabe korrekt oder falsch ist.

SEO ist eine Wissenschaft und genau deswegen muss man es strukturiert angehen und jeder Eingabe eine valide Ausgabe liefern. Auch wenn eine Eingabe keinen Sinn macht. Nur so bekommt man eine korrekte Seitenarchitektur.

Ich habe in einem größeren Wiki bereits dutzende „ausgetestete“ URLs in der Searchconsole aufgeführt, wo doppelte titles aufgeführt werden. Ich kann sogar einfach mal wahllos aus einem öffentlichen Projekt von mir die SERP zeigen:

google duplicate content wordpress seo fail

Ein paar solcher Fehler werden sogar in der Searchconsole angezeigt. Hier nur ein Beispiel:
Screenshot 2016-02-22 um 11.55.18

Es interessiert Google also nicht, dass es dieser URL gar nicht gibt. Google testet öfters mal URL Kombis aus um zu sehen, wie die OnPage Systeme darauf reagieren. Damit habe ich früher öfters auch unter osCommerce extrem zu kämpfen gehabt.

„Speziell Google neigt dazu, zusätzlich URL-Fragmente und Angaben, die wie Urls aussehen, aufzurufen. Wenn im Quelltext einer Seite eine Angabe /info/ vorkommt, kann das bereits dazu führen, dass Google diese Struktur versucht zu crawlen … Es kommt regelmäßig vor, dass Suchmaschinen viele Ressourcen für das Crawling solcher URL-Strukturen aufwenden, die für eine erfolgreiche Suchmaschinenoptimierung unnötig sind. … Solche Fehler können auftreten, wenn Webserver trotz falscher Schreibweise einer Adresse dennoch gleichen Inhalt ausliefern. In solchen Fällen kann der gezielte Einsatz von Crawling-Beschränkungen sehr sinnvoll sein.“ Technisches SEO von Dominik Wojcik

Seiten oder Beiträge?

Es sind Seiten und Beiträge zugleich betroffen

Achtung! Es geht hier nicht um Archivseiten von Kategorien oder die paginierten Seiten der Startseite!

Diese liefern in der Regel jedes mal unterschiedlichen Content aus! Das sind erstmal keine echten Duplikate wie die, die ich hier beschrieben habe.

Bei meinem Beispiel liefert WordPress bei allen Seiten 99%-ig gleichen Quellcode. Das einzige Problem bei diesen Archiven ist, dass die Titles und Descriptions identisch sind. Das ist aber eher nicht ganz so tragisch. In wpSEO kann man einstellen, dass die paginierten Seiten der Kategorie Archive als Title und Description immer den Title und die Description des ersten Beitrags in der Liste nehmen. Immer noch ein DC, aber wesentlich weniger. Aber das ist eine komplett andere Geschichte als hier im Beitrag beschrieben.

Wer ist also betroffen?

Betroffen ist jede WordPress Installation ohne einem SEO Plugin. Du solltest also nachsehen, ob auch Deine Installation betroffen ist.

Was kann man gegen das Problem tun?

Ein SEO Plugin nutzen. Egal ob Yoast oder wpSEO, beide beheben das Problem. Ich tendiere immer zu wpSEO aus diversen Gründen. Ich mag wpSEO weil es schmal ist und nicht zu überladen, zu komplex, zu schwerfällig. Vor allem kann ich in wpSEO per Hook auf die Meta-Inhalte zugreifen und diese im Template auslesen und verwenden. Zu guter letzt ist Yoast nach meinem Wissen rein rechtlich in Deutschland nicht nutzbar.

Wordpress hat ein enormes Duplicate Content SEO Problem! Klick um zu Tweeten

Mein Abschließendes Statement:

SEO ist eine Wissenschaft und genau deswegen muss man es strukturiert angehen und jeder Eingabe eine valide Ausgabe liefern. Auch wenn eine Eingabe keinen Sinn macht. Nur so bekommt man eine korrekte Seitenarchitektur. Wer WordPress einsetzt muss also alleine schon wegen diesem Problem auf ein SEO Plugin seiner Wahl setzen.

Kategorie: SEO, Wordpress

von

Ich betreibe T-Shaped Marketing in zwei Online-Shops. Dazu gehört auch ständig neue technische Raffinessen in die Shops einzubauen. Ich bin ein leidenschaftlicher Philosoph, Tech and IT Blogger auf mizine.de. Mein #COFFEE is always #000000

12 Kommentare

  1. Markus sagt

    Stimme dem soweit zu, danke für den Hinweis! Habe ich doch gleich mal bei uns im Yoast-Plugin korrigiert! 😉

  2. Viktor Dite sagt

    Du stimmst mir also zu, dass man dieses Problem unbedingt angehen sollte? Das freut mich, jetzt hier nicht ganz so allein damit zu stehen 🙂

  3. Elias Kowaltschik sagt

    Ich bin entsetzt hier nicht schon mehr Kommentare.

  4. Elias Kowaltschik sagt

    So schlimmes Problem und keiner schreibt Kommentar. Habe nicht Problem. Mache kein SEO. Bin glücklich.

  5. Viktor Dite sagt

    Wenn Du kein technisches OnPage SEO betreibst entgehen Dir aber viele Möglichkeiten.

  6. Ich hab mir mal erlaubt, einen Quickfix für wpSEO 4.1.1 zu basteln. Tut folgendes: Wenn der Content nicht paginiert ist (also kein in Beitrag/Seite), wird der Permalink als Canonical ausgegeben (ohne Paginierung!). Und zwar ganz egal, was man im Browser an die URL anhängt! Ist der Inhalt hingegen Paginiert ($multipage>0), erfolgt die Ausgabe des Canonicals wie bisher (also mit Pagenummer in der URL). Die Änderung Betrifft die Datei wpseo\inc\output.class.php. Da wpSEO ja ein Premium-Plugin ist, warte ich auf Soerens erlaubnis, ob ich den Fix veröffentlichen darf. Hier nur die geänderten Zeilen zu posten geht leider wegen minify nicht.
    Der Fix in Aktion ist sichtbar auf http://www.reisetiger.net

  7. Viktor sagt

    Klasse! Danke Dir! Dacht ich es mir doch, dass da eine if Abfrage reichen würde!

  8. Viktor Dite sagt

    Deine 3 Beispiele liefern zumindest jedes mal unterschiedlichen Content aus! Das sind erstmal keine echten Duplikate wie die, die ich hier beschrieben habe. Bei meinem Beispiel liefert WordPress bei allen Seiten 99%-ig gleichen Quellcode. Das einzige Problem bei euren Pages ist, dass die Titles und Descriptions identisch sind. Das ist aber eher nicht ganz so tragisch. Da würde nur die Search-Konsole meckern, dass duplicate Titles vorahnden sind. Sollte man angehen, aber nicht so adhock und mit Bedacht.

    In wpSEO kann man einstellen, dass die paginierten Seiten der Kategorie Archive als Title und Description immer den Title und die Description des ersten Beitrags in der Liste nehmen. Immer noch ein DC, aber wesentlich weniger. Aus diesem Grund schalte ich die Kategorie-Archive immer auf noindex, so wie Du es grad gemacht hast.

    DENNOCH solltest Du mal nachsehen, ob Ihr nicht vorher Google Search Traffic auf euren Startseiten Archiv hattet. Denn jetzt hast Du 266 paginierte Seiten auf einmal noindexed!

  9. Smashing Magazine GmbH sagt

    Danke Viktor. Ordentlich Traffic kommt da definitiv drauf, aber kein Search-Traffic. Liegt sicher auch daran, dass sich eine Archiv-Seite innerhalb einer Woche komplett ändert, da macht es also auch kaum Sinn darauf zu verlinken. 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.