Zum Inhalt springen
Zur Hauptnavigation springen
Zum Footer springen
  • 10+ Jahre Erfahrung 

  • 900+ erfolgreiche Projekte

  • 300+ ★★★★★ Bewertungen

  • 20+ Experten, europaweit tätig

  • 2400+ Follower auf Youtube

Duplicate Content & Thin Content - finden und vermeiden [Guide]

zuletzt aktualisiert am 03. März 2024
Mann und Frau im Büro mit Google auf Bildschirm
Inhaber & Geschäftsführer von ithelps Digital. Seit 2013 beschäftigt er sich intensiv mit den Themen SEO & Online-Marketing.

Vorsicht vor Duplicate Content und Thin Content – die unsichtbaren Gefahren für dein SEO! Der Beweis liegt auf der Hand: Nur die Inhalte, die wirklich Nutzen bieten und die Suchintention erfüllen, schaffen es an die Spitze.

In diesem Artikel zeige ich dir, wie du dünnen Inhalt und Duplikate vermeidest und gleichzeitig den Wert deiner Seite steigerst.


Das Wichtigste in Kürze:

  1. Vermeide Duplicate Content: Achte darauf, dass dein Inhalt einzigartig ist. Vermeide interne doppelte Inhalte, wie dieselben Texte auf verschiedenen URLs deiner Webseite, und externen Duplicate Content, wie das Kopieren von Inhalten anderer Webseiten.

  2. Erkenne und beseitige Thin Content: Identifiziere Seiten mit wenig oder wertlosem Inhalt. Verbessere sie, indem du relevante Informationen, Storytelling, Grafiken oder Infografiken hinzufügst, um den Nutzwert für deine Besucher zu erhöhen.

  3. Nutze Tools zur Erkennung von Duplicate Content: Setze Tools wie Siteliner für internen und Copyscape für externen Duplicate Content ein, um doppelte Inhalte auf deiner Webseite zu finden und zu entfernen.

  4. Biete wertvollen und einzigartigen Content: Stelle sicher, dass deine Inhalte originell sind und echten Mehrwert für deine Leser bieten. Dies erhöht nicht nur die Zufriedenheit deiner Besucher, sondern verbessert auch deine Position in Suchmaschinenergebnissen.


Duplicate Content

Duplicate Content bedeutet duplizierter Inhalt oder doppelter Inhalt.

Eines gleich vorweg: Du wirst von Google nicht abgestraft. Es hat aber einen Einfluss auf SEO: Eventuell rankt bei internem Duplicate Content die falsche Seite. Bei externem dupliziertem Content (Kopie von fremder Website) wird in den meisten Fällen die Originalseite ranken. Deine Kopie wird nicht gerankt oder indexiert werden. Das mag auf dich wie eine Abstrafung seitens Google wirken, ist aber nur eine Auswirkung, die sich aus dem Panda Update ergibt.

Sieh dir auch hier an, was Google dazu sagt:

Wie entsteht Duplicate Content?

(Quelle: SEO-Summery de)

Die häufigsten Gründe für internen Duplicate Content sind:

  • Webseite ist mit und ohne www erreichbar
  • Webseite ist per http und https erreichbar
  • Archiv- und Kategorie-Seiten
  • Übersichtsseiten für Filter oder Tags
  • interne Suchergebnisseiten
  • Seiten oder Beiträge, die mehreren Kategorien und/oder Tags zugeordnet sind
  • Paginierung (Seitennummerierung) z.B. von Kommentaren
  • URL-Parameter und Session-IDs
  • Print-Versionen von Seiteninhalten
  • Identische oder sehr ähnliche Produktbeschreibungen
  • Mobile Webseite mit identischem Inhalt

Die häufigsten Gründe für externen Duplicate Content sind:

  • Webprojekte, auf denen teils ähnliche oder identische Inhalte veröffentlicht werden
  • Content-Klau bzw. Content-Diebstahl
  • Content-Scraping (Scraped content)
  • Verbreitung / Veröffentlichung von Pressemitteilungen
  • Übernahme von Hersteller Produkt- oder Artikelbeschreibungen
  • Veröffentlichen der eigenen Inhalte auf Newsportalen oder in Foren
  • Content-Einspielung von Newslettern oder über RSS-Feeds

Duplicate Content finden

Internen Duplicate Content finden mit Siteliner:

Um internen Duplicate Content auf der eigenen Webseite zu identifizieren, kann ich siteliner.com empfehlen. Das Online-Tool ist kostenlos und du kannst damit deine gesamte Webseite auf doppelte Inhalte prüfen. Die Auswertung beinhaltet eine detaillierte Auflistung jeder einzelnen Seite mit Angaben zur Übereinstimmung der Inhalte (übereinstimmende Wörter, Übereinstimmung der Seiteninhalte in Prozent, Anzahl der Seiten mit ähnlichem Inhalt, Relevanz der Seite für Suchmaschinen).

Ergebnis eines Duplicate-Content-Checks mit siteliner

Siteliner wird von den Entwicklern von copyscape.com, dem führenden Service für Online-Plagiate und Duplicate Content Detection, bereitgestellt. Und dieses Online-Service nutzen wir auch gleich, um externen Duplicate Content zu finden.

Externen Duplicate Content finden mit Copyscape

Copyscape ist das Gegenstück zu Siteliner und hilft dir bei der Suche nach externen Kopien und Plagiaten. Hierzu gibst du deine URL in die Suchmaske ein und klickst auf GO.

Eingabefeld des Duplicate-Content-Checkers copyscape

Daraufhin durchsucht das Online-Tool seinen eigenen Datenbestand und externe Datenquellen nach ähnlichen oder identischen Inhalten und gibt anschließend den entsprechenden Textausschnitt zusammen mit den Webseiten aus, auf denen die Duplikate gefunden wurden.

Duplicate Content Analyse mit der Google Suche

Solltest du einzelne Webseiten auf Duplicate Content überprüfen wollen, kannst du dazu auch die Google-Suche verwenden.

Gib dazu einfach eine Textpassage deines Textes, von der du denkst, dass sie einzigartig ist, in die Suchmaske ein. Der Text-Schnipsel sollte nicht länger als 32 Wörter sein und in Anführungszeichen gesetzt sein.

Duplicate Content Analyse mit der Google SucheSo sieht es aus, wenn kein Duplicate Content gefunden wurde.

Was tun gegen bestehenden Duplicate Content?

Mit internem Duplicate Content gehst du gleich um, wie mit Thin Content.

  • verändere ihn
  • erweitere ihn
  • lösche ihn
  • ergänze ihn
  • mache einen eigenständigen einzigartigen Inhalt daraus

Bei einer Druckversion deines Contents kann es auch zu einer Duplicate-Content-Meldung kommen. In diesem Fall solltest du einen "NoIndex"-Meta-Tag bei der Druckversion setzen.

Bei ähnlichen Produktbeschreibungen, setzt du einen Canonical-Link auf die Originalseite.

Bei externem Duplicate Content gehst du folgendermaßen vor:

Solltest du aus irgendeinem Grund Textpassagen von anderen Webseiten in deinen Content eingebunden haben, musst du diesen erst einmal als fremden Text kennzeichnen. Gib die Quelle an.

Außerdem darfst du nicht ausschließlich fremde Inhalte auf deiner Webseite veröffentlichen. Kurze Passagen, zur Unterstützung deines eigenen Inhalts, sollten kein Problem darstellen.

Du kannst auch kurze Textpassagen eines fremden Textes kommentieren oder diskutieren. Aber denke immer daran, die Quelle zu nennen.

Findest du deine eigenen Texte auf einer anderen Seite, würde ich den Inhaber der Website anschreiben und darum ersuchen, dass der „gestohlene Inhalt“ entfernt wird. Die Kontaktdaten findest du üblicherweise im Impressum. Sollte kein Impressum vorhanden sein, kannst du über verschiedene Dienste herausfinden, wer der Webseitenbetreiber ist.

Beispiele für solche Dienste sind:

In den meisten Fällen reicht dieser Schritt und der doppelte Inhalt wird entfernt. Sollte dies nicht der Fall sein, kannst du über die Google Search Console eine Meldung abschicken. Hier kannst du lesen, was Google über duplizierten Inhalt sagt.

ithelps Expertentipp

Um Duplicate Content effektiv zu vermeiden, solltest du eine konsistente und saubere URL-Struktur auf deiner Webseite implementieren. Achte darauf, dass jede Seite eine eindeutige URL besitzt. Verwende Canonical Tags, um Suchmaschinen mitzuteilen, welche Version einer Seite die vorrangige ist, insbesondere wenn ähnliche Inhalte über mehrere URLs verteilt sind. Außerdem solltest du URL-Parameter und Session-IDs vermeiden, da diese oft zu Duplicate Content führen können. Durch die Implementierung einer klaren und einheitlichen URL-Struktur sorgst du dafür, dass Suchmaschinen deine Inhalte korrekt indexieren und vermeidest so Probleme mit doppelten Inhalten.

Neben Duplicate Content richtet sich Google auch gegen Thin Content. Darüber sollten wir also auch noch sprechen.

Was ist Thin Content?

Dünner Inhalt bezeichnet Webseiteninhalte, die für den Nutzer ohne oder nur wenig Wert bezüglich Informationsgehalt, Lösungen oder Lerninhalte sind.

Google und die anderen Suchmaschinen (Bing, Yahoo und Co.) wollen ihren Usern nur hochwertige Suchergebnisse liefern. Daran kommst du nicht vorbei. Und es ist ja im Grunde ganz logisch.

Google ist kein Wohlfahrtsunternehmen, sondern möchte seine Marktführerschaft und sein Geschäftsmodell ausbauen. Ja, der Suchmaschinenriese möchte Geld verdienen. Je mehr, desto besser. Und das funktioniert nur, wenn die Nutzer mit der Suchmaschine zufrieden sind.

Präsentiert Google seinen Nutzern Inhalte ohne Mehrwert, sind diese unzufrieden. Unzufriedene Nutzer klicken nicht auf Werbeeinschaltungen. Außerdem, wie soll Google relevante Ads einblenden, wenn der Content nichts hergibt. Thin Content ist für den User und für Google also nutzlos. Deshalb wird dieser weit hinten gerankt oder erst gar nicht indexiert.

Thin Content bedeutet nicht unbedingt kurze Texte (unter 300 Wörter)

Die Empfehlung vieler SEO’s ist, keine zu kurzen Texte zu schreiben. Auch wir von ithelps gehören dazu. Ein Richtwert dafür ist: Texte sollten nicht weniger als 300 Wörter haben.

Aber: Kurze Texte, selbst wenn sie weniger als 300 Wörter beinhalten, müssen nicht zwingend wertloser Inhalt sein.

Ein kurzer List-Post, eine Aufzählung wichtiger Punkte zu einem bestimmten Thema, kann von großem Nutzen für den Webseitenbenutzer sein, wenn dieser genau danach gesucht hat.

In solch einem Fall musst du den Text nicht künstlich auf über 300 Wörter strecken. Schreibe eine kurze, aussagekräftige Einleitung, damit der Leser und die Suchmaschine erkennen, worum es geht. Danach verlinke aus themenrelevanten Seiten darauf und teile deinen Text auf Social-Media-Plattformen. Google wird aufgrund der Social Signals und der Relevanz des Textes erkennen, dass es sich nicht um Thin Content handelt. Auch, wenn er weniger als 300 Wörter hat.

Schau dir dazu an, was Matt Cutts von Google zu Thin Content sagt:

Warum schadet Thin Content meiner Website?

Um noch etwas genauer zu sein. Wertlose Inhalte schaden nicht deiner Website, sondern deinen Rankings. Deine Website wird weiterhin funktionieren, gut aussehen und deine Zeit- und Geldressourcen verbrauchen. Sie wird jedoch nicht in der Suchmaschine ranken. Vielleicht wird sie erst gar nicht indexiert. Und das willst du doch nicht. Stimmt’s?

Daher musst du etwas gegen nutzlose Texte und all die anderen Qualitätsmängel tun.

Beginnen wir damit, die nutzlosen, dünnen Inhalte zu finden.

Wie identifiziere ich Thin Content?

Um wertlose Inhalte zu identifizieren, kannst du folgendermaßen vorgehen:

Gehe auf dein Google-Analytics-Konto und finde die Webseiten, die eine hohe Bounce Rate (Absprungrate) und eine kurze Verweildauer haben. Absprungrate und Verweildauer sind gute Indikatoren dafür, ob die Inhalte für den Leser nützlich sind oder nicht.

Ist dein Content gut, ist die Verweildauer dementsprechend hoch und die Absprungrate niedrig.

Bei Thin Content verlässt der Leser deine Seite sehr schnell wieder und hat auch keine Veranlassung, weitere Seiten deiner Website zu besuchen.

Eine weitere gute Möglichkeit inhaltsleere Texte zu finden ist die Google Search Console. Sieh unter Crawling Fehler > Soft 404 nach, ob es Einträge gibt. Bei diesen handelt es sich meist auch um dünnen Inhalt.

Was tun gegen existierenden Thin Content?

Hast du auf deiner Website leere Texte gefunden, solltest du im Sinne deiner Rankings etwas dagegen unternehmen. Dazu hast du drei Optionen:

  1. Content aufwerten
  2. Content löschen
  3. Content auf NoFollow setzen

So machst du aus Thin Content, Rich Content

Deine dünnen Inhalte kannst du aufwerten durch: Storytelling, Hinzufügen von relevanten Informationen, Listen, Vergleiche, Fallbeispiele, Grafiken, Infografiken, Erklärvideos…

Storytelling:

Schreibe eine Geschichte um das Thema herum. Erzähle als Einleitung zum Beispiel, wie du auf das Thema gekommen bist:

„Unlängst habe ich eine Reportage über „Keyword/Keyword-Kombination“ gesehen. Darin wurde erwähnt, dass „Longtail-Keyword“… Ich habe mir Gedanken darüber gemacht und etwas recherchiert. Hier sind meine Erkenntnisse und Erfahrungen.“

Danach ergänzt du den bestehenden Text und nimmst die überzähligen Keywords raus, um Keyword Stuffing zu vermeiden.

Schließe deine Story mit einem Fazit in eigenen Worten ab.

Hinzufügen von relevanten Informationen

Thin Content wird nicht ohne Grund so genannt. Es fehlt an relevanten Informationen. Diese fehlenden Infos musst du deinem Text hinzufügen.

Wenn du nichts mehr zum Thema zu sagen hast oder nichts mehr darüber weißt, recherchiere. Lies dir die Texte der auf Seite 1 bei Google gerankten Webseiten durch. Welche Inhalte kannst du finden, die auf deiner Seite fehlen? Ergänze deinen Text um diese Informationen. Aber Vorsicht: Nicht 1 zu 1 übernehmen. Schreibe mit deinen eigenen Worten. Schreibe so, wie du die Sache verstehst.

Copy and Paste führt zu Duplicate Content, und das ist genauso schlecht wie dünner Inhalt. Darüber reden wir gleich noch.

Listen und Vergleiche

Ergänze deinen Text durch Listen.

  • Zähle die Vorteile und Nachteile eines Produkts, einer Methode, etc. auf.
  • Vergleiche Produkt A mit Produkt B.
  • Erstelle eine Pro und Kontra Liste zu deinem Thema.

Case Studies – Fallbeispiele

Hast du oder jemand, den du kennst, Erfahrung mit deinem Thema gesammelt? Schreibe darüber.

Grafiken und andere Medien

Unterstütze deinen Text durch relevante Medien. Solche können sein:

  • Infografiken
  • Bilder und Grafiken
  • Screenshots
  • Videos
  • etc.

Sorge dafür, dass du die Dateien aussagekräftig benennst (mit Keyword oder themennahen Wörtern) und füge ebensolche ALT-TAGS hinzu. Die Bildbeschreibung bietet sich ebenfalls für die Platzierung von relevanten Inhalten an.

Thin Content löschen

In manchen Fällen kann es im Sinne von SEO auch nützlich sein, dünne Inhalte oder nicht mehr aktuelle Inhalte zu löschen.

Thin Content auf NoFollow setzen

Grundsätzlich halte ich nichts davon, Google von Inhalten auszusperren. Es gibt aber Ausnahmen.

  • Du hast einen Text als wertlos identifiziert. Aus irgendeinem Grund liefert dieser jedoch über Social Media ordentlich Traffic.
  • Es handelt sich um eine Landing Page zum Einsammeln von E-Mail-Adressen für deinen Newsletter. Auf dieser befinden sich meist nur eine Headline, einige Bullet Points und ein Anmeldeformular.
  • Bibliotheken oder Download-Seiten, auf denen oft nur Downloadlinks vorhanden sind.

In solchen Fällen willst du die Seite natürlich nicht löschen. Wenn du auch keine wertvollen Inhalte hinzufügen willst oder kannst, macht es Sinn, diese auf NoFollow zu setzen.

Fazit

Duplicate Content und Thin Content sind zwei der größten Hürden auf dem Weg zum Erfolg. Doch wie wir gesehen haben, sind sie nicht unüberwindbar. Mit den richtigen Tools und Strategien kannst du sicherstellen, dass deine Inhalte nicht nur einzigartig, sondern auch wertvoll und relevant für deine Zielgruppe sind. Die Vermeidung von doppelten und dünnen Inhalten ist nicht nur eine Frage der SEO-Ethik, es ist eine zwingende Notwendigkeit, um bei Google und Co. zu punkten.

Durch die Anwendung der vorgestellten Methoden zur Identifizierung und Korrektur von Duplicate und Thin Content setzt du ein klares Zeichen gegen Mittelmäßigkeit und für Qualität. Es zeigt, dass du bereit bist, den zusätzlichen Schritt zu gehen, um deinen Lesern Mehrwert zu bieten. Und genau das wird von Suchmaschinen belohnt. Letztlich ist es eine Investition in die Zukunft deiner Online-Präsenz und in das Vertrauen deiner Besucher.

Ziehe also aus diesem Artikel die Lehre, dass Originalität und Tiefgang nicht nur SEO-Strategien sind, sondern die Grundpfeiler einer jeden erfolgreichen Website. Lass dich nicht von der Flut an Duplicate und Thin Content mitreißen. Sei stattdessen der Leuchtturm der Einzigartigkeit und Qualität in einem Meer der Gleichförmigkeit. Denn am Ende des Tages wird die Qualität deiner Inhalte darüber entscheiden, wie hoch du in den Suchergebnissen rankst und wie sichtbar deine Marke in der digitalen Welt ist.

 


Alles klar?

Solltest du noch Fragen zum Thema haben oder dir eine professionelle Unterstützung wünschen, dann melde dich bei uns. Schreibe eine E-Mail an Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein., rufe uns unter +43 1 353 2 353 an oder schicke uns deine Anfrage über unser Kontaktformular.



Beitrag teilen



SEO-Profi Sebastian Prohaska von ithelps

Masterclass: SEO verstehen & anwenden können

Start: 29.3.2024

Steigere deine Sichtbarkeit in nur 12 Wochen!
Lerne vom SEO-Profi alles über die Suchmaschinenoptimierung deiner Webseite, um eine nachhaltige und erfolgreiche Online-Präsenz zu bauen.