11 Oorzaken van duplicate content (mét oplossing)

11 Oorzaken van duplicate content (mét oplossing)
, Travix
@wouterkiel

Het is één van de meest gevreesde situaties voor elke online marketeer: je komt erachter dat een groot deel van je content dubbel voorkomt op je site. Die mooie tekst die je hebt geschreven over blauwe fietsen staat op minstens drie pagina’s binnen je site! Deksels! Als Google dat ziet dan gaat het mis! Nu gaan al je rankings down the drain! Je wordt uit de index gegooid! Google komt langs en scheert je hond kaal! Toch?

Duplicate content penalty?

Zo’n vaart zal het niet lopen. In de meeste gevallen zul je van Google geen penalty krijgen als er duplicate content voorkomt op je site. Zoekmachines zijn behoorlijk slim als het gaat om het herkennen van gelijke stukken content. Als Google twee versies van een pagina van je site in de index heeft zal de versie die het beste is gaan ranken, de ander wordt simpelweg niet vertoond in de resultaten. Welke pagina het beste is zal liggen aan de kwaliteit en de hoeveelheid van inkomende links, de sitestructuur, clickdata en nog een handvol redenen.

Oorzaken van duplicate content

Hoe kom je aan duplicate content? En vooral, hoe kom je er weer vanaf? Hieronder de 11 meest voorkomende redenen met bijpassende oplossingen.

  • www en non-www
    Voorbeeld: domein.nl en http://www.domein.nl
    Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect
  • Trailing slash
    Voorbeeld: domein.nl/blauwe-fiets en domein.nl/blauwe-fiets/
    Oplossing: redirect één van beiden naar de ander. Gebruik hiervoor een 301 redirect of de canonical tag
  • Product in meerdere categorieën
    Voorbeeld: domein.nl/blauwe-fiets/blauwe-gazelle-herenfiets.html en domein.nl/gazelle/blauwe-gazelle-herenfiets.html
    Oplossing: gebruik de canonical tag of vermijd het gebruik van categorieën in de url
  • URL rewrite + oude URL communiceren
    Voorbeeld: domein.nl/blauwe-fiets en domein.nl/?page_id=6, waarbij geen redirect wordt toegevoegd aan de rewrite regel
    Oplossing: gebruik een redirect
  • Filter criteria in URL
    Voorbeeld: domein.nl/blauwe-fiets?size=20&sort=asc
    Oplossing: gebruik de canonical tag, de meta robots noindex,follow of maak filters niet indexeerbaar
  • Paginering
    Voorbeeld: domein.nl en domein.nl/page/2
    Oplossing: gebruik de meta robots noindex,follow of de canonical tag
  • Session ID in URL
    Voorbeeld: domein.nl/?sessionid=123456
    Oplossing: geef geen session id mee aan de url of gebruik de canonical tag
  • Https & http
    Voorbeeld: http://domein.nl en https://domein.nl
    Oplossing: vermijd gebruikvan https of gebruik een user-agent 301 redirect voor crawlers
  • Printer friendly versie
    Voorbeeld: domein.nl/blauwe-fiets.html?print=true
    Oplossing: link naar printversie niet indexeerbaar, noindex,follow, uitsluiten in robots.txt
  • Interne campagne tagging
    Voorbeeld: domein.nl/blauwe-fiets.html?utm_source=internal&utm_medium=footer-links&utm_campaign=homepage
    Oplossing: Gebruik hash (#) voor campagne tagging of gebruik de canonical tag
  • Content syndication
    Voorbeeld: domein.nl/blauwe-fiets.html en affiliate.nl/blauwe-fiets.html
    Oplossing: Plaats een link naar de bron, cross domain canonical

Toch opzettelijk spammen?

Als je ervoor kiest om heel bewust de zoekresultaten te beïnvloeden door zowel blauwe-fiets.html als blauwe-fietsen.html aan te maken en daar dezelfde content voor te gebruiken, dan wordt het een iets ander verhaal. In dat geval bestaat de kans dat je inderdaad op termijn je rankings en dus je verkeer kwijt bent. Een quality rater die jouw site voorbij ziet komen en er een vlaggetje bij zet, een concurrent die je aangeeft bij Google of het algoritme dat jouw pagina’s er zelfstandig uitvist, er zijn genoeg manieren waarop je in een slecht daglicht komt te staan. Maar wees gerust, je hond laten ze sowieso met rust.

Dit bericht verscheen eerder op: Traffic4u weblog


Geplaatst in

Delen

0
0


Er zijn 9 reacties op dit artikel

  • "Dit bericht verscheen eerder op: Traffic4u weblog" Ehm... is het dan geen duplicate content? ;)

    geplaatst op
  • hahahaha David!

    geplaatst op
  • @davidbrinks: daar is natuurljik expres over nagedacht. Toch Wouter? ;)

    geplaatst op
  • Duh. Ik heb ook nog wel een blog vol met posts die ik een keer op MF wil zetten hoor, als jullie zitten te wachten op 'tips om meer merchandise te verkopen' of 'hoe ontwerp ik een t-shirt'.

    geplaatst op
  • @David Of het duplicate content is? Ik hoop het!

    geplaatst op
  • @merchboer Het moet wel relevant blijven natuurlijk, :).

    geplaatst op
  • hehe oh, begrijp me niet verkeerd, prima artikel en ik vind het prima dat het (ook) hier staat ;)

    geplaatst op
  • Veel voorkomende oorzaak van duplicate content is het overmatig gebruik van tags, zoals op weblogs vaak gebeurt. Met name door weinig voorkomende sleutelwoorden ontstaan binnen een site vaak talloze, nutteloze pagina's waar steeds één en hetzelfde nieuws-/blogbericht staat. Spam dus, bedoeld of onbedoeld. Bij blogs liggen vaak nog andere gevaren op de loer, zoals de verhouding main content / sidebar op individuele itempagina's (permalinks). Een beetje CMS of blogpakket (als Wordpress) houdt daar tegenwoordig gelukkig rekening mee.

    geplaatst op
  • @wouter ik heb er nog eentje:
    Heeft u andere domeinen die niet met een 301 geredirect staan maar met een alias waardoor ze beide in Google staan?

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.