Google, Yahoo en Live Search introduceren canonical-tag

Google, Yahoo en Live Search introduceren canonical-tag

duplicate contentHet probleem rondom duplicate content is duidelijk. Als je kijkt naar het internet dan stikt het van dubbele pagina’s. Aan de ene kant willen zoekmachines juist die ene bron pagina laten zien en aan de andere kant willen zoekers één resultaat zien. Maar hoe ontstaat deze “duplicate content” dan? Dit kan op verschillende manieren gebeuren, maar wel de meest bekende is dat informatie op verschillende urls te vinden is. Dit kan bijvoorbeeld doordat er variabelen aan de url van de pagina worden toegevoegd of een trackingcode voor analytics. Op deze manier is een specifieke pagina op een gegeven moment op een meerdere manieren te bereiken.

Dit kan resulteren in een minder goede indexering van je site of zelfs dat de populariteit (link juice) verdeeld wordt over verschillende urls die wel allemaal naar dezelfde pagina leiden. Wat is de oplossing hiervoor?

Canonical-tag

Om dit op te lossen kon soms “quite a pickle” zijn. Maar Google, Yahoo en Live Search hebben de zoek-hoofden bij elkaar gestoken om dit probleem op te lossen: de canonical-tag. Met deze tag kun je aangeven wat de door jou geprefereerde versie van een url is.

Sneaker Obsession Shop

Hoe ziet deze tag eruit en hoe werkt deze?

Stel ik heb een schoenensite en een hippe sneaker is te vinden op de url:
www.sneakerobsession.nl/product.php?sneakid=20

Simpel genoeg. Maar deze sneaker valt ook onder de zomer categorie. In dit geval “Sneakers Zomer”, waardoor hij ook te vinden is op deze url:
www.sneakerobsession.nl/produkt.php?sneakid=20&categorie=sneakerszomer

En als we dan vervolgens ook nog eens een trackingid meegeven kan dezelfde zomersneaker ook op de url te vinden zijn:
www.sneakerobsession.nl/produkt.php?sneakid=20&categorie=sneakerszomer&trackid=343798347

Door de canonical-tag is het vrij gemakkelijk om richting zoekmachines aan te geven dat deze 3 urls allemaal naar dezelfde pagina verwijzen en dat je dit ook op deze manier in de zoekmachines zou willen terug zien. In de head van duplicate url pagina’s zet je de volgende tag:

<link rel=“canonical” href=“www.sneakerobsession.nl/product.php?sneakid=20” />

Zoekmachines zullen nu begrijpen dat alle 3 urls verwijzen naar de canonical url, zoals aangegeven in de link-metatag.

Alle problemen zijn opgelost!

Nou dat is nog maar net de vraag. Uiteraard is deze tag een goede stap voorwaarts. Deze tag is voor zoekmachines een hint en zeker geen richtlijn. Daarnaast is het nog altijd sterker om een goede interne structuur op te zetten. Dit is ook iets wat Google benadrukt op het webmaster blog, waar overigens verdere vragen over de tag ook beantwoord worden.


Geplaatst in

Delen

0
0


Er zijn 16 reacties op dit artikel

  • Dit is een hele interessante stap, maar je bent met een goede interne structuur wel beter af. Ik mis alleen nog de canonical tag?

    geplaatst op
  • Tom: check even de broncode van de pagina voor de tag. Marketingfacts.nl CMS heeft de tag niet ge'encode met als gevolg dat dit als source 'getoond' wordt en de pagina in feite niet meer W3C valid is (niet dat dat in eerste instantie zo was).

    geplaatst op
  • @Tom: sorry, het CMS heeft inderdaad de tag zelf als echte tag in de code geplaatst ipv tekst. Opgelost!

    geplaatst op
  • Ik zie de tag eerlijk gezegd niet staan. Ik ben daarnaast wel benieuwd hoe je er voor zorgt dat een CMS (zeg Wordpress) deze tag automatisch in de pagina zet en dan ook nog met de juiste url erin. Of zijn daar nu al plugins voor?

    geplaatst op
  • @Tom
    Mee eens. Een goede sitestructuur en deugdelijke rewrites zal je veel van dit soort problemen besparen. En voor Analytics tagging kun je ook hashes gebruiken, zodat alle utm_source duplicate ellende je bespaart blijft. Maar er zijn altijd gevallen waarin dit erg nuttig kan zijn.

    geplaatst op
  • @Tom: een goede interne linkstructuur zorgt er inderdaad voor dat een deel van het dubbele URL's probleem opgelost wordt. Maar in dat geval gebruik je het als een lapmiddel voor een slechte interne linkstructuur die leidt tot een slecht URL strucuur. Dat is niet waar dit element voor bedoeld is, het is wel een handig zij-effect.

    Het echte probleem wat je bijna niet kunt ondervangen is het probleem wat Siegfried schetst met zoekpagina's:

    sneakerobsession.nl/produkt.php?sneakid=20&categorie=sneakerszomer
    sneakerobsession.nl/produkt.php?categorie=sneakerszomer&sneakid=20
    sneakerobsession.nl/produkt.php?sneakid=20&categorie=sneakerszomer&order=price
    sneakerobsession.nl/produkt.php?categorie=sneakerszomer&sneakid=20&order=size
    sneakerobsession.nl/produkt.php?sneakid=20&order=price&categorie=sneakerszomer
    sneakerobsession.nl/produkt.php?order=size&categorie=sneakerszomer&sneakid=20

    En zo kan ik nog 20 adressen maken die allemaal dezelfde content laten zien, maar dan met een iets ander schoenenaanbod (anders gesorteerd). En nu wil je dat Google al deze variaties als 1 pagina gaat zien:

    sneakerobsession.nl/produkt.php?sneakid=20

    Dit ondervang je niet met een goede link- of URL structuur. En andere oplossingen als useragent-cloaking waarmee je de googlebot een redirect geeft naar het origineel, of waar je alle andere varianten op noindex,follow zou plaatsen werken lang niet zo prettig.

    @Melle: Wordpress plugin

    geplaatst op
  • Een goede stap om een extra alternatief te hebben om problemen rondom dubbele content in zoekmachines te verhelpen!

    Met name goed dat Google, Yahoo en Microsoft hierin samenwerken, wat in 2006 al gebeurde met het sitemap.xml protocol.

    Mijn mening is echter dat je dubbele content problemen in deze volgorde het beste kunt oplossen:

    1) Goede site structuur (voorkom waar mogelijk dubbele content)
    2) Permanente redirect 301 (zowel bezoekers als zoekmachines worden permanent doorverwezen)
    3) Canonical tag (als de voorgaande verbeterpunten niet toepasbaar zijn)

    Belangrijk vind ik bij dit 'canonical tag' initiatief dat het - zoals Siegfried beschrijft - een richtlijn is voor zoekmachines, geen commando (zoals een permanente (301) redirect wel is).

    Als de pagina's onvoldoende identiek zijn, de canonical tag genegeerd wordt (mede om misbruik te voorkomen).

    Merk op dat deze tag alleen werkt binnen hetzelfde domein. Je dus geen verwijzing maken tussen identieke content op verschillende domeinen.

    geplaatst op
  • @Eduard: goede toevoeging over hetzelfde domein! Werkt wel op folders en subdomeinen, maar niet meerdere domeinnamen.

    Ik ben het overigens eens met je prioriteitenlijst. Goede structuur blijft gewoon de nummer een om dit op te lossen. Ben benieuwd hoe dit in de komende tijd zal worden opgepakt.

    geplaatst op
  • @Melle

    Checkout http://yoast.com/canonical-url-links/ Daar al een plugin voor Wordpress, Magento en Drupal..

    geplaatst op
  • Inderdaad mooi om te zien dat de zoekmachines weer eens samenwerken, ze deden dat trouwens ook in 2005 al bij de nofollow, rond de SES in New York, al blijf ik erbij dat ze dat crappy gedaan hebben.

    Nu maar hopen dat mensen niet denken dat dit alle problemen oplost. Toen we sitemaps ingevoerd werden waren er ineens allemaal mensen die dachten dat alle indexatieproblemen opgelost waren. Zonde natuurlijk, want dit soort dingen helpen wel, maar ze blijven een extratje, geen échte oplossing.

    Ik ga er van uit dat Endeca, Fredhopper enz en een flink aantal CMSen die gebaseerd zijn op het sorteren en presenteren van het aanbod van een site in verschillende samenstellingen, deze tag wel standaard zullen gaan meeleveren. Waarmee een aantal problemen met indexatie wat verzacht worden. We zullen het zien.

    geplaatst op
  • Slim goed oplossing van een bekend probleem.
    Alleen jammer dat het voorbeeld hier fout is

    <link rel=“canonical” href=“www.sneakerobsession.nl/product.php?sneakid=20” />

    href="www ?

    dat is natuurlijk fout.
    href="http://www is natuurlijk wel goed.
    Of ben ik nou een zeikerd? :)

    geplaatst op
  • @Kjeld: nee, vind je meer oplettend! (en scherp voor een vrijdagmiddag) Thanks! :)

    geplaatst op
  • Nog meer muggenziften: we hebben het hier over de waarde (canonical) van een attibuut (rel) en niet over een tag (link).

    geplaatst op
  • We zullen wel zien wat het oplevert.

    geplaatst op
  • Ziet iemand er voor of nadelen in om deze nieuwe meta-tag automatisch in iedere pagina op te nemen en de Canonical-URL gelijk te stellen aan de URL in de Sitemap.xml.

    Voor (Google)analytics doeleinden kun je dan een parameter in de URL meegeven. Google analytics blijft volgens mij gebruik maken van de URL en zoekmachines gebruiken de Canonical-URL voor o.a. de pagerank berekening.

    Als ik het goed begrijp is de Canonical-URL bij Google al geimplementeerd?

    geplaatst op
  • @JP Kroezen
    Zoals in de comments hieboven al is genoemd, zijn er al plugins gemaakt voor o.a. Wordpress en Drupal om de canonical url automatisch per pagina op te nemen.

    Een voordeel hiervan is dat elke pagina standaard als de canonical versie wordt aangewezen. Een nadeel is als je handmatig dubbele content creeert, de canonical tag nutteloos wordt.

    Google gebruikte de Sitemap.xml al om de juiste versie van een url vast te stellen. Het is dus aan te raden de canonical tag overeen te laten komen met die url's.

    Zie ook de duidelijke toelichting van Google's Matt Cutts in deze video:
    http://videos.webpronews.com/2009/02/13/breaking-news-matt-cutts-explains-canonical-tag-from-google-yahoo-microsoft/

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.