Google gaat ‘comment spam’ te lijf

Google gaat ‘comment spam’ te lijf
, Carl Mangold

Zoekmachine Google heeft veel last van ‘comment spammers’; bedrijven die waardeloze berichten op weblogs achterlaten, alleen maar om het aantal verwijzingen naar hun (casino-)websites te verhogen. En daarom heeft ze de <a href=”...”> tag uitgebreid met het rel=”...” attribuut.

<a href=”...” rel=“nofollow”> koppelingen worden voortaan niet meer meegenomen in Google’s PageRank systeem; voor weblog software van ondermeer LiveJournal, Scripting News, Six Apart, Blogger, WordPress, Flickr, Buzznet, blojsom en Blosxom zijn er plug-ins verkrijgbaar.


Geplaatst in

Delen



Er zijn 11 reacties op dit artikel

  • Het lijkt er op dat niet alleen Google maar ook MSN en Yahoo! meewerken aan de comment-spam bestrijding (zie o.a. r-win). Interessant is dat vanaf dat moment de kreet "Google loves blogs" niet meer opgaat. Weblogs zullen (weer) net als gewone websites goede content moeten bieden waar andere websites (of weblogs) naar linken om een hoge PageRank en daarmee een hoge positionering in Google te krijgen. Kan dit alleen maar toejuichen!

    geplaatst op
  • De kreet "Google loves Blogs" is niet enkel gebaseerd op de comments. Het vele updaten speelt daar volgens mij een net zo grote zo niet grotere rol bij.

    Daarbij, hecht Google waarde aan uitgaande links vanaf een weblog? Ik dacht dat de nadruk lag op de inkomende links (m.a.w.: het aantal links naar een weblog, ipv er vandaan).

    geplaatst op
  • Als de nofollow wordt geintroduceerd betekent het automatisch dat uitgaande links (bijv. mensen die op mijn weblog een bericht achterlaten met als doel een exta link naar hun eigen site te creeren) niet meer meetellen voor Google. Voor de betreffende site (spammer?) gaat het in dat geval om een inkomende link die geen enkel effect meer heeft op de PageRank. Comment-spam wordt daarmee zinloos!

    Vwb "Google loves blogs" heb je gelijk dat het niet alleen gaat om de linkstructuur (zowel interne als externe) maar ook om andere zaken als update-frequentie. De verhouding tussen beide ken ik eerlijk gezegd niet. Wellicht dat de SEM-specialisten hier iets meer over kunnen zeggen?

    geplaatst op
  • Ja, mee eens. Al heeft dat volgens mij weinig invloed op de waarde die Google hecht aan de "bespamde" site. Maar ik ben geen SEM-specialist, helaas. ;)

    Wat trouwens een reeds veel toegepaste manier is om commentspamming zinloos te maken is het automagisch vervormen van de url door er bijvoorbeeld een script voor te zetten. Bij het plaatsen van de link http://www.nu.nl zal de uiteindelijk vertoonde link iets in de trant van http://www.mediafact.nl/out.php?http://www.nu.nl worden, waardoor Google de link niet schijnt te herkennen als link naar nu.nl.

    Maar ook ik ben benieuwd wat de SEM-specialisten hierover te zeggen hebben.

    geplaatst op
  • Ik snap deze oplossing niet. Voor simpele weblog-software is het misschien wel en optie, maar waarom zetten weblogs die hun diensten centraal online aanbieden, niet gewoon een captcha in? Da's dat eerder besproken afbeelding met daarin een paar gehusselde letters die je als gebruiker moet voertypen om aan te tonen dat je geen robot bent. Ben je ook van alle spam af, terwijl je tegelijkertijd de waardevolle echte links van bezoekers wel kunt blijven meetellen.

    @Gert - die laatste methode ondermijnt wellicht de pagerank-effecten, maar het kan nog steeds bezoekers naar een viagra-site lokken, dus comment spam blijft dan (helaas) interessant.

    geplaatst op
  • @Anders: op zich is de oplossing met de captcha wel een idee, maar het geeft wel weer een extra drempel voor het reageren. Drempels die vele weblogs proberen te vermijden, alhoewel het net iets minder drastisch is dan het invoeren van een registratieverplichting.

    On a sidenote: wij hebben vrijwel nooit last van spamplaatsende bots. Wel hebben we een systeem om url's op een blacklist te plaatsen die automatisch worden vervangen wanneer ze geplaatst worden. Op die manier ondervang je in één keer alle mogelijke spamuitingen van een partij.

    Kortom: comment spam blijft - ook door google's plannen - interessant tenzij de webmaster er zelf actief tegenin gaat.

    geplaatst op
  • Vanuit een SEM oogpunt is de nofollow attribuut een goede stap met name voor zoekmachines die linkpopulariteit meenemen in de wegingscriteria. Inderdaad kunnen blogcomments worden misbruikt om het aantal links naar websites op te hogen. Hierdoor kan een kunstmatige linkpopulariteit worden verkregen, die bij grote aantallen zeker een invloed kunnen hebben op de ranking. Aangezien dit de kwaliteit van de zoekmachine resultaten ondermijnt, is dit zoekmachine spam.

    geplaatst op
  • Tsja, maar met dat uitgangspunt kun je alle links die in de "consumer generated media" worden genoemd, negeren. Hoeveel waarde heeft de pagerank dan nog.

    Het toont overigens nog maar eens aan dat blogs op dit moment enorm worden overhyped. Al jarenlang worden links, signatures, spam en whatnots en masse gebruikt in nieuwsgroepen en forums. Vrijwel nooit heeft iemand een kik gegeven over link/pagerank-spamming door alle signatures. Nu zijn er een paar weblog-botjes actief en opeens worden er van alle kanten redenen aangedragen om de links niet meer te indexeren?

    geplaatst op
  • Ook in verschillende fora is al heel lang de regel actief om ofwel geen sig. toe te laten vanwege mogelijke penalties van zoekmachines door het aantal links vanuit populaire fora.

    Ik denk eerder dat de weblogs de druppel zijn die de emmer laten overstromen. Ongetwijfeld zijn er meer weblogs dan fora.

    In principe zijn de grote weblog software leveranciers ook zoekmachines. Blogger is van Google, MSN Spaces van MSN, 6apart (to be Yahoo??). Dit kan de zoekmachine controleren, dus passen ze dit toe.

    Daarnaast is het gemakkelijker misbruik te maken van weblogs, dan van fora. Als ik wil start ik morgen 20 nieuwe blogs, plaats wat populaire berichtjes voor wat inkomende links, koppel vervolgens alle 20 blogs aan elkaar, stop er in de comments wat links in naar de daadwerkelijke (casino) sites en bouw zo snel een linkfarm.

    geplaatst op
  • Als je dat gemakkelijk noemt :)

    Jammer dat je voorbeeld feilloos aantoont dat de huidige maatregel een schijnmaatregel is. Wie zelf weblogs opzet, laat immers doorleuk die rel='nofollow'-tags weg.

    Juist het feit dat Blogger en MSN er bij betrokken zijn, doet bij verbazen waarom ze niet zo'n captcha-checker er in zetten. Zijn ze meteen klaar, zonder dat iemand er nadelige gevolgen van ondervindt, in tegenstelling tot de huidige maatregel waarbij het kind met het badwater wordt weggegooid.
    Als mensen de moeite nemen om een bericht van 40, 100, 200 karakters te typen, is het weinig moeite om nog eens 4, 5 karakters ter verificatie over te typen. Die drempel is zeer laag, en voor zover deze aanwezig is heeft deze bovendien nog als voordeel dat de kwaliteit van de reacties omhoog gaat.

    geplaatst op
  • Helemaal gelijk! Bij Blogger is het nu nog een plugin. Het is niet dwingend. Wie weet is dat de volgende stap.

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.