Comment Spam: Casino’s, porno en pillen

Comment Spam: Casino’s, porno en pillen

porn pills and casino sOplettende Marketingfacts lezers hebben het waarschijnlijk al gezien, de comment-spammers zijn weer bezig. Marco vertrok zondag naar zijn welverdiende vakantie en die zelfde middag verschenen de eerste berichten van online casino?s op de site.

Comment spam is erg vervelend. Hieronder een uitleg wat comment spam is, waarom wordt het gebruikt, hoe doormiddel van de no-follow tag geprobeerd wordt het te bestrijden en een poging uit te leggen waarom Ask Jeeves anders is.

On-page vs. off-page
Zoekmachines beoordelen websites in grote lijnen op 2 manieren. De on-page factoren en de off-page factoren. Bij on-page moet je denken aan de content, de presentatie van die content, titles, headers, bold- en italic-tekst, interne links, meta-descriptions enzovoorts. De eigenaar van een website kan deze factoren allemaal zelf wijzigen en heeft dus betrekkelijk veel invloed op de manier waarop zijn site in de zoekmachines komt.

Zolang dit netjes gebeurd kan ik iedereen aanraden hier mee bezig te gaan. Als je het goed doet kan het veel ge?nteresseerde bezoekers opleveren.

Naast de on-page factoren worden ook off-page factoren meegenomen in de ranking van een website. Deze komen voort uit de volgende gedachte:

?Je kunt iemand beter beoordelen op basis van wat anderen over hem/haar zeggen dan wat hij/ zijn over zichzelf zegt.?

image Alle belangrijke zoekmachines werken met een systeem dat een site waardeert op basis van de inkomende links. Bij Google heet dat PageRank. Yahoo en MSN gebruiken een soortgelijk systeem. Google zegt zelf het volgende over PageRank:

Google interpreteert een koppeling van pagina A naar pagina B als een ‘stem’ van pagina A voor pagina B. Google beoordeelt de relevantie van een pagina door de ontvangen stemmen te tellen.

Daarnaast analyseert Google de pagina’s die de stemmen uitbrengen. Stemmen die zijn uitgebracht door pagina’s die zelf ‘belangrijk’ zijn, wegen zwaarder en helpen om andere pagina’s belangrijk te maken. Belangrijke sites met een hoge kwaliteit ontvangen een hogere PageRank en worden hoger in de zoekresultaten geplaatst of gerangschikt.

Anders gezegd: Als er 10 websites verwijzen naar pagina A en 20 websites verwijzen naar pagina B, dan krijgt pagina B een hogere PageRank en daardoor een betere positie in de zoekresultaten. (Er vanuit gaande dat de andere factoren identiek zijn) Daarbij geldt dat een link van een pagina die zelf een hoge PageRank heeft zwaarder telt dan een link van een pagina die een lage PageRank heeft.
Verder is de tekst waarmee gelinkt wordt, de zogenaamde anchor text, erg belangrijk. Deze tekst zegt veel over de pagina waar naartoe gelinkt wordt.

Dit hele principe heeft betrekking op pagina?s, en dus niet op websites.

Comment spam
Om goede posities in zoekmachines te krijgen moet je dus voldoende inkomende links hebben. Een snelle en eenvoudige manier om veel inkomende links te krijgen is door geautomatiseerd comments in weblogs te posten met een link naar jezelf. En dat is precies waar Marketingfacts de afgelopen dagen last van heeft:

comment spam roulette

Porn, Pills & Casino?s
Waarom komt dit soort spam nou altijd van die porno, viagra of casino sites?

Dit soort bedrijven is over het algemeen geheel online. Ze zijn dus compleet afhankelijk van de bezoekersaantallen op hun website. Daarbij is de concurrentie erg competitief en agressief. Wil je hier mee concurreren dan zul je dus zelf ook agressief te werk moeten gaan. Het is dus niet zo verwonderlijk dat comment spam met name door dit soort bedrijven wordt toegepast.

Deze agressieve manier van concurreren heeft er toe geleid dat binnen de SEO branche aparte bedrijven zijn die zich richten op de promotie van PPC bedrijven (Porn, Pills & Casino?s). Een voorbeeld is WebGuerilla van Greg Boser. (Hiermee zeg ik niet dat Greg ook comment spam toepast, maar wel dat hij ?rg ver gaat om zijn klanten tevreden te stellen) Met nette technieken kun je een online casino niet voldoende positioneren ten opzichte van de rest. Je zult dus haast wel moeten spammen om een redelijk resultaat te behalen. De ?gewone? SEO bedrijven willen hun handen hier niet aan branden.

Nofollow-tag
Sinds begin dit jaar maakt een groot deel van de zoekmachines en weblogs gebruik van de nofollow-tag. Een weblog kan hiermee aan de zoekmachines vertellen dat een link door een bezoeker van de site is geplaatst. De eigenaar van de weblog kan dus niet voor die link instaan. Google negeert links met de no-follow tag. Yahoo! telt ze wel mee, maar daar wegen links met een no-follow tag minder dan ?gewone? links. Inmiddels heeft een groot deel van de weblogtools de no-follow tag in de standaard templates ingebouwd.

Een uitgebreidere uitleg van de nofollow tag vind je hier. Hierin schreef ik al het volgende over de nofollow-tag:
?Toch zitten er een aantal nadelen aan deze methode. Zo zeggen links in de reacties op weblogs vaak veel over wat populaire websites zijn en wat er actueel is. Bovendien mag je er van uitgaan dat het grootste deel van de links is geplaatst uit een informatief oogpunt, en niet om het zoekresultaat te verbeteren. Door links die in reacties staan te negeren, mis je al dit soort nuttige informatie.?

Het lijkt dus een beetje een halve oplossing van het probleem. Zou Marketingfacts de nofollow tag invoeren dan zullen comment-spammers waarschijnlijk de volgende keer een ander weblog uitkiezen. Daarmee zou je wel buigen voor die enkele spammer ten koste van al die nuttige en interessante informatie die in de comments op Marketingfacts te lezen is.

De nofollow is dus een goede manier om de nadelen van PageRank en dergelijke systemen op korte termijn aan te pakken. Helaas zullen nieuwe manieren bedacht worden om op een agressieve wijze meer inkomende links te krijgen. Zoekmachines zullen dus op zoek moeten naar een betere manier om inkomende links te beoordelen.

Ask Jeeves/ TEOMA/ Communities
Nu heb ik eindelijk een bruggetje naar mijn favoriete zoekmachine: Ask Jeeves.

Om uit te leggen waarom Ask Jeeves waarschijnlijk slimmer omgaat met de linkproblematiek moet ik eerst even een uitstapje maken waarin ik uitleg hoe Ask Jeeves/ TEOMA werkt en waarom dat zo anders is dan de andere zoekmachines:

Ask Jeeves maakt gebruik van de technologie van TEOMA. TEOMA deelt het internet op in communities die over een bepaald onderwerp gaan. Zoek je in Google, Yahoo! of MSN naar ?apple? dan kom je bovenin de zoekresultaten alleen het computermerk apple tegen. Mocht je zoeken naar de vrucht ?apple? dan zul je creatief met je zoekvraag om moeten gaan om een zinnig zoekresultaat uit deze zoekmachines te halen.

Zoek je daarentegen met behulp van Ask Jeeves naar de term ?apple?, dan krijg je naast het zoekresultaat een aantal ?Related Topics? te zien. In dit geval zie je onder andere:

- Apple the Fruit
- Banana
- Apple Computers
- Red Apple
- Apple Tree
- Oranges

teoma s view of the web

Nu kun je dus kiezen of je informatie zoekt over de vrucht ?apple? of de computer ?apple?.

Elke community bestaat uit Authorities en Hubs. Een autoriteit is vaak te herkennen aan het informatieve karakter en veel uitgaande links. Door deze links te beoordelen kun je de rest van de community in kaart brengen. Zoek je in TEOMA bijvoorbeeld naar een ?fiets? dan zie je rechts naast de zoekresultaten een kopje ?Resources?. (Link collections from experts and enthusiasts!) Hierin tref je pagina?s aan die min of meer ?onafhankelijk? zijn en links bieden naar de resultaten aan de linkerkant.

Links tref je merken als Batavus en Giant, rechts tref je o.a. www.infotaria.be met links naar Batavus, Gazelle en Giant. Hiermee laat ik ook meteen een voordeel van dit systeem zien. Batavus en Gazelle zullen geen links naar elkaar plaatsen. Ze zijn immers concurrenten. Toch zijn het allebei belangrijke spelers in deze branche en is er dus wel degelijk een relatie tussen de beide bedrijven. De meeste zoekmachines snappen deze relatie niet.
Door de community te doorzoeken snapt TEOMA wel dat Batavus, Gazelle en Giant belangrijke spelers zijn in de ?fiets? branche en dus een onderlinge relatie hebben.

Wat heeft dat nou allemaal met comment spam te maken?

Doordat je communities onderscheid, kun je links van buiten de community als irrelevant bestempelen. Alleen links die vanaf sites uit een voor de zoekopdracht relevante community komen tellen mee in de beoordeling. Links die zomaar random op weblogs worden gezet hebben dus geen effect op de ranking van de website. Daarmee wordt het effect van de comment-spam teniet gedaan. Pas als iemand besluit een artikel op Marketingfacts te schrijven over online casino?s, dan zou een link in de reacties bij dat artikel relevant zijn.


Opgeruimd!
Inmiddels heeft Erik van Roekel de comment spam verwijderd, Marketingfacts is dus weer schoon. Nu maar hopen dat het zo blijft.


Bronnen/ zie ook
Yahoo! Search Blog
Google Blog
MSN Search Weblog
Ask Jeeves Blog

Adding a New Dimension to Search: The Teoma Difference is Authority
Block-level Link Analysis (PDF)
Filthy Linking Rich And Getting Richer!
In conversation with Jim Lanzone & Apostolos Gerasoulis of Ask Jeeves/Teoma (By Mike Grehan)


Delen



Er zijn 13 reacties op dit artikel

  • Tjah, daar typ je dan net een heel bericht over dit onderwerp, ben je vergeten je e-mail adres te vermelden en werkt de back knop niet goed. Dan heb je niet veel zin meer om het bericht opnieuw te typen....

    geplaatst op
  • Het fenomeen was me de afgelopen dagen erg opgevallen hier, maar kende het begrip Comment Spam niet. Dank voor de heldere en informatieve uitleg Remi!

    geplaatst op
  • Maargoed, toch nog maar een keer dan...

    Is het voor Nederlandse sites niet vrij simpel om comment spam te weren omdat het toch vooral over Casino's, porno en pillen gaat? Is het niet zo dat ze altijd gebruik maken van (anonieme) proxies? Altijd gebruik makend van HTTP 1.0?Accepteren ze wel cookies en geven ze die dan ook door? Een vreemde UserAgent misschien?

    Ik kan niet geloven dat er niet ergens een patroon in zit zodat het met wat aanpassingen vrij simpel tegen te houden is.

    geplaatst op
  • Er zijn voor vele blogsystemen inmiddels anti-commentspam scripts/plugins in omloop die gebruikt maken van Jay Allen's blacklist voor Movable Type, zie daar dus http://www.jayallen.org/comment_spam/

    geplaatst op
  • Er zijn natuurlijk meerdere (semi) oplossingen. De beste ervan vind ik een combinatie van meerdere technieken:

    Maak gebruik van een ip2country database. Bekijk uit welk land een poster komt en bestempel een aantal landen als 'risicogroep'.

    Voor de posters uit de risicogroep zet je een plaatje met een cijfer-lettercombinatie neer (GD library) en je vraagt ze de combinatie over te typen. Een bot moet wel heel geavanceerd zijn om dat te kunnen.

    Daarnaast kun je creatief zijn met een variabel aantal hidden fields, met een random coder erin. Zet deze code in een sessie en vergelijk de codes bij het posten.

    Wanneer je postsysteem íets anders werkt dan de meest gebruikte systemen, is het al bijna onmogelijk er een goede bot voor te schrijven.

    geplaatst op
  • Remi,

    Dank voor deze heldere uiteenzetting. Ik heb er zelfs last van in een simpel gastenboek op mijn eigen prive site.

    geplaatst op
  • Misschien overbodig te vermelden, maar op het pmachine forum staat een thread met uitgebreide informatie om de comment spam te beperken.
    http://www.pmachine.com/forum/threads.php?id=25734_0_16_0_C

    Heeft mijn site spam-vrij gemaakt..

    geplaatst op
  • CommentSpam is vrij eenvoudig te voorkomen, niet door zogenaamde spamfilters of door nofollow tags, deze helpen wel maar zijn lapmiddelen.

    Registratie of als je dat niet wilt, simpelweg een authenticatieplaatje, ook wel de gekke cijfertjes en lettertjes die je ziet als je je bij sommige diensten moet aanmelden. Deze worden random gegenereerd en vragen dus aktie van de gebruiker.

    Helaas hebben niet alle blogpaketten deze optie, soms zijn ze wel als plugin te downloaden en te plaatsen in je comment template.

    geplaatst op
  • @Remi: prima uiteenzetting van een hoogst irritant verschijnsel.

    @Allen: Ik heb wat betreft Movable Type bijzonder goede ervaringen met de eerder genoemde Jay Allen's Movable Type Plugin, genaamd MT-blacklist. De blacklist wordt regelmatig geupdate en heeft bijzonder veel spam tegengehouden.

    geplaatst op
  • @ Anne, Martin en Erik
    Bedankt voor de complimenten! Ik vond het (als onervaren blogger) best lastig om kort en krachtig uit te leggen wat comment spam is en waarom sommige bedrijven het toepassen. In eerste instantie was het artikel zelfs nog langer, ik heb een groot deel over o.a. Ask Jeeves geschrapt om het leesbaar te houden. (wellicht verwerk ik dat nog eens in een ander artikel)

    @ De rest
    Bedankt voor de aangedragen oplossingen! Binnenkort zal de site toch op de schop moeten om de nieuwe lay-out van Marketingfacts in te voeren, dat is een mooi moment om meteen een structurele oplossing voor het comment spam probleem in te voeren.

    geplaatst op
  • @Martijn de Boer
    Voor een simpele gastenboek volstaat het wijzigen van de namen van de invoervelden in cryptische termen als naam123 email123 en reactie123. Bij weblog software gaat dit wat moeilijker, tenzij je bereid bent om bij elke update dezelfde wijzigingen te doen. Het probleem zit hem er in dat er zoveel weblogs op dezelfde manier werken. Wijk je daar van af dan zit je goed.

    geplaatst op
  • Hallo Marketingfacts,
    In Nederland geldt: "de vervuiler betaalt" is dit ook niet toepasbaar op ongewenste email. Uiteindelijk heeft elk van derlgelijke emails een doel of bedrijf wat de opdracht voor die email gegeven heeft. Een dergelijk beleid zou de "vervuiler" in zijn of haar portemonnee kunnen treffen en dat doet zeer daar waar het in mijn opinie hoort. De strijd van beveiliging en omzeilers historisch gezien een altijd verloren zaak. Zolang creatievelingen het een sport vinden of voor grof geld bereid zijn beveiligingen te hacken is dat dweilen met de kraan open.
    Het mooiste voorbeeld vind ik altijd nog dat Sony een nieuwe anti-kopie beveiliging voor zijn CD's aankondigde en voordat die uitgebracht werd op Internet al de omzeiling te lezen was: een strategisch geplaatste streep met een boardmarker op de CD.
    Vriendelijke groet,
    Lex Goode.

    geplaatst op
  • Comment spam werkt maar tijdelijk. Uiteindelijk zal de webmaster van een bepaald blog de spam gaan wissen. Ik heb zelf ook voor casino´s gewerkt en advies gegeven. Ik heb ze altijd gewaarschuwd om er niet aan te beginnen. Ze spammen zelfs op de blogs van hun eigen affiliates. Uiteindelijk zijn ze er mee gestopt omdat ze veel boze partners / affiliates hadden. Het enige voordeel van comment spam is dat je snel backlinks hebt op veel diverse ip adressen dat is momenteel één van de belangrijkste factoren in combinatie met de citation flow en trust flow van een backlink pagina.

    gr,

    SEO Robin Noppen

    PS ik zal niet spammen hoor met een linkje

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.