Comment Spam: Casino’s, porno en pillen

   17 mei 2005    @remivanbeekum

porn pills and casino sOplettende Marketingfacts lezers hebben het waarschijnlijk al gezien, de comment-spammers zijn weer bezig. Marco vertrok zondag naar zijn welverdiende vakantie en die zelfde middag verschenen de eerste berichten van online casino?s op de site.

Comment spam is erg vervelend. Hieronder een uitleg wat comment spam is, waarom wordt het gebruikt, hoe doormiddel van de no-follow tag geprobeerd wordt het te bestrijden en een poging uit te leggen waarom Ask Jeeves anders is.

On-page vs. off-page
Zoekmachines beoordelen websites in grote lijnen op 2 manieren. De on-page factoren en de off-page factoren. Bij on-page moet je denken aan de content, de presentatie van die content, titles, headers, bold- en italic-tekst, interne links, meta-descriptions enzovoorts. De eigenaar van een website kan deze factoren allemaal zelf wijzigen en heeft dus betrekkelijk veel invloed op de manier waarop zijn site in de zoekmachines komt.

Zolang dit netjes gebeurd kan ik iedereen aanraden hier mee bezig te gaan. Als je het goed doet kan het veel ge?nteresseerde bezoekers opleveren.

Naast de on-page factoren worden ook off-page factoren meegenomen in de ranking van een website. Deze komen voort uit de volgende gedachte:

?Je kunt iemand beter beoordelen op basis van wat anderen over hem/haar zeggen dan wat hij/ zijn over zichzelf zegt.?

image Alle belangrijke zoekmachines werken met een systeem dat een site waardeert op basis van de inkomende links. Bij Google heet dat PageRank. Yahoo en MSN gebruiken een soortgelijk systeem. Google zegt zelf het volgende over PageRank:

Google interpreteert een koppeling van pagina A naar pagina B als een ‘stem’ van pagina A voor pagina B. Google beoordeelt de relevantie van een pagina door de ontvangen stemmen te tellen.

Daarnaast analyseert Google de pagina’s die de stemmen uitbrengen. Stemmen die zijn uitgebracht door pagina’s die zelf ‘belangrijk’ zijn, wegen zwaarder en helpen om andere pagina’s belangrijk te maken. Belangrijke sites met een hoge kwaliteit ontvangen een hogere PageRank en worden hoger in de zoekresultaten geplaatst of gerangschikt.

Anders gezegd: Als er 10 websites verwijzen naar pagina A en 20 websites verwijzen naar pagina B, dan krijgt pagina B een hogere PageRank en daardoor een betere positie in de zoekresultaten. (Er vanuit gaande dat de andere factoren identiek zijn) Daarbij geldt dat een link van een pagina die zelf een hoge PageRank heeft zwaarder telt dan een link van een pagina die een lage PageRank heeft.
Verder is de tekst waarmee gelinkt wordt, de zogenaamde anchor text, erg belangrijk. Deze tekst zegt veel over de pagina waar naartoe gelinkt wordt.

Dit hele principe heeft betrekking op pagina?s, en dus niet op websites.

Comment spam
Om goede posities in zoekmachines te krijgen moet je dus voldoende inkomende links hebben. Een snelle en eenvoudige manier om veel inkomende links te krijgen is door geautomatiseerd comments in weblogs te posten met een link naar jezelf. En dat is precies waar Marketingfacts de afgelopen dagen last van heeft:

comment spam roulette

Porn, Pills & Casino?s
Waarom komt dit soort spam nou altijd van die porno, viagra of casino sites?

Dit soort bedrijven is over het algemeen geheel online. Ze zijn dus compleet afhankelijk van de bezoekersaantallen op hun website. Daarbij is de concurrentie erg competitief en agressief. Wil je hier mee concurreren dan zul je dus zelf ook agressief te werk moeten gaan. Het is dus niet zo verwonderlijk dat comment spam met name door dit soort bedrijven wordt toegepast.

Deze agressieve manier van concurreren heeft er toe geleid dat binnen de SEO branche aparte bedrijven zijn die zich richten op de promotie van PPC bedrijven (Porn, Pills & Casino?s). Een voorbeeld is WebGuerilla van Greg Boser. (Hiermee zeg ik niet dat Greg ook comment spam toepast, maar wel dat hij ?rg ver gaat om zijn klanten tevreden te stellen) Met nette technieken kun je een online casino niet voldoende positioneren ten opzichte van de rest. Je zult dus haast wel moeten spammen om een redelijk resultaat te behalen. De ?gewone? SEO bedrijven willen hun handen hier niet aan branden.

Nofollow-tag
Sinds begin dit jaar maakt een groot deel van de zoekmachines en weblogs gebruik van de nofollow-tag. Een weblog kan hiermee aan de zoekmachines vertellen dat een link door een bezoeker van de site is geplaatst. De eigenaar van de weblog kan dus niet voor die link instaan. Google negeert links met de no-follow tag. Yahoo! telt ze wel mee, maar daar wegen links met een no-follow tag minder dan ?gewone? links. Inmiddels heeft een groot deel van de weblogtools de no-follow tag in de standaard templates ingebouwd.

Een uitgebreidere uitleg van de nofollow tag vind je hier. Hierin schreef ik al het volgende over de nofollow-tag:
?Toch zitten er een aantal nadelen aan deze methode. Zo zeggen links in de reacties op weblogs vaak veel over wat populaire websites zijn en wat er actueel is. Bovendien mag je er van uitgaan dat het grootste deel van de links is geplaatst uit een informatief oogpunt, en niet om het zoekresultaat te verbeteren. Door links die in reacties staan te negeren, mis je al dit soort nuttige informatie.?

Het lijkt dus een beetje een halve oplossing van het probleem. Zou Marketingfacts de nofollow tag invoeren dan zullen comment-spammers waarschijnlijk de volgende keer een ander weblog uitkiezen. Daarmee zou je wel buigen voor die enkele spammer ten koste van al die nuttige en interessante informatie die in de comments op Marketingfacts te lezen is.

De nofollow is dus een goede manier om de nadelen van PageRank en dergelijke systemen op korte termijn aan te pakken. Helaas zullen nieuwe manieren bedacht worden om op een agressieve wijze meer inkomende links te krijgen. Zoekmachines zullen dus op zoek moeten naar een betere manier om inkomende links te beoordelen.

Ask Jeeves/ TEOMA/ Communities
Nu heb ik eindelijk een bruggetje naar mijn favoriete zoekmachine: Ask Jeeves.

Om uit te leggen waarom Ask Jeeves waarschijnlijk slimmer omgaat met de linkproblematiek moet ik eerst even een uitstapje maken waarin ik uitleg hoe Ask Jeeves/ TEOMA werkt en waarom dat zo anders is dan de andere zoekmachines:

Ask Jeeves maakt gebruik van de technologie van TEOMA. TEOMA deelt het internet op in communities die over een bepaald onderwerp gaan. Zoek je in Google, Yahoo! of MSN naar ?apple? dan kom je bovenin de zoekresultaten alleen het computermerk apple tegen. Mocht je zoeken naar de vrucht ?apple? dan zul je creatief met je zoekvraag om moeten gaan om een zinnig zoekresultaat uit deze zoekmachines te halen.

Zoek je daarentegen met behulp van Ask Jeeves naar de term ?apple?, dan krijg je naast het zoekresultaat een aantal ?Related Topics? te zien. In dit geval zie je onder andere:

- Apple the Fruit
- Banana
- Apple Computers
- Red Apple
- Apple Tree
- Oranges

teoma s view of the web

Nu kun je dus kiezen of je informatie zoekt over de vrucht ?apple? of de computer ?apple?.

Elke community bestaat uit Authorities en Hubs. Een autoriteit is vaak te herkennen aan het informatieve karakter en veel uitgaande links. Door deze links te beoordelen kun je de rest van de community in kaart brengen. Zoek je in TEOMA bijvoorbeeld naar een ?fiets? dan zie je rechts naast de zoekresultaten een kopje ?Resources?. (Link collections from experts and enthusiasts!) Hierin tref je pagina?s aan die min of meer ?onafhankelijk? zijn en links bieden naar de resultaten aan de linkerkant.

Links tref je merken als Batavus en Giant, rechts tref je o.a. www.infotaria.be met links naar Batavus, Gazelle en Giant. Hiermee laat ik ook meteen een voordeel van dit systeem zien. Batavus en Gazelle zullen geen links naar elkaar plaatsen. Ze zijn immers concurrenten. Toch zijn het allebei belangrijke spelers in deze branche en is er dus wel degelijk een relatie tussen de beide bedrijven. De meeste zoekmachines snappen deze relatie niet.
Door de community te doorzoeken snapt TEOMA wel dat Batavus, Gazelle en Giant belangrijke spelers zijn in de ?fiets? branche en dus een onderlinge relatie hebben.

Wat heeft dat nou allemaal met comment spam te maken?

Doordat je communities onderscheid, kun je links van buiten de community als irrelevant bestempelen. Alleen links die vanaf sites uit een voor de zoekopdracht relevante community komen tellen mee in de beoordeling. Links die zomaar random op weblogs worden gezet hebben dus geen effect op de ranking van de website. Daarmee wordt het effect van de comment-spam teniet gedaan. Pas als iemand besluit een artikel op Marketingfacts te schrijven over online casino?s, dan zou een link in de reacties bij dat artikel relevant zijn.


Opgeruimd!
Inmiddels heeft Erik van Roekel de comment spam verwijderd, Marketingfacts is dus weer schoon. Nu maar hopen dat het zo blijft.


Bronnen/ zie ook
Yahoo! Search Blog
Google Blog
MSN Search Weblog
Ask Jeeves Blog

Adding a New Dimension to Search: The Teoma Difference is Authority
Block-level Link Analysis (PDF)
Filthy Linking Rich And Getting Richer!
In conversation with Jim Lanzone & Apostolos Gerasoulis of Ask Jeeves/Teoma (By Mike Grehan)

Gepost in: Zoekmachine marketing

Over de auteur

Comment Spam: Casino’s, porno en pillen

, Storm Marketing Consultants

Als online marketing consultant bij Storm online marketing consultants ben ik verantwoordelijk voor de tevredenheid van een deel van onze klanten. Daarnaast ben ik als lid van het het management team verantwoordelijk voor de verdere ontwikkeling van de kwaliteit van onze dienstverlening.

12 Reacties

Comment Spam: Casino's, porno en pillen

Boudewijn Janssen

Tjah, daar typ je dan net een heel bericht over dit onderwerp, ben je vergeten je e-mail adres te vermelden en werkt de back knop niet goed. Dan heb je niet veel zin meer om het bericht opnieuw te typen....

geplaatst op 17-05-2005 om 07:11 uur

Comment Spam: Casino's, porno en pillen

Anne

Het fenomeen was me de afgelopen dagen erg opgevallen hier, maar kende het begrip Comment Spam niet. Dank voor de heldere en informatieve uitleg Remi!

geplaatst op 17-05-2005 om 07:17 uur

Comment Spam: Casino's, porno en pillen

Boudewijn Janssen

Maargoed, toch nog maar een keer dan...

Is het voor Nederlandse sites niet vrij simpel om comment spam te weren omdat het toch vooral over Casino's, porno en pillen gaat? Is het niet zo dat ze altijd gebruik maken van (anonieme) proxies? Altijd gebruik makend van HTTP 1.0?Accepteren ze wel cookies en geven ze die dan ook door? Een vreemde UserAgent misschien?

Ik kan niet geloven dat er niet ergens een patroon in zit zodat het met wat aanpassingen vrij simpel tegen te houden is.

geplaatst op 17-05-2005 om 07:34 uur

Comment Spam: Casino's, porno en pillen

BasW

Er zijn voor vele blogsystemen inmiddels anti-commentspam scripts/plugins in omloop die gebruikt maken van Jay Allen's blacklist voor Movable Type, zie daar dus http://www.jayallen.org/comment_spam/

geplaatst op 17-05-2005 om 08:25 uur

Comment Spam: Casino's, porno en pillen

Vincent

Er zijn natuurlijk meerdere (semi) oplossingen. De beste ervan vind ik een combinatie van meerdere technieken:

Maak gebruik van een ip2country database. Bekijk uit welk land een poster komt en bestempel een aantal landen als 'risicogroep'.

Voor de posters uit de risicogroep zet je een plaatje met een cijfer-lettercombinatie neer (GD library) en je vraagt ze de combinatie over te typen. Een bot moet wel heel geavanceerd zijn om dat te kunnen.

Daarnaast kun je creatief zijn met een variabel aantal hidden fields, met een random coder erin. Zet deze code in een sessie en vergelijk de codes bij het posten.

Wanneer je postsysteem íets anders werkt dan de meest gebruikte systemen, is het al bijna onmogelijk er een goede bot voor te schrijven.

geplaatst op 17-05-2005 om 08:25 uur

Comment Spam: Casino's, porno en pillen

Martin de Boer

Remi,

Dank voor deze heldere uiteenzetting. Ik heb er zelfs last van in een simpel gastenboek op mijn eigen prive site.

geplaatst op 17-05-2005 om 09:46 uur

Comment Spam: Casino's, porno en pillen

Rens Krijgsman

Misschien overbodig te vermelden, maar op het pmachine forum staat een thread met uitgebreide informatie om de comment spam te beperken.
http://www.pmachine.com/forum/threads.php?id=25734_0_16_0_C

Heeft mijn site spam-vrij gemaakt..

geplaatst op 17-05-2005 om 10:18 uur

Comment Spam: Casino's, porno en pillen

Ayalon

CommentSpam is vrij eenvoudig te voorkomen, niet door zogenaamde spamfilters of door nofollow tags, deze helpen wel maar zijn lapmiddelen.

Registratie of als je dat niet wilt, simpelweg een authenticatieplaatje, ook wel de gekke cijfertjes en lettertjes die je ziet als je je bij sommige diensten moet aanmelden. Deze worden random gegenereerd en vragen dus aktie van de gebruiker.

Helaas hebben niet alle blogpaketten deze optie, soms zijn ze wel als plugin te downloaden en te plaatsen in je comment template.

geplaatst op 17-05-2005 om 15:53 uur

Comment Spam: Casino's, porno en pillen

Erik van Roekel, ING Groep

@Remi: prima uiteenzetting van een hoogst irritant verschijnsel.

@Allen: Ik heb wat betreft Movable Type bijzonder goede ervaringen met de eerder genoemde Jay Allen's Movable Type Plugin, genaamd MT-blacklist. De blacklist wordt regelmatig geupdate en heeft bijzonder veel spam tegengehouden.

geplaatst op 17-05-2005 om 17:58 uur

Comment Spam: Casino's, porno en pillen

Remi van Beekum, Storm Marketing Consultants

@ Anne, Martin en Erik
Bedankt voor de complimenten! Ik vond het (als onervaren blogger) best lastig om kort en krachtig uit te leggen wat comment spam is en waarom sommige bedrijven het toepassen. In eerste instantie was het artikel zelfs nog langer, ik heb een groot deel over o.a. Ask Jeeves geschrapt om het leesbaar te houden. (wellicht verwerk ik dat nog eens in een ander artikel)

@ De rest
Bedankt voor de aangedragen oplossingen! Binnenkort zal de site toch op de schop moeten om de nieuwe lay-out van Marketingfacts in te voeren, dat is een mooi moment om meteen een structurele oplossing voor het comment spam probleem in te voeren.

geplaatst op 17-05-2005 om 18:17 uur

Comment Spam: Casino's, porno en pillen

Tinus

@Martijn de Boer
Voor een simpele gastenboek volstaat het wijzigen van de namen van de invoervelden in cryptische termen als naam123 email123 en reactie123. Bij weblog software gaat dit wat moeilijker, tenzij je bereid bent om bij elke update dezelfde wijzigingen te doen. Het probleem zit hem er in dat er zoveel weblogs op dezelfde manier werken. Wijk je daar van af dan zit je goed.

geplaatst op 17-05-2005 om 19:06 uur

Comment Spam: Casino's, porno en pillen

lex goode

Hallo Marketingfacts,
In Nederland geldt: "de vervuiler betaalt" is dit ook niet toepasbaar op ongewenste email. Uiteindelijk heeft elk van derlgelijke emails een doel of bedrijf wat de opdracht voor die email gegeven heeft. Een dergelijk beleid zou de "vervuiler" in zijn of haar portemonnee kunnen treffen en dat doet zeer daar waar het in mijn opinie hoort. De strijd van beveiliging en omzeilers historisch gezien een altijd verloren zaak. Zolang creatievelingen het een sport vinden of voor grof geld bereid zijn beveiligingen te hacken is dat dweilen met de kraan open.
Het mooiste voorbeeld vind ik altijd nog dat Sony een nieuwe anti-kopie beveiliging voor zijn CD's aankondigde en voordat die uitgebracht werd op Internet al de omzeiling te lezen was: een strategisch geplaatste streep met een boardmarker op de CD.
Vriendelijke groet,
Lex Goode.

geplaatst op 26-09-2008 om 12:13 uur

Plaats een reactie

  • Maximaal 5000 karakters. Basis HTML tags zoals <a> zijn toegestaan.