Marketingfacts 2.0: the Organic Search

Marketingfacts 2.0: the Organic Search

Enkele maanden geleden vroeg Marco ons te helpen bij de ontwikkeling van Marketingfacts 2.0. Hij vroeg ons specifiek om ervoor te zorgen dat de nieuwe site beter vindbaar zou worden in de belangrijke zoekmachines dan de vorige. Een leuke opdracht, en zeker ook een uitdaging.

Als Manager Organic Search bij Traffic4u heb ik een groot aantal optimalisatietrajecten afgerond en begeleid. Daarnaast ben ik verantwoordelijk voor de Organic Search strategie binnen Traffic4u. Een weblog had ik echter nog nooit gedaan.

Wanneer je een weblog wil optimaliseren zitten daar toch een aantal haken en ogen aan die net even anders zijn dan bij een ‘gewone’ website. Bovendien was de oude site best goed vindbaar, wat ik dus maar even moest overtreffen. Om het nog wat lastiger te maken moest ook meteen de migratie van de oude domeinnaam www .mediafact .nl naar www .marketingfacts .nl geregeld worden. Kortom, een leuke uitdaging, die ik maar al te graag aannam.

Hier een samenvatting van onze acties om een goede vindbaarheid te verzorgen.

Samenwerking projectteam
Bij Marketingfacts 2.0 heb ik Onstuimig geadviseerd bij de bouw van de website en heb de implicaties en gevolgen toegelicht bij de keuzes die we met het projectteam hebben gemaakt. Daarbij moeten soms lastige keuzes worden gemaakt tussen vindbaarheid, usability en design. (zie voor meer info over het design en de bouw van de site: Marketingfacts 2.0: the making of)

Gelukkig was het hele projectteam overtuigd van het nut van zoekmachine optimalisatie en was de samenwerking erg goed. Door deze samenwerking hebben we denk ik een erg goed resultaat geboekt. Hiervoor wil ik met name Ralph Bom van Onstuimig bedanken voor zijn inzet en geduld bij al mijn lastige mailtjes.

De optimalisatiestrategie
Bij organic search trajecten moet je rekening houden met drie zaken:

  • Indexatie: Hierbij zorg je ervoor dat alle pagina’s van een website snel en goed geïndexeerd kunnen worden door de zoekmachines. Een pagina die niet geïndexeerd kan worden, kan immers ook niet goed scoren.
  • Content en presentatie content: Hierbij zorg je voor goede content en zorg je dat deze content zo gepresenteerd wordt dat zoekmachines snappen waar een pagina over gaat.
  • Populariteit: Een populaire site heeft meer inkomende links dan een minder populaire site. Heb je meer links (een hogere linkpopulariteit), dan scoor je beter. Google noemt dit PageRank, MSN noemt het Neural Net en andere zoekmachines hebben vergelijkbare algoritmes.

 

Indexatie Marketingfacts 2.0

De indexatie is bij veel sites een groot probleem omdat er bijvoorbeeld gewerkt wordt met session id’s in de url, te veel variabelen in de url, variabelen die niets over de inhoud zeggen, javascript menu’s of Flash. In dit geval was dat allemaal niet aan de orde omdat gekozen was voor Expression Engine wat dit deel betrekkelijk eenvoudig maakte.

Verder heeft Expression Engine al een aantal standaard opties om URL Rewriting in te zetten. Na de nodige aanpassingen in de rewrite konden we van bijvoorbeeld deze url:
www .mediafact. nl/comments.php?id=11117_0_1_15_C
deze url maken:
www .marketingfacts. nl/berichten/the_search_van_john_battelle/

Dit heeft een aantal voordelen voor zowel de snelheid van indexeren, de vindbaarheid en de uitstraling van de site.

Verder hebben we er doormiddel van de interne linkstructuur voor gezorgd dat zoekmachines de site snel en eenvoudig kunnen indexeren. Dit vind je onder andere terug in de wijze waarop de rubrieken zijn toegepast, in ‘deze week hot’, in links naar recente artikelen, het archief en de sitemap. Verder hebben we aan de achterkant tags ingevoerd waar we binnenkort meer mee hopen te doen.

Vooral het archief was binnen het projectteam een discussiepunt, want waar heb je een archief voor nodig als je een goede zoekfunctie hebt? Het archief is echter een belangrijke manier voor zoekmachines om ook de oude berichten goed te kunnen indexeren. Hier heb ik de rest gelukkig van kunnen overtuigen.

Content en presentatie content

Nadat de indexatie van de website op orde is (de zoekmachine heeft toegang) is het belangrijk om goede content op de website te hebben.
Deze content is bij Marketingfacts geen probleem. Het team van bloggers produceert dagelijks een imposante hoeveelheid kwaliteitscontent waar zoekmachines gek op zijn.

Om de content goed in de zoekmachines te krijgen is het echter wel belangrijk de broncode van de site zo op te bouwen dat zoekmachines begrijpen waar een pagina (de content) over gaat. Dat hebben we gedaan door te zorgen dat titles, meta-descriptions, header tags enzovoorts de nadruk op de juiste termen leggen. Hier zullen de aankomende weken nog enkele puntjes op de i gezet worden, al zijn de pagina’s nu al erg zoekmachine vriendelijk.

Een bijkomend punt waar we aandacht aan hebben besteed is de uitstraling van de site in de zoekresultaten. Zoek je bijvoorbeeld in Google.nl naar John Battelle dan tref je op positie 1 een bericht van het oude Marketingfacts aan. Het resultaat ziet er als volgt uit:

John Battelle

In de titel zie je niet om welke site het gaat, de omschrijving zegt helemaal niets over het artikel en ook de url ziet er niet uit. Kortom: dit resultaat nodigt niet uit om door te klikken. Een aantal van de andere sites die je bij deze zoekopdracht aantreft ziet er veel interessanter uit en de kans is dus groot dat die meer bezoekers aan deze zoekopdracht overhouden dan Marketingfacts, terwijl die netjes op plek 1 staat.

Door de aanpassingen die we hebben gedaan zal dit resultaat er als het goed is binnenkort een stuk interessanter uitzien en kunnen we dus met de zelfde positie meer geïnteresseerde bezoekers krijgen. Inmiddels is de nieuwe versie van dit bericht al geïndexeerd. Deze ziet er als volgt uit:

John Battelle

In de titel zie je nu netjes de bedrijfsnaam, de beschrijving verteld een stuk meer over de inhoud en de url ziet er een stuk netter uit en geeft het onderwerp weer.

Populariteit

Omdat de domeinnaam http://www.marketingfacts.nl al geruime tijd gebruikt wordt heeft deze op het moment een PageRank 7, net als http://www.mediafact.nl. Nou zegt dat niet alles, want er is een groot verschil tussen 6,5 en 7,4 maar het zegt wel dat de site inmiddels zelf zorgt voor een goede linkpopulariteit. Het is dus vooral van belang deze te behouden en te bundelen op het ‘nieuwe’ domein. Daarvoor hebben we een migratiestrategie toegepast:

De migratiestrategie
We zaten met twee problemen:

  • de verhuizing van het oude naar het nieuwe domein
  • de wijziging van de url structuur

Beide hebben we opgelost door 301 redirects (Moved Permanently) toe te passen. Dit hebben we toegepast op onder andere de berichten, de rubrieken en het archief. Zoekmachines snappen hierdoor dat een pagina niet meer bestaat en nu op een andere locatie staat. De oude pagina wordt uit de index gehaald, de nieuwe pagina wordt opgenomen en de linkpopulariteit verhuist mee. Dit proces kan wel enkele maanden duren.

Als backup hebben we een 404 pagina toegepast die eventuele andere bezoekers afvangt en een nette melding geeft dat de betreffende pagina niet meer bestaat.

Verminderen van de vindbaarheid
We hebben ook nog gewerkt aan het verminderen van de vindbaarheid in de zoekmachines. Wat? Ja, het verminderen van de vindbaarheid, ik zal het uitleggen.

Met het projectteam hebben we discussie gevoerd over het nut van image search (voorbeeld: Google, MSN) voor Marketingfacts en stelden ons daarbij de volgende vraag:

Krijgt Marketingfacts meer geïnteresseerde bezoekers door vindbaar te zijn in de Image Search engines?

We concludeerden dat dit waarschijnlijk verwaarloosbaar is. Verder hebben we het gevoel dat image search voor een groot deel gebruikt wordt om plaatjes te zoeken en die vervolgens zelf te gebruiken. Daar hebben we natuurlijk niets aan. We willen niet zomaar zoveel mogelijk bezoekers, maar zo veel mogelijk geïnteresseerde bezoekers, mensen die de artikelen lezen en af en toe een reactie plaatsen.

Dus hebben we er door middel van de robots.txt voor gezorgd dat we niet vindbaar zijn in de verschillende image search zoekmachines.

Ik moet toegeven dat dit een discussiepunt is. We zullen hiermee vast af en toe een geïnteresseerde bezoeker mislopen, maar voor ons voelde het goed en daarom hebben we het gedaan.

En nu afwachten….
En nu is de spannendste tijd aangebroken, de tijd van het wachten op de spiders en het oplossen van bugjes. We hebben er de afgelopen dagen een paar bugjes uit gehaald en een aantal dingen verder verfijnd. Google, MSN en Yahoo beginnen de site inmiddels flink te indexeren en de eerste topposities zijn binnen, dus zoals het nu lijkt gaat alles goed.

 


Geplaatst in

Delen



Er zijn 17 reacties op dit artikel

  • Ik kan de robots.txt (link) niet openen, wordt deze met opzet alleen aan zoekmachines getoond, of is dit een foutje?

    geplaatst op
  • Op het eerste gezicht werkt het allemaal best ok. Wat me wel opvalt is bij de description-tag, hier wordt de titel + eerste regel gebruikt. Voor de netheid zou die nog best gesplitst mogen worden door een "."

    Verder "leven" er op het domein marketingfacts.nl in Google nogal wat gecachte bestanden die allemaal in een 404 resulteren. Als die nou ook nog geredirect kunnen worden ben je helemaal het "mannetje".

    Dat was even een eerste oogopslag, als ik nog meer heb maak ik er misschien een leuke casus van op mijn weblog :-)

    geplaatst op
  • @ Boudewijn, goed punt, klein foutje. Hij zat wel in de laatste testversie, maar was niet live gezet. Zojuist gefixed.

    geplaatst op
  • En zijn jullie dan toevallig ook de 404 pagina vergeten? ;) Ik krijg nu gewoon de index te zien.

    geplaatst op
  • Waarom is er geen sitemap.xml samengesteld. Dan heb je de beschikking over nog meer gegevens mbt tot het spideren van Marketingfacts. Kan van pas komen als je alle pagina's er op zo'n korte termijn mogelijk weer in wil hebben

    geplaatst op
  • Interessant artikel.
    Ben benieuwd hoe deze optimalisatie zich laat zien de komende tijd.
    Hou je ons op de hoogte?

    geplaatst op
  • @ Ulco,
    We hebben 301’s toegepast op alle belangrijke groepen pagina’s. (rubrieken, archief, berichten enz) Hiermee tackelen we dus 95% van de bezoekers en het probleem.

    In de loop der tijd zijn er echter ook wat tijdelijke en/of aparte delen aan de site gemaakt. Zo heeft Marco bijvoorbeeld ooit een soort directory online gezet met links naar allerlei, voor bezoekers van MarketingFacts, interessante websites. Dit deel is in de nieuwe site niet meer opgenomen. Er is dus geen plek om heen te redirecten. Toch staan er nog ruim 100 van deze pagina’s in Google, zie: http://www.google.com/search?q=site:www.marketingfacts.nl/links

    De 301 is bedoeld om te zeggen ‘deze pagina bestaat niet meer, hij staat nu daar’ maar er is in dit geval geen ‘daar’. Omdat we de oude ‘rommel’ toch snel uit de zoekmachines willen hebben staat daar dus een 404 op die bezoekers opvangt en zorgt dat de oude pagina’s uit de zoekmachines zullen verdwijnen.

    Deze redenatie zit achter de meeste pagina’s waar je nu een 404 aantreft. Uiteraard monitoren we het bezoek op de 404. Zo kunnen we ontdekken of er nog bepaalde inkomende links zijn die we eventueel moeten aanpassen. (mailtje sturen) Of dat we misschien ergens een 301 moeten toevoegen.

    @ Dave,
    De meningen over de Google sitemaps zijn verdeeld, dus ik zal vast commentaar op deze reactie krijgen.

    Uiteraard testen wij al sinds Google met de sitemaps kwam met deze techniek. Tot nu toe hebben wij in die tests geen enkele indicatie gezien dat dit helpt een site sneller te laten indexeren, of beter te laten scoren. Ook in de verschillende weblogs en fora die ik in de gaten houdt heb ik geen enkel bewijs gelezen dat de Google sitemap helpt.

    Uitzondering hierop zijn sites die van zichzelf niet goed indexeerbaar zijn. Denk bijvoorbeeld aan sites waarbij (een deel van) de informatie achter een keuzeformulier zit. Of waar andere indexatieproblemen zijn. (In die gevallen kan het dus wél positief zijn)

    We hebben er voor gezorgd dat MarketingFacts 2.0 geheel indexeerbaar is door toepassing van een goede linkstructuur, goede url’s en door geen obstakels voor zoekmachines neer te leggen zoals Javascripts, Flash, Sessios id’s, té veel variabelen in de url, variabelen die niets over de inhoud zeggen enzovoorts.

    Kortom: De site is van zichzelf goed indexeerbaar en er is dus in dit geval geen enkele reden om Google sitemaps te gebruiken.

    Daarbij zijn ook aardig wat gevallen bekend waar de Google sitemaps een negatief effect hebben. Er worden regelmatig rare bugjes en uitzonderingen ontdekt. Hierdoor kunnen bijvoorbeeld duplicate-content problemen ontstaan.

    Dat het zonder ook prima gaat zie je ook aan het feit dan bijvoorbeeld Google nu, na ruim 3 dagen al 14.000 pagina’s geïndexeerd heeft en we al aardig wat topposities behaald hebben.

    Op zich wel een goed idee om de statistieken van de Google Sitemaps wel even aan te zetten, dat is soms inderdaad wel makkelijk. Ga ik even regelen straks ;-)

    @ Erwin,
    bedankt voor het compliment! En ik zal jullie zeker op de hoogte houden. Ik hoop over een maandje wat grafiekjes te kunnen tonen met een toename in bezoek vanuit zoekmachines. Daarvoor moeten we wel even geduld hebben, want alles moet eerst goed geindexeerd zijn en de posities kunnen in het begin wat fluctueren. Bovendien zien we nu sowieso een piek in de traffic omdat veel mensen de nieuwe site willen bekijken.

    Ik hoop dat ik van Marco openheid mag geven over de statistieken, maar Marco kennende zal dat niet zo'n probleem zijn ;-)

    geplaatst op
  • Wow, wat een verslag Remi, top! Ben uiteraard ook erg benieuwd naar het effect; de eerste resultaten zien er al erg goed uit. En uiteraard kunnen we straks wat mij betreft alle cijfers naar buiten brengen.

    geplaatst op
  • Goed artikel, Remi. Wat ik me echter nog afvraag is het volgende. Ik heb op Highrankings.com gelezen dat je bij een rewrite van een url beter geen underscores kunt gebruiken maar koppeltekens (ter vervanging van de spatie in de paginatitel).

    Volgens mijn bron zou dus
    www .marketingfacts. nl/berichten/the-search-van-john-battelle/
    meer effect in zoekmachines sorteren dan
    www .marketingfacts. nl/berichten/the_search_van_john_battelle/

    Testen jullie hiermee in dit geval of is het effect hiervan al langer bij je bekend?

    geplaatst op
  • @ Niels,
    Voor zover ik weet is dat meer een theoretisch verschil. Waarschijnlijk heb je gelijk en is dat iets beter, maar dat verschil is erg klein. Bovendien is de underscore is wel een stuk mooier. En bij organic search moet je soms keuzes maken tussen vindbaarheid en design.

    Kortom: Volgens mij heb je gelijk, maar ik vind het een te klein verschil om rekening mee te houden.

    geplaatst op
  • inderdaad Remi,
    In het punt wat je aangaf over Sitemaps herken ik zelf ook een en ander. Voor een verhuizing van een website heb ik hier ook gebruik van gemaakt, ook van 301 redirects, maar het opnemen van de pagina's aan de hand van de sitemaps viel me toch enigszins tegen. eigenlijk had ik verwacht dat de meeste pagina's binnen een aantal dagen wel opgenomen zou zijn, maar uiteindelijk bleek dit meer een kwestie van weken.

    geplaatst op
  • Wat ik nog mis is een correct gebruik van header. H1 is er , maar in de kopjes in dit stuk zouden ook h2 en h3 tags niet misstaan hebben.

    En met alle respect: 187 fouten volgens de W3C Markup validation service is misschien wat veel van het goede?

    http://validator.w3.org/check?uri=http://www.marketingfacts.nl/berichten/marketingfacts_20_the_organic_search/

    geplaatst op
  • Dat van de header h2 neem ik terug. Zie ineens toch een h2 staan, alleen voor mijn gevoel niet op een logische plaats.

    En jullie gaan met glans door de WCAG *** test heen. Mijn complimenten!

    geplaatst op
  • Nog een klein schoonheidsfoutje imho: zowel met en zonder www. werkt alle content. Dit kan ertoe leiden dat mensen links maken naar http://marketingfacts.nl en dat haalt de rank van http://www.marketingfacts.nl wat naar beneden.

    Ik zou zeggen, ook een 301 maken van marketingfacts.nl naar http://www.marketingfacts.nl, op alle niveaus.

    geplaatst op
  • @Ruben,
    Goed punt, zijn we inderdaad nog mee bezig.

    Zolang er niemand naar de non-www linkt is er geen probleem, maar aangezien je net dat linkje hebt gemaakt zal ik er even haast achter zetten ;-)

    Met Google's nieuwe 'bigdaddy' infrastructuur zou dit probleem overigens opgelost moeten zijn.

    geplaatst op
  • Persoonlijk vind ik het mooier als een site zonder de www getoond wordt. Dus de htaccess er op aanpassen.

    geplaatst op
  • @Remi en Marco: wat is de balans na 14 maanden? Wat zijn de leerervaringen? Ik ben benieuwd!

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.