Nieuwe interne zoekmachine van Sooqr live op Marketingfacts!

9 oktober 2013, 14:00

De interne zoekmachine is bij veel website een ondergeschoven kindje. Waarom? Moeilijk te zeggen. Wellicht ben je zo druk met het optimaliseren van de gebruiksvriendelijkheid van de interface en het aanbrengen van een logische structuur en navigatie dat je geen on-site search engine nodig denkt te hebben. In die val ben ik zelf ook gelopen. Goed dus dat Erik Keegstra van Sooqr me een tijd terug aan m’n jasje trok. Dat heeft er toe geleid dat we vandaag Sooqr als interne zoekmachine voor Marketingfacts hebben gelanceerd!

Ondergeschoven kindje

10, 15 jaar geleden zagen zoekmachines er nog heel anders uit dan nu. Veel zoekmachines zochten nog alleen op titel, en de relevantie werd bepaald door de zoektermdichtheid. Google heeft daar met PageRank en de inmiddels meer dan 200 andere zoeksignalen flinke verandering in gebracht. Daarmee zijn ook de verwachtingen van bezoekers gegroeid.

Desalniettemin lopen interne zoekmachines nog vaak achter. Veelal wordt er gebruik gemaakt van de zoekmachine die standaard onderdeel is van het CMS. Die zoekmachines zijn vaak een ondergeschoven kindje; de zoekresultaten sluiten niet aan bij de verwachtingen van de bezoeker, het zoeken gaat vaak traag en er zijn weinig opties voor het filteren of sorteren van resultaten. Zonde, want hoe goed je je site ook ingericht denkt te hebben, veel bezoekers (10 procent wordt vaak aangenomen) grijpen snel naar een zoekmachine om direct te vinden wat ze zoeken. Dat percentage is echter sterk afhankelijk van de site en de content. Vanwege het brede aanbod bij grote e-commerce sites zal het percentage daar vele malen hoger liggen. Lezers die mij kennen weten dat ik dat ik graag onderzoeken gebruik in mijn blogs. Wat geldt voor de inzet van interne zoekmachines geldt helaas ook voor onderzoek over interne zoekmachines. Er wordt maar zeer beperkt onderzoek gedaan, en wat beschikbaar is is vaak oud en/of onbetrouwbaar.

Over Sooqr

Het gemis van een goede interne zoekmachine is ook waar Erik tegenaanliep toen hij voor The Phone House bezig was met de ontwikkeling van de interne zoekmachine. Al snel zag hij dat dit probleem bij veel sites speelde, waartoe hij besloot Sooqr te ontwikkelen. “Sooqr draait op Solr, een open-source search engine project van Apache. Solr is een zeer geavanceerde en schaalbare zoekoplossing, maar niet heel gebruiksvriendelijk. Daar heeft Sooqr een eigen softwarelaag over Solr heen gebouwd”, legt Erik uit. Die combinatie maakt het mogelijk om bezoekers intuïtief je site te laten doorzoeken en snel en relevante resultaten te kunnen leveren.

Sooqr werkt anders dan bv. Google in de zin dat het niet een website crawlt maar dat het werkt op basis van datafeeds. In die datafeed kan je (gestructeerde) eigenschappen meegeven (bv. categorieën, tags) op basis waarvan de zoekresultaten kunnen worden gefilterd of gesorteerd. In het geval van Marketingfacts kun je op dit moment de zoekresultaten filteren op channel, type content, auteur en datum. De resultaten worden on-the-fly aangepast op basis van de selecties die je maakt. Daarnaast kan je de resultaten ordenen op basis van relevantie (standaard) en publicatiedatum.

De functies

De zoekmachine van Sooqr beschikt over de volgende functies:

  • Full-text search
  • Data is te verrijken met meta-informatie
  • Zowel tekstueel zoeken als middels querietaal
  • Search as you type, na de eerste letter direct relevante zoekresultaten in beeld
  • Spelfouten worden door de spellingcorrectie gericht op het juiste zoekwoord (zie ook bovenstaand screenshot)
  • Het systeem begrijpt en leert synoniemen.
  • Ranking rules. Zelf invloed hebben op wat bovenaan staat.
  • Faceted search (zoeken op basis van gestructureerde eigenschappen)
  • Hit highlighting (zoektermen worden op de resultatenpagina uitgelicht)
  • Efficiënte verdeling van de load (d.m.v. sharding en caching)
  • Herkent automatisch clusters van content
  • Er kan aan de knoppen van het algorithme worden gedraaid (bv. de weging van publicatiedatum verzwaren)
  • Field Collapsing. Groepeert soortgelijke resulaten in de zoekresulatenpagina.

Leren van zoekopdrachten

Dan is er nog de back-end van Sooqr. In deze beheeromgeving kun je:

  • Statistieken inzien (bv. aantal zoekopdrachten, result-click-ratio)
  • De zoekopdrachten bekijken (meest gezocht, meest geklikt en zoekopdrachten zonder resultaten)
  • Synoniemen toevoegen

Met name de zoekopdrachten zonder resultaat zijn erg interessant. Mogelijk zijn gebruikers op zoek naar een onderwerp waar je site nog niet in voorziet. Of moet de zoekopdracht aan een synoniem worden gekoppeld.

Ook populaire zoekopdrachten zijn waardevol; ze geven immers aan waar je bezoekers het meest naar op zoek zijn. Zo zullen wij de zoekopdrachten als input gebruiken voor het introduceren van nieuwe tags.

Daarnaast kan Sooqr worden gekoppeld aan Google Analytics zodat je ook daarin de resultaten van de on-site search engine kan analyseren.

Op de plank

Met betrekking tot Sooqr wordt er op dit moment gewerkt aan een mobiele versie (responsive). Als Erik verder in de toekomst kijkt, dan ziet hij vooral potentie in de data. “Er wordt op dit moment al veel data gegenereerd en opgeslagen op online platformen waar eigenlijk niet echt iets mee gebeurd. Denk hierbij aan zoekopdrachten, bezoek van webpagina’s, aankopen, etc. Het gebruiken van al deze data om zoeken te personaliseren zie ik als een grote kans voor interne zoekmachines“, vertelt Erik. “Koppel deze data aan lokale gebruikersprofielen en je weet al wie iemand is voordat hij een zoekopdracht heeft ingetikt“.

Danny Oosterveer
Data-gedreven digital marketeer bij Datasexual

Data-gedreven digital marketeer. Resident bij Amdax en Woonduurzaam. Daarnaast vertel ik vaak als spreker over data-gedreven marketing. Auteur van het boek Data-bedreven marketing. Eén van de twee Groene Nerds.

Categorie

12 Reacties

    Hans Kramer

    Ha Danny, ik begrijp uit je mooie sales post dat het een deal met gesloten beurs was? 😉 Grtz!


    9 oktober 2013 om 15:05
    Erik Keegstra

    @ Hans, het is altijd fijn dat een mes aan twee kanten kan snijden. Wij zijn er in ieder geval heel blij mee, vooral omdat we nu ook relevante informatie op Marketingfacts snel kunnen vinden 🙂


    9 oktober 2013 om 15:33
    DannyOosterveer

    @Hans volgens mij leg ik vooral de tool uit en hoe we die gaan toepassen. Zo zou ik het dus niet noemen. Het is wel een partnership inderdaad.


    9 oktober 2013 om 16:40
    Rob de Groot

    Mooie tool inderdaad. Hebben inmiddels een eerste Magento webwinkel aangesloten op Sooqr, niet zonder resultaat. Kost wat maar dat verdient zich al vrij snel terug!


    9 oktober 2013 om 21:50
    Jan

    @ Rob

    Rob zijn jullie echt tevreden met de sooqr magento module. Wij hebben hem ook draaien maar hij hapert van alle kanten.En geen reactie van de kant van sooqr

    Problemen

    Producten met een magento instelling niet opnemen in catalogus / search worden toch weergeven in de zoek resultaten

    Afbeeldingen worden verkeerd weergeven. Bv. je hebt een t shirt in zwart , rood en wit. Er worden dan 3 t-shirts getoond alle met een zwarte afbeelding.

    Je hebt vrij weinig invloed op de look and feel

    Voor een volgende webshop gaan we in elk QWEERY gebruiken die zijn veel flexibeler. Dit is ook de zoekfunctie die flinders.nl gebruikt

    Iets duurder maar dat verdiend zich heel snel terug.

    Op dit moment zijn de klanten ontevreden met de SOOQR search en dat kost ook geld.


    10 oktober 2013 om 05:03
    Erik Keegstra

    Hallo Jan, ik wil niet al te inhoudelijk reageren, maar er waren inderdaad problemen met de eerste versies van de plugin voor Magento, die zijn inmiddels allemaal opgelost. Magento heeft nl. het probleem dat het op 100 manieren ingericht en gebruikt kan worden, dat maakt een generieke tool ingewikkeld. Dit heeft op zich niets met Sooqr zelf te maken gehad.

    Invloed op look-en-feel: we bieden een standaard design aan voor Magento, dit omdat we ook het midden en de onderkant van de markt graag willen bedienen. Ik heb aangegeven dat qua design alles mogelijk is, maar dat daar wel kosten aan verbonden zijn om de doodeenvoudige reden dat daar werk voor verzet moet worden.

    Jan, mail me even op erik@sooqr.com dan regelen we het!


    10 oktober 2013 om 07:35
    Jan

    @ Erik

    Ik ben al vanaf eind juni aan het bellen en mailen. en krijg telkens te horen we zijn op dit moment druk. We kijken er naar.

    Waarom wordt het nu dan wel opgelost ?

    Design problematiek is bekend. Het ging ook om kleine wijzingen oa breedte van de zoekresultaten.


    11 oktober 2013 om 05:52
    Remi

    Ziet er goed uit!

    Ik merk wel dat er iets mis lijkt te gaan als je op auteur wilt filteren. Ik zocht op “SEO”, kreeg veel resultaten. Wilde op auteur filteren, maar krijg dat ding niet uitgeklapt en begint dan ineens zelf een selectie te maken.

    Straks eens even wat oude artikelen van me her-taggen en wat marketingfacts-sooqr-artikel-optimalisatie doen! 😉


    11 oktober 2013 om 08:25
    DannyOosterveer

    Hi Remi,

    Kan het hier niet reproduceren. Welke browser/os gebruik je?


    11 oktober 2013 om 08:37
    Remi

    Chrome/ Windows euh.. iets recents.


    11 oktober 2013 om 08:58
    DannyOosterveer

    Thanks, ik ga even stormen


    11 oktober 2013 om 09:10
    Jan

    Sooqr heeft een mail ontvangen en is er direct mee aan de slag gegaan.

    Dankjewel


    12 oktober 2013 om 12:43

Marketingfacts. Elke dag vers. Mis niks!