AOL zet 439 Mb gebruikersdata online!

7 augustus 2006, 14:27

Iemand nog interesse om 439 Mb gebruikersdata door te spitten? AOL heeft namelijk 20 miljoen zoekopdrachten, afkomstig van 650.000 gebruikers gedurende een periode van 3 maanden, online gezet voor onderzoeksdoelstellingen. De data bevat per zoekopdracht de datum/tijd, userid (geanonimiseerd), zoekterm(en) en per link waarop de gebruiker heeft doorgeklikt de link en de positie (ranking) van de betreffende link (met dank aan Rene).

Marco Derksen
Partner bij Upstream

Oprichter/partner Upstream, Marketingfacts, Arnhem Direct, SportNext, TravelNext, RvT VPRO, Bestuur Luxor Live, social business, onderwijs, fotografie en vader!

Categorie
Tags

5 Reacties

    media

    Btw, als het goed is heb ik over een uurtje de data binnen 😉


    7 augustus 2006 om 14:38
    Ruben

    Iemand die het bestandje nog heeft kunnen downloaden?


    7 augustus 2006 om 15:37
    media

    Nog een paar Mb’tjes en dan heb ik de dataset binnen.

    Smetty, ik had al een link naar de mirror in bovenstaand bericht opgenomen. Verbaasd me overigens niets dat er een publieke discussie over is ontstaan. Een willekeurige quote op TechCrunch:

    (…) User 491577 searches for “florida cna pca lakeland tampa”, “emt school training florida”, “low calorie meals”, “infant seat”, and “fisher price roller blades”. Among user 39509’s hundreds of searches are: “ford 352″, “oklahoma disciplined pastors”, “oklahoma disciplined doctors”, “home loans”, and some other personally identifying and illegal stuff I’m going to leave out of here. Among user 545605’s searches are “shore hills park mays landing nj”, “frank william sindoni md”, “ceramic ashtrays”, “transfer money to china”, and “capital gains on sale of house”. Compared to some of the data, these examples are on the safe side. I’m leaving out the worst of it – searches for names of specific people, addresses, telephone numbers, illegal drugs, and more. There is no question that law enforcement, employers, or friends could figure out who some of these people are. (…)


    7 augustus 2006 om 16:06
    Wouter

    Ik heb even een eerste tekstbestand geopend en er staat inderdaad gevoelige informatie in. Zo zijn er bijvoorbeeld een flink aantal queries te zien van iemand die naar kinderporno zoekt. Dit verhaal gaat zeker een staartje krijgen.


    7 augustus 2006 om 16:25

Marketingfacts. Elke dag vers. Mis niks!