AOL zet 439 Mb gebruikersdata online!

   07 augustus 2006    @marcoderksen

Iemand nog interesse om 439 Mb gebruikersdata door te spitten? AOL heeft namelijk 20 miljoen zoekopdrachten, afkomstig van 650.000 gebruikers gedurende een periode van 3 maanden, online gezet voor onderzoeksdoelstellingen. De data bevat per zoekopdracht de datum/tijd, userid (geanonimiseerd), zoekterm(en) en per link waarop de gebruiker heeft doorgeklikt de link en de positie (ranking) van de betreffende link (met dank aan Rene).

Gepost in: Cijfers en feiten, Zoekmachine marketing

Over de auteur

AOL zet 439 Mb gebruikersdata online!

, Upstream

Oprichter/partner Upstream, Marketingfacts, Arnhem Dichtbij, SportNEXT, TravelNext, FoodNext, RvT VPRO, Bestuurslid Luxor Live, docent HAN Zie voor details: Upstream.nl

8 Reacties

AOL zet 439 Mb gebruikersdata online!

Marco Derksen, Upstream

Btw, als het goed is heb ik over een uurtje de data binnen ;-)

geplaatst op 07-08-2006 om 16:38 uur

AOL zet 439 Mb gebruikersdata online!

Smetty

De reacties in de Engelstalige blogosfeer, zoals Techcrunch bijvoorbeeld, zijn erg negatief... Vooral de kans dat users achterhaald worden, lijkt erg aanwezig te zijn. Brrrr...

geplaatst op 07-08-2006 om 17:00 uur

AOL zet 439 Mb gebruikersdata online!

Bernice Klaassen

AOL ziet inmiddels in dat dit niet zo heel handig was, en heeft (de link naar) het bestand verwijderd:

"This was a screw up, and we're angry and upset about it," "It was an innocent-enough attempt to reach out to the academic community with new research tools, but it was obviously not appropriately vetted, and if it had been, it would have been stopped in an instant."

(bron: Yahoo)
Helaas voor AOL is het bestand al via allerlei mirrors en torrents te achterhalen.

geplaatst op 07-08-2006 om 17:19 uur

AOL zet 439 Mb gebruikersdata online!

Ruben

Iemand die het bestandje nog heeft kunnen downloaden?

geplaatst op 07-08-2006 om 17:37 uur

AOL zet 439 Mb gebruikersdata online!

Smetty

Mirrors staan hier... Voorlopig althans.

geplaatst op 07-08-2006 om 17:57 uur

AOL zet 439 Mb gebruikersdata online!

Marco Derksen, Upstream

Nog een paar Mb'tjes en dan heb ik de dataset binnen.

Smetty, ik had al een link naar de mirror in bovenstaand bericht opgenomen. Verbaasd me overigens niets dat er een publieke discussie over is ontstaan. Een willekeurige quote op TechCrunch:

(...) User 491577 searches for “florida cna pca lakeland tampa”, “emt school training florida”, “low calorie meals”, “infant seat”, and “fisher price roller blades”. Among user 39509’s hundreds of searches are: “ford 352″, “oklahoma disciplined pastors”, “oklahoma disciplined doctors”, “home loans”, and some other personally identifying and illegal stuff I’m going to leave out of here. Among user 545605’s searches are “shore hills park mays landing nj”, “frank william sindoni md”, “ceramic ashtrays”, “transfer money to china”, and “capital gains on sale of house”. Compared to some of the data, these examples are on the safe side. I’m leaving out the worst of it - searches for names of specific people, addresses, telephone numbers, illegal drugs, and more. There is no question that law enforcement, employers, or friends could figure out who some of these people are. (...)

geplaatst op 07-08-2006 om 18:06 uur

AOL zet 439 Mb gebruikersdata online!

Paul van Veenendaal

Velen zullen de tekstbestanden waarschijnlijk niet kunnen openen, vanwege de grootte van 217MB (Memory problemen). Dus heb je een filesplitter nodig, hier een gratis tooltje

geplaatst op 07-08-2006 om 18:14 uur

AOL zet 439 Mb gebruikersdata online!

Wouter

Ik heb even een eerste tekstbestand geopend en er staat inderdaad gevoelige informatie in. Zo zijn er bijvoorbeeld een flink aantal queries te zien van iemand die naar kinderporno zoekt. Dit verhaal gaat zeker een staartje krijgen.

geplaatst op 07-08-2006 om 18:25 uur

Plaats een reactie

  • Maximaal 5000 karakters. Basis HTML tags zoals <a> zijn toegestaan.