Studying rapidly evolving user interests on Twitter

A Study of “Churn” in Tweets and Real-Time Search Queries

Zoeken via Twitter levert de meeste gebruikers weinig goede resultaten op. Maar, ligt dit wel aan Twitter? Of kijken we naar Twitter door de Googlebril? In dit wetenschappelijk onderzoek van Twitter engineer Jimmy Lin wordt beschreven dat Twitter's modellen voor het bepalen van relevantie niet zijn opgewassen tegen de enorme hoeveelheid aan berichten die binnen korte tijd worden getweet. De distributie aan termen en onderwerpen wisselt zo snel dat er simpelweg geen "Google-relevantie" aan is te hangen.

Een illustratie aan de hand van de volgende uitkomsten:
  • Examining all search queries from October 2011, we see that, on average, about 17% of the top 1000 query terms from one hour are no longer in the top 1000 during the next hour. In other words, 17% of the top 1000 query terms “churn over” on an hourly basis.
  • Repeating this at a granularity of days instead of hours, we still find that about 13% of the top 1000 query terms from one day are no longer in the top 1000 during the next day.
  • During major events, the frequency of queries spike dramatically. For example, on October 5, immediately following news of the death of Apple co-founder and CEO Steve Jobs, the query “steve jobs” spiked from a negligible fraction of query volume to 15% of the query stream — almost one in six of all queries issued! Check it out: the query volume is literally off the charts! Notice that related queries such as “apple” and “stay foolish” spiked as well.

Om dit document te downloaden moet je ingelogd zijn. Niet geregistreerd? Registreer je dan hier.