lunes, marzo 09, 2015

¿Cómo funciona el cálculo del tema del momento (trending topic) de Twitter?


recientemente me han llovido preguntas  a esto. te comparto lo que creo mas acertado del tema, espero también te pueda ayudar:
Dado que este es un tema que genera bastante polémica, hemos decidido responder en la medida de lo posible a la pregunta del título. Hay buenas explicaciones por la red, como esta, en las que se basará esta entrada.
Supongo que todos sabemos qué es Twitter: Un servicio de microblogging en forma de red social. Una de las características que nos interesa es que a los comentarios que escribimos les podemos añadir lo que se suele llamarhashtags (etiqueta), en principio, con el objeto de clasificarlos en temas. A partir de los hashtags utilizados por los usuarios, Twitter hace una explotación en la que muestra (globalmente y también por regiones) la tendencia actual (en un horizonte de 24 horas) o lo que conocemos como trending topics. Esto es una lista con los hashtags “que marcan tendencia”.
El problema que suele darse en Twitter es que los usuarios hacen una suposición respecto a los trending topics: El cálculo de éstos se hace de manera absoluta, numéricamente. Así, suponemos que si el hashtag x aparece en 1000tweets y el hashtag y en 500, x debe estar más arriba de la lista que y. Pues bien, eso NO es cierto. El algoritmo que se aplica no es sobre valores absolutos de frecuencia sino sobre digámosle “popularidad y frescura”. Eso hace que hashtagsque se utilizan mucho un cierto día no sean trending topic y los usuarios vean una sombra de censura detrás.
Entonces ¿cómo funciona el algoritmo que calcula trending topics? Pues bien, Tweeter no lo ha “liberado” por lo que no os puedo escribir el pseudocódigo, pero sí que han intentado explicarlo:
“The new algorithm identifies topics that are immediately popular, rather than topics that have been popular for a while or on a daily basis, to help people discover the ‘most breaking’ breaking news from across the world. We think that trending topics which capture the hottest emerging trends and topics of discussion on Twitter are the most interesting.” (sección de Ayuda de Twitter)
Efectivamente, el algoritmo no pretende mostrar “lo más twitteado“, sino “lo twitteado más nuevo.” Por lo tanto, cuando un hashtag lleva tiempo siendo usado, se “penaliza” dentro del algoritmo. Es por esto que, si quieres que un ciertohashtag llegue a ser trending topic es importante que los tweets que lo incluyan nada más en un periodo de tiempo limitado. Así pasa con programas de televisión, series, noticias de última hora, etc.
En fin, la estrategia para conseguir un trending topic sería parecida a la que se utilizó para una gran película basada en una obra del gran Chuck Palahniuk que no nombraré: “La primera regla del club de la lucha: Nadie habla sobre el club de la lucha.”

No hay comentarios.:

The Internet in Real-Time


Click the animation to open the full version (via PennyStocks).