lunes, marzo 09, 2015

¿Cómo funciona el cálculo del tema del momento (trending topic) de Twitter?


recientemente me han llovido preguntas  a esto. te comparto lo que creo mas acertado del tema, espero también te pueda ayudar:
Dado que este es un tema que genera bastante polémica, hemos decidido responder en la medida de lo posible a la pregunta del título. Hay buenas explicaciones por la red, como esta, en las que se basará esta entrada.
Supongo que todos sabemos qué es Twitter: Un servicio de microblogging en forma de red social. Una de las características que nos interesa es que a los comentarios que escribimos les podemos añadir lo que se suele llamarhashtags (etiqueta), en principio, con el objeto de clasificarlos en temas. A partir de los hashtags utilizados por los usuarios, Twitter hace una explotación en la que muestra (globalmente y también por regiones) la tendencia actual (en un horizonte de 24 horas) o lo que conocemos como trending topics. Esto es una lista con los hashtags “que marcan tendencia”.
El problema que suele darse en Twitter es que los usuarios hacen una suposición respecto a los trending topics: El cálculo de éstos se hace de manera absoluta, numéricamente. Así, suponemos que si el hashtag x aparece en 1000tweets y el hashtag y en 500, x debe estar más arriba de la lista que y. Pues bien, eso NO es cierto. El algoritmo que se aplica no es sobre valores absolutos de frecuencia sino sobre digámosle “popularidad y frescura”. Eso hace que hashtagsque se utilizan mucho un cierto día no sean trending topic y los usuarios vean una sombra de censura detrás.
Entonces ¿cómo funciona el algoritmo que calcula trending topics? Pues bien, Tweeter no lo ha “liberado” por lo que no os puedo escribir el pseudocódigo, pero sí que han intentado explicarlo:
“The new algorithm identifies topics that are immediately popular, rather than topics that have been popular for a while or on a daily basis, to help people discover the ‘most breaking’ breaking news from across the world. We think that trending topics which capture the hottest emerging trends and topics of discussion on Twitter are the most interesting.” (sección de Ayuda de Twitter)
Efectivamente, el algoritmo no pretende mostrar “lo más twitteado“, sino “lo twitteado más nuevo.” Por lo tanto, cuando un hashtag lleva tiempo siendo usado, se “penaliza” dentro del algoritmo. Es por esto que, si quieres que un ciertohashtag llegue a ser trending topic es importante que los tweets que lo incluyan nada más en un periodo de tiempo limitado. Así pasa con programas de televisión, series, noticias de última hora, etc.
En fin, la estrategia para conseguir un trending topic sería parecida a la que se utilizó para una gran película basada en una obra del gran Chuck Palahniuk que no nombraré: “La primera regla del club de la lucha: Nadie habla sobre el club de la lucha.”

¿Cómo se genera un tema del momento (trending topic) en Twitter?


En respuesta a una duda comparto esto

Un grupo de desarrolladores de Barcelona creó TweetTrendings, una web de servicios que intenta explicar por qué una palabra, una frase o un tema se transforma en trending topic (tema del momento) en Twitter. No es la única forma de conocer el origen de los temas del momento de esa red social, aunque sí un sitio que puede ayudar a los que intentan iniciarse en esta red.

Los trending topics se basan, en muchos casos, en los hashtags, las etiquetas que van precedidas por un numeral (#). Desde hace tiempo, el concepto trending topic (TT) se convirtió en tema del momento, o sea, algo de lo que la gente habla, y de lo que, tanto los seguidores de la red social del pajarito, como del resto de la población, suelen seguir en sus tweets o en sus conversaciones.

En un primer momento, esta página usa un programa de búsqueda automatizada de contenidos por la red para determinar cuál es la causa de que un tema sea trend (de moda), explica Ricardo Valiente, uno de los tres impulsores de este proyecto junto a Juan A. Rico y Christopher Vallès.

Los buscadores tratan de descifrar las causas del auge de ese topic concreto y generan enlaces a alguna información específica relacionada con la misma (ya sea de un medio de comunicación, u otra web). SiTweetTrendings no encuentra el foco original del topic, desde la página se ofrece a los usuarios la posibilidad de que ellos mismos intenten explicar el origen y de mejorar o corregir las explicaciones ya existentes de una forma simple. Cuando el origen de un tema queda "aclarado", la misma cuenta emite otro tweet con la explicación para los interesados.

The Internet in Real-Time


Click the animation to open the full version (via PennyStocks).