09 febrero 2017

Congresos científicos y Twitter (I): un análisis de #AEETMED



La semana pasada se celebraron a la vez dos congresos a los que no me hubiera importado para nada asistir. Por un lado, se celebró en Sevilla, del 31 de enero al 4 de febrero, el Congreso de la Asociación Española de Ecología Terrestre (AEET), que este año iba en conjunto con MEDECOS, el congreso que organiza la International Society of Mediterranean Ecology. Por otro lado, la Fundación Pau Costa organizaba en Barcelona ICOPFIRES, el Congreso Internacional sobre Quemas Prescritas, que este año se hizo coincidir además con la Wildland Fire Safety Summit.

Como os decía, hubiera encontrado cualquiera de los dos muy interesante, porque además en cualquiera de ellos tenía numerosos colegas - aunque más en Sevilla, donde además el lab estuvo representado por este póster. Por suerte, los que nos tuvimos que quedar en casa contamos hoy en día con herramientas para ir siguiendo los momentos más interesantes de los congresos, y una de las más ágiles en este sentido es sin duda twitter. Los dos congresos tuvieron la buena iniciativa de definir con antelación un hashtag claro, #AEETMED para el de Sevilla, #iCOPFires para el de Barcelona, y así muchos pudimos seguir desde nuestro ordenador o móvil los momentos más destacados.

Pero ¿cuál fue la repercusión de estos eventos en twitter? ¿Cuándo y quién tuiteó desde los congresos? ¿Quiénes fueron los tuiteros más activos? Es lo que me pretendo analizar hoy, aprovechando que se puede extraer fácilmente la información a partir de la API de Twitter. Antes de meternos en harina, quiero dejar claro que el código que he utilizado para descargar los tuits y analizar las tendencias no es originalmente mío, sino una adaptación de diversas fuentes, en concreto ésta, ésta, ésta y ésta. Los tweets que incluian el hashtag #AEETMED o #ICOPFires se recopilaron de la API de RTwitter mediante el paquete twitteR y la entrada la he escrito utilizando RMarkdown, y el codigo fuente y los datos están disponibles en mi GitHub. Dicho esto, al lío.

Según los organizadores, el iCOPFires acogió en total a unos 500 asistentes, mientras que AEETMED reunió a unos 600.  En cuanto a número de tuits generados la cosa anduvo bastante pareja, como se ve en esta tabla.


A partir de aquí, como no quiero que esto se convierta en una competicion entre ambos congresos, los analizaré por separado, en dos entradas distintas. Hoy nos centraremos en el congreso de la AEET, y mañana o pasado publicaré el análisis de ICOPFires.

Actividad durante la semana

Como la API permite importar la fecha y hora del tuit, podemos ver en qué momentos se produjo más actividad.


Vemos que en el grueso de actividad se produjo el jueves y el viernes, y además parece que la proporción de retuits fue más alta por la tarde, veamos si es así:


Efectivamente, el ratio retweets/tweets originales es más alto por la tarde, y es que no éramos pocos los que consultábamos los highlights de la jornada al llegar a casa por la tarde, retuiteando lo que nos parecia mas interesante. 


Tuits favoritos

De entre los 1282 tuits con la etiqueta #AEETMED que se generaron durante la semana pasada, estos fueron los 3 más retuiteados:



Y estos los 3 más marcados como favoritos:




Tuiteros más activos

Veamos quienes fueron los más activos de entre los 288 usuarios que tuitearon sobre el congreso utilizando la etiqueta oficial.




Si consideramos todos los tuits, las más prolíficas fueron la cuenta de la AEET y la de la paleontóloga AR Gómez-Cano. En cambio, si sólo consideramos los tuits originales, gana por goleada la paleoecóloga Graciela Gil Romera, con más de 40 tuits durante el congreso. ¡Parece que lo paleo estuvo muy activo!

Usuarios más populares

Podemos ver qué usuarios tuvieron más repercusión analizando la media de RT y FAVs que recibió cada usuario. (Nota: las figuras de abajo solo incluyen usuarios que han tuiteado mas de 3 veces, y no incluyen retuits).



Parece que no hay grandes “superestrellas” que concentren la mayor parte de los RT y FAVs, sino que hay un gradiente bastante suave, aunque destacan perfiles de ecólogos muy reconocidos como JC Svenning, Fernando Maestre o Pedro Jordano, entre otros.

De hecho podríamos juntar RT + Favs como un indicador del impacto, y ver si los que más impacto tuvieron son también los que más tuitearon


En líneas generales vemos que no es así, y no parece haber relación entre el número de tuits y el impacto medio de cada tuit.

Wordcloud

Estas fueron las 50 palabras más frecuentes en los tweets etiquetados con #AEETMED


Parece que efectivamente, en Sevilla hubo “grandes charlas” ;-), pero se vislumbra por aquí algunos de los temas estrella que ya ha definido Ignasi Bartomeus en el blog de Journal of Ecology: sequía, fuego, e interacciones entre especies.

Menciones: twitter como plataforma de conversación

Una de las cosas buenas de twitter es cuando se montan debates entre varios usuarios sobre un tema concreto, a veces muy interesantes a pesar de lo limitado de los 140 caracteres, y de hecho no sería la primera vez que una de esas conversaciones deriva en un post de Forestalia. Usando las capacidades de las expresiones regulares (regexp) podemos identificar los usuarios que fueron mencionados más a menudo durante el congreso.



Pues aparte de los organizadores (AEET), y la Universidad de Sevilla, institución donde se celebró, parece que los usuarios más mencionados fueron F.Maestre y el grupo de paleocología y vertebrados de UCM y CSIC. ¡Otra vez la paleo!

Twitter como red social

Lo que hace únicas a las menciones de twitter respecto a otras redes sociales como facebook, es que se pueden rastrear las menciones de ida y vuelta. Por lo tanto, una vez extraídas las menciones podemos explorar las dinámicas de las conversaciones mediante un grafo, representando cada usuario como un vértice y las menciones como las aristas entre los vértices. Aquí quiero mencionar expresamente que esta parte del código está tomada del análisis que hizo Keith H.Turner para el ISME2016. La pena es que blogger no me permite insertar un gráfico interactivo como el que generan estas funciones (de este año no pasa la migración a Wordpress!!!!). Si alguien sabe como hacerlo, por favor que me deje un comentario. Mientras tanto, los que queráis explorar la figura tendréis que ir a GitHub

La verdad es que hay mucha información en este gráfico, es una pena que aquí no se vea de forma dinámica. Aun así destaca un gran nodo o vértice central, que corresponde a la cuenta de la AEET, y es que una buena parte de las conversaciones pasó por ellos. También llaman la atención unas pocas cuentas que parecen tener una importante red de contactos en twitter (F.Maestre, JC. Svenning, P. Jordano, G. Gil-Romera) frente a las cuentas de los exteriores, que difundieron información sobre el congreso (por eso aparecen en azul) a numerosas personas que en cambio sólo recibieron menciones, pero no tuitearon (en amarillo).

También resulta muy interesante aplicar análisis de cluster de grafos para ver en cuantos grupos se puede clasificar la tuitesfera del AEETMED, pero una vez más blogger nos juega una mala pasada, asi que os enseño aquí la figura estática pero os animo a que vayáis a la animada.




Usando los parámetros por defecto de la función random walk, el grafo de menciones se divide en 23 grupos distintos, algunos muy numerosos, otros formados sólo por dos usuarios. Es un gráfico superchulo, donde se puede ver como los colegas de la misma institución tienden a agruparse juntos, mientras que hay individuos que aparecen como puentes entre dos grupos más amplios. Como ejemplo os dejo aquí abajo una captura de lo que podríamos llamar el "cluster catalán" del congreso. ;-) Os animo a que os busquéis (una vez más, en GitHub) y valoreis si el algoritmo os ha clasificado bien u os habéis llevado una sorpresa. La verdad es que ver los datos asi hace valorar el paper de tuiter como difusor de la actividad en una conferencia!


Esto es todo de momento. En los próximos días prometo publicar un análisis parecido de la conferencia #iCOPFires.

NOTA FINAL: El codigo para generar el documento fue desarrollado originalmente por Francois Michonneau (fmic_ en Twitter) para el congreso de Evolución de 2015, y se puede encontrar aqu?. El codigo ha sido posteriormente modificado para el congreso ICCB-ECCB 2015 por Joona Lehtomaki (jlehtoma en Twitter), y por Emily J. Rollinson (ejrollinson en Twitter), para los congresos de la Ecological Society of America de 2015 (Baltimore, #ESA100), y de 2016 (Fort Lauderdale, Florida, #ESA2016). También he incorporado algunos elementos del análisis de redes que hizo Keith H.Turner para el ISME2016.

Los tweets que incluian el hashtag #AEETMED se recopilaron mediante el paquete twitteR a partir de la API de Twitter. El documento se generó mediante RMarkdown, y el código fuente y los datos están disponibles en mi GitHub. El documento, así como el código asociado, tienen una licencia CC0.

4 comentarios:

  1. Oye, como mola el análisis que has hecho! Me ha encantado leer-lo y gracias por dejar el código abierto!
    Un abrazo,
    Ignasi.

    ResponderEliminar
  2. Concuerdo con Ignasi. Gran entrada y genial experiencia leer los análisis de los tweets del congreso AEETMED

    ResponderEliminar
  3. Gracias a ambos, me alegro de que os haya gustado! Como le decía a Ignais por twitter, una lástima que el análisis de redes, que es lo más chulo, no se pueda ver en blogger :-(

    ResponderEliminar
  4. Que interesante! Ayuda mucho a conocer estas herramientas para optimizar su uso. Gracias por el análisis y el post!

    ResponderEliminar