Sabes quienes son los #BotBusters?



La iniciativa surgió en noviembre del año pasado a raíz de un artículo publicado en el portal Animal Político por José Merino y Enrique Valero Roth, en el que alertaban sobre estas cuentas falsas
Merino, politólogo por el Centro de Investigación y Docencia Económicas y profesor del Instituto Tecnológico Autónomo de México, relató en entrevista que mediante un intercambio por Twitter con Valero se dieron cuenta del fenómeno.
Notaron que se estaba repitiendo en México la promoción falsa que detectó la Universidad de Indianápolis en las elecciones presidenciales de 2008 en Estados Unidos.
La creación de cuentas falsas ha buscado desde entonces hacer que un tema tenga muchas menciones en Twitter y se ubique dentro de los diez más mencionados del país, conocidos como “trending topics”.
“Acá quien primero usó bots (que viene de robots, es decir, cuentas automáticas) para promoverse fue el gobernador de Veracruz, Javier Duarte, cuando quiso tratar de poner como trending topic nacional su Primer Informe de Gobierno.
“Pero no le funcionó, porque no alcanzó a ubicarse en los primeros lugares de las tendencias”, comentó Merino.
Ya este año, luego de la publicación del artículo, los usuarios comenzaron a subir sus “denuncias” mediante el hashtag (etiqueta) #CazaUnBot, colocado al final de su comentario para que pudiera unirse a la discusión sobre el tema.
Luego surgió la cuenta @TheBotBusters, conformada por un grupo de programadores que crearon un programa especial para detectar cuentas falsas. Han eliminado 11 mil 529 cuentas hasta el 1º de junio.
Mediante correos con los nombres de estos usuarios automáticos, alertaron a Twitter sobre la existencia de los bots, lo que hizo que la red social suspendiera estas cuentas.
        
         Adiós bots
El 21 de mayo, cuando vio lo “fácil” que era detectarlos, Iván Santiesteban, programador web de Monterrey, contribuyó a la causa creando el usuario @adiosbots.
“Lo lancé después de pasar el fin de semana ideando la mejor forma de encontrar una gran cantidad de bots. 
“Lo inicié para que otros se enteraran del tamaño del problema, espero al menos causar algún daño logístico a su campaña”, confesó Santiesteban.
Mediante un algoritmo propio que desarrolló ha detectado en apenas once días 16 mil 88 cuentas falsas usadas a favor del candidato del PRI, que ya han sido suspendidas por los administradores de Twitter.
        
         Debate artificial
Para el debate presidencial del 6 de mayo Lev Guzmán Vargas, doctor en física y profesor del Instituto Politécnico Nacional, hizo también un registro de cuentas falsas mediante un programa desarrollado en colaboración con AdQat Tracking.
“Hicimos un monitoreo desde las horas previas al debate, encontramos frases muy repetitivas y tuits muy periódicos a favor de Enrique Peña Nieto”, reveló
La diferencia entre los mensajes espontáneos y periódicos se volvió “abismal” cuando inició el debate, pues este esquema de tuits repetitivos y con una frecuencia de tiempo más o menos igual se incrementó cuando López Obrador atacó al mexiquense.
En dos horas se generaron más de 50 mil tuits relacionados, dijo, subieron a más de 2 mil los tuits negativos para AMLO entre las 9 y las 10 de la noche, pero eran artificiales.
“Se vio claramente que había un esquema orquestado, que tuvieron instrucción para que los trending topics reflejaran que había apoyo y Peña Nieto había ganado el debate”, dijo el especialista en sistemas complejos.
Guzmán Vargas, quien es también miembro de la Academia Mexicana de la Ciencia, detalló que detectaron bots activos a favor de Josefina Vázquez Mota, pero al realizar un análisis final del debate eliminándolos ella “pasó de noche” por la red social.
“Nuestro análisis de contenido, palabra por palabra, nos indica que el resultado real del debate estuvo dividido entre Peña Nieto y López Obrador, pero Peña fue quien incrementó más sus negativos”, acotó el investigador.
         Cacería para principiantes
Los especialistas coinciden en que si alguien está interesado puede “cazar bots” políticos aunque no disponga de conocimientos de programación.
La forma más rudimentaria, señaló Merino en su texto de Animal Político, es buscar el nombre de un candidato con la herramienta “search” de Twitter e identificar los tuiteros más entusiastas o que sólo replican lo dicho por el candidato.
Con la misma herramienta puede detectarse si esa misma frase la repiten otros tuiteros, descartando que se repita porque venga de un medio de comunicación.
También debe revisarse su perfil para saber si es un usuario automático o alguien que en su perfil declare específicamente que apoya al candidato, conocidos como ectivistas.
Luego debe tomarse una foto de la pantalla donde se observe la repetición de mensajes y se puede mandar un mensaje con esa imagen utilizando la etiqueta #CazaUnBot.
“Como persona puedes darte cuenta de que es un bot porque lo que tuitean se repite mucho entre sí, encontré una docena de mensajes que compartían muchos usuarios”, dijo Santiesteban desde Monterrey.
Recomendó fijarse también si el usuario es falso porque no tiene personalizada su cuenta con fondo e imagen de perfil, si habla todo el tiempo de política y siempre en el mismo sentido o si repite frases de otros usuarios que ya se detectaron como bots.
Si se detecta un tuit sospechoso que podría provenir de un bot puede copiarse en el sitio who.stolemytweet.com, donde se observa si otros usuarios han replicado el mensaje de forma más o menos idéntica.

         ENTREVISTA
        
         Cazar bots, oficio de tiempo completo
         Ciudad de México
         Peniley Ramírez Fernández
         Imagen del Golfo
El movimiento para detectar cuentas automáticas en Twitter lo inició en noviembre del año pasado el politólogo José Merino mediante la etiqueta #CazaUnBot, pero es el grupo The Bot Busters el más activo en esta comunidad.
Entrevistados por Internet ya que no accedieron a revelar su identidad, estos programadores aclaran que no son hackers y no intervienen la privacidad de las personas, pero se unieron a #CazaUnBot para dar más “profundidad” al movimiento.
“Hoy tenemos un algoritmo que detecta los comportamientos, un sitio online que ofrece análisis para que cualquiera pueda aplicarlos y una plataforma de denuncias para concentrar la intención de los usuarios de limpiar la red”, advirtieron.
         ¿Cómo detectan cuando una cuenta es un bot? 
Tenemos un algoritmo que se alimenta de distintos datos de la cuenta y realiza algunas comprobaciones, análisis y validaciones para aportar una probabilidad. Creemos que nadie tiene la información suficiente (salvo Twitter, claro) para decir que un usuario es un bot con seguridad, pero si hay comportamientos que aportan y nos dan un indicio.
Todos los análisis y reglas de validación se pueden agrupar en 9 grandes grupos:
          
         - Fecha de creación de la cuenta
         - Información del perfil
         - Interacciones con otros usuarios
         - Proporción entre tweets, replies y RT
         - Ratio de following / followers
         - Tweets duplicados
         - Fuente de publicación del contenido
         - Analisis derivado de los followers del usuario
         - Patrones ya previamente detectados en nuestra base de datos

Ninguno de los algoritmos es un análisis simple ni funciona independiente del resto. Por ejemplo, si un tweet duplicado (que aporta probabilidad que sea un bot) se publicó desde TwitterFeed (para autopublicar desde un RSS muy utilizado por usuarios humanos) nosotros anulamos la regla, entendiendo que los seres humanos instalan esta aplicación para compartir y no por eso deberíamos aplicarle una probabilidad de ser un bot.
Cabe destacar que ninguno de los elementos en sí mismo significa que el usuario sea bot, no por romper alguna de las validaciones el usuario directamente es penalizado, sino que cada elemento va sumando probabilidades. Si en la totalidad (la suma de las probabilidades acumuladas) el análisis supera cierta tolerancia lo clasificamos en NULA, BAJA, MEDIA y ALTA probabilidad de ser un bot.
El aprendizaje progresivo de nuestro algoritmo es fundamental, ya que cada vez que un usuario es detectado como bot y suspendido por Twitter nosotros almacenamos toda la información del perfil y el sistema intenta encontrar algún patrón de comportamiento automáticamente. De esta manera, si por ejemplo el username es reiterativamente nombre_0000_ (donde 0000 podría ser cualquier número) establecemos un patrón para compararlo con los demás usuarios. Hoy cuando analizas cualquier usuario en nuestro sistema estamos comparando sus patrones con los de otros miles de usuarios analizados para detectar algún comportamiento ya previamente analizado, de esta forma quizás tenga un patrón en el username compartido con un usuario y otro patrón distinto (pero también penalizado) de otro usuario.
Esta sistema de detección es incremental, cada vez que vamos analizando más usuarios vamos encontrando más patrones y se agranda la base de datos útil para detectar los comportamientos bot.

         ¿Cómo se elimina esa cuenta?
Tenemos tres procedimientos en paralelo: las denuncias de los usuarios (gente como tu y como yo) que colabora denunciando los usuarios, las denuncias del sistema que tenemos preparadas para alertar a Twitter automáticamente (equivale a reportes vía API) y las listas que casi manualmente compartimos con los responsables en Twitter de eliminar los bots y el spam en su comunidad.
Cabe aclarar que NO somos hackers ni tampoco procedemos contra la seguridad de una cuenta. Es decir NO robamos cuentas, NO atacamos a nadie. Simplemente cuando encontramos bots, los denunciamos e insistimos para que Twitter avance sobre la cuenta analizando y suspendiendo las que correspondan.


Vi que ya han eliminado más de 9 mil cuentas, ¿saben cuántas de esas han sido a favor de cada candidato a la presidencia?
Llevamos publicadas más de 10 mil cuentas e incluso seguimos eliminando diariamente muchas más. Con la colaboración de los usuarios y de la buena predisposición de Twitter venimos eliminando unos 1.000 bots diariamente y creemos que llegaremos a los 40.000 bots eliminados antes que las elecciones terminen.
Debo decirte que nuestros análisis han arrojado resultados un poco distintos a lo que comúnmente se percibe. Para romper el mito: los 3 partidos tienen cuentas con distintos niveles de automatización. En algunos casos son militantes con muchas cuentas “apoyando” a un candidato, en otros casos son sistemas de publicación un poco más sofisticados. La realidad es que ninguno de los partidos está exento de este comportamiento, todos tienen distintos tipos de bots.

Basados en los que han detectado, ¿qué candidato tiene más bots?
Somos una organización que busca limpiar la red de usuarios bots, sin ningún tipo de intencionalidad política. Expresarnos en contra de algún partido serviría solamente para que nos acusen de manipular la información para inculpar a alguno u otro. La realidad es que los tres partidos tienen una proporción bastante similar de bots, algunos son más descarados al utilizarlos y otros siembran contenido sin llamar tanto la atención.

¿En alguna fecha específica vieron algo así como una “explosión” de bots o surgen más o menos regularmente?

Aparecen regularmente, pero se vieron dos momentos clave donde la creación de nuevos bots aumentó exponencialmente. El primero fue unos pocos días antes de la campaña, calculo que para preparar estas cuentas para este proceso. El segundo fue cerca del primer debate del IFE, donde se vieron muchísimos más bots que hasta ese momento (hoy siguen en aumento).

¿Cómo puede una persona ayudarlos a eliminar bots?
La colaboración de la gente es un elemento fundamental. Nosotros diariamente analizamos las conversaciones, los trending topics y las comunidades alrededor de distintos actores políticos pero siempre es sumamente útil que la gente reporte en si misma sus propios descubrimientos.
Mediante nuestra plataforma http://thebotbusters.com pueden hacer todo el trabajo.

         ANALIZAR
Cada usuario que ingresen al análisis, quedará registrado en nuestra base de datos. No hace falta hacer más para que nosotros comencemos a trabajar sobre eso.

         EXPONER
Si el sistema arrojó una ALTA probabilidad de que el usuario analizado sea un bot, se puede dar click a PUBLICAR y alertará a otras personas del bot. Esto expondrá a la cuenta bot y seguramente con la colaboración de los miles que día a día apoyan la iniciativa en cuestión de minutos será suspendida.

         DENUNCIAR
Cada vez que analizan un usuario también tienen el botón para denunciar vía Twitter. La idea con este proceso es facilitar las denuncias mediante nuestra plataforma, aprovechando la aplicación que creamos para eso. 

Nuestro sistema jamás publicará ningún tweet (salvo que voluntariamente den click en publicar e incluso en este caso pedirá confirmación) ni hará follow, ni nada parecido.

Lo único que haremos vía API será denunciar directamente en Twitter, esto equivale al “Reportar” en Twitter pero directamente de nuestra plataforma.
Lo interesante de esto es que desde nuestra plataforma pueden colaborar en todo el proceso. Analizando nos facilitan la información y nos permiten recopilar bots, con el botón publicar terminan exponiendo a los bots públicamente y esto permite que los usuarios colaboren. Finalmente con el botón denunciar terminan el proceso, aplicando directamente una denuncia en Twitter.
¿Qué saben de ese momento en que de un día para otro Josefina Vázquez Mota tuvo casi 100 mil seguidores más en Twitter? ¿Eran bots?
Efectivamente, fue un paquete demasiado grande de implantación de seguidores. No podía pasar desapercibido y todos esos usuarios forman parte de la gigantesca base de usuarios analizados que dieron positivo. No te puedo afirmar que todos, pero según nuestro algoritmo más de un 92% eran afirmativamente bots. Al igual que el caso de Lopez Obrador (que aun no finalizamos y seguimos analizando) donde creció 192 mil followers solo en mayo siendo el triple de los followers obtenidos en meses anteriores.
Otro detalle no menor es la cantidad y el tipo de conversaciones que se generaron a partir de mayo, donde surgieron distintos grupos (antes inexistentes) que simulan ser militancia y que están implantando distintos temas o trending topics para candidatos que antes no eran tan principales.
         ¿Han detectado bots atacando al movimiento #yosoy132? ¿Cuántos?
Hemos detectado bots en ese movimiento, al menos 1.400 que son los que llevamos suspendidos solo sobre ese hashtag. Tenemos aun en análisis unos 2.000 más. De nuevo, lamentablemente los bots respondían a todos los candidatos. En algunos casos participaban para atacar a algún candidato, en otros para defenderlo, por desgracia hay bots en todas las direcciones.
        
Finalmente, ¿cómo los presento en el texto para citar esto que comentemos? ¿Thebotbusters es un grupo de personas o es una sola?
Si bien prefiero mantener mi identidad bajo reserva yo creé el movimiento #BotBusters y luego se fueron sumando otros colaboradores que también creían en la necesidad de limpiar la red. Hoy nos convertimos en una muy pequeña organización, claramente sin fines de lucro, gestionada por un grupo muy pequeño de colaboradores pero respaldado por una comunidad gigante que nos ayuda.
Es impresionante la colaboración y la importancia de la inteligencia colectiva. Hay usuarios que nos envían análisis, otros que colaboran con nuestras herramientas e incluso acercan distintos recursos para optimizar los algoritmos. Sin el aporte de todos ellos, seguramente no hubiéramos logrado los enormes resultados que hoy tenemos.
Es importante destacar esto: no somos los únicos que estamos limpiando la red. Hay varios perfiles, personas y organizaciones que quizás no lograron un nivel de organización suficiente pero están haciendo distintos aportes para que todo esto suceda. Como también contamos con el apoyo de Anonymous para lograr movilizar y hacer conciencia de la necesidad de limpiar la red. Nosotros no participamos de Anonymous, pero agradecemos muchísimo su colaboración y difusión para nuestras actividades.
Hemos recibido también otro tipo de propuestas, desde algún partido en ascenso que ofreció contratarnos como también alguna empresa interesada en patrocinar nuestras investigaciones. Rechazamos todas estas ofertas porque creemos en una actividad libre, sin condicionamientos, para poder trabajar total y solamente enfocados en depurar la red. Imaginate que si nosotros aceptamos una oferta de AXA se generaría un conflicto de intereses con la comunidad y lo último que queremos es perder la confianza y la transparencia que hemos construido.


         Pasos para detectar un bot
         (Según @santiesteban)
          
         1) ¿Sigue a cuentas que ya identificamos como bots?
         2) ¿No ha personalizado el diseño de su perfil?
         3) ¿Habla frecuentemente de política?
         4) ¿Repite frases que hemos identificado en otros bots?
          
         Otros datos:
          
         Usuarios mexicanos en Twitter: 22 millones
         Fuente: Asociación Mexicana de Internet, actualizado al 17 de mayo.
          
         Páginas para detectar bots:
         www.thebotbusters.com
         who.stolemytweet.com
        
         Cuentas falsas suspendidas de la red:
         The Bot Busters: 11 mil 529 (al 1º de junio)
         Adios Bots: 16 mil 88 (al 29 de mayo)
         Total: 27 mil 617 cuentas.