Page 1


MARIANA SANTOS Las posibilidades de la visualización de datos Les voy a hablar de la experiencia que yo he vivido en The Guardian. Para resumir, lo primero que debo decirles es que no hay una sola persona que pueda hacer de todo, no es algo así como llegar a un periódico y decir: “Consígueme a un chico que haga visualización de datos”. No, no es así, por lo menos en mi unidad es un trabajo de equipo en el que se necesita, al menos, un periodista, un diseñador y un desarrollador. Una parte del equipo está conformada por la gente de datos que cuenta con los periodistas y los desarrolladores que buscan datos, buscan la historia, buscan el contenido. Ellos en conjunto con los diseñadores van a pensar cómo contar la historia, porque, por un lado, se puede contar una historia con el tema que surge de inmediato, pero, por otro lado, hay más historias que se pueden contar a partir de allí. Entonces, el trabajo con el diseñador es muy importante en cuanto la elección de la narrativa y la forma visual de contar. En mi caso particular todos mis trabajos son para online, no hago print, pero trabajo mucho con los de print porque hay un montón de proyectos que vienen de print y renacen para ir a online, lo que te da otras oportunidades. La sala de prensa de The Guardian es un espacio muy iluminado, lleno de vidrios, y muy grande en el que todas las personas trabajan en open space1. Como sabrán, no somos un diario privado, sobrevivimos gracias al fondo Scott Trust2, de ahí que se esté pensando en nuevos proyectos o nuevas formas de sustentabilidad como las Guardian Masterclasses, que son cursos y talleres de capacitación para periodistas, diseñadores y personas que quieran hacer periodismo de investigación, long form writing, entre otras cosas, pues el dinero en algún momento se va a acabar. Ahora bien, The Guardian se mantiene gratis, todos los accesos son gratuitos, no tenemos paywall, y nuestro editor quiere seguir así, pero es necesario reinventarse y nosotros como periodistas también debemos reinventar nuestras historias, porque no podemos continuar en el esquema de texto seguido de una foto; con el medio digital hay que empezar a hacer cosas distintas. Para que se hagan una idea de cómo se manejan los dineros en The Guardian tenemos 170 desarrolladores; hace un año y medio éramos 40 y ahora somos 170. De manera que hay mucha inversión en desarrollo, todos los productos se hacen en casa y sé que no se puede contar con esta clase de inversiones en cualquier periódico, es algo que nosotros tenemos las suerte de tener.

Open Space Technology (Tecnología del Espacio Abierto): es una técnica o metodología de diálogo o de trabajo abierto para grupos grandes o pequeños, en la que todas las personas colaboran, se autoorganizan, se apropian de los resultados, conviven, hablan y trabajan. 2 El Fideicomiso Fondo Caritativo Scott es un presupuesto anual creado para apoyar proyectos relacionados con el periodismo independiente, la ética periodística, la alfabetización mediática y la capacitación de periodistas en el Reino Unido y en el extranjero. 1

1


Cómo contar una historia Quiero hablarles de uno de los trabajos que realizamos en el diario y que pasó de print a online. La historia de los gastos del Gobierno es en general muy aburrida, es algo de lo que las personas hablan todo el año y es, en cierta medida, un tema fuerte porque es muy duro que corten los dineros para las pensiones, para las escuelas, etc. Así que como pueblo nos duele directamente nuestra patria. Todo empieza con el acceso a la información. El Gobierno publica la información en PDF, es decir, podemos encontrar todos los gastos públicos por secciones, uno va al sitio oficial y descarga la información. Ahora bien, si usted es una persona especializada en análisis de datos y en análisis de manejo de dineros pues va a entenderlo todo, pero si es una persona común que no entiende mucho de matemáticas y gastos esta historia del PDF no le dirá mucho. Entonces, nuestro trabajo es traducir esto para que pueda tocar a las personas y estas puedan entender lo que sucede y, por ende, se sientan interesados en explorar y en elegir. Primero realizamos el trabajo en print. Se llama “Atlas de gastos del Gobierno3” y es una opción para visualizar y elegir con pelotas las diferentes secciones y gastos del Gobierno. Claro, se ha hablado mucho de que las pelotas no son la forma más intuitiva para identificar distintos tamaños de información, pero a nosotros nos funcionó muy bien, pues fue clara la jerarquización y diferenciación de la información por intensidad de colores y tamaños de las pelotas. De hecho, el Gobierno imprimió el Atlas en tamaño gigante y lo expuso en sus oficinas para que todos pudieran verlo, pues se presentaban allí todas las informaciones y toda la distribución de los gastos públicos por departamentos. Para esclarecer un poco el proceso les voy a explicar lo siguiente. The Guardian tiene tres equipos principales de diseño. Está el equipo de diseño de print, que son aquellos que hacen cosas de última hora, es decir, si hoy renunció el papa hay que hacer algo para publicar en un par de horas. Luego, encontramos el design team, que hace todo el diseño para online, como botones o layouts, cosas muy básicas y rápidas, de alrededor de tres días de producción interactiva. Finalmente, está el interactive team que es el equipo en el que yo estoy, allí hacemos cosas más largas, de tres semanas o más, lo que hace que no podamos asistir a breaking news, aunque en ocasiones hay cosas que son del breaking news y que merecen algo más desarrollado que tomará varias semanas. Por ejemplo, con el papa hicimos algo muy rápido para el mismo día de la renuncia, pero después el interactive team tuvo dos o tres semanas de desarrollo, antes de la elección del nuevo papa, en el que hicimos un trabajo más desarrollado sobre los perfiles de cada uno de los papables. Retomando el trabajo de los gastos del Gobierno, lo que hicimos después de la publicación en print fue hacer la parte interactiva del Atlas del impreso, en el que el usuario podía explorar cada pelota de la que se desplegaban subcategorías y contendidos para mirar cuánto dinero se iba a cortar y cuánto dinero se quedaba en cada uno de los departamentos. Claro, siempre hay pros y contras en cada una de las opciones. En el print el lector puede ver toda la pantalla y comparar todos los 3

Public spending by UK’s central government departments, 2010-2011

2


sectores, mientras que en el digital el usuario puede entrar en un departamento y explorar dentro este, pero pierde un poco the hole picture. Más adelante mi equipo hizo un juguete4, es decir, se contó la historia a través de un juego para que el utilizador se entretuviera y no solamente leyera para informarse, sino que a su vez se sintiera entretenido y relajado. Entonces, realizamos otra vez el mismo proceso, lo separamos por departamentos y después invitamos al usuario a ponerse en los zapatos de los encargados de la distribución de los dineros públicos, así se le preguntaba al usuario cómo realizaría él los cortes de presupuesto. Luego de realizado el corte, a través de una curaduría editorial, el usuario podía copiar el link y enviárselo a sus amigos por Tweeter o Facebook y así empezar una conversación con una base más sólida de entendimiento. Los disturbios de Inglaterra Los disturbios de Inglaterra fueron un suceso muy fuerte en el que las personas salían a la calle y de repente a través de teléfonos BlackBerry empezaron a incentivar crímenes de toda índole, desde poner fuego en las calles, en las casas y en los coches, hasta incendiar las casas de grandes compañías como Sony. Uno de nuestros periodistas fuertes de investigación, que se llama Paul Lewis, estaba mirando la reacción de las redes sociales con los twitter que se lanzaban y en ese momento se tomó la decisión de seguir esta red social para ver lo que pasaba. Lewis fue la persona en el medio que intentaba mirar si la información era correcta o no. Este ha sido, tal vez, el evento más tuiteado de historia con alrededor de 2.6 millones de tweets5. Luego del seguimiento inicial de Lewis The Guardian pensó que solamente con Twitter no se podía hacer el seguimiento, así que se le pidió a las personas que se conectaran a través de Facebook, Twitter o The Guardian Log in y nos contaran lo que estaba sucediendo en sus calles, que nos enviaran fotografías y demás elementos. Ahí creamos una barrera porque ya no se trataba solamente de decir tonterías, sino que había un esfuerzo que le iba a tomar a las personas un tiempo. Después el mapa adquirió popularidad y los usuarios podían mirar muy cercano al tiempo real lo que estaba ocurriendo; cliqueaban y abrían una ventana con las informaciones. Al tercer día del suceso hicimos una reflexión en print y mapeamos con las cosas más fuertes e importantes del hecho, pues teníamos un espacio limitado. Al final, con todo este mundo de tweets y con la participación social, Paul Lewis llegó a mi equipo y nos dijo: “Mira, tengo 2.6 millones de tweets, ¿qué podemos hacer? Eso sí, tenemos que ver cómo estudiar los datos, porque no todo es verdad”. Los riots ya habían pasado, pero teníamos que ver cómo íbamos a investigar todo aquello que se había generado desde la población. En ese momento una universidad estaba interesada en desarrollar un algoritmo matemático que estudiara el tweet, es decir, que revelara si un tweet era positivo o negativo. Entonces, si alguien tuiteaba “los riots fueron al zoológico, abrieron las jaulas de los leones y hay un león que se está comiendo a las personas” y yo respondía diciendo “sí, sí, claro” el 4 5

Gamification: contar una historia a través de un juguete. How riot rumours spread on Twitter

3


algoritmo miraba y afirmaba que yo estaba de acuerdo, pues “sí, sí, claro” son palabras positivas. Sin embargo, esto no era así, porque la lengua humana tiene ironía, metáforas e intersecciones al hablar que los tweets y el algoritmo matemático no entendían porque no hablan, no son humanos, no tienen emociones y sentimientos. De manera que una semana y media antes de lanzar el proyecto con este algoritmo miramos que habían muchos tweets de este estilo, es decir, que no eran positivos, sino negativos. Así que estudiamos las relaciones entre tweets y descubrimos que todo estaba mal. Lo que hicimos fue poner a los estudiantes y académicos que estaban desarrollando el algoritmo a revisar uno por uno para que pudiésemos poner el estudio6. Grandes oportunidades para desafiar nuestra creatividad Lo que les voy a comentar ahora es para que se den cuenta de que solamente porque es The Guardian no quiere decir que todo va súper bien. The Guardian quiere llamar la atención del mundo para que lo vean, así que invierte mucho dinero en la plata física y en la expansión en los países de habla inglesa, por ejemplo, ahora hay oficinas en Australia. Entonces, cuando se dio lo de los Juegos Olímpicos de 2012 en el diario pensaron que todo el mundo iba a mirar hacia nosotros porque estábamos en Londres. En ese momento yo era la última de la línea y les propuse que trabajáramos en conjunto los de comercial, editorial y desarrollo para así tener ideas fuertes, porque iba a ser una oportunidad magnífica y si lo hacíamos un año antes tendríamos aún más tiempo y se trabajaría sin presiones. Alrededor de 100 personas se apuntaron para la realización del proyecto, pero dos días antes de empezar la jefa del proceso me dice: “Mariana, quita eso, no podemos hacerlo; no tenemos Project Manager”. Claro, yo en todo caso pensaba que podíamos tener ideas, que podíamos llevar a cabo un preproceso, pero no, la orden fue acabar con todo y yo no podía hacer nada porque corría el riesgo de que me despidieran. Todo esto se los cuento para decirles que no dejen que el proceso interrumpa sus ideas y si las personas tienen ganas de trabajar háganlo, no interesa que no sea perfecto al inicio, las ideas son, justamente, un inicio para tener algo fuerte. Lo que finalmente hicimos fue una interfase exploratoria, varios miembros del equipo aprendieron a hacer 4D y en conjunto con un fotógrafo que había realizado fotografías 3sixty hicieron un mapa 3D interactivo para que las personas pudieran ver lo que sucedía dentro de las instalaciones en las que se realizarían los Olímpicos7. Ahora bien a 3 o 4 meses de los Olímpicos aún no había Project Manager y la persona responsable del tema llegó a nuestro equipo y nos dijo: “Hagan lo que quieran, pero hagan algo”. Claro, lo primero que pensé es que si no nos hubieran detenido tiempo atrás en ese momento habríamos contado con muchas ideas para llevar a cabo. Otro de los proyectos que nos gustó mucho fue el interactivo que realizamos para que las personas pudieran ver en tiempo real lo que sucedía con los juegos y con Vea una explicación detallada del proceso y el resultado del estudio en el video It was a war, and we had the police scared 7 London 2012: A virtual reality tour of the Olympic & Paralympic Games 6

4


las tablas de medallas. Ahí tuvimos un reto, puesto que la BBC tenía todos los derechos de las imágenes de video y nosotros no podríamos utilizar nada de video, entonces tuvimos que pensar en cómo contar las historias sobre Olímpicos en real time y sin video. Pues bien, creamos el Second Screen8, un portal en el que el usuario podía elegir fotos, tweets, guardian comentarios, tablas de medallas, etcétera en real time. También podían ver cosas que pasaron antes navegando en la línea de tiempo e incluso hicimos un juego9, era algo a modo de broma ya que teníamos toda la libertad de proponer, así que hicimos un ATS Game con los datos de todos los records de corredores o nadadores que han jugado o han sido campeones olímpicos. Entonces, el usuario jugaba con personas que habían sido campeonas de otros países y en otros años, y después, para entrar en más locura, el usuario podía desbloquear la opción de “animal” y elegir a un león o una pantera. Así que comparábamos las habilidades de los humanos con las de los animales, por ejemplo, la velocidad del hombre con la de un caballo. Cabe señalar que para ello llamamos al Instituto de Biología para saber con exactitud las habilidades de los animales que pusimos en el juego. Quiero finalizar hablándoles de una experiencia personal en mis primeros años en el diario, del primer trabajo que realicé cuando era interna. Antes de llegar a The Guardian yo trabajaba en Universal Music haciendo animación para TV y para musicales, así que cuando me entregaron una base de datos de cosas que se iban a utilizar en dos años, una base de datos sobre los Juegos Olímpicos, intenté aplicar mis conocimientos previos utilizando tipografías y elementos más cercanos a The Guardian y contar la historia de los datos con estilo grafico. En ese momento yo trabajaba por las mañanas en WikiLeaks y por las noches me dedicaba al proyecto de los datos, pues era lo que realmente sabía hacer y quería mostrar en el diario que yo sabía hacer más cosas, estaba muy entusiasmada y trabajé con la ilusión de que les gustara mucho10. Pues bien, cuando termine estaba súper encantada, debo decir que el director artístico me ayudó muchísimo, y les entregué el trabajo para que pudieran publicarlo, aún faltaban dos años para los Olímpicos, y me dijeron: “Mira, nosotros nunca habíamos hecho eso. No sabemos si vamos a poder publicarlo, a las personas no les van a gustar”. ¡No podía creerlo! No había dormido en semanas ¿y no lo iban a publicar? Bueno, me resigné y entre tanto me hice parte del staff y empecé a hacer más cosas con visualización de datos. En ese punto ya no le preguntaba al editor si podía o no publicar algo, simplemente lo hacía y como el video es algo tan fácil de compartir y de mirar, siempre y cuando sea de menos de 2 minutos, se empezaron a generar un montón de cosas. Al paso de dos años, en el año de los Juegos Olímpicos de Londres, publicaron mi trabajo, pero se quedó dos años guardadito. Por supuesto, solamente después de que The New York Times empezó a hacer videos The Guardian pensó: “Si ellos hacen, nosotros también podemos hacerlo”. Así que, además publicar mi trabajo, hablaron conmigo para que realizara visualizaciones por mes. Entonces, es un poco difícil luchar con los pre-supuestos y la mentalidad de un periódico muy grande que tiene que ser bueno y no puede fallar.

Olympics Second Screen: archive edition Could you be a medallist? Find out with our brilliant retro interactive 10 Olympics 2012 in numbers – animation 8 9

5


Mi conclusión es trabajen en equipo. Aquí en Latinoamérica me parece que las personas son muy amables y humildes, pero en Londres es común que los editores piensen que lo saben todo, así que si ponen el ego tranquilito las cosas se procesarán mucho mejor. Piensen siempre que toda la gente que trabaja con ustedes tiene muchas ganas y mucha pasión, y que cuando todos se involucran los proyectos son mayores y mucho más fuertes. JUAN DIEGO LÓPEZ La experiencia de una unidad de visualización de datos – El caso de La Nación de Argentina Recuerdo que a finales del 2009 me llamaron a una reunión en la que me dijeron: “Ché, empecemos a hacer cosas con datos”. Esto me pareció buenísimo pero el problema era qué íbamos a hacer. Así que, como imaginarán, fue un año de muchas reuniones entre periodistas, diseñadores y editores para empezar a pensar en algunos proyectos de datos. Finalmente, en el 2010 empezamos el proyecto de subsidios a colectivos11 en el que trabajó un periodista del papel de la edición económica, tres personas de sistemas y una agencia externa que generó el micrositio de subsidio a colectivos. Luego, el equipo de datos de La Nación empezó con mucho miedo y despacito a involucrar más gente, y entre tanto con el equipo de realización multimedia y diseño interactivo nos planteábamos: “Nosotros podemos generar visualizaciones bonitas y atractivas para el lector, pero nos tienen que dar algo más”. De manera que para trabajar partimos del modo en el que esas visualizaciones le ayudarían a los periodistas a entender y a encontrar historias. Para mí la visualización de datos es una manera sencilla de mostrar datos complejos, que le sirve tanto al lector, pues le ayuda a asimilar y a entender los datos, como a los periodistas, pues les ayudan a encontrar datos, a transmitir mayor información en menor tiempo, facilita además el trabajo de análisis y les permiten descubrir nuevas historias. A este respecto, les quiero hablar del proyecto de declaraciones juradas12, en el que decidimos mostrar las declaraciones juradas del Gabinete Nacional Argentino. Allí, el reto era transformar estos documentos aburridos, complejos e insípidos en un producto didáctico y amigable para el lector, porque de nada nos servía mostrar los papeles de archivo. Lo primero que tuvimos que hacer fue conseguir los datos, es decir, solicitarle a la Oficina de Anticorrupción Argentina las declaraciones juradas de cada uno de los miembros del Gabinete. Una vez las obtuvimos, que por cierto nos costó mucho trabajo, las agrupamos en 3 categorías para poder hacer el análisis de información personal, de los cargos y de los bienes de cada integrante. Luego de esto la pregunta fue, ¿cómo visualizamos la información? Entonces, el equipo de diseño interactivo y de visualizaciones planteó que la manera más fácil de hacerlo era agrupar los datos por color, unos colores que se apegaran al diseño del diario y al diseño de la pagina, y que, además, debíamos trabajar fuertemente desde lo icnográfico.

11 12

Los subsidios a colectivos en Argentina Los bienes de los funcionarios, en una news application de La Nación

6


Más adelante, el interrogante fue, ¿y cómo navegamos en esta marea de información? Pues bien, el primer desafío que se nos presentó fue qué funcionario elegir, es decir, darle la posibilidad a la gente de que hiciera la elección a través de fotografías, para ello generamos un cabezal fotográfico. La otra opción que concebimos fue creada para aquellas personas que no conocían la cara del funcionario, entonces elaboramos un listado que aparecía a modo de drop down. Después de esto generamos 2 niveles de lectura. El primero desde lo iconográfico, que a través de un primer vistazo la gente pudiera saber cuántas propiedades, cuántos bienes (autos, motos, casas) tenía el funcionario y, el segundo nivel, mostraba esa información con mayor complejidad. El trabajo también fue dividido y en él mostrábamos dos declaraciones juradas de cada funcionario; la que hizo cuando ingresó a trabajar en el Gabinete Nacional y la del año actual. Por ejemplo, con la declaración de la presidenta Cristina Fernández de Kirchner tuvimos un desafío muy grande, pues presentaba mucho crecimiento patrimonial a causa del fallecimiento de su marido, Néstor Kirchner. Por ende, muchas propiedades eran herencia y eso también debíamos mostrarlo gráficamente. Lo que además hicimos en el caso de ella fue generar una nota aparte contando cómo fue el crecimiento del patrimonio, pues estaba en parte vinculado a la herencia de los bienes de su marido. Ahora bien, nosotros también programamos y, a diferencia de The Guardian, solo tenemos un programador. Así que todo el proceso fue en este sentido un desafío muy grande. Trabajamos con gente de minería de datos, una profesión desconocida para mí hasta hace un año y medio o dos, programamos con Ruby on Rails para integrar la base de datos y en la parte de diseño trabajamos con HTML5, CSS3 y JavaScript. Estas son la clase de cosas que considero un periodista debería conocer, claro, no demasiado, pero sí tener una base. Ahora, como les contaba más atrás, en este proyecto trabajamos de la mano un periodista, que se incorporó sobre el final del proyecto y quien interpretó algunos datos mientras se construía la visualización y generó algunas notas; tres personas de diseño, que diseñaron la interfase; una persona de data mining y una persona de programación. Más adelante se integraron algunos periodistas y colaboradores que ayudaron a hacer el data entry de las declaraciones juradas y los pedidos de información. Tardamos cuatro meses en llevar a cabo el proyecto, porque nuestro equipo trabajaba para datos y para la actualización de noticias. Un ejemplo, cuando tuvimos la suerte de tener al primer papá argentino tuvimos que dejar de lado todo lo que estábamos haciendo y pasar a todo el equipo de diseño y programación a generar piezas relacionadas con Francisco. Claro está que ese suceso no fue paralelo al de las declaraciones juradas, pero quiero ejemplificar de algún modo la dinámica que tuvimos al realizar el proyecto. Juegos Olímpicos de Londres 2012 Ahora quisiera hablarles de otros ejemplos de visualización de datos. A nosotros nos pasó algo parecido a lo que le pasó a The Guardian y es que se nos vinieron encima

7


los Juegos Olímpicos y debíamos hacer algo. Entonces, generamos un micrositio13 con distintos elementos y conectado a redes sociales como Twitter y Facebook. Paralelamente, conseguimos, por las buenas relaciones que tenemos con la gente de The Guardian, una base de datos con atletas y la cantidad de medallas que habían ganado. En ese momento nuestro desafío en la visualización fue que teníamos una base de datos de 29,217 registros que fueron traducidos y que en el momento de chequear nos generaron errores; aparecía que Argentina tenía alrededor de 100 medallas de oro, lo que es mentira. Pues bien, los datos estaban diciendo que los deportes colectivos generaban medallas individuales, es decir, Argentina tenía 22 medallas de oro por los 22 futbolistas que ganaron años atrás y lo mismo sucedía con el equipo de basketball y el de hockey, así que generábamos mucha medallas por deportes colectivos, cuando en realidad teníamos una medalla. Una vez subsanado eso pudimos arreglar la base, les avisamos a los amigos de The Guardian y quedamos todos contentos. Es pertinente aclarar que esa falla la descubrimos cuando el equipo de deportes vio la visualización, ellos nos alertaron de que algo andaba mal, pues para ellos era imposible que el deporte argentino tuviera esa esta cantidad de medallas. Ahí pudimos entender el problema y pudimos solucionarlo. Más adelante, generamos las visualizaciones pertinentes14. Otro inconveniente que tuvimos fue en la visualización de la cantidad de medallas en hombres y mujeres15. Cuando el equipo deportivo vio el pico que había en hombres en los Juegos Olímpicos de Amberes descubrió que había un error. Empezamos a investigar y lo que pasó en esos Juegos Olímpicos fue que se incorporaron también muchos deportes colectivos; entonces, hubo un pico muy grande en la cantidad de medallas. Los viajes de Boudou y el Proyecto Censo 2001-2010 Quiero hablarles de algo que está sucediendo en Argentina, tenemos un vicepresidente que, en general, es noticia. Lo que nos pasó en este caso fue que encontramos mediante ordenes de pago de viáticos en el Senado de la Nación que había solapamiento de viajes del vicepresidente. Allí el desafío era cómo mostrar esos viajes. Nosotros hicimos un relevamiento de más de 30,000 documentos entre decretos y resoluciones, y cuando visualizamos la información encontrábamos que era claro el solapamiento, pero que esa visualización no era del todo adecuada para la edición impresa, pues teníamos los documentos realizados por la gente de sistemas en tamaño gigante, pero no sabíamos cómo mostrarlos, así que se nos ocurrió agrupar los datos mensualmente.16

Juegos Olímpicos. Londres 2012 Estadísticas olímpicas a lo largo de la historia. 15 Cantidad total de medallas en hombres y en mujeres 16 Los viajes de Boudou: expedientes incompletos y "sin rastro" en el Senado y Boudou, sobre sus viajes: "Si se compara con la gestión de Cobos, surgen cosas interesantes" 13 14

8


Finalmente, lo que les quiero mostrar es el Proyecto Censo 2001-201017. El objetivo era visualizar los datos en crudo y las variaciones porcentuales entre el año 2001 y el año 2010 por departamento en el país. Lo bueno era que teníamos mucho research hecho por varias versiones de censo que hubo en Estados Unidos y muchas críticas, sobre todo de Alberto Cairo, a cómo estaban generadas las visualizaciones. Entonces, tuvimos el tiempo para analizar todos esos datos y pensar en la visualización. En el sitio uno puede elegir por tres grandes grupos que son: población, hogares y vivienda. Y dentro de cada ítem el usuario puede ir filtrando mayor cantidad de información. Además, si se pasa el mouse sobre el mapa del departamento se puede ver la variación porcentual entre 2001 y 2010 de cada departamento. Les muestro esto porque es el primer mapeo de censo en Latinoamérica y porque en este proyecto no participó ningún periodista y a mí eso me parece muy curioso. En el equipo trabajaron dos programadores, un líder de proyecto y un diseñador, pero no hubo ningún periodista. Y cuál es el desafío que yo creo que tienen los periodistas al trabajar con las visualizaciones: encontrar historias. El equipo de datos, el equipo de diseño y el equipo de programación pueden hacer un trabajo excelente y pueden mostrar visualizaciones súper complejas o súper claras, pero para mí el desafío del periodista con las visualizaciones de datos es encontrar la historia colateral que los datos dan, creo que ahí está el gran desafío que por lo menos yo encuentro en el diario cada día. MIRIAM FORERO ZoomOnline, construir y manejar una base de datos ZoomOnline18 es una base de datos que está pensada para ser desarrollada por periodistas, que es el equipo que trabaja en ella en Consejo de Redacción, y para los periodistas, que son los asociados de esta misma organización. La primera pregunta a este respecto sería por qué hacer una base de datos y, de hecho, fue lo que nos preguntamos al momento de desarrollarla. En ese entonces empezamos a ver por qué realizarla y por qué sería necesaria. Primero, porque gran parte de la información pública en Colombia y en otros países está dispersa, por ejemplo, para el proyecto que realizamos sobre regalías y ola invernal fue necesario acudir a muchas entidades y solicitar, a través de derechos de petición, información publica para el proyecto, para poder concatenar las cifras que tenía una entidad con las que tenía otra. Por otra parte, la información pública es lejana, es decir, hay mucha información que está centrada en Bogotá, en las oficinas de las entidades a nivel nacional que se encuentran en la capital. Entonces, si un periodista de otra ciudad quiere saber cuál es la lista de financiadores de la campaña de su alcalde, tiene que recurrir al Consejo Nacional Electoral que está en Bogotá y que tiene la información, principalmente, en formularios diligenciados a mano y en fotocopias en sus archivos.

17 18

Proyecto Censo 2001-2010 ZoomOnline

9


Esto no es verdadero acceso a la información para un periodista que vive en una ciudad lejana a Bogotá. De otro lado, gran parte de la información es ilegible. A este respecto, recuerdo el primer tipo de información con el que arrancamos la base de datos, hablo de las declaraciones de intereses particulares de los congresistas. Este Registro de Intereses Particulares es un documento que deben llenar los senadores o representantes a la Cámara al momento de su posesión, en él declaran cualquier tipo de interés que puedan tener por sus negocios, por su familia, etc. Ahora bien, la ley es muy general en esto, pues no especifica que quienes lo diligencien deberían decir qué intereses puedan tener sus conyugues o aquellos con quienes hayan trabajado, si se han vinculado anteriormente con el sector privado, entre otras cosas, lo que hace que los registros sean de menos de dos renglones y digan, en su mayoría: “no tengo ningún interés”, con letra y números de cédula ilegibles. Así pues el primer trabajo que hicimos para lanzar la base de datos fue tratar de interpretar eso, identificar al menos los nombres y las cedulas para saber quién era el que había llenado el documento y asignárselo al congresista correspondiente. La otra razón para hacer una base de datos, y que responde al otro servicio que prestamos con ZoomOnline, es que muchos periodistas desconocen la gran cantidad de información que pueden obtener en línea, hay mucha información incluso en páginas web colombianas sobre antecedentes de todo tipo. Por ejemplo, información sobre profesiones (abogados, arquitectos, médicos, ingenieros), sobre las afiliaciones al Sistema de Seguridad Social de una persona, sobre las multas que pueda tener, sobre su licencia de tránsito, si tiene propiedades en el extranjero, etc. Entonces, hay mucha información que se puede encontrar en línea y que, a veces, por desconocimiento no es aprovechada. En este punto me parece pertinente comentar que, además de tener esta información recolectada en la base de datos, en Consejo de Redacción hacemos capacitaciones para que los periodistas puedan conocer estas herramientas. Con las reflexiones anteriores comenzó ZoomOnline en el 2009, fue lanzada oficialmente en el Encuentro de Periodismo de Investigación de 2010, pero todo el trabajo empezó el año anterior y, actualmente, tenemos más de 2.000.000 de datos en la base de datos. Estos datos están clasificados por aéreas y de esa mezcla de diferentes temas obtenemos cosas muy útiles. Por ejemplo, tenemos la información de financiadores electorales y candidatos, pero, como mencioné anteriormente, este es un tema difícil de manejar y es por eso que debemos ir por partes. Actualmente, tenemos dos de campañas presidenciales, más o menos seis de alcaldías y varias más de campañas del congreso y candidatos, de modo que tenemos largos listados de candidatos a las elecciones territoriales y presidenciales. En cuanto al Congreso tenemos información de las UTL, del equipo de trabajo legislativo de cada congresista y de sus intereses particulares. Tenemos, además, información sobre funcionarios de la rama judicial, los de las altas cortes, es decir, allí están registrados todos aquellos que se han visto involucrados con el que llamamos el Carrusel de las Pensiones en la rama judicial. A su vez, contamos con información de funcionarios, diplomáticos, contralores municipales y departamentales, etc. Del mismo modo, hay información de antecedentes, actualmente, tenemos a todas las personas que han sido 10


extraditadas en el país hasta diciembre del 2012 y también personas que tienen antecedentes fiscales, es decir, que son o han sido sancionadas por la Contraloría. En una sección que es reciente agregamos datos sobre municipios y departamentos, por ejemplo, tenemos giros y proyectos sobre regalías, es decir, todo el dinero que ha recibido cada municipio y cada departamento, además contamos con las cifras de la ola invernal, esto es, sus damnificados, la ayuda que recibieron los proyectos de cada departamento, etc. Finalmente, contamos con algunos listados de profesiones porque son los que más fácilmente tienen procesos de contratación pública. Ahora bien, y luego de conocer todo lo que tenemos, la pregunta es, ¿qué podemos hacer con todo eso? Pues bien, tenemos varias opciones. La primera de ella es hacer los cruces de información, esto funciona de la siguiente manera: un periodista asociado a Consejo de Redacción solicita en su investigación un volumen de datos relacionados con los temas que está manejando y nos da esa información, lo que hacemos es cruzar la base de datos del asociado con los más de dos millones de registros que tiene ZoomOnline y ahí es donde empiezan a aparecer las coincidencias. Un ejemplo es el de la revista Semana19, en esa investigación trabajaron los asociados Carlos Eduardo Huertas y Catalina Lobo Guerrero, y la información que nos enviaron fue un listado de personas en el país a los que el Estado les había asignado terrenos baldíos. Se supone que estos terrenos deben ser entregados a campesinos de bajos recursos cuyo único medio de subsistencia es la tierra en la que viven hace años y de la que trabajan; sin embargo, al hacer el cruce con ZoomOnline apareció que muchas personas de la lista eran profesionales tales como: abogados, arquitectos e ingenieros. Ahí se generó la primera duda, pues se suponía que debían ser campesinos que vivían de explotar la tierra. También, se encontraron muchas personas que tenían actividad política, esto es, que habían sido candidatos a varias elecciones presidenciales. Otra utilidad de la base de datos es que parte de la información que contiene tiene un dato geográfico; me dice, por ejemplo, dónde se graduó una persona, dónde fue jurado de votación en las elecciones, dónde fue candidato, etc. Siguiendo con el caso anterior, al cruzar las informaciones no coincidían con el lugar en el que le habían entregado los terrenos baldíos a estas personas, de hecho, estaban lejanos. Ese cruce demostró en gran parte las inconsistencias y las irregularidades que estaba investigando y denunciando Semana en ese momento. Y el proceso en general es un ejemplo de aquello que hablaba Brant Houston al afirmar que una base de datos ayuda a poner contextos y a corroborar una investigación que, además, se fortalece con reportería y con muchísimos más métodos. A ese caso de cruce de gran cantidad de información se le suma una publicación del diario El País de Cali en la que también trabajaron asociados de Consejo de Redacción. En ese caso lo que investigaron fue lo que estaba pasando con el dinero que el Ministerio de Educación le entregaba a Buenaventura, el principal puerto del país, para que los estudiantes que no tenían o no alcanzaban a tener un cupo en el sector público pudieran ser inscritos en un colegio privado20. Lo que 19 20

Fraude agrario histórico: ¡Qué tierrero! Así fue el robo que amigos del exsenador Martínez hicieron a alumnos en Buenaventura

11


encontró el periódico fueron una gran cantidad de inconsistencias, pues se estaban desviando enormes cantidades de ese dinero que enviaba el Ministerio de Educación. Allí nuestra labor fue realizar el cruce de la información de los representantes legales de esos colegios particulares que estaban obteniendo el dinero con la base de datos y apareció que muchos, siendo representantes legales de colegios privados, estaban inscritos en el Sisben, que es el sistema de salud subsidiada en Colombia. Además de ello, también se encontró que uno de estos sujetos era representante legal y dueño de una fundación, que tenía una actividad política importante y que en Antioquia tenía un historial de irregularidades en contratación pública. Entre otras de las utilidades de la base de datos está la de descubrir coincidencias y relaciones entre una persona y otra, pero de manera individual y no con grandes cantidades de información. A esto se le suma que a través de la base de datos se puede obtener información para construir un perfil de una persona o de una empresa. Del mismo modo, la base de datos le permite a los usuarios seguir el dinero de municipios y departamentos, por ejemplo, en cuanto al tema de regalías y ola invernal la base de datos en el Valle del Cauca arroja datos de suspensión de los giros por regalías en 2008, porque el departamento no reportó información. Además da los proyectos y los giros de regalías que ha recibido dicho departamento. Asimismo, en cuanto a la ola invernal da información sobre los damnificados, las cédulas que salieron no válidas de fallecidos en el registro de damnificados, las cifras de la ayuda humanitaria de los proyectos que se empezaron a desarrollar allá, el dinero que recibió el departamento, etc. Es, sin duda, bastante información de contexto para poder investigar, tanto la ola invernal como las regalías. Finalmente, una herramienta que tiene la base de datos es una especie de repositorio de bases de datos externas, es decir, enlazamos también a otras bases de datos que consideramos son útiles para los periodistas. Actualmente, tenemos un total de 140 bases de datos registradas en esta sección, son enlaces a páginas en Colombia o en otros países del mundo en las que uno puede averiguar si una persona tiene propiedades o empresas en el exterior o antecedentes fiscales disciplinarios aquí en Colombia. Después de todo esto se preguntarán, cómo superar los obstáculos. Pues bien, si parte de la información está escrita a mano y en fotocopias, como las de financiación electoral, lo que se debe hacer es una digitación muy cuidadosa; en nuestro caso contratamos digitación que se revisaba, es decir, una persona digitaba y otra revisaba lo digitado para evitar errores. Además, tomamos la decisión de no digitar el valor de la donación de cada aportarte porque era una información tan delicada que con un cero de más o un cero de menos le cambiábamos totalmente las dimensiones a la información. Lo que hicimos para suplir esto fue ingresar listados de aportantes que, a través de una profundización de los reportes de financiación, le permitían al periodista saber cuánto podía aportar cada persona. Otro inconveniente muy común es que las entidades públicas entregan miles de datos impresos o en PDF, cuando lo que el periodista necesita es un Excel. ¿Qué solución hay ahí? Existen unos programas y hay bastantes software que convierten PDF a Word y PDF a Excel. Hay también un sistema que se ha vuelto muy común, y que incluso muchos escáner tienen, hablo del reconocimiento de caracteres, es 12


decir, reconoce el texto que hay en un impreso y al escanearlo lo convierte en texto. A este respecto, les recomiendo un programa que tuvimos en Consejo de Redacción y que nos ayudó a convertir los PDF a Word o a Excel, se llama wondershare pdf converter. Otra de las dificultades que pueden encontrar en el camino son los posibles errores en la información. Ya lo decía Brant Houston al afirmar que todas las bases de datos tienen errores o información basura. Nuestra solución ha sido realizarle una revisión exhaustiva a cada tabla de datos que nos entregan, para evitar publicar errores. Otra solución ha sido citar directamente de la fuente, esto es, que en la base de datos se puede saber de donde vino cada información, para poder ir a esa entidad o a esa fuente y corroborar cualquier dato que el periodista necesite. Finalmente, es posible que se encuentren con los obstáculos de acceso a la información, que como periodistas debemos conocer a profundidad. Lo que hemos hecho a este respecto es conocer la normatividad del país, es importante que desde nuestra profesión sepamos cuál es la legislación sobre acceso a la información; qué se puede mantener en secreto y qué no, y dar la pelea. Por ejemplo, cuando les solicitamos información a las entidades que manejan los listados de ingenieros, abogados, médicos o contadores su respuesta inmediata fue que la información era privada y que no nos iban a dar las listas de los profesionales registrados; sin embargo, ellos mismos no tenían conciencia de que son una entidad de carácter publico y que, por ende, debían entregar la información. Dimos la pelea y el Tribunal Administrativo de Cundinamarca falló a nuestro favor. PREGUNTAS DEL PÚBLICO DANIEL SUÁREZ PÉREZ ¿Cómo puede un medio monetizar este tema de las visualizaciones? ¿Se puede generar impacto a través de ellas? ¿En qué se ve reflejado? JUAN DIEGO LÓPEZ Yo creo que es al revés, la monetización en la experiencia de La Nación va por el impacto que produce la visualización y no al revés. De todos modos, para darles el ejemplo de lo que acabo de decir y el antiejemplo retomo el trabajo de Declaraciones Juradas que lógicamente no se podía monetizar, pero tuvo más de medio millón de visitas desde que se publicó hasta la fecha, y esto es algo bastante interesante para los anunciantes. Ahora, algunas de las visualización que armamos para los Juegos Olímpicos fueron pedidos de los anunciantes, por lo cual nosotros tuvimos que trabajar en la generación de una pieza en la que quería aparecer el anunciante. Así que creo que por el contenido o por el anunciante se puede monetizar el trabajo. MARIANA SANTOS En mi caso hay muchos ejemplos que pueden considerarse extraños. Uno de los proyectos con más visitas ha sido un interactivo de regalos de navidad, en este el usuario podía elegir para quién era el regalo, seleccionar el presupuesto que tenía y el 13


tipo de regalo que deseaba obsequiar. Otro caso es el de un artículo sobre la comparación de armas en Siria, este artículo había tenido muchas lecturas, pero cuando publicamos el gráfico de la comparación visual aumentó el número de vistas en menos de una hora. Nosotros creemos que poner la información de manera visual es muy atractivo y cuando se tienen medios y se pueden hacer cosas en redes sociales es mucho más fácil que tenga éxito un video corto que un interactivo que dure un montón de tiempo. DANIEL SUÁREZ PÉREZ Qué nos pueden decir sobre el conflicto que existe en ocasiones con el editor o con los jefes para poder publicar. ¿La salida es independizarse o seguir adelante con esa lucha? MARIANA SANTOS Mi jefe siempre ha dicho que los diseñadores y los desarrolladores tenemos que hacer nuestra propia agencia. Pero yo pienso que no, que necesitamos a los periodistas, porque ellos son los expertos en investigación, en recoger su material y en tener una historia preparada, mientras que los desarrolladores y diseñadores son expertos en hacer que esa historia se vea bonita y que les guste a las personas. JUAN DIEGO LÓPEZ Mi opinión es similar a la de Mariana, hay que perseverar y hay que mostrar los trabajos. Quizás al principio sea una publicación chiquita, pero a lo largo del tiempo, me parece, la gente se va convenciendo de que este tipo de narraciones terminan sirviendo. Yo empecé trabajando entre el 2001 y el 2002 con videos de 320 x 2.40, algo muy pequeño, y hoy tenemos videos en HD, no solo en La Nación sino en muchos otros medios. Me parece que lo que hay que pensar, más allá del crédito propio, es que nosotros trabajamos para los lectores y los que se llevan la ganancia son ellos. MIRIAM FORERO ARIZA En Consejo de Redacción tenemos un área de trabajo llamada Emprendimiento, que es precisamente para los periodistas que tienen estas inquietudes. Retomando un poco lo que decía Mariana, si se van a ir del medio tradicional, háganlo con el ingeniero y el desarrollador. Así se van a lograr proyectos mucho más interesantes DANIEL SUÁREZ PÉREZ Hay un proceso interesante en los medios de ustedes y en esa verificación de datos que hacen con sus visualizaciones, no solo se trata de que el diseño quede bonito, eso pasa por varios ojos. ¿Cómo es ese proceso de verificación de los trabajos? JUAN DIEGO LÓPEZ 14


En La Nación nosotros lo dividimos en varias etapas, como si fuera un doble comando: verificamos quienes hacemos la visualización, verifican los periodistas y verifican quienes hacen la minería de datos. Esto también depende de qué tan largo o no sea el trabajo, pero aún así a veces encontramos errores. En todo caso, me parece que es la parte más importante, porque de lo contrario estarías informando mal y no importa qué tan linda sea tu visualización, si tienes un dato incorrecto lo echas a perder todo. MARIANA SANTOS En The Guardian tenemos un equipo de migración de datos que está compuesto por un periodista principal y dos asistentes que tienen conocimientos súper fuertes de matemática, y cuando un trabajo está listo para ser visualizado es revisado por otros periodistas. MIRIAM FORERO ARIZA En mi trabajo para ZoomOnline antes de subir cualquier información a la base de datos hacemos muchos procesos de verificación. Un método que funciona, además de mostrarles los resultados a otras personas con una visión más limpia, es hacerse preguntas y aprender a identificar los errores típicos que tienen las bases de datos. Por ejemplo, una base de datos no debería tener cédulas repetidas, ahí ya puede haber un error y es cuando entramos a verificar. Creo que es necesario ser un poquito creativos, pensar qué tipo de error puede haber y verificar si lo hay o no.

15

Nuevas tendencias, el periodismo y la visualización de datos  

Panel a cargo de Mariana Santos, de The Guardian, Juan Diego López, de La Nación, y Miriam Forero Ariza, de Consejo de Redacción. Moderado p...

Read more
Read more
Similar to
Popular now
Just for you