En fin, sentido común. En el libro Dear Data juegan con ello a un nivel personal, como los metadataos de la vida cotidiana pueden retratar tanto a una persona. Pero jugando con el tema primero del asunto es conseguir los datos, primera tarea que no es sencilla a ciertos niveles, y que la revolución que se vive es la facilidad con la que teóricamente se consiguen esos datos. El siguiente paso es que esos datos sean útiles, es decir conseguir categorizarlos, y aquí empiezan las dificultades y las interpretaciones, según como se seleccionen, se marquen, se centre el interés en una cosa o otra vamos a tener una interpretación y unas conclusiones diferentes. Categorizar, ordenar, marcar, etiquetar, puede que sea la tarea más laboriosa y complicada del análisis de datos. El quid de la cuestión. Luego antes esa cantidad de datos, etiquetas, categorías se trata de sacar lo interesante, pero ahí las herramientas estadísticas habituales. Y luego esta el como presentar los resultados, los datos elaborados, ordenados, de forma que cuenten algo. De nuevo aparece una visión narrativa, y mucho de arte, porque al fin y al cabo, hay que transformar algo más o menos abstracto en algo que sea interpretable de forma agradable por los humanos. Hay mucho de arte ahí. Una combinación de muchas disciplinas diferentes que hacen el tema apasionante.
Vamos con el ejemplo con el que he estado jugando. Mis lecturas durante los últimos 10 años. Tengo los datos, más o menos todas han ido apareciendo reseñadas en el blog, y ya tiene una edad. Nos limitamos a lo que consideramos libros, sin incluir otro tipo de lecturas, por ejemplo los tebeos, que los consideramos a parte. Con esa lista vamos a hacer una visualización por géneros para tener una imagen de lo que he leído estos años. La selección de géneros, el clasificador ya tiene un sesgo interpretativo. En función de lo que leo he generado una lista de etiquetas de género que creo se ajustan a mis intereses lectores, con lo que los datos se van a ordenar en función a mis gustos a priori. Algo que hay que tener ya en cuenta.
He elegido Ficción y No ficción. Como Ficción básicamente entiendo narrativa, y de ahí he seleccionado unos subgéneros, ciencia ficción, fantasía (en torno al género), negro (negro, trilles, suspense...), y humor (entendido cono narrativa con fin o gran carga humorística,a lo Tom Sharpe por ejemplo y no al libro de chistes que se encuentra en la sección de las librerías). El resto de ficción sería lo que no se encuadra en estos subgéneros. Con la No ficción he hecho algo similar, lo que vendrían a ser ensayos, libros periodísticos, divulgación, etc. Y hemos marcado como subgéneros los de Ciencia y tecnología, los socioeconómicos, los de historia, los de arte (cómics, música, cine...) y los de ilustración como género a parte. El resto de no ficción; cerveza, deporte, comida, todo junto. Algún libro puede ser marcado en dos categorías simultáneamente, es lo que tiene separar por géneros, así que marcaría como un doble libro.
Y con esto y siguiendo el ejemplo de Dear Data generamos una tabla visual y cronológica con las lecturas que hemos hecho. La foto del móvil y la tabla son de pena, pero ya nos sirven para mostrar el ejemplo. En general hemos ido leyendo menos cada año, con un pico bajo en 2008. Es interesante porque puedo correlacionar los intereses, los géneros y la cantidad leída con hechos vitales. A nivel personal es útil ver la imagen global para tener una nueva vista de la película.
Los mismos datos en formato digital los hemos puesto a jugar con el google docs, y perdiendo la cronología podemos tener visualizaciones parecidas en barras.
Uno de esos gráficos visualmente bonitos, con la misma información que puesta a mano, aunque sin la cronología. Y que de hecho son difíciles de interpretar realmente, da una idea, para profundizar sobre ella hay que mirar las cosas con lupa.
Un poco más parecido a la versión manual, aunque todavía sin lo cronológico. Pero muestra como se pueden hacer cosas rápidas para enseñar cosas. En digital además podemos añadir otras etiquetas para tener otro tipo de información.
Por ejemplo la distribución de lecturas anuales por idiomas. Me ha sorprendido lo poco que leo en catalán. Consecuencia de que soy un lector de obra traducida, mucha de género, o leo en inglés o leo la traducción más cómoda, económicamente o más directa. El catalán tiene las de perder, un hecho para pensar en ello. La otra sorpresa es la cantidad de obras directamente en inglés, prácticamente un tercio, un año incluso más que en castellano, lengua materna. El alemán es meramente testimonial, y en italiano debemos también empezar a aumentar el número.
El total de libros por año, una tendencia preocupante. Consecuencia de la Vida(tm). Y un poco de los tebeos.
En resumen, estos 10 años hemos leído más ficción que no ficción, mucha ciencia ficción y mucho humor. Y de ese pie calzamos por aquí. Hay un poco de variación en los últimos años, pero no creo vaya a alterarse mucho el tema. El rosco no es el mejor tipo de gráfico, pero para algo rápido ya nos servirá.
Por idiomas, dos tercios en castellano, un tercio en inglés. Habrá que ir variando un poco más de idiomas. Pero va a depender mucho que se publique lo que nos interese leer.
En fin, con unos pocos datos se le pueden dar varias vueltas al asunto. Unos 250 libros leídos en 10 años, unos dos al mes, no es mucho, pero es que el leer tebeos, más de dos mil en el mismo período, se nos lleva bastante tiempo de lectura. Entre otras cosas. Cosas que ya sabíamos, y otras cosas que quedan más claras. Curioso el datificar las vidas de la gente. Y luego lo de siempre, información es poder, las estadísticas dicen al fin y al cabo lo que quieren que digan él que las hace, o las paga. Todo aplicado a la nueva era de los datos masivos y la datificación personal.
Conclusiones, pues nada, en cuanto a lecturas ya podemos hacer los propósitos de nuevo año con fundamento y un análisis de datos. Para ustedes, pues nada, si comento un libro ya saben en función de que va a basarse la opinión. Y todo el mundo a datificar, no debemos perder el poder sobre nuestros propios datos.
No hay comentarios:
Publicar un comentario