Hace pocos días Matthew Hurst hacía un comentario en su blog Data Mining que posteriormente fue mencionado en Barrapunto a propósito de la presentación de Open Data Cordoba:
Los datos abiertos son una parte de la transparencia. Son condición necesaria pero no suficiente.
Quizá estamos presenciando una fase de crecimiento que permita imaginar (léase soñar) en una masa crítica de fuentes y datos. Tanto unas como otros son imprescindibles para garantizar la posibilidad de contrastar, verificar y también adaptarse a las necesidades concretas.
En mi opinión, se llegará a la masa crítica en el momento que existan datos potencialmente vinculables (no sólo open, sino también linked) y posibilidad de consultas a nivel atómico, sólo recuperando una parte de la información (y no descargar necesariamente 100MB de datos, por ejemplo).
Ahora suena a una idea lejana, pero ¿no es así como floreció y maduró el código abierto? ¿Por qué no los datos? Como sucede con el primero, la idea de abrir datos puede tener efectos distintos en cada caso, pero eso no lo hace descartable. Como comenta Nigel Shaboldt en la nueva revista thinkquarterly de Google:
Pregúntate: ¿Qué informaciones tienes? ¿Algunas de estas pueden ser publicadas libremente para mejorar la transparencia o mejorar la imagen de marca?
No siempre funciona, pero ha funcionado.
Por ejemplo, en el caso de los datos municipales, varias administraciones pueden facilitar información. Si es posible obtener datos de varias fuentes para los municipios de una provincia (por ejemplo, a través de la codificación de municipios), ya es suficiente. Utilizando estas codificaciones ya disponemos de un valor clave para vincular, por lo que se puede dar el paso al procesado (seleccionar los datos necesarios, crear variables derivadas, etc.) y análisis (obtener las respuestas).
La convivencia entre transparencia y privacidad es la garantía de subsistencia de los datos abiertos. Todo aquello que enturbie esta convivencia (llámese cotilleo, vigilancia o como se quiera) es mejor que se quede al margen.
Su forma, su existencia (principalmente en el subsuelo) y su ubicuidad lo asemejan a la existencia de datos. Estos datos, que hasta hace poco eran difíciles de obtener, están empezando a aparecer (sí, como setas). En gran parte por nuestra actividad a través de dispositivos electrónicos e Internet, pero también por los datos abiertos.
Su existencia altera el contenido del substrato para crear relaciones simbióticas con (y a veces incluso preparar el terreno para) vegetales superiores. Su capacidad para aparecer en los lugares más inhóspitos (porque los datos crecen en todas partes donde alguien quiera buscarlos) no tiene igual. Y por si fuera poco, evitan la erosión del suelo fértil donde se desarrolla.
Esas son las características deseables para los datos abiertos. Pero quizá para explicar esto, lo mejor sea un vídeo de TED: seis maneras en que los hongos pueden salvar al mundo.
En especial me llamó la atención el fragmento de los minutos 8:00-9:35, pero el video en conjunto es muy recomendable: Paul Stamet impregna con pasión todas las revelaciones del vídeo.
© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.