A blog about data, information and IT, by Mario Alberich

Mar 28
2011

Los datos abiertos son el micelio de la transparencia

Hace pocos días Matthew Hurst hacía un comentario en su blog Data Mining que posteriormente fue mencionado en Barrapunto a propósito de la presentación de Open Data Cordoba:

Los datos abiertos son una parte de la transparencia.  Son condición necesaria pero no suficiente.


Coincido con esta visión.  Sólo se puede afirmar que datos abiertos=transparencia cuando se disponen de las herramientas, la metodología y un criterio técnico mínimo.  Con esta receta es posible convertir datos abiertos en respuestas objetivas (transparencia) a preguntas concretas.  Luego sólo hace falta plantear las preguntas adecuadas.

Fuentes y datos


Cada vez son más las entidades están dando a conocer la disponibilidad de sus datos en abierto , ya sea por publicidad de las entidades que aplican las ideas del proyecto aporta, o bien por iniciativas tan imprescindibles como abredatos.es.

Quizá estamos presenciando una fase de crecimiento que permita imaginar (léase soñar) en una masa crítica de fuentes y datos.  Tanto unas como otros son imprescindibles para garantizar la posibilidad de contrastar, verificar y también adaptarse a las necesidades concretas.

En mi opinión, se llegará a la masa crítica en el momento que existan datos potencialmente vinculables (no sólo open, sino también linked) y posibilidad de consultas a nivel atómico, sólo recuperando una parte de la información (y no descargar necesariamente 100MB de datos, por ejemplo).

Datos abiertos públicos y privados


No sólo las administraciones públicas pueden abrir sus datos.  Entidades privadas (quizá sin ánimo de lucro o participadas por organismos públicos) pueden abrir conjuntos de datos para facilitar la creación de un ecosistema alrededor de su proyecto.

Ahora suena a una idea lejana, pero ¿no es así como floreció y maduró el código abierto? ¿Por qué no los datos? Como sucede con el primero, la idea de abrir datos puede tener efectos distintos en cada caso, pero eso no lo hace descartable.  Como comenta Nigel Shaboldt en la nueva revista thinkquarterly de Google:

Pregúntate: ¿Qué informaciones tienes? ¿Algunas de estas pueden ser publicadas libremente para mejorar la transparencia o mejorar la imagen de marca?


El escenario actual en relación a los datos abiertos guarda analogías con el del open source.  Por un lado la escasedad aparente, los riesgos de ceder terreno a la competencia, y la (aparente) inexistencia de un contexto adecuado.

No siempre funciona, pero ha funcionado.

Transparencia también es privacidad


Sinceramente no creo que la fase linked venga de la administración pública.  Sería deseable pero no lo veo factible a medio plazo (por ejemplo, por los riesgos en la privacidad derivados de seleccionar muestras muy pequeñas e identificar individuos concretos) y en la mayoría de casos incluso será innecesario.

Por ejemplo, en el caso de los datos municipales, varias administraciones pueden facilitar información.  Si es posible obtener datos de varias fuentes para los municipios de una provincia (por ejemplo, a través de la codificación de municipios), ya es suficiente. Utilizando estas codificaciones ya disponemos de un valor clave para vincular, por lo que se puede dar el paso al procesado (seleccionar los datos necesarios, crear variables derivadas, etc.) y análisis (obtener las respuestas).

La convivencia entre transparencia y privacidad es la garantía de subsistencia de los datos abiertos.  Todo aquello que enturbie esta convivencia (llámese cotilleo, vigilancia o como se quiera) es mejor que se quede al margen.

Generar el micelio


Buscando la imagen que más se ajusta al camino que queda por recorrer, pienso en el micelio.

Su forma, su existencia (principalmente en el subsuelo) y su ubicuidad lo asemejan a la existencia de datos.  Estos datos, que hasta hace poco eran difíciles de obtener, están empezando a aparecer (sí, como setas). En gran parte por nuestra actividad a través de dispositivos electrónicos e Internet, pero también por los datos abiertos.

Su existencia altera el contenido del substrato para crear relaciones simbióticas con (y a veces incluso preparar el terreno para) vegetales superiores.  Su capacidad para aparecer en los lugares más inhóspitos (porque los datos crecen en todas partes donde alguien quiera buscarlos) no tiene igual. Y por si fuera poco, evitan la erosión del suelo fértil donde se desarrolla.

Esas son las características deseables para los datos abiertos.  Pero quizá para explicar esto, lo mejor sea un vídeo de TED: seis maneras en que los hongos pueden salvar al mundo.

En especial me llamó la atención el fragmento de los minutos 8:00-9:35, pero el video en conjunto es muy recomendable: Paul Stamet impregna con pasión todas las revelaciones del vídeo.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.