A blog about data, information and IT, by Mario Alberich

May 22
2014

Big data, desigualdad y desarrollo

Admito que de primeras este título puede parecer mezclar churras con merinas, pero no lo es en absoluto.  El análisis de datos en el ámbito de los negocios se centra en la optimización de los beneficios. Esa optimización a su vez hace rentable la recopilación de los datos dentro de un proceso, un flujo de actividad de sus clientes potenciales: si recopilando unos datos la empresa gana dinero, los seguirá recopilando.

Así pues, es posible que tu rango de actividades esté fuera de ese flujo de datos de interés para las empresas. Y en ese caso, corres el riesgo de ser excluído. Así lo comentaba Jonas Lerman en su artículo Big Data and Its Exclusions del Stanford Law Review del Septiembre de 2013 (el destacado es mío):

big data has the potential to solidify existing inequalities and stratifications and to create new ones. It could restructure societies so that the only people who matter—quite literally the only ones who count—are those who regularly contribute to the right data flows.


Es complicado reaccionar con una insubordinación a esta tendencia, comenta este autor, si no es que se traslada a los Estados mediante un cuerpo legal consistente, y también al sector privado. Que la capacidad para tratar esos datos, no lleve a la exclusión a todos aquellos que se mantienen ajenos a la corriente principal.

Pero las exclusiones también pueden suceder dentro del flujo de datos. Es lo que expone el artículo Big Data’s Dangerous New Era of Discrimination, en el que comenta:

But the main source of concern won’t be privacy, per se — it will be whether and how companies and organizations like your own use Big Data analytics to justify their segmentation/personalization/discrimination strategies.

The more effective Big Data analytics are in profitably segmenting and serving customers, the more likely those algorithms will be audited by regulators or litigators.


Regulación de algoritmos, entonces. Bueno, quizás sí, aunque no tengo muy claro cómo se evitará que esos datos se procesen con ese algoritmo. Incluso se puede desglosar el algoritmo en sus diversas operaciones matemáticas para poder dar un rodeo a las restricciones.

Big Data para el desarrollo


He aquí la otra cara de la moneda: enfocar el Big Data no para optimizar los ingresos, sino para optimizar el número de beneficiarios de sus algoritmos. ¿Cómo se podría aplicar esta tecnología para el desarrollo? Un informe de las Naciones Unidas titulado Big Data for Development (2012, incluye un enlace a PDF en la página) trata de tipificar y reenfocar la terminología habitual de este tema.

El documento adolece de su relativa antigüedad y deja abiertos muchos puntos que quizá ahora se podrían concretar. Pero en todo caso, presenta una serie de posibilidades para la aplicación del Big Data a este contexto:

  • Disponibilidad de dispositivos de bajo coste y fácil mantenimiento para recopilar datos.
  • Crowdsourcing como modelo operativo en la recolección.
  • Estándares de privacidad para los datos personales.


Y sus aplicaciones:

  • Mejora de la capacidad de seguimiento y respuesta de sucesos inesperados (Outbreak).
  • Mejora de la comprensión del cambio de comportamiento en las crisis.
  • Mapeo más concreto de las necesidades de los servicios.
  • Habilidad para predecir los cambios en la la oferta y la demanda.


Todo ello depende de la participación, tanto en el crowdsourcing como en una actitud de cooperación que acoja este proceso de recopilación de datos.  Al fin y al cabo, el objetivo final es poder crear una base de evidencias que permitan afrontar el desarrollo, con unos recursos siempre escasos.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.