A blog about data, information and IT, by Mario Alberich

Sep 10
2013

Primero los datos, datos reales

Parece que el ciclo en el análisis y la representación de los datos también está cambiando. Como ya sucedió en IT con las metodologías ágiles, quizá la reducción en el precio de los recursos (en este caso, el acceso a más datos por un coste bajo o nulo), ha conducido a cambios en el ciclo de trabajo. Así, en una entrevista a Jer Thorp, leía:

We have a research based practice which can be summed up in two words: “Data first”. Let’s look at the data and let it tell us where we are going to.


Esta supuesta ausencia de metodología podría ser objeto de crítica. Y en realidad, si sólo disponemos de los datos minimos y el coste de obtención fuera alto, no plantear las hipótesis de trabajo sería negligente. Pero no lo es necesariamente si los datos estan ahí, disponibles y baratos (o gratis).

Pero ¿acaso necesitamos sólo los datos? No, esos datos deben ser reales. No valen datos de prueba, e incluso datos simulados.  La exploración de datos, que nos permite detectar patrones visuales, es lo que acaba determinando la visualización. Por eso vale la pena pedir los datos:

Clients are not always good at coming up with real data, he said, but you have to try to get it. Without it, the prototypes don’t make sense and people find them confusing because there’s no context. “They need to see themselves in the data,” he said. If he doesn’t have it, he makes very rough prototypes in D3 or relies on paper sketches.


A partir de esos datos, podemos seguir una serie de pasos generales como los propuestos en UX Magazine:

  • Entender la fuente (de los datos).
  • Identificar la narrativa.
  • Definir la experiencia de uso (cómo interactúa el usuario en esa narrativa base).
  • Evitar la reinvención de la rueda (ergo sé al menos un poco original).


Pero primero pide los datos. Y si no te los dan, trabaja primero para obtenerlos.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.