A blog about data, information and IT, by Mario Alberich

Apr 14
2011

La gramática de los gráficos

¿Qué elementos forman parte de un gráfico? ¿Cómo se trasladan los datos de una representación gráfica a otra? ¿Cómo se pueden integrar los gráficos? ¿Qué combinación de parámetros hay que tener en cuenta en el momento de crearlos?

Estas son preguntas que por lo general no nos planteamos en el momento de representar datos gráficamente.  Lo obviamos por agilidad, igual que no estamos dando órdenes conscientes de inspirar-expirar o pie izquierdo/pie derecho.

La pregunta de fondo es: ¿Importa tenerlo presente? Puede que antes no fuera necesario, pero ahora, para mí, sí.

Me refiero a antes como a las épocas en que los conjuntos de datos eran más bien limitados, las interrelaciones entre ellos eran simples, e incluso cuando se dibujaban los gráficos a mano.  Hablo de antes como el momento en el que las interrelaciones entre datos no formaban parte del núcleo del análisis ni había interacción posible con ellos.

Ahora, el momento en el que hay (sobre)abundancia de datos, disponemos de aplicaciones informáticas capaces de gestionar la interactividad; cuando buscamos respuestas más profundas, revisar la razón de ser de los gráficos y sus componentes resultaba para mí un ejercicio casi imprescindible.

Buscando entre libros que pudieran servirme de base y que plantearan una definición estructurada, me topé con el libro de Leland Wilkinson, The Grammar of Graphics (Springer, 2a ed. 2005).

Punto de partida


Wilkinson, además de profesor universitario de estadística, ha sido vicepresidente de SPSS del 1994 al 2007 y actualmente vicepresidente ejecutivo de SYSTAT.  Se puede decir que ha estado en sitios de suficiente prestigio como para decir que sabe de lo que habla.

Con su experiencia empezó a recopilar gráficos de cualquier tipo para empezar a detectar patrones, factores y elementos a tener en cuenta para desarrollar esta gramática.  A partir de esa base, desarrollo un marco de trabajo sobre el que se puede definir prácticamente cualquier representación gráfica de datos.

¿A quién va dirigido este libro? Exceptuando los conceptos puramente matemáticos/estadísticos, Wilkinson comenta que ha desarrollado su exposición partiendo de una terminología no especializada.  Según él, cualquier persona interesada en los gráficos científicos o de negocios. Diferencia en tres niveles según el grado de conocimiento en matemáticas:

  • Los que buscan un catálogo/tesauro de gráficos.
  • Los que quieren seguir el argumento sin necesidad de entrar en los aspectos matemáticos.
  • Los que tienen suficientes conocimientos matemáticos para entender la notación matemática y seguir los criterios.


Cuanto más nivel, más contenido relevante.  Pero los tres niveles pueden seguir sus argumentos.  Personalmente creo que sacarán mucho más partido del libro las personas con conocimientos matemáticos y/o informáticos para aplicar sus ideas.

Hay una delimitación explícita sobre lo que no tiene por objetivo este libro.  Lo que Wilkinson no plantea es:

  • Un lenguaje de comandos (o de programación, como se prefiera). Sin embargo utiliza expresiones similares.
  • Una taxonomía, aunque la cantidad y variedad de gráficos es notable.
  • Una aplicación de dibujo (drafting package).
  • Un libro de las buenas virtudes: con lo que explica se pueden conseguir tanto gráficos maravillosos como horribles. Es tarea de quien lo utilice identificar las cualidades y defectos del resultado.
  • Un método heurístico: El primer paso es definir un lenguaje formal de los gráficos (que es lo que él propone en el libro) para luego establecer una heurística que determine los gráficos más adecuados a cada caso.
  • Un sistema de información geográfica.
  • Un sistema de visualización. Matiza que sus bases se pueden utilizar para la visualización, pero que no lo incluyen para no viciar (concentrarse en) los conceptos básicos.

La gramática (o cómo hacer un gráfico de sectores)


El capítulo 2 es una aproximación rápida a la propia gramática, y expone en un ejemplo práctico (el diagrama de sectores) los componentes de la gramática.  En una lista:

  • Relacionados con datos:
    • Variables/datos: Lo que nos viene dado. Nuestro punto de partida.
    • álgebra: Operaciones matemáticas sobre los datos que permiten representarlos dentro del marco que supone un gráfico.
    • Escalas: Por decirlo de un modo simple, unidades de medida.  Decidir las escalas y adecuar los datos a ellas es una parte importante del proceso.
    • Estadísticas: Los cálculos matemáticos propiamente estadísticos sobre los datos. Incluye desde medias, cuartiles y proporciones, hasta relaciones de agregación o separación entre datos.


  • Relacionados con la representación gráfica:
    • Geometría: Las formas a aplicar sobre los elementos a representar.
    • Coordenadas: Las guías visuales que servirán de referencia para la representación.  Por ejemplo, en el caso del gráfico de sectores, tratamos con coordenadas polares.
    • Elementos estéticos: Color, texturas, etiquetas, títulos,




Los elementos están en el mismo orden en el que según Wilkinson deben ser aplicados sobre el gráfico a representar.  Por mi parte destacaría el capítulo de coordenadas.  Las coordenadas dan coherencia y facilitan la lectura visual del gráfico para identificar patrones.  Hay una relación estrecha entre escalas y coordenadas, pero no es lo mismo.

Además, las coordenadas incluyen guías visuales, aunque también las proyecciones y en definitiva todo lo que da forma al conjunto del gráfico.  Bajo mi punto de vista en las coordenadas tienen lugar los aciertos y errores más claros, a la vez que difíciles de detectar por un espectador.

Valoración


Releyendo lo escrito hasta aquí me doy cuenta que estoy dejando de lado un aspecto importante.  Aunque el libro tiene un objeto claro, el proceso ha sido más interdisciplinar de lo que parece.  Por ejemplo, se comentan aspectos psicológicos en la diferenciación de las escalas de colores, formas y coordenadas, así como los efectos de combinar algunos tipos de gráficos.

No es comparable con los libros de Tufte, más bien complementario.  En algunos puntos parece que se hubieran puesto de acuerdo: donde empieza uno acaba el otro.

Tanto Wilkinson como Tufte me han aportado muchas ideas y enfoques renovados a la representación gráfica. Espero sumar en breve la lectura de un tercer autor que tengo en el punto de mira, Jacques Bertin y su semiología de los gráficos.  Hasta el pasado Noviembre no se reeditó el libro, pero ahora ya no hay excusa...

 

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.