ene 2010
Visualizando: Estadísticas de navegadores (III)
En esta última parte comparo las dos versiones de gráficos y comento las ventajas e inconvenientes de la representación:
ene 2010
Visualizando: Estadísticas de navegadores (II)
En el anterior artículo de la serie comentaba los pasos para la obtención de los datos, la unificación de las fuentes, y finalmente el cálculo de los parámetros del gráfico. Para dar el siguiente paso hay que modificar el código del ejemplo. En concreto, hay que modificar sólo dos archivos:
- browser_stats.xml, es el archivo que contiene los datos.
- BrowserMarketShare.mxml, que es el que contiene el código ActionScript de Flash y MXML de Flex para modificar los datos.
ene 2010
Visualizando: Estadísticas de navegadores (I)
Llevaba tiempo buscando un rato para acabar un pequeño experimento sobre la visualización de la información, la biblioteca Axiis y unos cuantos cálculos matemáticos. Por fin ha llegado el momento.
oct 2009
Visualización de datos: Una aproximación ingénua
Hasta ahora había comentado la representación visual estrictamente relacionada con gráficos estadísticos estándares, como en el caso de Open Flash Chart 2. Sin embargo los gráficos estadísticos no siempre son aplicables, y es necesario buscar alternativas.
El área de la visualización de datos es una encrucijada de caminos: por un lado está la vertiente técnica (no sólo tecnológica), en la que se generan los datos, y de la que se obtienen las reglas que les afectan. Por el otro están todas las cuestiones relacionadas con la usabilidad y la interacción, algo especialmente importante si hablamos del entorno digital. Finalmente está el factor gráfico, que busca representar una realidad en base a formas, perspectivas, tonalidades, texturas y demás desde un punto de vista de conjunto.
jun 2009
Sobre las Elecciones Europeas y la decisión de voto
Domingo se celebran las elecciones Europeas. Lo cierto es que las encuestas vaticinan un alto nivel de abstención. Bueno o malo, el sistema electoral está estructurado, y las decisiones que tomamos al respecto tienen una consecuencia.
Mi comentario aquí se limita a aclarar el cómo se traduce cada tipo de voto al resultado final. Para aclarar esto es necesario concretar el significado de los tipos de votos, y analizar ventajas, inconvenientes y beneficios para los partidos políticos. El color político queda totalmente al margen del artículo.
may 2009
Programación Neurolingüística, hipnosis y buscadores
Leí hace tiempo un libro introductorio sobre la programación neurolingüística (PNL). La PNL es una especie de compendio que combina ideas de la informática, la psicología y la lingüística. El objetivo es aportar una serie de modelos y herramientas para entender cómo funcionan nuestros procesos mentales, y puntualmente tratar de cambiarlos. Así que cuando encontré el libro Manual del cerebro para usuarios en una librería, lo hojeé, me interesó y lo compré.
La herramienta principal de la PNL es el lenguaje, que ayuda a analizar nuestros propios modelos mentales. Según la PNL, nuestro uso de la lengua es un reflejo de nuestro esquema mental. Identificar patrones de nuestro lenguaje permite identificar nuestros patrones mentales. Aunque no es un proceso directo, el cambio de patrones lingüísticos incide en el cambio de patrones mentales.
La posibilidad de utilizar el habla como herramienta de cambio ha permitido introducir la PNL en áreas como el management, el coaching, la comunicación y el marketing. Debatir su utilidad puede ser polémico, porque los resultados dependen del usuario de las herramientas. No entraré en estas cuestiones.
Entrando ya en el tema que quería tratar, hay un área de la PNL que es especialmente seductora. El libro mencionado desmitifica este área, añadiéndole a su vez más interés. Me refiero a la hipnosis.
abr 2009
Modelos lineales (regresión lineal) - 2
Con esta segunda parte comento los pasos del proceso de cálculo de los errores cuadráticos y la determinación del mejor modelo.
Cabe decir que lo que explico aquí no debe tomarse al pie de la letra, ya que evito entrar en detalles casi imprescindibles (como el cálculo matricial y el contraste de hipótesis) para dominar este proceso.
La decisión viene tomada porque hay ingente cantidad de documentación disponible sobre los detalles de este proceso, y pocos que se centren en cuestiones más pedagógicas.
abr 2009
Modelos lineales (regresión lineal)
Los modelos lineales son una herramienta muy utilizada para el análisis de datos que presentan una relación causa-efecto. El punto de partida en un modelo lineal son conjunto de datos que se presentan simultáneamente, y que a priori pueden explicar el comportamiento de la variable que queremos analizar (la que se denomina la variable respuesta o dependiente) a partir del resto.
El proceso de análisis de los modelos lineales es relativamente sencillo en cuanto que sistemático, siempre que se tengan las nociones básicas sobre producto matricial, o bien se disponga de una aplicación informática que haga la tarea por nosotros.
De todos modos, esta técnica de tanto uso oculta una serie de cuestiones de sentido común que ayudarían a entender su razón de ser. Los concepto com error cuadrático medio o el error total son conceptos esenciales que sin embargo permanecen ocultos al entendimiento general.
abr 2009
Y ya van dos años
Preparando nuevos posts aunque ahora mismo algo atareado, me permito celebrar los dos años de este blog.
Me parece mucho más tiempo del que ahora digo, pero como decía el filósofo, la vida realmente vivida es el tiempo que nos cambia por dentro: eso es algo difícil de traducir en artículos, aunque lo sigo intentando.
mar 2009
Open Flash Chart 2 - Mejorando los gráficos estadísticos
Tenía pendiente escribir una actualización para comentar los cambios en la versión 2 de Open Flash Chart (OFC2). En esencia la biblioteca funciona de forma casi idéntica a la versión 1, salvo algunas correcciones de errores y mejoras concretas, pero hay también hay un cambio importante.
El verdadero salto cualitativo está en la introducción del formato JSON . El proceso de configuración se hace más transparente, tanto para revisar la estructura en búsqueda de potenciales errores, como también por la libertad que da este formato al enviar los datos. Vayamos por partes.
mar 2009
La quinta disciplina
Leí este libro ocho años atrás y me gustó, me gustó mucho. Es de esos libros que dejan una sensación clara al acabar la última página: lo volveré a leer. Y por fin ha llegado el momento.
Aunque a estas alturas hay gran cantidad de literatura sobre el análisis de sistemas aplicado al management, el libro La quinta disciplina de Peter Senge (Granica, 1996) tiene un sabor genuino. A pesar de contar con casi quinientas páginas, su lectura resulta bastante llana. Recomiendo marcar un ritmo relajado (ni muy rápido, ni muy aplazado).
Su quinta disciplina (el análisis de sistemas) es una lectura casi obligada para quien trabaje en equipo, los gestione, o dirija una empresa. En cierto sentido eso incluye a casi todo el mundo.
mar 2009
Del blog al podcast con síntesis de voz
Quizá diga poco a mi favor si digo que hace relativamente poco que me he aficionado a los podcasts. Hace mucho que entiendo su funcionamiento y también he implantado soluciones, pero de ahí a usarlos es otra historia. Mi uso de la tecnología se limita a lo estrictamente necesario. Porque una cosa es jugar con gadgets, y otra cosa es sacarle partido para el día a día.Los podcasts son un ejemplo claro que la tecnología es lo de menos: hasta que uno no encuentra el lugar y el momento para utilizarlos, su utilidad es relativa. Otro de los puntos clave, como sucede con los feeds textuales, es encontrar las fuentes interesantes que aporten información de acuerdo con el tiempo que uno le puede dedicar, pero eso es harina de otro costal.
Así que he optado por introducir una pequeña mejora en el blog para poder convertir los artículos textuales en pequeñas audiciones en formato MP3.
Una de las razones para hacerlo es que, a menudo, los artículos que escribo tienen mucho "verbo" y poca imagen (algo a mejorar), por lo que probablemente toda la lectura se hace pesada si no existe una relevancia directa. La otra cuestión es que esto permite escuchar el artículo mientras se leen otros contenidos, o también mientras se revisan los propios correos matutinos
.Para conseguir este objetivo, he echado mano de la herramienta libre Festival Text-to-Speech, el codificador Lame MP3 encoder y del widget Flash MP3 Player . El resto se realiza a través de un sencillo script en PHP.
Vale decir que el acabado final no tiene una "calidad comercial", ni tampoco era mi intención. El único objetivo es llevar a la práctica la utilidad que le veo al podcast, nada más.
feb 2009
Eyetracking, movimiento e información neuronal
Siempre me ha atraído la tecnología del eyetracking como una forma de entrar más a fondo en los procesos de análisis de usabilidad de una aplicación. En cualquier caso, lo he percibido como una técnica algo manca, si bien muy potente. Los ojos y la mirada son indicadores del interés, pero por este mismo hecho no son una fuente primaria sino secundaria. Por retorcer un poco el refrán, los ojos son el espejo del alma, pero un espejo pequeño y sólo útil según para qué objetivos.Lo que en mi humilde opinión falta a estos dispositivos es identificar el grado de atención que se genera en el momento de mirar. Es decir, identificar la motivación y la atención que hay tras el movimiento ocular con información directa de nuestra actividad neuronal. La cuestión es: ¿El electroencefalograma (EEG) puede ofrecernos información más ajustada a lo que está sucediendo? ¿Nos proporcionará más información, o simplemente más datos?
feb 2009
Variables aleatorias, la semilla estadística
Las variables aleatorias son la base de la estadística probabilística actual. Son el paradigma sobre el que se asienta toda la estadística matemática.Es por esto que la variable aleatoria es el concepto que cualquiera que quiera tratar con datos estadísticos debe entender a fondo, si no quiere echar mano a las mismas /herramientas/ ante cualquier situación.
A menudo, cuando surge el tema de la estadística como asignatura universitaria, surge la idea de la dificultad de esta asignatura en las carreras universitarias. La razón principal por la que creo que esto sucede tiene que ver con el concepto de las variables aleatorias. Es decir, que no se explica adecuadamente.
En muchas carreras se trabaja sobre un punto de partida: el control. A partir de ahí, hay que explicar la forma como ese control se puede perder. En ese contexto, la estadística pierde parte de su sentido. Enseñar un contraste de hipótesis sobre el paradigma del control es como narrar una película sólo con letras vocales.
La estadística (al menos la probabilística) parte de otra premisa: supongamos que todo tiene su componente aleatorio; que todo se mueve. A partir de este supuesto, analicemos la forma como se presenta esta aleatoriedad para establecer unas bases para un control que tiene tolerancia a los errores.
¿Parece lo mismo? No se parece en nada.
feb 2009
Muestreo estadístico
Quizá este artículo podría resumirse diciendo que el muestreo estadístico es algo similar a una fotografía, pero dirigido a los datos, no a las imágenes.Bueno, ya está. Ha quedado claro ¿no? Si es así, déjame pensar: no te dedicas a la fotografía, ¿verdad? Un conocedor de este arte podría argumentar: "en fotografía hay muchos estilos, técnicas y herramientas". En el muestreo también, sólo que un buen resultado no luce tanto
.El muestreo estadístico es la toma de contacto con la realidad antes de llevar la muestra al laboratorio. Desde el punto de vista teórico de las matemáticas puras, es un mal necesario. Pero desde el punto de vista del trabajo de campo y del análisis empírico, escoger el tipo de muestreo estadístico es todo un arte.
Y desde luego, es un arte que va mucho más allá que el muestreo aleatorio simple.
Fuentes RSS
Etiquetas
Aleatoriedad apis-mashups Buscadores Clustering del.icio.us Desarrollo web estadísticas estándares Expresiones regulares Flash Fractales fuentes de información Gestión documental Google grafos Gráficos estadísticos Innovación Java lenguajes documentales Lingüística Linux Lógica borrosa modelización Muestreo estadístico Navegadores off-topic open source PHP PLN Productividad Profesionales Publicidad Recuperación información relevancia reseñas SEO spam Tagging Usabilidad utilidades veracidad visualizacion Web social yahoo pipes