A blog about data, information and IT, by Mario Alberich

Dec 12
2013

Predecir disturbios con modelos matemáticos

Vía flowingdata leí hace meses que un grupo de investigadores han analizado los disturbios de Londres en 2011, para destilar un modelo matemático de predicción de tales disturbios.

Read more »

Apr 14
2011

La gramática de los gráficos

¿Qué elementos forman parte de un gráfico? ¿Cómo se trasladan los datos de una representación gráfica a otra? ¿Cómo se pueden integrar los gráficos? ¿Qué combinación de parámetros hay que tener en cuenta en el momento de crearlos?

Read more »

Apr 27
2009

Modelos lineales (regresión lineal) - 2

Con esta segunda parte comento los pasos del proceso de cálculo de los errores cuadráticos y la determinación del mejor modelo.

Cabe decir que lo que explico aquí no debe tomarse al pie de la letra, ya que evito entrar en detalles casi imprescindibles (como el cálculo matricial y el contraste de hipótesis) para dominar este proceso.

La decisión viene tomada porque hay ingente cantidad de documentación disponible sobre los detalles de este proceso, y pocos que se centren en cuestiones más pedagógicas.

Read more »

Apr 24
2009

Modelos lineales (regresión lineal)

Los modelos lineales son una herramienta muy utilizada para el análisis de datos que presentan una relación causa-efecto.  El punto de partida en un modelo lineal son conjunto de datos que se presentan simultáneamente, y que a priori pueden explicar el comportamiento de la variable que queremos analizar (la que se denomina la variable respuesta o dependiente) a partir del resto.

El proceso de análisis de los modelos lineales es relativamente sencillo en cuanto que sistemático, siempre que se tengan las nociones básicas sobre producto matricial, o bien se disponga de una aplicación informática que haga la tarea por nosotros.

De todos modos, esta técnica de tanto uso oculta una serie de cuestiones de sentido común que ayudarían a entender su razón de ser.  Los concepto com error cuadrático medio o el error total son conceptos esenciales que sin embargo permanecen ocultos al entendimiento general.

Read more »

Feb 21
2008

Las tareas y la motivación

¿Podría este ordenador valorar la motivación para tu lista de tareas? La respuesta es que quizás sí. El sistema no se basa en analizar la velocidad del tecleo ni de tu agilidad para cambiar de ventanas con el Alt+Tab. Eso es técnica, y no motivación.

Por aquella máxima que dice que hay que saber escuchar el silencio, parece ser que la respuesta está en los lapsos de tiempo entre tareas, o al menos así lo afirma el análisis de la gestión de tareas en base a la motivación...

Read more »

Oct 03
2007

Normalización y distancias normalizadas

Tu jefe entra por la puerta. Lleva su maletín en una mano, y en la otra sostiene una hoja de papel que mira con el ceño fruncido. Se le ve concentrado, mientras avanza hacia tu mesa.

- Hola. Entro en una reunión dentro de un par de minutos. ¿Puedes normalizarme esto?
- Sí, claro...

Reconozcámoslo, tiene madera de jefe: en menos de dos minutos ha entrado en la oficina, te ha dejado una hoja de papel llena de garabatos y encima es urgente. A eso se le llama delegar.

Mientras asimilas la orden, te reincorporas. Minimizas el programa de correo y te dispones a normalizar... Bueno, quizá empezarás por aprender una palabra más mirando el diccionario...

Read more »

Aug 16
2007

Lecturas veraniegas: Chaos and order in the capital markets

El papel de los fractales, o los fractales y el papel

Uno de esos temas pendientes que tenía en el tintero desde hace mucho tiempo eran los fractales. Mis pinitos había hecho con el fractal de Mandelbrot, la aplicación de algunos conceptos base de la topología para el cálculo de la dimensión de un fractal, y otros. El concepto de fractal lo entendía más o menos. Vamos, que no lo entendía.


Me costó entender el concepto del fractal como algo que no tiene un número entero de dimensiones, hasta que leyendo a Edgar E. Peters encontré la metáfora del papel arrugado. Para Peters, el fractal se puede entender como un papel arrugado: en esa situación, el papel sigue teniendo dos dimensiones, pero la geometría euclidiana no permite su representación en dos dimensiones porque no forma un plano (es decir, lo forma, pero no de la manera que espera la geometría euclidiana).

Sabiendo que se trata de un papel arrugado, la representación en tres dimensiones es excesiva: mentalmente, casi lo podríamos estirar: el papel tiene huecos, y no queda compacto. Sólo en caso de tener algún material que compactara el papel, éste llegaría a tener tres dimensiones. Pero mientras eso no sucede, el papel arrugado es representable "euclídeamente" como un cuerpo tridimensional.


Una forma como cualquier otra de acabar rápido la faena, y también de malgastar recursos.

En cambio, los fractales dan un paso más allá en la generalización: establecen una serie de principios basados en lo que informáticamente conocemos como la "recursividad" y en matemáticas fractales se conoce como "autosemejanza", para detectar comportamientos repetitivos a diferentes niveles, de modo que una fórmula de una gran simplicidad puede generar un fractal de gran complejidad. A la inversa, una forma de gran complejidad (todos los matices del papel arrugado) puede ser "descompuesta" en un fractal aparentemente sencillo.

Read more »

Jun 29
2007

Facetas: aplicaciones en informática

En el post anterior comenté las características principales de las facetas, así como sus implicaciones a la hora de construir una representación del conocimiento.

Después de echarle un vistazo, he de reconocer que me quedó algo ambiguo en algunos apartados, así que he pensado que sería de interés exponer ejemplos y aplicaciones de las facetas.

Creo que la representación del conocimiento utilizando lenguajes controlados, puede ser entendida como un sistema de consenso para la comunicación ágil en contextos delimitados. No es el tema que quiero tratar en este post, así que ya profundizaré más adelante.

De momento, podemos ver varias aplicaciones...

Read more »

Jun 26
2007

Facetas: las matemáticas en la semántica

Ahora que ya baja el ritmo de trabajo, retomaré los temas pendientes que dejé apuntados.

He publicado algunos posts (relacionados con mi hacer codos en PLN), y ya tengo ganas de marcar un ritmo de producción (tanto de posts como de mejoras en el blog) que espero poder definir a lo largo de este mes de Julio.

Para empezar, una de facetas. Es uno de los conocimientos que más me ha gustado aprender. Quizá el hecho que fuera un matemático quien lo enunciara (Shiyali Ramamrita Ranganathan) es un motivo de debilidad. Su base conceptual aporta un esquema formal para organizar el conocimiento...

Read more »

Jun 23
2007

Apuntes sobre Procesamiento del lenguaje natural

El procesamiento del lenguaje natural es una de las áreas con más interés para todas las aproximaciones a un tratamiento de la información que se centren en los aspectos semánticos.  Los apuntes son un extracto 

El documento describe los aspectos clave del procesamiento del lenguaje natural, y las interacciones y aportaciones entre la lingüística y la informática.  Expone de forma muy básica el funcionamiento interno de de los sistemas de PLN, así como los recursos utilizados para conseguir esta finalidad.

 El documento tiene una licencia Creative Commons - Atribución.

Read more »

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.