A blog about data, information and IT, by Mario Alberich

Sep 29
2013

Sonido en algoritmos y Wikipedia

No todo el mundo entiende el funcioamiento de los algoritmos paso por paso. Hay ciertos perfiles que requieren partir del ejemplo, e incluso tener la ayuda de otros sentidos, como la vista o el oído. Para ellos, estos dos recursos.

Read more »

Sep 10
2013

Primero los datos, datos reales

Parece que el ciclo en el análisis y la representación de los datos también está cambiando. Como ya sucedió en IT con las metodologías ágiles, quizá la reducción en el precio de los recursos (en este caso, el acceso a más datos por un coste bajo o nulo), ha conducido a cambios en el ciclo de trabajo. Así, en una entrevista a Jer Thorp, leía:

Read more »

Sep 05
2013

Simular un valor Poisson

La distribución de Poisson es la otra cara de la moneda de la distribución Exponencial.  Mientras que la distribución exponencial nos sirve para modelizar el tiempo que transcurre entre dos sucesos independientes, la distribución de Poisson modeliza el número de sucesos que tienen lugar en una unidad de tiempo.

Read more »

Aug 26
2013

Simular un valor exponencial

La distribución exponencial es una distribución especialmente importante en estadística.  Sirve para modelizar el tiempo que transcurre entre dos eventos independientes, y durante los cuales transcurren, por término medio, el mismo tiempo. También se la reconoce por ser la otra cara de la moneda de los procesos de Poisson, de los que hablaré en otro momento.

Read more »

Aug 14
2013

Transparencia, claridad y Big Data

Un interesante ejemplo de los riesgos por el exceso de datos disponibles lo retrataba hace un par de semanas el blog del colegio de periodismo en su blog de la BBC.  No comparto al completo la visión, pero sí los efectos primarios (sesgo) y secundarios (toma de decisiones errónea) debido a un problema relativamente nuevo: el exceso de datos.

Read more »

Jul 11
2013

Calcular la variancia sin recorrer dos veces los datos

El cálculo de la variancia (o varianza, según la literatura) implica a la media.  Dado que para calcular la media necesitamos todos los datos (bueno no siempre, pero en este caso sí), el algoritmo más básico nos obligaría a recorrer dos veces la muestra de datos:

Read more »

Jun 28
2013

Cálculo de la media con datos en flujo

En muchos casos disponemos de todo el conjunto de datos para poder calcular la media. En esas situaciones, la suma de todos los elementos divididos por el número de éstos, ya nos proporciona la media.

Read more »

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.