A blog about data, information and Tech by Mario Alberich

        

ago. 24
2014

Enlaces de interés 2014-34

jul. 20
2014

Enlaces de interés 2014-29

jul. 15
2014

Frecuentistas y Bayesianos

Probablemente el debate entre el enfoque frecuentista y bayesiano sea un tema que le trae a poco a la inmensa mayoría de usuarios de la estadística, como también lo será el debate entre software libre y propietario de la informática.  Como sucede en éste, también en aquél los resultados finales pueden diferir poco, pero la clave está en la metodología y la filosofía.

Y lo cierto es que no sabría explicarlo mejor que en el blog Pythonic Perambulations, que ha publicado una serie de (por ahora) cuatro artículos sobre frecuentismo y bayesianismo, con ejemplos de programación en Python:


Lo que se desprende de estos artículos es un posicionamiento claro en favor del enfoque bayesiano. Algo cada vez menos raro. Pero, ¿por qué?

¿Por qué oiremos cada día más sobre el enfoque Bayesiano?


Resumiéndolo en un solo concepto, Aprendizaje automático, o en su traducción inglesa, más habitual, Machine Learning. Ante la ingente cantidad de datos, es necesario encontrar métodos y algoritmos que faciliten la adaptación de aplicaciones informáticas a los datos que las alimentan. Los métodos Bayesianos ofrecen una buena base para implementar algoritmos en programas que necesitan adaptar su funcionamiento a los datos que les son suministrados.

Ante la pregunta sobre las potenciales aplicaciones, no es necesario ir muy lejos para conocer una aplicación muy conocida: las herramientas de detección de SPAM cumplen todas las condiciones: los datos no tienen una estructura conocida, es necesario adaptar los criterios (los emails de los spammers cambian, la longitud y los enlaces también, así como los criterios para la evaluación del coeficiente de spam).

El Machine Learning y otras aplicaciones de algoritmos estadísticos a la Inteligencia Artificial y Deep Learning, pueden oscilar desde el marketing directo y la personalización hacia el cliente, hasta el análisis de modelos de datos para los que no existe una suposición de normalidad.

Pero lo más importante que aporta este enfoque es que incorpora en el núcleo de su funcionamiento el propio principio del aprendizaja, a partir de los conceptos de la distribución a priori y a posteriori.

Read more »

jul. 6
2014

Enlaces de interés, 2014-27

jun. 29
2014

Enlaces de interés, 2014-26

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.