A blog about data, information and IT, by Mario Alberich

Jul 15
2014

Frecuentistas y Bayesianos

Probablemente el debate entre el enfoque frecuentista y bayesiano sea un tema que le trae a poco a la inmensa mayoría de usuarios de la estadística, como también lo será el debate entre software libre y propietario de la informática.  Como sucede en éste, también en aquél los resultados finales pueden diferir poco, pero la clave está en la metodología y la filosofía.

Y lo cierto es que no sabría explicarlo mejor que en el blog Pythonic Perambulations, que ha publicado una serie de (por ahora) cuatro artículos sobre frecuentismo y bayesianismo, con ejemplos de programación en Python:


Lo que se desprende de estos artículos es un posicionamiento claro en favor del enfoque bayesiano. Algo cada vez menos raro. Pero, ¿por qué?

¿Por qué oiremos cada día más sobre el enfoque Bayesiano?


Resumiéndolo en un solo concepto, Aprendizaje automático, o en su traducción inglesa, más habitual, Machine Learning. Ante la ingente cantidad de datos, es necesario encontrar métodos y algoritmos que faciliten la adaptación de aplicaciones informáticas a los datos que las alimentan. Los métodos Bayesianos ofrecen una buena base para implementar algoritmos en programas que necesitan adaptar su funcionamiento a los datos que les son suministrados.

Ante la pregunta sobre las potenciales aplicaciones, no es necesario ir muy lejos para conocer una aplicación muy conocida: las herramientas de detección de SPAM cumplen todas las condiciones: los datos no tienen una estructura conocida, es necesario adaptar los criterios (los emails de los spammers cambian, la longitud y los enlaces también, así como los criterios para la evaluación del coeficiente de spam).

El Machine Learning y otras aplicaciones de algoritmos estadísticos a la Inteligencia Artificial y Deep Learning, pueden oscilar desde el marketing directo y la personalización hacia el cliente, hasta el análisis de modelos de datos para los que no existe una suposición de normalidad.

Pero lo más importante que aporta este enfoque es que incorpora en el núcleo de su funcionamiento el propio principio del aprendizaja, a partir de los conceptos de la distribución a priori y a posteriori.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.