A blog about data, information and IT, by Mario Alberich

Jul 15
2013

Simular un valor binomial

Un proceso binomial es aquel que sólo puede tomar dos valores: uno o cero, sí o no, blanco o negro... En estadística, el proceso básico es denominado experimento de Bernouilli en honor al matemático (que por cierto, vaya familia). El experimento se refiere a cualquier experimento que tenga esta característica.

Este proceso otorga una probabilidad p a que tenga lugar un suceso (por ejemplo, que alguien responda "Sí" a una pregunta), y por contraposición otorga la probabilidad q al suceso contrario (alguien responde "No"). Lo importante es que siempre p + q = 1. Esto quizá te sonará del post de p = q = 0,5.

Los procesos de simulación estadística parten siempre de los recursos que proporciona la informática.  Para el caso, se utilizan los generadores de valores aleatorios (en concreto, los generadores pseudoaleatorios). Estos generadores devuelven un valor entre 0 y 1, pero es un valor continuo.

Conversión de continuo a discreto


Entonces, cómo convertimos ese valor a un valor 0 ó 1? Este caso es sencillo, pero se puede extrapolar a otros casos más complejos. El algoritmo es:

  • Iniciamos un experimento de Bernouilli para determinar el valor de X
  • Se genera un valor aleatorio U entre 0 y 1
  • Si U es menor que p, X valdrà 1. En caso contrario, valdrá 0.


Si lo que queremos es simular una distribución binomial con n repeticiones, lo que debemos hacer es ejecutar el proceso anterior n veces y sumar los valores de X. Este proceso, ejecutado un número de veces lo suficientemente grande, y representado gráficamente, nos mostrará un diagrama cercano a la distribución teórica del modelo Binomial.

Pero eso ya queda para otros momentos.

Tags

gestión documental 10     Recuperación información 11     Linux 7     Usabilidad 5     open source 3     Tagging 12     lógica borrosa 2     fuentes de información 12     Google 6     off-topic 6     spam 2     grafos 6     Web social 11     modelización 12     Productividad 11     buscadores 2     utilidades 17     Profesionales 9     SEO 5     estándares 3     veracidad 3     relevancia 2     lingüística 2     PLN 2     lenguajes documentales 2     apis-mashups 3     reseñas 7     Flash 7     Gráficos estadísticos 13     Publicidad 3     Innovación 5     muestreo estadístico 9     PHP 14     internet 2     testeo 12     desarrollo 3     visualizacion 36     javascript 16     datos abiertos 9     elecciones 2     simulación 5     html5 7     phing 9     ssh 2     seguridad 3     indicadores 2     demografía 3     media 2     algoritmos 7     shell 4     mysql 2     backup 2     big data 6     twitter 2     d3js 11     revealjs 2     metodología 6     data-journalism 6     smartcities 2     NYT 2     privacidad 3     benchmarking 4     recopilaciones 21     magento 5     formacion 2     github 2     HHVM 3     psicología 2     angularjs 3     grep 2     nodejs 5     promises 2     mapreduce 3     crossfilter 2     exploración de datos 2     machine learning 2    

© 2007 and beyond Mario Alberich, licensed under CC-BY-SA unless stated otherwise.