Un uso común de la prueba binomial es en el caso donde la hipótesis nula es aquella en la que las dos categorías son igualmente probables de que ocurran (como el lanzamiento de una moneda). Las tablas están ampliamente disponibles para dar la importancia observada en el número de observaciones en las categorías para este caso. Sin embargo, como muestra el siguiente ejemplo, la prueba binomial no se limita a este caso.
Para muestras grandes como las del siguiente ejemplo, la distribución binómica es bien aproximada por convenientes distribuciones continuas, y éstos se utilizan como la base para las pruebas alternativas que son mucho más rápidas para computar, Prueba χ² de Pearson y el G-test. Sin embargo, para pequeñas muestras estas aproximaciones se descomponen, y no hay alternativa para la prueba binomial.
Ejemplo de prueba binomial
Supongamos que tenemos un juego de mesa que depende del lanzamiento de un dado (ver dado) y asigna una especial importancia al lanzamiento de un 6. En un juego en particular, el dado es lanzado 235 veces, y el 6 sale 51 veces. Si el dado es justo, esperamos que el 6 salga
veces. ¿Es la proporción del 6 significativamente más alta de lo que se esperaría por casualidad, sobre la hipótesis nula de un dado justo?
Para encontrar una respuesta a esta pregunta usando el binomial, usamos la distribución binomial:
para calcular la probabilidad de 51 o más seises en una muestra de 235 si la verdadera probabilidad de lanzar un 6 en cada intento es 1/6. Esto se hace sumando la probabilidad de obtener exactamente 51 seises, exactamente 52 seises, y así sucesivamente hasta 235:
En este caso, la probabilidad de obtener 51 o más seises en un dado justo es 0,027. Si estábamos buscando por una significación al nivel del 5%, este resultado indica que el dado se carga para dar muchos 6 (Pruebas de una y dos colas, prueba unilateral).
La prueba antes dicha mira si el dado lanza demasiados seises. También podríamos usar una prueba de dos colas que nos pudiera decir si el dado está sesgado para producir muy pocos o demasiados seises. Se tenga en cuenta que para hacer esto no podemos simplemente doblar el valor p de una cola a menos que la probabilidad del evento sea 1 / 2. Esto es porque la distribución binomial se hace asimétrica ya que la probabilidad se desvía de 1/2.Hay dos métodos para definir el valor-p de dos colas. Un método consiste en sumar la probabilidad de que la desviación total en el número de eventos en cualquier dirección del valor esperado sea mayor o menor que el valor esperado. La probabilidad de que ocurra en nuestro ejemplo es 0.0437. El segundo método implica calcular la probabilidad de que la desviación del valor esperado sea tan improbable o más improbable que el valor observado, es decir, a partir de una comparación de las funciones de densidad de probabilidad. Esto puede crear una diferencia sutil, pero en este ejemplo produce la misma probabilidad de 0.0437. En ambos casos, la prueba bilateral revela significancia al nivel del 5%, indicando que el número de 6s observados fue significativamente diferente para este dado que el número esperado al nivel del 5%.
En paquetes de software estadístico
Las pruebas binomiales están disponibles en la mayoría de los programas informáticos utilizados con fines estadísticos. P.ej.
En R El ejemplo anterior se podría calcular con el siguiente código:
binom.test(51,235,(1/6),alternative="less") (test de una cola)
binom.test(51,235,(1/6),alternative="greater") (test de una cola)
binom.test(51,235,(1/6),alternative="two.sided") (test de dos colas)
En SAS La prueba está disponible en el procedimiento Frecuencia
scipy.stats.binom_test(51,235,1.0/6,alternative='greater') (test de una cola)
scipy.stats.binom_test(51,235,1.0/6,alternative='two-sided') (test de dos colas)
En MATLAB, usa myBinomTest, Que está disponible en el sitio web de intercambio de archivos de la comunidad de Mathworks. MyBinomTest calculará directamente el valor-p para las observaciones dada la hipótesis de probabilidad de éxito. [pout]=myBinomTest(51,235,1/6) (generalmente de dos colas, pero opcionalmente puede realizar una prueba de una cola).
En Microsoft Excel, usa Binom.Dist. La función toma los parámetros (Número de éxitos, Pruebas, Probabilidad de éxito, Acumulativo). El parámetro "Cumulativo" toma un booleano True o False, con True dando la probabilidad acumulativa de encontrar estos muchos éxitos (una prueba de cola izquierda), y Falso la probabilidad exacta de encontrar estos muchos éxitos.[2]