A aproximação normal da distribuição binomial
Matt Cardy / Getty Images
Variáveis aleatórias com distribuição binomial são conhecidos por serem discretos. Isso significa que há um número contável de resultados que podem ocorrer em uma distribuição binomial, com separação entre esses resultados. Por exemplo, uma variável binomial pode ter um valor de três ou quatro, mas não um número entre três e quatro.
Com o caráter discreto de uma distribuição binomial, é um tanto surpreendente que uma variável aleatória contínua possa ser usada para aproximar uma distribuição binomial. Para muitos distribuições binomiais , podemos usar uma distribuição normal para aproximar nossas probabilidades binomiais.
Isso pode ser visto quando se olha n lançamentos de moedas e locação X ser o número de cabeças. Nesta situação, temos uma distribuição binomial com probabilidade de sucesso como p = 0,5. À medida que aumentamos o número de lançamentos, vemos que a probabilidade histograma tem cada vez maior semelhança com uma distribuição normal.
Declaração da Aproximação Normal
Toda distribuição normal é completamente definida por dois numeros reais . Esses números são a média, que mede o centro da distribuição, e a desvio padrão , que mede a propagação da distribuição. Para uma dada situação binomial, precisamos ser capazes de determinar qual distribuição normal usar.
A seleção da distribuição normal correta é determinada pelo número de tentativas n na configuração binomial e a probabilidade constante de sucesso p para cada uma dessas tentativas. A aproximação normal para nossa variável binomial é uma média de por exemplo. e um desvio padrão de ( por exemplo. (1 - p )0,5.
Por exemplo, suponha que adivinhamos cada uma das 100 perguntas de um teste de múltipla escolha, em que cada pergunta tinha uma resposta correta entre quatro opções. O número de respostas corretas X é uma variável aleatória binomial com n = 100 e p = 0,25. Assim, esta variável aleatória tem média de 100(0,25) = 25 e um desvio padrão de (100(0,25)(0,75))0,5= 4,33. Uma distribuição normal com média 25 e desvio padrão de 4,33 funcionará para aproximar essa distribuição binomial.
Quando a aproximação é adequada?
Usando um pouco de matemática, pode-se mostrar que existem algumas condições que precisamos usar uma aproximação normal para o distribuição binomial . O número de observações n deve ser grande o suficiente, e o valor de p para que ambos por exemplo. e n (1 - p ) são maiores ou iguais a 10. Esta é uma regra prática, que é guiada pela prática estatística. A aproximação normal sempre pode ser usada, mas se essas condições não forem atendidas, a aproximação pode não ser tão boa.
Por exemplo, se n = 100 e p = 0,25 então estamos justificados em usar a aproximação normal. Isto é porque por exemplo. = 25 e n (1 - p ) = 75. Como esses dois números são maiores que 10, a distribuição normal apropriada fará um bom trabalho na estimativa de probabilidades binomiais.
Por que usar a aproximação?
As probabilidades binomiais são calculadas usando uma fórmula muito simples para encontrar o coeficiente binomial. Infelizmente, devido à fatoriais na fórmula, pode ser muito fácil encontrar dificuldades computacionais com o binômio Fórmula. A aproximação normal nos permite contornar qualquer um desses problemas trabalhando com um amigo familiar, uma tabela de valores de uma distribuição normal padrão.
Muitas vezes, a determinação de uma probabilidade de que uma variável aleatória binomial caia dentro de um intervalo de valores é tediosa de calcular. Isso porque para encontrar a probabilidade de que uma variável binomial X for maior que 3 e menor que 10, precisaríamos encontrar a probabilidade de que X é igual a 4, 5, 6, 7, 8 e 9, e então some todas essas probabilidades. Se a aproximação normal puder ser usada, precisaremos determinar os escores z correspondentes a 3 e 10 e, em seguida, usar uma tabela de probabilidades de escores z para o distribuição normal padrão .