Exemplo de intervalo de confiança para uma variação populacional
C.K. Taylor
A variância da população dá uma indicação de como distribuir um conjunto de dados. Infelizmente, normalmente é impossível saber exatamente qual é esse parâmetro populacional. Para compensar nossa falta de conhecimento, usamos um tópico de estatística inferencial chamado intervalos de confiança . Veremos um exemplo de como calcular um intervalo de confiança para uma variância populacional.
Fórmula do intervalo de confiança
A fórmula para o (1 - α) intervalo de confiança sobre a variância da população . É dado pela seguinte sequência de desigualdades:
[( n - 1) s dois] / B <σdois <[ ( n - 1) s dois] / UMA .
Aqui n é o tamanho da amostra, s doisé a variância da amostra. O número UMA é o ponto da distribuição qui-quadrado com n -1 graus de liberdade em que exatamente α/2 da área sob a curva está à esquerda de UMA . De forma semelhante, o número B é o ponto da mesma distribuição qui-quadrado com exatamente α/2 da área sob a curva à direita de B .
Preliminares
Começamos com um conjunto de dados com 10 valores. Este conjunto de valores de dados foi obtido por uma amostra aleatória simples:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Alguma análise exploratória de dados seria necessária para mostrar que não há outliers. Ao construir um parcela de caule e folha vemos que esses dados são provavelmente de uma distribuição que é aproximadamente normalmente distribuída. Isso significa que podemos prosseguir encontrando um intervalo de confiança de 95% para a variância da população.
Variação da amostra
Precisamos estimar a variância da população com a variância da amostra, denotada por s dois. Então começamos calculando essa estatística. Essencialmente, estamos calculando a média soma dos desvios quadrados da média. No entanto, em vez de dividir esta soma por n nós dividimos por n - 1.
Descobrimos que a média amostral é 104,2. Usando isso, temos a soma dos desvios quadrados da média dada por:
(97 - 104,2)dois+ (75 – 104,3)dois+ . . . + (96 – 104,2)dois+ (102 – 104,2)dois= 2495,6
Dividimos essa soma por 10 – 1 = 9 para obter uma variância amostral de 277.
Distribuição Qui-Quadrado
Agora vamos para nossa distribuição qui-quadrado. Como temos 10 valores de dados, temos 9 graus de liberdade . Como queremos os 95% do meio de nossa distribuição, precisamos de 2,5% em cada uma das duas caudas. Consultamos uma tabela qui-quadrado ou software e vemos que os valores da tabela de 2,7004 e 19,023 abrangem 95% da área da distribuição. Esses números são UMA e B , respectivamente.
Agora temos tudo o que precisamos e estamos prontos para montar nosso intervalo de confiança. A fórmula para o ponto final esquerdo é [( n - 1) s dois] / B . Isso significa que nosso ponto final esquerdo é:
(9 x 277)/19,023 = 133
O ponto final certo é encontrado substituindo B com UMA :
(9 x 277)/2,7004 = 923
E assim estamos 95% confiantes de que a variância da população está entre 133 e 923.
Desvio Padrão da População
Obviamente, como o desvio padrão é a raiz quadrada da variância, esse método pode ser usado para construir um intervalo de confiança para o desvio padrão da população. Tudo o que precisaríamos fazer é extrair raízes quadradas dos pontos finais. O resultado seria um intervalo de confiança de 95% para o desvio padrão .