Exemplo de intervalo de confiança para uma variação populacional

Essa sequência de desigualdades nos dá um intervalo de confiança para uma variância populacional.

C.K. Taylor





A variância da população dá uma indicação de como distribuir um conjunto de dados. Infelizmente, normalmente é impossível saber exatamente qual é esse parâmetro populacional. Para compensar nossa falta de conhecimento, usamos um tópico de estatística inferencial chamado intervalos de confiança . Veremos um exemplo de como calcular um intervalo de confiança para uma variância populacional.

Fórmula do intervalo de confiança

A fórmula para o (1 - α) intervalo de confiança sobre a variância da população . É dado pela seguinte sequência de desigualdades:



[( n - 1) s dois] / Bdois <[ ( n - 1) s dois] / UMA .

Aqui n é o tamanho da amostra, s doisé a variância da amostra. O número UMA é o ponto da distribuição qui-quadrado com n -1 graus de liberdade em que exatamente α/2 da área sob a curva está à esquerda de UMA . De forma semelhante, o número B é o ponto da mesma distribuição qui-quadrado com exatamente α/2 da área sob a curva à direita de B .



Preliminares

Começamos com um conjunto de dados com 10 valores. Este conjunto de valores de dados foi obtido por uma amostra aleatória simples:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Alguma análise exploratória de dados seria necessária para mostrar que não há outliers. Ao construir um parcela de caule e folha vemos que esses dados são provavelmente de uma distribuição que é aproximadamente normalmente distribuída. Isso significa que podemos prosseguir encontrando um intervalo de confiança de 95% para a variância da população.

Variação da amostra

Precisamos estimar a variância da população com a variância da amostra, denotada por s dois. Então começamos calculando essa estatística. Essencialmente, estamos calculando a média soma dos desvios quadrados da média. No entanto, em vez de dividir esta soma por n nós dividimos por n - 1.



Descobrimos que a média amostral é 104,2. Usando isso, temos a soma dos desvios quadrados da média dada por:

(97 - 104,2)dois+ (75 – 104,3)dois+ . . . + (96 – 104,2)dois+ (102 – 104,2)dois= 2495,6



Dividimos essa soma por 10 – 1 = 9 para obter uma variância amostral de 277.

Distribuição Qui-Quadrado

Agora vamos para nossa distribuição qui-quadrado. Como temos 10 valores de dados, temos 9 graus de liberdade . Como queremos os 95% do meio de nossa distribuição, precisamos de 2,5% em cada uma das duas caudas. Consultamos uma tabela qui-quadrado ou software e vemos que os valores da tabela de 2,7004 e 19,023 abrangem 95% da área da distribuição. Esses números são UMA e B , respectivamente.



Agora temos tudo o que precisamos e estamos prontos para montar nosso intervalo de confiança. A fórmula para o ponto final esquerdo é [( n - 1) s dois] / B . Isso significa que nosso ponto final esquerdo é:

(9 x 277)/19,023 = 133



O ponto final certo é encontrado substituindo B com UMA :

(9 x 277)/2,7004 = 923

E assim estamos 95% confiantes de que a variância da população está entre 133 e 923.

Desvio Padrão da População

Obviamente, como o desvio padrão é a raiz quadrada da variância, esse método pode ser usado para construir um intervalo de confiança para o desvio padrão da população. Tudo o que precisaríamos fazer é extrair raízes quadradas dos pontos finais. O resultado seria um intervalo de confiança de 95% para o desvio padrão .