quinta-feira, 6 de setembro de 2012

Forma alternativa de cálculo da variância

Recebi um e-mail do Antônio Carlos, aluno do Eu Vou Passar, pedindo ajuda com o cálculo alternativo de variância, quando optamos por usar a variável auxiliar.


Bom, relembrando, a variância é uma medida de dispersão. Ela me indica o quanto os dados estão afastados da média aritmética. Para calcular a variância, fazemos assim:


clip_image002[11]

Ou seja, calculamos a média dos quadrados dos desvios. Desvios estes calculados em relação à média aritmética.


Caso estejamos diante de uma amostra, usamos “n – 1” no denominador. Neste caso, usamos o símbolo s2 para a variância.


clip_image004[11]

Não entrarei em detalhes no porquê disso, mas fica registrado que o objetivo é obter um estimador não-viciado da média da população.


Ok, continuando.

O grande detalhe é que esta forma de cálculo é muito demorada, é trabalhosa. E, na hora da prova, é sempre bom poupar tempo.


Pois bem, outra maneira de calcular a variância, que demanda muito menos tempo, é a seguinte:


clip_image006[7]


Ou seja:

- calculamos a média dos quadrados

- calculamos o quadrado da média

- subtraímos um do outro, obtendo a variância populacional

Detalhe: essa forma alternativa pressupõe que utilizamos “n” no denominador. Se estivermos diante de uma amostra, temos que multiplicar por “n” (para anular a divisão feita pelo próprio “n”) e dividir por “n – 1”, para obter o denominador correto. Fica assim:


clip_image008[5]


E, é claro, podemos usar o cálculo alternativo da variância em qualquer situação, inclusive quando decidimos adotar a variável “auxiliar”. E aqui reside a dúvida do Antônio Carlos.


Para ver como fica, nada melhor que um exemplo. Utilizarei a recente prova da Esaf, feita agora em 2012:

(ESAF - Ministério da Integração Nacional 2012)
A distribuição de frequências em classes do salário mensal x, medido em número de salários mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a seguir.





























Classeclip_image004
Mais de 0 a 1022
Mais de 10 a 2013
Mais de 20 a 3010
Mais de 30 a 403
Mais de 40 a 502


Usando os dados acima, obtenha o valor mais próximo da variância amostral do salário mensal.

a) 121,5

b) 124

c) 126,5

d) 129

e) 131,5

Resolução:

Seja “X” o ponto médio de cada classe.

































Classeclip_image002[1]clip_image004[1]
Mais de 0 a 10522
Mais de 10 a 201513
Mais de 20 a 302510
Mais de 30 a 40353
Mais de 40 a 50452

Observem que os valores de X são elevados. Para diminuir um pouco as contas, usamos a variável auxiliar, que eu costumo chamar de “d”.

Vamos criar a variável auxiliar “d”, dada por:

clip_image006


Fazemos assim: subtraímos da variável "X" a constante 25 (ponto médio da classe central) e dividimos por 10 (amplitude de classe). O resultado fica:
















































clip_image002[2]clip_image008clip_image004[2]clip_image010
5-222-44
15-113-13
250100
35133
45224
TOTAL50-50

Observação: não existe regra fixa para cálculo da variável “d”. O objetivo é usar qualquer transformação (envolvendo somas, subtrações, divisões e multiplicações de constantes) para chegarmos a números mais fáceis de se trabalhar.


Outra forma de cálculo muito comum em livros é subtrair X do ponto de maior frequência. Também dá certo. Aí vai do “gosto do freguês”.


Continuando.


Agora calculamos a média e a variância para “d”. Por quê? Porque para “d” os valores são menores, mais fáceis de se trabalhar.


A média de “d” fica:


clip_image012


Com o mesmo raciocínio, calculamos a média de clip_image014




















































clip_image002[2]clip_image016clip_image018clip_image004[2]clip_image020
5-242288
15-111313
2500100
351133
452428
TOTAL50112

O que resulta em:

clip_image022


Agora é só aplicar a forma alternativa de cálculo da variância. A variância populacional é igual à diferença entre a média dos quadrados e o quadrado da média:


clip_image024


clip_image026


Na variância populacional, o denominador é “n”(= número de dados na amostra).

Mas nós queremos a variância amostral, com denominador “n – 1”. Então multiplicamos o resultado acima por “n”, para cancelar a divisão feita, e dividimos por “n – 1”, para chegarmos ao denominador desejado.

clip_image028


Essa é a variância amostral para “d”.

clip_image030


Agora calculamos a variância amostral para X. Assim:

clip_image006[1]


clip_image032


Quando multiplicamos os dados por uma constante (10), a variância fica multiplicada pela constante ao quadrado (102). Quando somamos uma constante aos dados (25), a variância não se altera.


clip_image034


clip_image036


Gabarito: C

Pronto. Usamos o cálculo alternativo da variância em conjunto com o emprego da variável auxiliar. Como fizemos?

Calculamos tudo para a variável auxiliar (média e variância). Depois usamos propriedades da variância para achar a dispersão da variável original (X).

É isso.

Para mais questões comentadas, acesse www.tecconcursos.com.br.

Bons estudos!

Vítor

http://www.facebook.com/vitor.menezes01

vitor@tecconcursos.com.br

Nenhum comentário:

Postar um comentário