quinta-feira, 12 de julho de 2012

Transpetro 2012

Hoje respondo a uma dúvida da Pâmela, aluna do meu curso regular de Estatística. Ela pediu para eu resolver a questão abaixo, da Transpetro:


(Transpetro 2012 - Cesgranrio) Uma empresa tem 38 funcionários, sendo a média de idade 32 anos e o desvio padrão de 4 anos. Foram contratados mais dois funcionários, ambos com 32 anos. Em relação à variância original, a variância da nova distribuição de salários ficará


Dado: A variável idade é expressa em termos de anos completos.
(A) 5% menor
(B) 23,75% menor
(C) 76,25% menor
(D) 95% menor
(E) não se alterará


Resolução:


Em primeiro lugar, ressalto que não conferi o enunciado original na prova da banca, nem o gabarito definitivo, ok? Pâmela, estou confiando nas suas informações, tá bem? Alegre


Ok, vamos lá.


A média inicial era de 32.


Em seguida, acrescentamos mais dois funcionários com idade 32. Logo, a média não se altera. A média permanece em 32 anos.


O desvio padrão inicial era 4. Para calcular a variância, basta elevar o desvio padrão ao quadrado:


clip_image002

Como calculamos a variância?

Lembrando, a variância é a média dos quadrados dos desvios. Desvios esses calculados em relação à média aritmética. Logo, na situação inicial, temos:


clip_image004


clip_image006


Logo:

clip_image008


Em seguida, passamos a ter 40 funcionários, pois adicionamos mais dois valores iguais a 32. A nova variância fica:


clip_image010


No numerador temos um somatório. Podemos separá-lo em duas partes: a soma dos 38 desvios originais, mais a soma dos últimos dois desvios, correspondentes aos dois novos funcionários:


clip_image012


Os últimos dois desvios são nulos, porque os valores são exatamente iguais à média.

clip_image014


clip_image016


clip_image018


A nova variância é 95% da variância anterior. Logo, houve uma redução de 5% na variância. Deste modo, eu marcaria a letra “a”. Segundo a Pâmela, a questão foi anulada. Realmente não sei o motivo da anulação.

sexta-feira, 6 de julho de 2012

Box Plot–Inmetro 2010

Hoje respondo a uma dúvida do Sylvio Henrique, aluno do meu curso regular de estatística. Ele pediu ajuda na questão a seguir, do concurso do Inmetro 2010.

(CESPE – INMETRO/2010) Nos últimos cinco meses, uma família apresentou o seguinte quadro de despesas:

1.º mês: R$ 1.000,00;

2.º mês: R$ 1.200,00;

3.º mês: R$ 900,00;

4.º mês: R$ 1.100,00;

5.º mês: R$ 800,00.

Em relação a esse conjunto de dados, assinale a opção correta.

A O desvio padrão amostral é superior a R$ 200,00.

B O primeiro quartil é igual a R$ 1.100,00.

C O terceiro quartil é igual a R$ 1.200,00.

D Ao se construir um Box plot para esse conjunto de dados, os limites inferior e superior estarão contidos no intervalo [R$ 400,00, R$ 1.600,00].

E A média é maior que a mediana dos dados.

Resolução.

Vamos direto para a alternativa que trata de Box-plot.

Rol:

800, 900, 1.000, 1.100, 1.200

A mediana é o termo do meio:

clip_image002

A mediana divide o conjunto de dados em duas partes com 2 elementos cada.











Primeira parteSegunda parte
800, 9001.100, 1.200

O primeiro quartil é a mediana da primeira parte:

clip_image004

O segundo quartil é a mediana da segunda parte:

clip_image006

O intervalo interquartílico é igual a:

clip_image008

Os limites do Box plot são:

- Limite inferior: clip_image010

- Limite superior: clip_image012

Os limites do Box-plot são 400 e 1.600. A alternativa D está correta.

Gabarito: D

Agora vejamos as demais alternativas.

A letra “a” é a de verificação mais demorada, pois depende de uma maior quantidade de cálculos. Na hora da prova, o ideal é marcá-la “por exclusão”.

Letra B:

Já vimos que o primeiro quartil é 850. Alternativa errada.

Letra C:

Já vimos que o terceiro quartil é 1.150. Alternativa errada.

Letra E:

clip_image014

A média é igual à mediana. Alternativa errada.

Finalmente, para analisar a letra “a”, vamos criar a variável auxiliar:

clip_image016

Os valores de “d” são:

-2, -1, 0, 1, 2

Logo:

clip_image018

clip_image020

A variância é a diferença entre a média dos quadrados e o quadrado da média:

clip_image022

 

Tendo o desvio padrão de "d", podemos calcular o desvio padrão de "x", assim:



Quando somamos uma constante aos dados, o desvio padrão não se altera.

Quando multiplicamos os dados por uma constante, o desvio padrão é multiplicado pela mesma constante. Logo, o desvio padrão de "x" será 100 vezes o desvio padrão de "d".

clip_image024

Esse é o desvio padrão populacional de "x".

Para cálculo do desvio padrão amostral, fazemos o ajuste. Multiplicamos por "n" (número de dados = 5) e dividimos por "n-1".

E o desvio padrão amostral fica:

clip_image026

O desvio padrão amostral não é superior a 200.