Variância

Todas as medidas de dispersão anteriores são utilizadas ocasionalmente. Todavia, a medidas que abordaremos agora, são de longe as mais importantes, não só pelo seu maior uso, mas porque com o uso da média aritmética como medida de tendência central é natural as usarmos como medida de dispersão, e isto pode ser o motivo do seu amplo uso. Vimos que, para evitar o fato de que a soma dos desvios em relação à média é nula, definimos o desvio médio como a soma dos valores absolutos dos desvios. A dificuldade de se lidar, matematicamente, com valores absolutos fez a medida ser pouco usada no desenvolvimento da teoria estatística.

Outra forma de se evitar a soma nula é a elevação dos desvios ao quadrado. Como sabemos um número ao quadrado é sempre uma grandeza positiva, e os desvio negativos são transformados em positivos. A definição de variância como uma medida de dispersão segue esta linha de raciocínio e é calculada através da seguinte fórmula:

, sem agregação e , com agregação.

De muita utilidade no desenvolvimento dos estudos estatísticos, a variância tem uma desvantagem em termos de descrição dos dados, devido a falta de homogeneidade na unidade de medida utilizada quando comparada àquela da variável para a qual ela está sendo estimada; por exemplo, uma variável medida em reais, como é o caso de renda no nosso exemplo, terá variância medida em reais ao quadrado, o que é mesmo de difícil interpretação. A medida de dispersão discutida na próxima seção tenta resolver esta questão. Estimativas das variâncias das variáveis envolvidas são apresentadas a seguir:

 

 

Tabela 16 - Variância - Principais Variáveis

RENDA

ANOSMORA

ANOSANT

EDUC

SITUAÇÃO

ESTILO

Variância da amostra

120983364,5

57,78019324

13,88792271

8,062318841

0,255072464

1,509661836