Desvio Padrão
O desvio padrão surge como o caminho natural para resolver o problema de unidade de medida no caso da variância, e pode ser considerada a mais importante medida de dispersão, tanto pelo seu extenso uso quanto por algumas de suas propriedades, que comentaremos abaixo. O desvio padrão é definido como a raiz quadrada da variância e é estimado pela fórmula:
, sem agregação e
, com agregação.
Pela coerência entre as unidades de medidas do desvio padrão e a variável analisada, essa medida funciona muitas vezes, como a própria unidade de medida. Por exemplo, pode-se demonstrar que o desvio padrão de uma variável y que seja definida como: y = aX + b é igual a |a|sx , onde sx é o desvio padrão de X; se definirmos a = 1/sx e b = -/sx , então teremos a variável:
, que tem média igual a zero e desvio padrão igual a um. Essa última variável, que, como veremos, tem muitas aplicações, é chamada variável normalizada ou padronizada, ou mesmo "estandardizada" (do inglês standard). Outra importante propriedade do desvio padrão é aquela que nos diz que, se escolhermos qualquer número k, a probabilidade de
é menor do que 1/k2. Isto gera algumas proposições muito comuns sobre o número de observações que caem longe da média aritmética em termos de desvio padrão. Por exemplo, para determinadas distribuições, pode-se garantir que 99% das observações estão no intervalo:
ou que 95% delas estão no intervalo:
. A Tabela seguinte nos dá os desvios padrões da amostra (ver nota 2), para as variáveis do nosso exemplo.
Tabela 17 - Desvio Padrão - Principais Variáveis
|
RENDA |
ANOSMORA |
ANOSANT |
EDUC |
SITUAÇÃO |
ESTILO |
Desvio padrão |
10999,24382 |
7,601328386 |
3,726650333 |
2,839422272 |
0,505046992 |
1,228682968 |