Regressão não linear simples

Resíduos não aderentes a normalidade, por determinado teste estatístico, provavelmente a distribuição de dados é não linear.

Exemplo de Teste estatístico para verificar se os resíduos estão aderentes a normalidade.

Shapiro-Wilk: Amostras pequenas (50 observações)

Shapiro-Francia: Amostras maiores.

O teste de Shapiro–Francia é um teste estatístico utilizado justamente para verificar essa hipótese de normalidade.

Hipóteses do teste

O teste trabalha com duas hipóteses:H0: os resıˊduos seguem distribuic¸a˜o normalH_0:\ \text{os resíduos seguem distribuição normal}H1: os resıˊduos na˜o seguem distribuic¸a˜o normalH_1:\ \text{os resíduos não seguem distribuição normal}

Ou seja:

  • H0H_0​ representa a hipótese de normalidade;
  • H1H_1​ representa a hipótese alternativa, indicando violação da normalidade.

Interpretação do p-valor

Após executar o teste, obtém-se um valor chamado p-value.

A regra geral é:

Se:

p-value>0,05p\text{-value} > 0,05

não rejeitamos H0H_0​.

Assim, há evidências de que os resíduos possuem aderência à normalidade.

Se:

p-value0,05p\text{-value} \leq 0,05

rejeitamos H0H_0​.

Nesse caso, conclui-se que os resíduos não seguem distribuição normal.

Normalização/Transformação box-cox (transformação da variável dependente)

O Box-Cox não transforma os resíduos diretamente. Primeiro transformamos YY, ajustamos o modelo com YY^*, e só depois avaliamos se os novos resíduos ficaram mais aderentes à normalidade.

Qual melhor Lambda que maximiza a aderência a normalidade.

Na transformação Box-Cox, quando ainda não existe um modelo ajustado, não avaliamos os termos de erro, pois os resíduos só existem após a estimação do modelo. Nesse caso, a transformação é aplicada diretamente sobre a variável resposta YYY, com o objetivo de aproximar sua distribuição da normalidade e estabilizar sua variância.


O parâmetro λ\lambda da transformação Box-Cox é escolhido de forma a tornar a variável resposta transformada YY^*o mais próxima possível de uma distribuição normal. Assim, antes de ajustar o modelo, buscamos uma escala mais adequada para YY, aumentando a chance de que os resíduos do modelo apresentem melhor comportamento estatístico.

A transformação é:Y=Yλ1λY^* = \frac{Y^\lambda – 1}{\lambda}

quando:λ0\lambda \neq 0

E quando:λ=0\lambda = 0

usa-se:Y=ln(Y)Y^* = \ln(Y)

A ideia é testar vários valores de λ\lambdaλ, por exemplo:[2, 1, 0,5, 0, 0,5, 1, 2][-2,\ -1,\ -0{,}5,\ 0,\ 0{,}5,\ 1,\ 2]

e escolher aquele que maximiza a aderência de YY^* à distribuição normal.

Exemplo de interpretação:

  • λ = 1 → praticamente não transforma Y
  • λ = 0,5 → raiz quadrada de Y
  • λ = 0 → log(Y)
  • λ = -1 → inverso de Y

Deixe um comentário