Regressão não linear simples

Resíduos não aderentes a normalidade, por determinado teste estatístico, provavelmente a distribuição de dados é não linear.

Exemplo de Teste estatístico para verificar se os resíduos estão aderentes a normalidade.

Shapiro-Wilk: Amostras pequenas (50 observações)

Shapiro-Francia: Amostras maiores.

O teste de Shapiro–Francia é um teste estatístico utilizado justamente para verificar essa hipótese de normalidade.

Hipóteses do teste

O teste trabalha com duas hipóteses: $H_0:\ \text{os resíduos seguem distribuição normal}$ $H_1:\ \text{os resíduos não seguem distribuição normal}$

Ou seja:

$H_0$ representa a hipótese de normalidade;
$H_1$ representa a hipótese alternativa, indicando violação da normalidade.

Interpretação do p-valor

Após executar o teste, obtém-se um valor chamado p-value.

A regra geral é:

Se:

$p\text{-value} > 0,05$

não rejeitamos $H_0$ .

Assim, há evidências de que os resíduos possuem aderência à normalidade.

Se:

$p\text{-value} \leq 0,05$

rejeitamos $H_0$ .

Nesse caso, conclui-se que os resíduos não seguem distribuição normal.

Normalização/Transformação box-cox (transformação da variável dependente)

O Box-Cox não transforma os resíduos diretamente. Primeiro transformamos $Y$ , ajustamos o modelo com $Y^*$ , e só depois avaliamos se os novos resíduos ficaram mais aderentes à normalidade.

Qual melhor Lambda que maximiza a aderência a normalidade.

Na transformação Box-Cox, quando ainda não existe um modelo ajustado, não avaliamos os termos de erro, pois os resíduos só existem após a estimação do modelo. Nesse caso, a transformação é aplicada diretamente sobre a variável resposta $Y$ Y, com o objetivo de aproximar sua distribuição da normalidade e estabilizar sua variância.

O parâmetro $\lambda$ da transformação Box-Cox é escolhido de forma a tornar a variável resposta transformada $Y^*$ o mais próxima possível de uma distribuição normal. Assim, antes de ajustar o modelo, buscamos uma escala mais adequada para $Y$ , aumentando a chance de que os resíduos do modelo apresentem melhor comportamento estatístico.

A transformação é: $Y^* = \frac{Y^\lambda – 1}{\lambda}$

quando: $\lambda \neq 0$

E quando: $\lambda = 0$

usa-se: $Y^* = \ln(Y)$

A ideia é testar vários valores de $\lambda$ λ, por exemplo: $[-2,\ -1,\ -0{,}5,\ 0,\ 0{,}5,\ 1,\ 2]$

e escolher aquele que maximiza a aderência de $Y^*$ à distribuição normal.

Exemplo de interpretação:

λ = 1 → praticamente não transforma Y
λ = 0,5 → raiz quadrada de Y
λ = 0 → log(Y)
λ = -1 → inverso de Y

Samanta Lekecinskas – Data Science e Machine Learning

Data Science e Machine Learning

Regressão não linear simples

Exemplo de Teste estatístico para verificar se os resíduos estão aderentes a normalidade.

Hipóteses do teste

Interpretação do p-valor

Se:

Se:

Normalização/Transformação box-cox (transformação da variável dependente)

Deixe um comentário Cancelar resposta

Exemplo de Teste estatístico para verificar se os resíduos estão aderentes a normalidade.

Hipóteses do teste

Interpretação do p-valor

Se:

Se:

Normalização/Transformação box-cox (transformação da variável dependente)

Compartilhe isso:

Relacionado

Deixe um comentário Cancelar resposta