Resumo tipos de gráficos

Bibliotecas utilizadas:

BoxPlot: muito utilizado para identificar outliers univariados isso é feito no que chamamos de unidade inter quartil.

Mostra também as proporções de Quartis, a média, valor minimo.

No exemplo abaixo o Upper fence, é o valor da ultima observação da distribuição da variável que não é considerada outliers por esse critério boxplot.

Os pontos acima são considerados outliers conforme critério do boxplot.

AIQ (amplitude inter quartil) ou IQR = Q3 – Q1 (é a diferença entre o quartil 3 e o quartil 1, ou seja é o tamanho da caixa).

Limites dos valores considerados outliers:

  • A identificação dos outliers no boxplot na parte inferior da distribuição = Q1 – 1,5 * AIC, ou seja tudo que estiver abaixo desse valor é considerado outliers.
  • A identificação dos outliers no boxplot na parte superior da distribuição = Q3 + 1,5 * AIC, ou seja tudo que estiver acima desse valor é considerado outliers.

PairPlot: mostar o histograma e o scatterplot, a relação entre essas variáveis.

Abaixo a relação positiva, se traçar um reta ela tende a crescer positivamente, para cima.

Adicionando uma variável categorica, no grafacio abaixo PairPlot, agora ele adicionou um gráfico de densidade e não mais um de histograma.

Streamlit, Dashboard e virtualenv

O virtualenv seria uma VM na sua maquina, ou em um host, para centralizar o projeto de ML , ajudando na administração, gerenciamento e compartilhamento.

Para criar uma virtualenv é simples (utilizo nesse caso tambem o vscode/terminal):

--Criar ambiente virtual - virtualenv
mkdir venv_streamlit
cd venv_streamlit
$ sudo apt-get install -y python3-pip
$ sudo apt-get install build-essential libssl-dev libffi-dev python3-dev
$ sudo apt-get install -y python3-venv

--criar novo ambiente-virtual chamado ambiente-virtual
python3 -m venv ambiente-virtual

--abrir ambiente-virtual
cd ~/Área de Trabalho/venv_streamlit/ambiente-virtual/bin
source activate

--fechar
deactivate