# **CASE: EPIDEMIOLOGIA**

---

### Leitura da base de dados

In [None]:
dados_epidemiologia <- read.table(file   = "Epidemiologia.txt",
                                  sep    = "\t",
                                  header = TRUE)

### Visualização da base de dados

In [None]:
View(dados_epidemiologia)

### Análise exploratória breve

In [None]:
# Medidas resumo
summary(dados_epidemiologia)

In [None]:
# Histograma do volume de chuva em janeiro
hist(dados_epidemiologia$VOLUME_CHUVA_JAN_MM,
     main = "Volume de chuva em janeiro",
     col = "darkturquoise",
     border = "white",
     xlab = "Volume de chuva (mm)",
     ylab = "Frequência",
     breaks = 10)

In [None]:
# Histograma da qtde. de casos de dengue em fevereiro
hist(dados_epidemiologia$QTDE_CASOS_DENGUE_FEV,
     main = "Qtde. de casos de dengue em fevereiro",
     col = "darkturquoise",
     border = "white",
     xlab = "Qtde. de casos de dengue",
     ylab = "Frequência",
     breaks = 10)

### Análise bivariada: variável resposta vs. variáveis explicativas

In [None]:
# Gráfico de dispersão
plot(x    = dados_epidemiologia$VOLUME_CHUVA_JAN_MM,
     y    = dados_epidemiologia$QTDE_CASOS_DENGUE_FEV,
     pch  = 19,
     col  = "darkturquoise",
     xlab = "Volume de chuva (mm)",
     ylab = "Qtde. de casos de dengue",
     main = "Qtde. de casos de dengue vs. volume de chuva")

In [None]:
# Coeficiente de correlação
cor(dados_epidemiologia$VOLUME_CHUVA_JAN_MM,
    dados_epidemiologia$QTDE_CASOS_DENGUE_FEV)

### Modelo de regressão linear simples

In [None]:
# Comando auxiliar para para omitir notação científica nos p-valores e controlar largura dos outputs na tela do Colab
options(scipen = 999, width = 200)

In [None]:
# Ajuste do modelo
regressao <- lm(QTDE_CASOS_DENGUE_FEV ~ VOLUME_CHUVA_JAN_MM,
                data = dados_epidemiologia)

summary(regressao)

### Intervalos de confiança

In [None]:
# Intercepto (beta 0)
print("Limite inferior")
as.numeric(regressao$coefficients[1] - 1.96 * coef(summary(regressao))[1, "Std. Error"])
print("Limite superior")
as.numeric(regressao$coefficients[1] + 1.96 * coef(summary(regressao))[1, "Std. Error"])

In [None]:
# Ângulo (beta 1)
print("Limite inferior")
as.numeric(regressao$coefficients[2] - 1.96 * coef(summary(regressao))[2, "Std. Error"])
print("Limite superior")
as.numeric(regressao$coefficients[2] + 1.96 * coef(summary(regressao))[2, "Std. Error"])

### Gráfico de dispersão com reta ajustada

In [None]:
plot(x    = dados_epidemiologia$VOLUME_CHUVA_JAN_MM,
     y    = dados_epidemiologia$QTDE_CASOS_DENGUE_FEV,
     pch  = 19,
     col  = "darkturquoise",
     xlab = "Volume de chuva (mm)",
     ylab = "Qtde. de casos de dengue",
     main = "Qtde. de casos de dengue vs. volume de chuva")
points(abline(regressao,
              col = "red"))

### Qualidade de ajuste

In [None]:
# Coeficiente de determinação (R²)
summary(regressao)$r.squared

In [None]:
# MAE
sum(abs(regressao$residuals))/nrow(dados_epidemiologia)

In [None]:
# MAPE
sum(abs(regressao$residuals/dados_epidemiologia$QTDE_CASOS_DENGUE_FEV))/nrow(dados_epidemiologia)

### Análise de resíduos

In [None]:
# Histograma dos resíduos
hist(x      = regressao$residuals,
     main   = "Histograma dos resíduos",
     col    = "darkturquoise",
     border = "white")

In [None]:
# QQ plot dos resíduos
qqnorm(y    = regressao$residuals,
       main = "QQ-plot dos resíduos",
       col  = "darkturquoise",
       pch  = 19)
qqline(y    = regressao$residuals,
       col  = "red")

In [None]:
# Resíduos vs. volume de chuva
plot(x    = dados_epidemiologia$VOLUME_CHUVA_JAN_MM,
     y    = regressao$residuals,
     pch  = 19,
     col  = "darkturquoise",
     xlab = "Volume de chuva (mm)",
     ylab = "Resíduos",
     main = "Resíduos vs. volume de chuva")

### Exemplo de uso (aplicação) do modelo

In [None]:
# Criação de base de dados com uma nova cidade, com 280mm de chuva em janeiro
# Obs.: o nome de coluna deve ser idêntico ao da base utilizada para construção do modelo ("VOLUME_CHUVA_JAN_MM")
novos_dados <- data.frame(VOLUME_CHUVA_JAN_MM = c(280))

In [None]:
# Aplicação do modelo
novos_dados$VOLUME_CHUVA_JAN_MM_PREDITO <- predict(regressao, novos_dados)
View(novos_dados)