# Exemplo geral modelo de Árvore de regressão

Neste exemplo iremos desenvolver um modelo de Particionamento Recursivo (Árvore de decisão) para um exemplo de regressão.

## Carregar pacotes

In [None]:
library(tidyverse)
library(magrittr)
library(rpart)
library(visNetwork)

## Carregar dados

In [3]:
dados_spline <- read_csv(file = "/home/vm-data-science/dados/dados_spline.csv")

Parsed with column specification:
cols(
  x = col_double(),
  y = col_double()
)


In [4]:
dados_spline %>% 
    head()

x,y
0.08216883,0.19462317
0.08413394,0.07939476
0.14659427,0.06655269
0.17459164,-0.05863454
0.22330805,-0.15040834
0.29192236,0.01899571


## Gráfico dos dados

In [None]:
dados_spline %>%
  ggplot( aes( x = x, y = y) ) + 
  geom_point( shape = 1, size = 3 )

## Ajustando um modelo de regressão

Neste exemplo, vemos um ajuste de regressão aos dados.

In [None]:
dados_spline %>% 
  ggplot( aes( x = x, y = y) ) + 
  geom_point( shape = 1, size = 3 ) +
  geom_smooth( method = lm, se = FALSE, size = 2 )

Você acha que os dados estão bem ajustados?

## Treina modelo de Árvore de decisão

Iremos usar a função rpart

In [7]:
modelo_arvore_regressão <- rpart( y ~ x, 
                                  data = dados_spline )

In [None]:
# Não da pra entender nada!!!, vamos ajustar
summary( modelo_arvore_regressão )

### Gráfico dos dados com modelo de Árvore de decisão

In [None]:
dados_spline %>% 
  mutate( y_pred = predict(modelo_arvore_regressão) ) %>% 
  ggplot( aes( x = x ) ) +
  geom_point( aes( y = y ), shape = 1, size = 3 ) +
  geom_line( aes( y = y_pred ), colour = 'royalblue3', size = 2 )

Não é o melhor ajuste, mas apresenta melhor desenho de que o modelo de regressão linear.

### Desenho da Árvore

In [None]:
modelo_arvore_regressão %>% 
  visTree(., rules = TRUE,
          fallenLeaves = TRUE,
          width = "100%",
          height = "850" ) %>% 
  visOptions(highlightNearest = TRUE, 
             nodesIdSelection = FALSE) %>% 
  visLegend( width = 0.1 )

### Obtenção das regras

In [12]:
source('/home/vm-data-science/R_scripts/tree_rules.R')

In [None]:
tree_rules(modelo_arvore_regressão, model_type = 'regression')

### Ajustando as regras

IF  [x]>=3.153 AND [x]>=3.53 AND [x]< 5.85 THEN -0.803859793190476

ELSEIF [x]>=3.153 AND [x]>=3.53 AND [x]>=5.85 THEN -0.291492582527333

ELSEIF [x]>=3.153 AND [x]< 3.53 THEN -0.155720793697166

ELSEIF [x]< 3.153 AND [x]>=2.535 THEN 0.309722697556229 

ELSEIF [x]< 3.153 AND [x]< 2.535 AND [x]< 0.3793 THEN 0.0966041945562344

ELSEIF [x]< 3.153 AND [x]< 2.535 AND [x]>=0.3793 THEN 0.836111424982046

END