# Aula11_Analise_discriminante_e_ACP

- É similar à ACP/ACM (baseada em redução de dimensionalidade), mas se difere por maximizar a separação entre as categorias (que se agrupam ao traçar-se uma ou mais linhas divisórias médias).

- ACP reduz dimensionalidade para se analisar a covariância (pergunta respondida por ACP: quais as variáveis com maior variação em relação ao conjunto dos dados/centróide?); ALD reduz dimensionalidade para se analisar variância entre as categorias (pergunta respondida por ALD: qual a distância estabelecida entre uma variável em relação à outra variável?)

- ALD supõe NORMALIDADE, diferente da ACP.

#### FÓRMULA

LDA = máxima variância entre as categorias calculadas com razão de μcategoria1 (média da categoria 1) menos μcategoria2 (média da categoria 2) ao quadrado por variância da categoria1  mais variância da categoria2 .


LDA =   (μcategoria1 - μcategoria2)^2 
         /
        (variância da categoria 1 + variância da categoria 2) 

In [None]:
library(tidyverse)
library(FactoMineR)
library(caret)
library(MASS)
library(stats)
library(IRdisplay)

In [None]:
df <- read_csv("Aula10_analise_discrimin.csv")
df

#### TREINANDO AS VARIÁVEIS

In [None]:
set.seed(123)
training.samples <- df$status_sec %>%
  createDataPartition(p = 0.8, list = FALSE)
train.data <- df[training.samples, ]
test.data <- df[-training.samples, ]

training.samples

train.data

test.data



#### PRÉ-PROCESSAMENTO DOS PARÂMETROS E NORMALIZANDO OS DADOS

In [None]:
preproc.param <- train.data %>% 
  preProcess(method = c("center", "scale"))

train.transformed <- preproc.param %>% predict(train.data)

test.transformed <- preproc.param %>% predict(test.data)

preproc.param

train.transformed

test.transformed

### LDA DE FATO!!!

1. AJUSTE DE MODELO
2. PRODUÇÃO DE PREDITORES
3. ACURÁCIA DO MODELO


#### 1. AJUSTE DE MODELO

In [None]:
modelo <- lda(status_sec~., data = train.transformed)
modelo
plot(modelo)

#### 2. PRODUÇÃO DE PREDITORES

In [None]:
predictions <- modelo %>% predict(test.transformed)
names(predictions)
head(predictions$class, 6)
head(predictions$posterior, 6)
head(predictions$x, 3) 

#### 3. ACURÁCIA DO MODELO

In [None]:
mean(predictions$class==test.transformed$status_sec)

#### 4. GRÁFICO

In [None]:
lda.data <- cbind(train.transformed, predict(modelo)$x)
ggplot(lda.data, aes(LD1, LD2)) +
  geom_point(aes(color = status_sec))

### COMPARAÇÃO COM O ACP:

In [None]:
matacp <- df[, 3:6]
labacp <- df[, 2]
analacp <- prcomp(matacp,
                 center = TRUE,
                 scale. = TRUE)

print(analacp)

Observação sobre as dimensões. Quais contribuem mais para var expl:

In [None]:
plot(analacp, type = "l")
summary(analacp)

Por fim, comparação dos resultados com a LDA em gráfico:

In [None]:
display_png(file="Aula10_resultado_graf_ACP.png")