# Modelos Baseados em Otimização
Notebook com os modelos de aprendizado supervisionado baseados em otimização, são utilizadas redes neurais e support vector machines, ambos métodos não interpretáveis.

In [1]:
# Importando bibliotecas
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.linear_model import SGDClassifier
from sklearn.svm import SVC
from sklearn.preprocessing import OneHotEncoder
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import *
import pandas as pd
import numpy as np

## Lendo os dados

In [2]:
df = pd.read_csv('https://raw.githubusercontent.com/ImagineDogs/TranstornosMentais/main/dados/df_cid10.csv')
table = df[['cid10_faixa', 'cid10_faixa_alta', 'cid10_seg_faixa','traumatismo',
 'prob_respiratorios',
 'avc',
 'convulsao',
 'has',
 'gravidez',
 'diabetes',
 'doenca_infecto']].loc[~df['cid10_faixa'].isnull()]
table = table.fillna('Sem')

## Preparação dos dados
Aqui é aplicado OneHotEncoder nos dados, de forma a representar numéricamente os dados categóricos utilizados na predição

In [3]:
X = table[['cid10_faixa', 'cid10_seg_faixa']]
encoder = OneHotEncoder()
X = encoder.fit_transform(X)
y = np.array(table['cid10_faixa_alta'])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Perceptron
O primeiro modelo a ser testado é o clássico perceptron, ou seja, uma rede neural composta de apenas um neurônio

In [4]:
clf = MLPClassifier(random_state=42, max_iter=300).fit(X_train, y_train)

In [5]:
y_pred = clf.predict(X_test)

In [6]:
acuracia = accuracy_score(y_pred, y_test)
acuracia

0.7414841849148418

O modelo perceptron encontrou uma acurácia bastante elevada nos dados, o perceptron lida bem com dados linearmente separáveis, o notebook com os agrupamentos corrobora essa informação, são encontrados principais grupos nos dados, que estão concentrados em pontos diferentes, de forma que uma reta pode separar os dados relativamente bem.

### Multi-Layer Perceptron [5, 5, 5]

In [7]:
clf = MLPClassifier([5,5,5],random_state=42, max_iter=1000).fit(X_train, y_train)

In [8]:
y_pred = clf.predict(X_test)

In [9]:
acuracia = accuracy_score(y_pred, y_test)
acuracia

0.7232360097323601

### Multi-Layer Perceptron [5]

In [10]:
clf = MLPClassifier([8], random_state=42, max_iter=1000).fit(X_train, y_train)

In [11]:
y_pred = clf.predict(X_test)

In [12]:
acuracia = accuracy_score(y_pred, y_test)
acuracia

0.7402676399026764

Com outras opções de arquitetura do modelo ele parece atingir uma acurácia parecida com a do perceptron, o que sugere que não é necessário um modelo mais complicado e que um simples perceptron já é capaz de classificar os dados de forma satisfatória.

### Modelo com regularização L1
Testando um modelo linear otimizado por descida do gradiente, especificamente utilizando penalidade l1, que gera esparsidade nos pesos das entradas, fazendo com que características não relevantes para o resultado sejam ignoradas.

In [19]:
clf = SGDClassifier(max_iter=1000, tol=1e-3, penalty='l1').fit(X_train, y_train)

In [20]:
y_pred = clf.predict(X_test)

In [21]:
acuracia = accuracy_score(y_pred, y_test)
acuracia

0.7274939172749392

Utilizando o modelo acima descobrimos que a acurácia é muito parecida com as anteriores, a interpretabilidade continua comprometida, pois não é possível identificar o quão relevantes as variáveis são depois do OneHotEncoding, já que os dados são transformados para um novo espaço de embeddings

## SVM
Finalmente, foi testado um modelo de Máquina de vetores de suporte

In [16]:
clf = SVC(kernel='rbf').fit(X_train, y_train)

In [17]:
y_pred = clf.predict(X_test)

In [18]:
acuracia = accuracy_score(y_pred, y_test)
acuracia

0.7414841849148418

O modelo SVM também encontrou uma acurácia parecida com os modelos anteriores, dessa forma todos os modelos atingiram um resultado semelhante, indicando que o uso de um modelo simples e rápido deve ser mais recomendado, já que o uso de modelos mais complexos não aumenta a acurácia de forma significativa.