#**Modelos Não-Lineares**
Os modelos não-lineares são uma classe de algoritmos de aprendizado de máquina que conseguem capturar relações complexas e não-lineares entre as variáveis independentes (features) e a variável dependente (target). Diferentemente dos modelos lineares, que assumem uma relação linear entre as variáveis, os modelos não-lineares utilizam técnicas avançadas para modelar interações e padrões mais intricados nos dados.

**Características dos Modelos Não-Lineares**
- **Capacidade de Capturar Relações Complexas:** Podem modelar interações e dependências não-lineares entre as variáveis.
- **Flexibilidade:** Adequados para uma ampla variedade de problemas e tipos de dados.
- **Alta Performance:** Frequentemente alcançam melhores resultados em tarefas complexas comparados aos modelos lineares.
- **Escalabilidade:** Alguns modelos não-lineares, especialmente redes neurais profundas, podem escalar bem com grandes conjuntos de dados.
Limitações
- **Complexidade Computacional:** Podem exigir maior poder de processamento e memória.
- **Interpretação Difícil:** Modelos como redes neurais são frequentemente considerados "caixas-pretas", dificultando a interpretação das decisões.
- **Risco de Overfitting:** A alta flexibilidade pode levar ao ajuste excessivo aos dados de treinamento, prejudicando a generalização.
- **Necessidade de Hiperparâmetros:** Muitos modelos não-lineares possuem múltiplos hiperparâmetros que precisam ser cuidadosamente ajustados para otimizar o desempenho.

In [1]:
# Importando bibliotecas necessárias
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report

# Importando modelos não-lineares do scikit-learn
from sklearn.svm import SVC, SVR
from sklearn.neighbors import KNeighborsClassifier, KNeighborsRegressor
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import StandardScaler

# Importando bibliotecas para Redes Neurais
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM, Conv1D, Flatten, SimpleRNN
from tensorflow.keras.utils import to_categorical

# Carregando o dataset breast_cancer
data = load_breast_cancer()
X = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.Series(data.target)

# Dividindo o dataset em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Normalizando os dados para modelos que requerem
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Função para treinar, prever e avaliar modelos de scikit-learn
def train_evaluate_sklearn_model(model, model_name, X_train, X_test, y_train, y_test):
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    print(f"### {model_name}")
    print("Acurácia:", accuracy_score(y_test, y_pred))
    print(classification_report(y_test, y_pred))



##**Support Vector Classifier (SVC)**
**Funcionamento**
O Support Vector Classifier (SVC) é uma implementação do algoritmo de Máquinas de Vetores de Suporte para tarefas de classificação. O SVC busca encontrar o hiperplano que melhor separa as classes no espaço de características, maximizando a margem entre as classes. Com o uso de kernels, o SVC pode transformar os dados para torná-los separáveis linearmente em um espaço de alta dimensão.

**Pontos Fortes**
- Eficiente em Espaços de Alta Dimensão: Funciona bem mesmo com um grande número de features.
- Flexível com Kernels: Através de diferentes funções de kernel (linear, polinomial, RBF, etc.), pode modelar relações não-lineares complexas.
- Robustez a Overfitting: Particularmente eficaz em situações onde há uma clara separação entre as classes.

**Pontos Fracos**
- Complexidade Computacional: Pode ser lento em grandes conjuntos de dados.
- Escolha do Kernel: A performance depende fortemente da escolha e parametrização do kernel.
- Sensível a Escalas de Dados: Requer pré-processamento adequado, como normalização ou padronização das features.

In [2]:
# 1. Support Vector Classifier (SVC)
svc = SVC(kernel='rbf', C=1, gamma='scale', random_state=42)
train_evaluate_sklearn_model(svc, "Support Vector Classifier (SVC)", X_train_scaled, X_test_scaled, y_train, y_test)


### Support Vector Classifier (SVC)
Acurácia: 0.9766081871345029
              precision    recall  f1-score   support

           0       0.97      0.97      0.97        63
           1       0.98      0.98      0.98       108

    accuracy                           0.98       171
   macro avg       0.97      0.97      0.97       171
weighted avg       0.98      0.98      0.98       171



##**Support Vector Regression (SVR)**
**Funcionamento**
O Support Vector Regression (SVR) é a versão de regressão das Máquinas de Vetores de Suporte. O SVR tenta prever valores contínuos, encontrando uma função que mapeia as entradas para as saídas com a menor margem de erro possível. Assim como o SVC, o SVR pode utilizar kernels para capturar relações não-lineares.

**Pontos Fortes**
- Capacidade de Modelar Relações Complexas: Com o uso de kernels, pode capturar padrões não-lineares nos dados.
- Robustez a Outliers: Minimiza a influência de outliers através da utilização de margens de tolerância.
- Flexibilidade com Hiperparâmetros: Possui parâmetros que permitem ajustar a complexidade do modelo e a tolerância ao erro.

**Pontos Fracos**
- Computacionalmente Intensivo: Pode ser lento para conjuntos de dados grandes.
- Escolha do Kernel e Hiperparâmetros: Requer uma cuidadosa seleção e ajuste para obter o melhor desempenho.
Escalabilidade Limitada: Menos adequado para grandes volumes de dados comparado a outros modelos de regressão.

In [3]:
# 4. Support Vector Regression (SVR) - Aplicado para Ilustração (Regressão)
# Como o dataset é de classificação, transformaremos o target para uma tarefa de regressão
svr = SVR(kernel='rbf', C=1, gamma='scale')
svr.fit(X_train_scaled, y_train)
y_pred_svr = svr.predict(X_test_scaled)
# Avaliação usando R²
from sklearn.metrics import r2_score
print("### Support Vector Regression (SVR)")
print("R² Score:", r2_score(y_test, y_pred_svr))


### Support Vector Regression (SVR)
R² Score: 0.8468029272190664


##**K-Nearest Neighbors (KNN)**
**Funcionamento**
O K-Nearest Neighbors (KNN) é um algoritmo de aprendizado de máquina baseado em instâncias, utilizado para tarefas de classificação e regressão. Para prever a classe ou valor de uma nova amostra, o KNN considera as k amostras mais próximas no conjunto de treinamento e realiza uma votação (para classificação) ou média (para regressão).

**Pontos Fortes**
- Simplicidade e Facilidade de Implementação: Fácil de entender e implementar.
- Flexibilidade: Pode ser usado para tarefas de classificação e regressão.
- Não Paramétrico: Não faz suposições sobre a distribuição dos dados.

**Pontos Fracos**
- Custo Computacional em Predição: Pode ser lento para grandes conjuntos de dados durante a fase de predição.
- Sensível à Escolha de k e Métrica de Distância: A performance depende fortemente do valor de k e da métrica de distância utilizada.
- Desempenho com Dados Irregulares ou de Alta Dimensão: Pode sofrer com a maldição da dimensionalidade e dados não balanceados.

In [4]:
# 2. K-Nearest Neighbors (KNN)
knn = KNeighborsClassifier(n_neighbors=5)
train_evaluate_sklearn_model(knn, "K-Nearest Neighbors (KNN)", X_train, X_test, y_train, y_test)


### K-Nearest Neighbors (KNN)
Acurácia: 0.9590643274853801
              precision    recall  f1-score   support

           0       0.98      0.90      0.94        63
           1       0.95      0.99      0.97       108

    accuracy                           0.96       171
   macro avg       0.96      0.95      0.96       171
weighted avg       0.96      0.96      0.96       171



 ##**Artificial Neural Networks (ANN)**
**Funcionamento**
As Artificial Neural Networks (ANN) são modelos inspirados no funcionamento do cérebro humano, compostos por camadas de neurônios artificiais interconectados. Cada neurônio realiza uma combinação linear das entradas e aplica uma função de ativação não-linear. As ANNs são treinadas ajustando os pesos das conexões para minimizar a função de perda através de técnicas como o backpropagation.

**Pontos Fortes**
- Capacidade de Capturar Relações Complexas e Não-Lineares: Adequadas para uma vasta gama de problemas, desde classificação até geração de dados.
- Flexibilidade: Pode ser adaptada para diferentes tipos de dados e arquiteturas, como redes profundas.
- Escalabilidade com Dados e Computação: Melhoram o desempenho com o aumento da quantidade de dados e poder computacional.

**Pontos Fracos**
- Requerimento de Grandes Quantidades de Dados: Desempenham melhor com conjuntos de dados extensos.
- Complexidade Computacional e de Implementação: Podem ser difíceis de treinar e ajustar.
- Propensão a Overfitting: Necessitam de técnicas de regularização para evitar o ajuste excessivo.

In [5]:

# 3. Artificial Neural Networks (ANN) - MLPClassifier
mlp = MLPClassifier(hidden_layer_sizes=(100,), max_iter=1000, random_state=42)
train_evaluate_sklearn_model(mlp, "Artificial Neural Network (ANN) - MLPClassifier", X_train_scaled, X_test_scaled, y_train, y_test)





### Artificial Neural Network (ANN) - MLPClassifier
Acurácia: 0.9824561403508771
              precision    recall  f1-score   support

           0       0.98      0.97      0.98        63
           1       0.98      0.99      0.99       108

    accuracy                           0.98       171
   macro avg       0.98      0.98      0.98       171
weighted avg       0.98      0.98      0.98       171



##**Long Short-Term Memory (LSTM)**
**Funcionamento**
As Long Short-Term Memory (LSTM) são um tipo de Recurrent Neural Network (RNN) projetadas para capturar dependências de longo prazo em dados sequenciais. As LSTMs possuem células de memória que controlam o fluxo de informações através de portas (entrada, esquecimento e saída), permitindo que a rede mantenha informações relevantes por longos períodos.

**Pontos Fortes**
- Capacidade de Capturar Dependências de Longo Prazo: Adequadas para dados sequenciais onde a ordem e o contexto são importantes.
- Redução do Problema de Desvanecimento do Gradiente: As estruturas de portas ajudam a preservar informações relevantes durante o treinamento.
- Flexibilidade em Diferentes Tarefas Sequenciais: Utilizadas em tradução automática, reconhecimento de fala, análise de séries temporais, entre outros.

**Pontos Fracos**
- Complexidade e Tempo de Treinamento: Mais complexas e demoradas para treinar comparadas a RNNs simples.
- Requerimentos de Dados e Computação: Necessitam de grandes quantidades de dados e poder computacional.
- Desafios de Implementação: Mais difíceis de configurar e ajustar corretamente.


In [17]:
# 7. Long Short-Term Memory (LSTM) - Aplicado para Ilustração
# Adaptando os dados para LSTM (necessita de sequências)
# Como os dados são tabulares, vamos tratar cada feature como uma "sequência" de comprimento 1

from keras.models import Sequential
from keras.layers import LSTM, Dense, Input
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, precision_score, recall_score, f1_score, roc_auc_score

# Adaptando os dados para LSTM (necessita de sequências)
# Como os dados são tabulares, tratamos cada feature como uma "sequência" de comprimento 1
X_train_lstm = X_train_scaled.reshape((X_train_scaled.shape[0], 1, X_train_scaled.shape[1]))
X_test_lstm = X_test_scaled.reshape((X_test_scaled.shape[0], 1, X_test_scaled.shape[1]))

# Definindo o modelo LSTM
lstm_model = Sequential()
lstm_model.add(Input(shape=(X_train_lstm.shape[1], X_train_lstm.shape[2])))
lstm_model.add(LSTM(32))
lstm_model.add(Dense(2, activation='softmax'))

lstm_model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Treinando o modelo LSTM
lstm_model.fit(X_train_lstm, y_train_cat, epochs=50, batch_size=16, verbose=0)

# Avaliando o modelo LSTM
lstm_loss, lstm_accuracy = lstm_model.evaluate(X_test_lstm, y_test_cat, verbose=0)
print("\n### Long Short-Term Memory (LSTM)")
print("Acurácia:", lstm_accuracy)

# Fazendo previsões
y_pred_lstm = lstm_model.predict(X_test_lstm)
y_pred_lstm_classes = y_pred_lstm.argmax(axis=1)
y_test_cat_classes = y_test_cat.argmax(axis=1)

# Avaliadores do scikit-learn
print("\n### Avaliação com métricas adicionais")
print("Acurácia:", accuracy_score(y_test_cat_classes, y_pred_lstm_classes))
print(classification_report(y_test_cat_classes, y_pred_lstm_classes))

# Matriz de Confusão
print("Matriz de Confusão:")
print(confusion_matrix(y_test_cat_classes, y_pred_lstm_classes))

# Precisão, Revocação e F1-Score
print("Precisão:", precision_score(y_test_cat_classes, y_pred_lstm_classes, average='weighted'))
print("Revocação:", recall_score(y_test_cat_classes, y_pred_lstm_classes, average='weighted'))
print("F1-Score:", f1_score(y_test_cat_classes, y_pred_lstm_classes, average='weighted'))

# AUC-ROC (se aplicável)
if lstm_model.output_shape[-1] == 2:  # Verifica se o modelo está em binário
    y_pred_lstm_proba = lstm_model.predict(X_test_lstm)[:, 1]
    print("AUC-ROC:", roc_auc_score(y_test_cat_classes, y_pred_lstm_proba))



### Long Short-Term Memory (LSTM)
Acurácia: 0.9707602262496948
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step

### Avaliação com métricas adicionais
Acurácia: 0.9707602339181286
              precision    recall  f1-score   support

           0       0.95      0.97      0.96        63
           1       0.98      0.97      0.98       108

    accuracy                           0.97       171
   macro avg       0.97      0.97      0.97       171
weighted avg       0.97      0.97      0.97       171

Matriz de Confusão:
[[ 61   2]
 [  3 105]]
Precisão: 0.9709250491883916
Revocação: 0.9707602339181286
F1-Score: 0.970807351651423
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step 
AUC-ROC: 0.9963256907701352


##**Convolutional Neural Networks (CNN)**
**Funcionamento**
As Convolutional Neural Networks (CNN) são uma classe de redes neurais projetadas para processar dados com uma grade topológica, como imagens. Utilizam camadas de convolução que aplicam filtros para extrair características espaciais locais, seguidas por camadas de pooling para reduzir a dimensionalidade e capturar características invariantes.

**Pontos Fortes**
- Excelentes para Processamento de Imagens e Dados Espaciais: Capturam eficientemente padrões locais e hierarquias de características.
- Redução de Parâmetros: Uso de filtros compartilhados reduz o número de parâmetros em comparação com redes totalmente conectadas.
- Capacidade de Generalização: Bom desempenho em tarefas de reconhecimento e classificação visual.

**Pontos Fracos**
- Desempenho Limitado em Dados Não-Espaciais: Menos eficaz para dados tabulares ou sequenciais.
- Requerimentos de Dados e Computação: Necessitam de grandes quantidades de dados e recursos computacionais para treinar.
- Complexidade de Arquitetura: Mais difíceis de projetar e ajustar corretamente para tarefas específicas.

In [18]:
# 8. Convolutional Neural Networks (CNN) - Aplicado para Ilustração


from keras.models import Sequential
from keras.layers import Conv2D, Flatten, Dense
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, precision_score, recall_score, f1_score, roc_auc_score

# Adaptando os dados para CNN (necessita de dados com dimensão espacial)
# Vamos tratar as features como uma "imagem" de 1 canal e altura 1
X_train_cnn = X_train_scaled.reshape((X_train_scaled.shape[0], 1, X_train_scaled.shape[1], 1))
X_test_cnn = X_test_scaled.reshape((X_test_scaled.shape[0], 1, X_test_scaled.shape[1], 1))

# Definindo o modelo CNN
cnn_model = Sequential()
cnn_model.add(Conv2D(32, kernel_size=(1, 2), activation='relu', input_shape=(1, X_train_cnn.shape[2], 1)))
cnn_model.add(Flatten())
cnn_model.add(Dense(16, activation='relu'))
cnn_model.add(Dense(2, activation='softmax'))

cnn_model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Treinando o modelo CNN
cnn_model.fit(X_train_cnn, y_train_cat, epochs=50, batch_size=16, verbose=0)

# Avaliando o modelo CNN
cnn_loss, cnn_accuracy = cnn_model.evaluate(X_test_cnn, y_test_cat, verbose=0)
print("\n### Convolutional Neural Network (CNN)")
print("Acurácia:", cnn_accuracy)

# Fazendo previsões
y_pred_cnn = cnn_model.predict(X_test_cnn)
y_pred_cnn_classes = y_pred_cnn.argmax(axis=1)
y_test_cat_classes = y_test_cat.argmax(axis=1)

# Avaliadores do scikit-learn
print("\n### Avaliação com métricas adicionais")
print("Acurácia:", accuracy_score(y_test_cat_classes, y_pred_cnn_classes))
print(classification_report(y_test_cat_classes, y_pred_cnn_classes))

# Matriz de Confusão
print("Matriz de Confusão:")
print(confusion_matrix(y_test_cat_classes, y_pred_cnn_classes))

# Precisão, Revocação e F1-Score
print("Precisão:", precision_score(y_test_cat_classes, y_pred_cnn_classes, average='weighted'))
print("Revocação:", recall_score(y_test_cat_classes, y_pred_cnn_classes, average='weighted'))
print("F1-Score:", f1_score(y_test_cat_classes, y_pred_cnn_classes, average='weighted'))

# AUC-ROC (se aplicável)
if cnn_model.output_shape[-1] == 2:  # Verifica se o modelo está em binário
    y_pred_cnn_proba = cnn_model.predict(X_test_cnn)[:, 1]
    print("AUC-ROC:", roc_auc_score(y_test_cat_classes, y_pred_cnn_proba))



  super().__init__(activity_regularizer=activity_regularizer, **kwargs)



### Convolutional Neural Network (CNN)
Acurácia: 0.9649122953414917
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 10ms/step

### Avaliação com métricas adicionais
Acurácia: 0.9649122807017544
              precision    recall  f1-score   support

           0       0.94      0.97      0.95        63
           1       0.98      0.96      0.97       108

    accuracy                           0.96       171
   macro avg       0.96      0.97      0.96       171
weighted avg       0.97      0.96      0.97       171

Matriz de Confusão:
[[ 61   2]
 [  4 104]]
Precisão: 0.9654113513100604
Revocação: 0.9649122807017544
F1-Score: 0.9650224422036399
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step 
AUC-ROC: 0.995296884185773


##**Recurrent Neural Networks (RNN)**
**Funcionamento**
As Recurrent Neural Networks (RNN) são redes neurais projetadas para processar sequências de dados, onde as conexões recorrentes permitem que informações de passos anteriores influenciem os atuais. São adequadas para tarefas que envolvem sequências temporais, como previsão de séries temporais, tradução de idiomas e reconhecimento de fala.

**Pontos Fortes**
- Capacidade de Processar Dados Sequenciais: Adequadas para tarefas onde a ordem e o contexto são importantes.
- Modelagem de Dependências Temporais: Capturam relações de dependência ao longo do tempo.
- Flexibilidade em Diferentes Tarefas Sequenciais: Utilizadas em tradução automática, análise de séries temporais, entre outros.

**Pontos Fracos**
- Problemas de Desvanecimento e Explosão do Gradiente: Dificuldades em capturar dependências de longo prazo.
- Desempenho Inferior em Comparação com LSTM/GRU: Menos eficazes em tarefas que requerem captura de dependências de longo prazo.
- Requerimentos de Tempo de Treinamento: Mais lentas para treinar devido às dependências sequenciais.

In [19]:
# 9. Recurrent Neural Networks (RNN) - Aplicado para Ilustração

from keras.models import Sequential
from keras.layers import SimpleRNN, Dense
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, precision_score, recall_score, f1_score, roc_auc_score

# Definindo o modelo RNN
rnn_model = Sequential()
rnn_model.add(SimpleRNN(32, input_shape=(X_train_lstm.shape[1], X_train_lstm.shape[2])))
rnn_model.add(Dense(2, activation='softmax'))

rnn_model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Treinando o modelo RNN
rnn_model.fit(X_train_lstm, y_train_cat, epochs=50, batch_size=16, verbose=0)

# Avaliando o modelo RNN
rnn_loss, rnn_accuracy = rnn_model.evaluate(X_test_lstm, y_test_cat, verbose=0)
print("\n### Recurrent Neural Network (RNN)")
print("Acurácia:", rnn_accuracy)

# Fazendo previsões
y_pred_rnn = rnn_model.predict(X_test_lstm)
y_pred_rnn_classes = y_pred_rnn.argmax(axis=1)
y_test_cat_classes = y_test_cat.argmax(axis=1)

# Avaliadores do scikit-learn
print("\n### Avaliação com métricas adicionais")
print("Acurácia:", accuracy_score(y_test_cat_classes, y_pred_rnn_classes))
print(classification_report(y_test_cat_classes, y_pred_rnn_classes))

# Matriz de Confusão
print("Matriz de Confusão:")
print(confusion_matrix(y_test_cat_classes, y_pred_rnn_classes))

# Precisão, Revocação e F1-Score
print("Precisão:", precision_score(y_test_cat_classes, y_pred_rnn_classes, average='weighted'))
print("Revocação:", recall_score(y_test_cat_classes, y_pred_rnn_classes, average='weighted'))
print("F1-Score:", f1_score(y_test_cat_classes, y_pred_rnn_classes, average='weighted'))

# AUC-ROC (se aplicável)
if rnn_model.output_shape[-1] == 2:  # Verifica se o modelo está em binário
    y_pred_rnn_proba = rnn_model.predict(X_test_lstm)[:, 1]
    print("AUC-ROC:", roc_auc_score(y_test_cat_classes, y_pred_rnn_proba))


  super().__init__(**kwargs)



### Recurrent Neural Network (RNN)
Acurácia: 0.9824561476707458
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 47ms/step

### Avaliação com métricas adicionais
Acurácia: 0.9824561403508771
              precision    recall  f1-score   support

           0       0.97      0.98      0.98        63
           1       0.99      0.98      0.99       108

    accuracy                           0.98       171
   macro avg       0.98      0.98      0.98       171
weighted avg       0.98      0.98      0.98       171

Matriz de Confusão:
[[ 62   1]
 [  2 106]]
Precisão: 0.9825842351205116
Revocação: 0.9824561403508771
F1-Score: 0.9824844109908538
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step 
AUC-ROC: 0.996766607877719
