# Pacotes

**Pacotes**

Você começa importando as bibliotecas necessárias:

**pandas**: Para manipulação e análise de dados.

**train_test_split** (de sklearn.model_selection): Para dividir o dataset em conjuntos de treino e teste.

**StandardScaler** (de sklearn.preprocessing): Normaliza os dados para melhorar o desempenho do modelo.

**LinearRegression** (de sklearn.linear_model): Para a aplicação de Regressão Linear.

**MLPRegressor** (de sklearn.neural_network): Para criar e treinar um modelo de Rede Neural.

**mean_squared_error** (de sklearn.metrics): Para calcular o erro quadrático médio (MSE), usado na avaliação dos modelos.

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.neural_network import MLPRegressor


# Carrega Dataset

**Carregar Dataset**

Carrega os dados de câncer de mama a partir de um arquivo CSV:

**pd.read_csv**('BreastCancer.csv', sep=";"): Lê o arquivo BreastCancer.csv com delimitador de ponto e vírgula. Esse dataset inclui informações sobre tumores, como características das células e a classificação do tumor (malignant ou benign).

In [None]:
# Carregar os dados
data = pd.read_csv('BreastCancer.csv',sep=";")

In [None]:
data

Unnamed: 0,Id,Cl.thickness,Cell.size,Cell.shape,Marg.adhesion,Epith.c.size,Bare.nuclei,Bl.cromatin,Normal.nucleoli,Mitoses,Class
0,1000025,5,1,1,1,2,1.0,3,1,1,benign
1,1002945,5,4,4,5,7,10.0,3,2,1,benign
2,1015425,3,1,1,1,2,2.0,3,1,1,benign
3,1016277,6,8,8,1,3,4.0,3,7,1,benign
4,1017023,4,1,1,3,2,1.0,3,1,1,benign
...,...,...,...,...,...,...,...,...,...,...,...
694,776715,3,1,1,1,3,2.0,1,1,1,benign
695,841769,2,1,1,1,2,1.0,1,1,1,benign
696,888820,5,10,10,3,7,3.0,8,10,2,malignant
697,897471,4,8,6,4,3,4.0,10,6,1,malignant


# Pré-processamento

**Pré-processamento**

Esta etapa prepara os dados para análise e modelagem:

Remover dados ausentes: data.dropna() remove linhas com valores nulos.
Mapeamento de Classes: Converte a coluna Class para valores binários. Define a classe malignant como 1 e benign como 0, facilitando a interpretação e o treinamento dos modelos.

In [None]:
data = data.dropna()

In [None]:
categoria_alvo = 'malignant'  # Categoria que desejamos transformar em 1
data['Class'] = data['Class'].replace({categoria_alvo: 1, 'benign': 0})

# Train Test Split

**Separação de Features e Variável Alvo (Train Test Split)**

Separação das variáveis independentes e da variável alvo Class:

Definição de X e y: X contém as features, e y contém a variável alvo Class.
Divisão do dataset: **train_test_split**(X, y, test_size=0.3, random_state=42) divide os dados em 70% para treino e 30% para teste, mantendo os resultados consistentes com random_state=42.

In [None]:
# Separar features e variável alvo
X = data.drop(['Class'], axis=1)
y = data['Class']

In [None]:
# Dividir em conjunto de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


# Normaliza

In [None]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Regressão Linear

**Regressão Linear**

Treina um modelo de Regressão Linear para prever a classe do tumor:

**LinearRegression**(): Instancia o modelo de Regressão Linear.
Treinamento: lm.fit(X_train_scaled, y_train) ajusta o modelo aos dados de treino.

**Predições e Avaliação**: O modelo prevê as classes no conjunto de teste com lm.predict(X_test_scaled), e o erro quadrático médio é calculado com mean_squared_error para avaliar a precisão das previsões.

In [None]:
# Regressão Linear
lm = LinearRegression()
lm.fit(X_train_scaled, y_train)
lm_predictions = lm.predict(X_test_scaled)
lm_mse = mean_squared_error(y_test, lm_predictions)

# Rede Neural

**Rede Neural**

Treina um modelo de Rede Neural para prever a classe do tumor:

**MLPRegressor**(hidden_layer_sizes=(5, 4, 2, 1), random_state=42, max_iter=1000): Cria uma rede neural com quatro camadas escondidas de tamanhos 5, 4, 2 e 1 neurônios. random_state=42 assegura que os resultados sejam reprodutíveis, e max_iter=1000 define o número máximo de iterações de treinamento.
Treinamento: nn.fit(X_train_scaled, y_train) ajusta a rede neural aos dados de treino.

Predições e Avaliação: O modelo gera predições para o conjunto de teste com nn.predict(X_test_scaled), e o erro quadrático médio é calculado para avaliar o desempenho.

In [None]:
# Rede Neural
nn = MLPRegressor(hidden_layer_sizes=(5, 4, 2, 1), random_state=42, max_iter=1000)
nn.fit(X_train_scaled, y_train)
nn_predictions = nn.predict(X_test_scaled)
nn_mse = mean_squared_error(y_test, nn_predictions)

**Resultados**

Imprime o MSE para ambos os modelos:

Avaliação da Regressão Linear: O erro quadrático médio é apresentado, indicando a precisão do modelo.
Avaliação da Rede Neural: O MSE da rede neural mostra que o modelo obteve menor erro em comparação com a Regressão Linear, sugerindo que a rede neural se ajustou melhor aos dados neste caso.

In [None]:
print("Regressão Linear - MSE:", lm_mse)
print("Rede Neural - MSE:", nn_mse)

Regressão Linear - MSE: 0.0492323795527988
Rede Neural - MSE: 0.031092809860219204
