In [3]:
# 1 - Carregar e Explorar o Dataset
from sklearn.datasets import load_breast_cancer
import pandas as pd

# a. Carregar o dataset
data = load_breast_cancer()

# b. Verificar as features e a variável target
print(f"As Features (atributos) são: {data.feature_names}")
print(f"As Target (alvo) são: {data.target_names}")

# Converter para DataFrame para visualização mais fácil
df = pd.DataFrame(data.data, columns=data.feature_names)
df['target'] = data.target

# c. Visualizar as primeiras amostras
print(df.head())

#----

# ----- 2. Pre-processamento dos Dados -----
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Separar features (X) e target (y)
X = df.drop('target', axis=1)
y = df['target']

# a. Dividir o dataset em treino (70%) e teste (30%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# b. Verificar valores nulos
print(f"Valores nulos no dataset: \n{df.isnull().sum()}")

# c. Normalizar os dados para garantir a mesma escala
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

#----

# ----- 3. Treinar o Modelo de Classificacao (Apenas o Random Forest aqui, mas poderia ser utilizado Arvore de Decisao tambem por exemplo) -----

from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix

# a. Treinar o modelo RandomForest
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# b. Fazer previsões
y_pred = model.predict(X_test)

#----

# ----- 4. Avaliacao dos Modelos -----

# a. Matriz de confusão
print("\nMatriz de Confusão:")
print(confusion_matrix(y_test, y_pred))

# b. Classification Report
print("\nRelatório de Classificação:")
print(classification_report(y_test, y_pred))


#----

As Features (atributos) são: ['mean radius' 'mean texture' 'mean perimeter' 'mean area'
 'mean smoothness' 'mean compactness' 'mean concavity'
 'mean concave points' 'mean symmetry' 'mean fractal dimension'
 'radius error' 'texture error' 'perimeter error' 'area error'
 'smoothness error' 'compactness error' 'concavity error'
 'concave points error' 'symmetry error' 'fractal dimension error'
 'worst radius' 'worst texture' 'worst perimeter' 'worst area'
 'worst smoothness' 'worst compactness' 'worst concavity'
 'worst concave points' 'worst symmetry' 'worst fractal dimension']
As Target (alvo) são: ['malignant' 'benign']
   mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
0        17.99         10.38          122.80     1001.0          0.11840   
1        20.57         17.77          132.90     1326.0          0.08474   
2        19.69         21.25          130.00     1203.0          0.10960   
3        11.42         20.38           77.58      386.1          0.