# Clasificadores (RL, KNN, SVM) con scikit-learn

Este notebook presenta paso a paso: 1) importaciones, 2) carga y preparación de datos, 3) entrenamiento/evaluación de Regresión Logística, KNN y SVM, y 4) comparación de resultados. Incluye nota sobre la visualización de la matriz de confusión.


In [1]:

# 1. Importación de Librerías (Librerías Necesarias)
# Dataset y preprocesamiento
from sklearn import datasets
from sklearn.datasets import load_breast_cancer  # Dataset de práctica (scikit-learn)
from sklearn.model_selection import train_test_split  # División train/test

# Modelos
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC

# Evaluación y visualización
from sklearn.metrics import accuracy_score, confusion_matrix
import matplotlib.pyplot as plt  # Matplotlib
import seaborn as sns  # Seaborn
import pandas as pd


In [2]:
# 2. Carga y Preparación de la Base de Datos
# Carga del dataset de cáncer y definición de X (características) e Y (target)
cancer = load_breast_cancer()
X = cancer.data   # 30 características (descriptores del tumor)
Y = cancer.target # 569 etiquetas (0: benigno, 1: maligno)

# División del conjunto (70% train, 30% test)
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=42, stratify=Y)
X_train.shape, X_test.shape


((398, 30), (171, 30))

In [3]:
# 3. Implementación del Modelo: Regresión Logística (RL)
# Creación y ajuste del modelo
modelo_RL = LogisticRegression(solver='liblinear', max_iter=1000)
modelo_RL.fit(X_train, Y_train)

# Predicción y métricas
prediccion_RL = modelo_RL.predict(X_test)
AS_RL = accuracy_score(Y_test, prediccion_RL)
cm_RL = confusion_matrix(Y_test, prediccion_RL)
AS_RL


0.9415204678362573

In [4]:
# 4. Implementación del Modelo: K-Nearest Neighbors (KNN)
# Creación (K=3) y ajuste del modelo
modelo_KNN = KNeighborsClassifier(n_neighbors=3)
modelo_KNN.fit(X_train, Y_train)

# Predicción y métricas
prediccion_KNN = modelo_KNN.predict(X_test)
AS_KNN = accuracy_score(Y_test, prediccion_KNN)
cm_KNN = confusion_matrix(Y_test, prediccion_KNN)
AS_KNN


0.9181286549707602

In [5]:
# 5. Implementación del Modelo: Support Vector Machine (SVM)
# Creación (kernel polinomial, grado 2) y ajuste del modelo
modelo_SVM = SVC(kernel='poly', degree=2)
modelo_SVM.fit(X_train, Y_train)

# Predicción y métricas
prediccion_SVM = modelo_SVM.predict(X_test)
AS_SVM = accuracy_score(Y_test, prediccion_SVM)
cm_SVM = confusion_matrix(Y_test, prediccion_SVM)
AS_SVM


0.9064327485380117

In [6]:
# 6. Comparación de Resultados
print("Accuracy Regresión Logística:", AS_RL)
print("Accuracy KNN:", AS_KNN)
print("Accuracy SVM:", AS_SVM)

# Tabla comparativa opcional
pd.DataFrame({
    'Modelo': ['Regresión Logística', 'KNN (k=3)', 'SVM (poly, grado=2)'],
    'Accuracy': [AS_RL, AS_KNN, AS_SVM]
}).sort_values('Accuracy', ascending=False).reset_index(drop=True)


Accuracy Regresión Logística: 0.9415204678362573
Accuracy KNN: 0.9181286549707602
Accuracy SVM: 0.9064327485380117


Unnamed: 0,Modelo,Accuracy
0,Regresión Logística,0.94152
1,KNN (k=3),0.918129
2,"SVM (poly, grado=2)",0.906433


Nota sobre la Matriz de Confusión Gráfica

Para visualizar la matriz de confusión (con Seaborn/Matplotlib), puede usarse un heatmap como en el notebook original, enfocándose en ejes (estimado vs. verdadero) y cuadrantes (VP, FP, VN, FN). Ejemplo breve:

```python
plt.figure(figsize=(6, 4))
sns.heatmap(cm_RL, annot=True, fmt='d', cmap='Blues', cbar=False,
            xticklabels=['Benigno (0)', 'Maligno (1)'],
            yticklabels=['Benigno (0)', 'Maligno (1)'])
plt.ylabel('Etiqueta Estimada (Predicción)')
plt.xlabel('Etiqueta Verdadera')
plt.title('Matriz de Confusión - Regresión Logística')
plt.show()
```

