Paso inicial
- Carga el archivo iris.csv.
- Codifica la columna class como variable numérica (LabelEncoder).
- Normaliza los datos con MinMaxScaler.
- Separa en entrenamiento (80%) y prueba (20%) con semilla 42.

In [None]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler, LabelEncoder
from sklearn.model_selection import train_test_split

df = pd.read_csv("iris.csv", sep = ",")
X = df.drop("class", axis=1)
y =LabelEncoder().fit_transform(df["class"])

scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size = 0.2, random_state = 42)

Ejercicio 1: Clasificadores básicos
Entrena los siguientes modelos y compara su exactitud:

- Regresión logística
- Perceptrón
- SVM lineal
- KNN (k=5)

In [1]:
from sklearn.linear_model import LogisticRegression, Perceptron
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

modelos = {
    "Regresion logistica": LogisticRegression(max_iter=1000),
    "Perceptron": Perceptron(max_iter=1000),
    "SVM lineal": SVC(kernel="linear"),
    "KNN(k=5)": KNeighborsClassifier(n_neighbors=5)
}

for nombre, modelo in modelos.items():
    modelo.fit(X_train, y_train)
    acc = accuracy_score(y_test, modelo.predict(X_test))
    print(f"{modelo}:{acc:.4f}")

NameError: name 'X_train' is not defined

Ejercicio 2: Visualización de fronteras
- Usa sepal length y petal width para entrenar una SVM lineal.
- Dibuja la superficie de decisión y los vectores soporte. ¿Cuántos vectores soporte hay?
- Repite con C=0.1, C=1 y C=10.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

df = pd.read_csv("iris.csv")
df = df[df["class"].isin(["Iris-setosa", "Iris-versicolor"])]  # Binario

# Seleccionar dos variables
X = df[["sepal length", "petal width"]]
y = LabelEncoder().fit_transform(df["class"])  # 0 y 1

# Normalizar y dividir
X_scaled = MinMaxScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Función para graficar para cada valor de C
def graficar_svm_lineal(C_val):
    clf = SVC(kernel='linear', C=C_val)
    clf.fit(X_train, y_train)

    # Dibujar muestras
    for clase in np.unique(y_train):
        plt.scatter(X_train[y_train == clase, 0], X_train[y_train == clase, 1], label=f"Clase {clase}")

    # Vectores soporte
    plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], c='k', marker='*', label='Vectores soporte')

    # Recta de decisión
    m = -clf.coef_[0, 0] / clf.coef_[0, 1]
    n = -clf.intercept_[0] / clf.coef_[0, 1]
    x_vals = np.linspace(X_train[:, 0].min(), X_train[:, 0].max(), 100)
    plt.plot(x_vals, m * x_vals + n, 'k-', label='Recta de decisión')

    plt.xlabel("sepal length")
    plt.ylabel("petal width")
    plt.title(f"SVM Lineal (C={C_val})")
    plt.legend()
    plt.grid(True)
    plt.show()

    print(f"C={C_val} -> Vectores soporte: {len(clf.support_)}")

# Ejecutar para los valores deseados de C
for C in [0.1, 1, 10]:
    graficar_svm_lineal(C)

Ejercicio 3: Multiclase con KNN
- Prueba con k = 1, k = 3, k = 9.

In [None]:
for k in [1, 3, 9]:
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)
    y_pred = knn.predict(X_test)
    acc = accuracy_score(y_test, y_pred)
    print(f"KNN (k={k}) Accuracy: {acc:.4f}")