In [1]:
import numpy as np
import pandas as pd
from sklearn import svm
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

In [2]:
# Paso 1: Cargar el dataset
# Aquí asumo que ya tienes el dataset cargado en 'data.csv'
df = pd.read_csv('C:/Users/Guillermo/Documents/Inferencia_Estadistica_Grupo/BBDD/Clasificacion_banco.csv')

In [3]:
# Seleccionar las características que deseas utilizar
X = df[['fico', 'installment']]  # Usa solo 2 features para facilitar la visualización
y = df['not.fully.paid']

In [4]:
# Paso 2: Preprocesar los datos
scaler = StandardScaler()
X = scaler.fit_transform(X)

In [5]:
# Paso 3: Separar los datos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [7]:
# Implementación de la clase SVM
class SVM(object):
    def fit_hard(self, X, y):
        # Crear un clasificador SVM de margen duro
        model = svm.SVC(kernel='linear', C=1e10)  # Un C muy grande simula un margen duro
        model.fit(X, y)
        return model
    
    def fit_soft(self, X, y, C):
        # Crear un clasificador SVM de margen blando
        model = svm.SVC(kernel='linear', C=C)  # C controla el margen blando
        model.fit(X, y)
        return model

In [None]:
# Paso 4: Entrenar ambos modelos

In [8]:
# Crear una instancia de la clase SVM
svm_classifier = SVM()

In [None]:
# Entrenar SVM de margen duro
hard_svm_model = svm_classifier.fit_hard(X_train, y_train)

In [None]:
# Entrenar SVM de margen blando con un C determinado
soft_svm_model = svm_classifier.fit_soft(X_train, y_train, C=1.0)

In [None]:
# Paso 5: Graficar la frontera de separación y las rectas paralelas

def plot_decision_boundary(model, X, y, title):
    # Crear una malla para visualizar la frontera
    h = .02  # Tamaño de los pasos en la malla
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

    # Predecir en todos los puntos de la malla
    Z = model.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    # Graficar la frontera de decisión y las clases
    plt.contourf(xx, yy, Z, cmap=plt.cm.coolwarm, alpha=0.8)
    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.coolwarm, edgecolors='k')
    
    # Graficar los vectores de soporte
    plt.scatter(model.support_vectors_[:, 0], model.support_vectors_[:, 1], facecolors='none', edgecolors='k', s=100, linewidths=1.5)
    
    plt.title(title)
    plt.xlabel('FICO')
    plt.ylabel('Installment')
    plt.show()

In [None]:
# Graficar el SVM de margen duro
plot_decision_boundary(hard_svm_model, X_train, y_train, "Frontera de SVM de Margen Duro")

# Graficar el SVM de margen blando
plot_decision_boundary(soft_svm_model, X_train, y_train, "Frontera de SVM de Margen Blando")