In [2]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC
from sklearn.preprocessing import MinMaxScaler
from sklearn.feature_selection import SelectKBest, f_classif
from sklearn.metrics import accuracy_score

# Cargar el dataset desde la URL
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/car/car.data"
column_names = ['buying', 'maint', 'doors', 'persons', 'lug_boot', 'safety', 'class']
df = pd.read_csv(url, names=column_names)

# Preprocesamiento de los datos
# Convertir variables categóricas en numéricas
df['buying'] = df['buying'].replace({'vhigh': 4, 'high': 3, 'med': 2, 'low': 1})
df['maint'] = df['maint'].replace({'vhigh': 4, 'high': 3, 'med': 2, 'low': 1})
df['doors'] = df['doors'].replace({'2': 2, '3': 3, '4': 4, '5more': 5})
df['persons'] = df['persons'].replace({'2': 2, '4': 4, 'more': 5})
df['lug_boot'] = df['lug_boot'].replace({'small': 1, 'med': 2, 'big': 3})
df['safety'] = df['safety'].replace({'low': 1, 'med': 2, 'high': 3})
df['class'] = df['class'].replace({'unacc': 0, 'acc': 1, 'good': 2, 'vgood': 3})

# Separar características y etiquetas
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

# Normalización de características
scaler = MinMaxScaler()
X = scaler.fit_transform(X)

# Selección de características
selector = SelectKBest(f_classif, k=4)
X = selector.fit_transform(X, y)

# Dividir los datos en conjunto de entrenamiento y conjunto de prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Ajuste de hiperparámetros mediante validación cruzada
param_grid = {'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf']}
svm_model = GridSearchCV(SVC(), param_grid, cv=5)
svm_model.fit(X_train, y_train)

# Obtener el mejor modelo SVM después de la búsqueda de cuadrícula
best_svm_model = svm_model.best_estimator_

# Realizar predicciones en el conjunto de prueba
y_pred = best_svm_model.predict(X_test)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print("Precisión del modelo SVM:", accuracy)
print("Mejores hiperparámetros encontrados:", svm_model.best_params_)


Precisión del modelo SVM: 0.8670520231213873
Mejores hiperparámetros encontrados: {'C': 1, 'kernel': 'rbf'}
