<a href="https://colab.research.google.com/github/JMartinArocha/MasterBigData/blob/main/SVM.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# SVC

El primer ejemplo utiliza el modelo SVC (Support Vector Classification) de la biblioteca scikit-learn para realizar una clasificación multiclase en el conocido conjunto de datos Iris. Este conjunto contiene datos de tres especies diferentes de flores de iris, con características como el largo y ancho de sépalos y pétalos.



In [1]:
import seaborn as sns
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix

# Cargamos el conjunto de datos
iris = sns.load_dataset('iris')

# Separamos los datos en características y etiquetas
X_iris = iris.drop('species', axis=1)
y_iris = iris['species']

# Dividimos los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_iris, y_iris, test_size=0.3, random_state=42)

# Creamos el modelo SVM
model = SVC(kernel='linear')  # Puedes probar otros kernels como 'rbf', 'poly', etc.

# Entrenamos el modelo
model.fit(X_train, y_train)

# Realizamos predicciones en el conjunto de prueba
predictions = model.predict(X_test)

# Evaluamos el modelo
print(classification_report(y_test, predictions))
print(confusion_matrix(y_test, predictions))


              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        19
  versicolor       1.00      1.00      1.00        13
   virginica       1.00      1.00      1.00        13

    accuracy                           1.00        45
   macro avg       1.00      1.00      1.00        45
weighted avg       1.00      1.00      1.00        45

[[19  0  0]
 [ 0 13  0]
 [ 0  0 13]]


# SVC

El segundo ejemplo ilustra cómo utilizar OneClassSVM para la detección de anomalías, también utilizando el conjunto de datos Iris. OneClassSVM es un enfoque diferente del SVM tradicional, enfocado en identificar datos que son "anómalos" o diferentes de un conjunto de entrenamiento dado.



In [4]:
import seaborn as sns
from sklearn.svm import OneClassSVM
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix

# Cargamos el conjunto de datos
iris = sns.load_dataset('iris')

# Elegimos una especie para entrenar el modelo. Ejemplo: 'setosa'
iris_setosa = iris[iris['species'] == 'setosa']

# Separamos los datos en características y etiquetas
X_setosa = iris_setosa.drop('species', axis=1)

# Creamos el modelo OneClassSVM
model = OneClassSVM(kernel='rbf', gamma='auto')

# Entrenamos el modelo solo con los datos de 'setosa'
model.fit(X_setosa)

# Ahora, probemos el modelo con todo el conjunto de datos
X_all = iris.drop('species', axis=1)
y_all = iris['species']

# Realizamos predicciones
predictions = model.predict(X_all)

# Las predicciones devolverán 1 para los puntos de datos similares a 'setosa' y -1 para los diferentes
# Convertimos estas predicciones en etiquetas de especie para facilitar la comprensión
predicted_species = ['setosa' if p == 1 else 'non-setosa' for p in predictions]

# Evaluación (ten en cuenta que esta evaluación es solo para propósitos ilustrativos)
print(classification_report(y_all, predicted_species))
print(confusion_matrix(y_all, predicted_species))

              precision    recall  f1-score   support

  non-setosa       0.00      0.00      0.00         0
      setosa       1.00      0.48      0.65        50
  versicolor       0.00      0.00      0.00        50
   virginica       0.00      0.00      0.00        50

    accuracy                           0.16       150
   macro avg       0.25      0.12      0.16       150
weighted avg       0.33      0.16      0.22       150

[[ 0  0  0  0]
 [26 24  0  0]
 [50  0  0  0]
 [50  0  0  0]]


  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
