# SVM (Support Vector Machine)

## Description

Les machines à vecteurs de support (SVM) sont des modèles de machine learning supervisés utilisés pour résoudre des problèmes de classification et de régression.



### Théorie des SVM 

Les SVM permettent de traiter des problèmes non linéaires en les reformulant en problèmes d’optimisation quadratique. Ces problèmes sont plus faciles à résoudre.


Deux idées clés sous-tendent les SVM :


- La notion de marge maximale : la frontière de séparation des données doit maximiser la distance entre la frontière et les points les plus proches (appelés vecteurs support).


- La notion de fonction noyau : une alternative au produit scalaire dans un espace de grande dimension, mesurant l’influence réciproque entre deux éléments.


En bref, les SVM cherchent à trouver l’hyperplan qui divise au mieux un jeu de données en deux classes

### Concrètement, qu’est-ce qu’un SVM 

Les SVM sont des séparateurs linéaires. La frontière séparant les classes est une droite (ou un hyperplan dans des dimensions supérieures).

L’objectif est de trouver l’hyperplan qui maximise la marge entre les vecteurs support et la frontière de séparation

## Exemple

In [1]:
# Importer les bibliothèques nécessaires
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn.metrics import accuracy_score

# Charger l'ensemble de données Iris
iris = datasets.load_iris()

# Séparer les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# Définir le modèle SVM avec un noyau linéaire
clf = svm.SVC(kernel='linear')

# Former le modèle sur les données d'entraînement
clf.fit(X_train, y_train)

# Prédire les classes pour les données de test
predictions = clf.predict(X_test)

# Mesurer l'exactitude du modèle
print("Exactitude :", accuracy_score(y_test, predictions))

Exactitude : 1.0


## Quand l'utiliser

Classification : par exemple, dans la détection de spam, reconnaissance d’images, diagnostics médicaux, etc.

Régression : pour prédire des valeurs continues (par exemple, le prix d’une maison).

Détection d’anomalies : identifier des observations inhabituelles dans un ensemble de données