#  **SVM multi-classe**


Support Vector Machine (SVM) est un algorithme d'apprentissage automatique supervisé utilisé pour les tâches de classification et de régression. En ce qui concerne la classification multi-classes, où il y a plus de deux classes, SVM peut être étendu de différentes manières pour gérer ce scénario. Deux approches courantes sont "One against One" et "One against All" (également appelées "One versus One" et "One versus All").


# **One against All (One versus Rest):**

One-vs-rest (OvR, abréviation d'One-vs-All ou OvA) est une méthode heuristique pour utiliser des algorithmes de classification binaire dans le cadre de la classification multi-classes.

Elle consiste à diviser l'ensemble de données multi-classes en plusieurs problèmes de classification binaire. Un classificateur binaire est ensuite entraîné pour chaque problème de classification binaire, et les prédictions sont effectuées en utilisant le modèle le plus confiant.

Par exemple, considérons un problème de classification multi-classes avec des exemples pour chaque classe 'rouge', 'bleu' et 'vert'. Cela pourrait être divisé en trois ensembles de données de classification binaire comme suit :

* Problème de Classification Binaire 1 : rouge vs [bleu, vert]

* Problème de Classification Binaire 2 : bleu vs [rouge, vert]

* Problème de Classification Binaire 3 : vert vs [rouge, bleu]


**Un inconvénient** possible de cette approche est qu'elle nécessite la création d'un modèle pour chaque classe. Par exemple, trois classes nécessitent trois modèles. Cela peut poser problème pour des ensembles de données volumineux (par exemple, des millions de lignes), des modèles lents (par exemple, des réseaux neuronaux) ou un très grand nombre de classes (par exemple, des centaines de classes).
Cette approche nécessite que chaque modèle prédise une probabilité d'appartenance à une classe ou un score semblable à une probabilité. L'argmax de ces scores (indice de classe avec le score le plus élevé) est ensuite utilisé pour prédire une classe.

Cette approche est couramment utilisée pour les algorithmes qui prédisent naturellement une probabilité d'appartenance à une classe ou un score numérique, tels que :

* Régression logistique
* Perceptron
En conséquence, l'implémentation de ces algorithmes dans la bibliothèque scikit-learn utilise par défaut la stratégie OvR lors de l'utilisation de ces algorithmes pour la classification multi-classes.

Nous pouvons le démontrer avec un exemple sur un problème de classification à 3 classes en utilisant l'algorithme LogisticRegression. La stratégie de gestion de la classification multi-classes peut être définie via l'argument "multi_class" et peut être réglée sur "ovr" pour la stratégie one-vs-rest.

**L'exemple complet** d'ajustement d'un modèle de régression logistique pour la classification multi-classes en utilisant la stratégie intégrée one-vs-rest est présenté ci-dessous.


In [None]:
# logistic regression for multi-class classification using built-in one-vs-rest
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
# define dataset
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)
# define model
model = LogisticRegression(multi_class='ovr')
# fit model
model.fit(X, y)
# make predictions
yhat = model.predict(X)

The scikit-learn library also provides a separate **OneVsRestClassifier** class that allows the one-vs-rest strategy to be used with any classifier.

In [None]:

# logistic regression for multi-class classification using a one-vs-rest
from sklearn.datasets import make_classification
from sklearn.linear_model import LogisticRegression
from sklearn.multiclass import OneVsRestClassifier
# define dataset
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)
# define model
model = LogisticRegression()
# define the ovr strategy
ovr = OneVsRestClassifier(model)
# fit model
ovr.fit(X, y)
# make predictions
yhat = ovr.predict(X)

# **One-vs-One**
One-vs-One est une autre méthode heuristique pour utiliser des algorithmes de classification binaire dans le cadre de la classification multi-classes.

Comme pour la méthode one-vs-rest, la méthode one-vs-one divise un ensemble de données de classification multi-classes en problèmes de classification binaire. Contrairement à la méthode one-vs-rest qui divise l'ensemble en un ensemble binaire pour chaque classe, l'approche one-vs-one divise l'ensemble en un ensemble pour chaque classe par rapport à chaque autre classe.

Par exemple, considérons un problème de classification multi-classes avec quatre classes : 'rouge', 'bleu', 'vert' et 'jaune'. Cela pourrait être divisé en six ensembles de données de classification binaire comme suit :

* Problème de Classification Binaire 1 : rouge vs bleu
* Problème de Classification Binaire 2 : rouge vs vert
* Problème de Classification Binaire 3 : rouge vs jaune
* Problème de Classification Binaire 4 : bleu vs vert
* Problème de Classification Binaire 5 : bleu vs jaune
* Problème de Classification Binaire 6 : vert vs jaune


Cela nécessite significativement plus d'ensembles de données et, par conséquent, de modèles que la stratégie one-vs-rest décrite dans la section précédente.

La formule pour calculer le nombre d'ensembles de données binaires, et donc de modèles, est la suivante :

* **(NumClasses * (NumClasses - 1)) / 2**

On peut voir que pour quatre classes, cela nous donne la valeur attendue de six problèmes de classification binaire :

* (NumClasses * (NumClasses - 1)) / 2
* (4 * (4 - 1)) / 2
* (4 * 3) / 2
* 12 / 2
* 6

Chaque modèle de classification binaire peut prédire une étiquette de classe, et la classe prédite par la stratégie one-vs-one est celle qui obtient le plus de prédictions ou de votes.

De même, si les modèles de classification binaire prédisent une adhésion à une classe numérique, telle qu'une probabilité, alors l'argmax de la somme des scores (classe avec le plus grand score total) est prédit comme l'étiquette de classe.

Classiquement, cette approche est suggérée pour les machines à vecteurs de support (SVM) et les algorithmes liés basés sur le noyau. Cela est considéré car la performance des méthodes basées sur le noyau ne s'échelonne pas proportionnellement à la taille de l'ensemble d'entraînement, et l'utilisation de sous-ensembles des données d'entraînement peut contrecarrer cet effet.

L'implémentation de la machine à vecteurs de support dans scikit-learn est fournie par la classe SVC et prend en charge la méthode one-vs-one pour les problèmes de classification multi-classes. Cela peut être réalisé en réglant l'argument "decision_function_shape" sur 'ovo'.

**L'exemple ci-dessous** illustre la SVM pour la classification multi-classes en utilisant la méthode one-vs-one.

In [None]:
# SVM for multi-class classification using built-in one-vs-one
from sklearn.datasets import make_classification
from sklearn.svm import SVC
# define dataset
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)
# define model
model = SVC(decision_function_shape='ovo')
# fit model
model.fit(X, y)
# make predictions
yhat = model.predict(X)

La bibliothèque scikit-learn propose également une classe distincte appelée **OneVsOneClassifier** qui permet d'utiliser la stratégie one-vs-one avec n'importe quel classificateur.







In [None]:
# SVM for multi-class classification using one-vs-one
from sklearn.datasets import make_classification
from sklearn.svm import SVC
from sklearn.multiclass import OneVsOneClassifier
# define dataset
X, y = make_classification(n_samples=1000, n_features=10, n_informative=5, n_redundant=5, n_classes=3, random_state=1)
# define model
model = SVC()
# define ovo strategy
ovo = OneVsOneClassifier(model)
# fit model
ovo.fit(X, y)
# make predictions
yhat = ovo.predict(X)

# **modèle parametrique :**
Les hypothèses peuvent grandement simplifier le processus d'apprentissage, mais elles peuvent également limiter ce qui peut être appris. Les algorithmes qui simplifient la fonction à une forme connue sont appelés algorithmes d'apprentissage automatique paramétriques.



Les algorithmes impliquent deux étapes :

Sélectionner une forme pour la fonction.
Apprendre les coefficients de la fonction à partir des données d'entraînement.
Une forme fonctionnelle facile à comprendre pour la fonction de mappage est une ligne, comme celle utilisée dans la régression linéaire :

**b0 + b1*x1 + b2*x2 = 0**

dont **b0, b1 and b2** sont les coefficients de la ligne qui contrôlent l'intercept et la pente, et  **x1 and x2** sont deux variables d'entrée.

Supposer la forme fonctionnelle d'une ligne simplifie grandement le processus d'apprentissage. Maintenant, tout ce que nous avons à faire, c'est estimer les coefficients de l'équation de la ligne et nous avons un modèle prédictif pour le problème.

Souvent, la forme fonctionnelle supposée est une combinaison linéaire des variables d'entrée, et en tant que tels, les algorithmes d'apprentissage automatique paramétriques sont souvent également appelés "algorithmes d'apprentissage automatique linéaires".

Le problème est que la fonction sous-jacente inconnue réelle peut ne pas être une fonction linéaire comme une ligne. Elle pourrait être presque une ligne et nécessiter une légère transformation des données d'entrée pour fonctionner correctement. Ou elle pourrait être totalement différente d'une ligne, auquel cas l'hypothèse est incorrecte et l'approche produira de mauvais résultats.

Quelques exemples supplémentaires d'algorithmes d'apprentissage automatique paramétriques incluent :

Régression logistique
Analyse discriminante linéaire
Perceptron
Naive Bayes
Réseaux neuronaux simples
Avantages des algorithmes d'apprentissage automatique paramétriques :

* Simplicité : Ces méthodes sont plus faciles à comprendre et à interpréter les résultats.
* Rapidité : Les modèles paramétriques sont très rapides à apprendre à partir des données.
* Moins de données : Ils ne nécessitent pas autant de données d'entraînement et peuvent bien fonctionner même si l'ajustement aux données n'est pas parfait.

Limitations des algorithmes d'apprentissage automatique paramétriques :

* Contraints : En choisissant une forme fonctionnelle, ces méthodes sont fortement contraintes à la forme spécifiée.

* Complexité limitée : Les méthodes conviennent mieux à des problèmes plus simples.
* Mauvais ajustement : En pratique, les méthodes ont peu de chances de correspondre à la fonction de mappage sous-jacente.


#** Les modèles non paramétriques**

Les algorithmes qui ne font pas d'hypothèses fortes sur la forme de la fonction de mappage sont appelés algorithmes d'apprentissage automatique non paramétriques. En ne faisant pas d'hypothèses, ils sont libres d'apprendre n'importe quelle forme fonctionnelle à partir des données d'entraînement.

Les méthodes non paramétriques cherchent à mieux ajuster les données d'entraînement en construisant la fonction de mappage, tout en maintenant une certaine capacité à généraliser aux données invisibles. En tant que tels, ils peuvent s'adapter à un grand nombre de formes fonctionnelles.

Un modèle non paramétrique facile à comprendre est l'algorithme des k plus proches voisins qui fait des prédictions basées sur les k motifs d'entraînement les plus similaires pour une nouvelle instance de données. La méthode ne suppose rien sur la forme de la fonction de mappage autre que des motifs proches sont susceptibles d'avoir une variable de sortie similaire.

Quelques exemples supplémentaires d'algorithmes populaires d'apprentissage automatique non paramétriques sont :

* k Plus Proches Voisins
* Arbres de Décision comme CART et C4.5
* Machines à Vecteurs de Support

Avantages des algorithmes d'apprentissage automatique non paramétriques :

* Flexibilité : Capables de s'adapter à un grand nombre de formes fonctionnelles.
* Puissance : Aucune hypothèse (ou des hypothèses faibles) sur la fonction sous-jacente.
* Performance : Peut donner des modèles de prédiction de performance supérieure.

Limitations des algorithmes d'apprentissage automatique non paramétriques :

* Plus de données : Nécessitent beaucoup plus de données d'entraînement pour estimer la fonction de mappage.
* Plus lents : Beaucoup plus lents à s'entraîner car ils ont souvent beaucoup plus de paramètres à entraîner.
* Surajustement : Plus de risques de surajuster les données d'entraînement, et il est plus difficile d'expliquer pourquoi des prédictions spécifiques sont faites.

**Paramètre :**

Un paramètre est une variable de configuration interne à un modèle et est appris à partir des données d'entraînement. Il fait partie intégrante du modèle et définit son comportement. Les paramètres sont les coefficients dans les modèles de régression, les poids dans les réseaux neuronaux, ou les points de division dans les arbres de décision. Au cours du processus d'entraînement, ces valeurs sont ajustées pour minimiser l'erreur dans les prédictions.

**Hyperparamètre :**

Un hyperparamètre, en revanche, est une configuration externe au modèle et dont la valeur ne peut pas être estimée à partir des données. Il est défini avant le processus d'entraînement et influence le processus d'apprentissage mais n'est pas appris à partir des données. Des exemples d'hyperparamètres incluent le taux d'apprentissage dans le boosting, le nombre de couches cachées dans un réseau neuronal ou la profondeur d'un arbre de décision.

# **Projet**

# **base de données des diabètes :**

In [None]:
import pandas as pd

In [None]:
data = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/ids4 /classification/diabetes.csv')

**Application svm one classe**


In [None]:
data.columns

Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
       'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'],
      dtype='object')

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import OneClassSVM
from sklearn.metrics import accuracy_score, recall_score, precision_score, roc_auc_score


# Assume the target variable is 'diabetes', where 1 indicates diabetes and 0 indicates non-diabetes
X = data.drop('Outcome', axis=1)
y = data['Outcome']

# Use only non-diabetic instances for training the One-Class SVM
X_normal = X[y == 0]

# Split the data into training and testing sets
X_train, X_test, _, _ = train_test_split(X_normal, [0] * len(X_normal), test_size=0.2, random_state=42)

# Standardize the features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X)

# Create and train the One-Class SVM model
model = OneClassSVM(nu=0.1, kernel='rbf')  # Adjust hyperparameters as needed
model.fit(X_train_scaled)

# Make predictions on the entire dataset
y_pred = model.predict(X_test_scaled)





Accuracy: 0.81640625
Recall: 0.81640625
precision: 1.0


**Evaluation des performances :**


In [None]:
# Evaluate the model
accuracy = accuracy_score([1] * len(X), y_pred)  # Assuming 1 represents normal class in the output
recall = recall_score([1] * len(X), y_pred)
precision = precision_score([1] * len(X), y_pred)


print("Accuracy:", accuracy)
print("Recall:", recall)
print("precision:", precision)


Accuracy: 0.81640625
Recall: 0.81640625
precision: 1.0


**Application SMV multi-class**

In [None]:

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, recall_score, precision_score, classification_report


# Assume the target variable is 'diabetes', which is a categorical variable with multiple classes
X = data.drop('Outcome', axis=1)
y = data['Outcome']

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardize the features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Create and train the SVM model
model = SVC(kernel='linear', C=1.0)
model.fit(X_train_scaled, y_train)

# Make predictions
y_pred = model.predict(X_test_scaled)




**Evaluation des performances**

In [None]:
# Evaluate the model
accuracy = accuracy_score(y_test, y_pred)
recall = recall_score(y_test, y_pred, average='weighted')  # For multi-class
precision = precision_score(y_test, y_pred, average='weighted')  # For multi-class

print("Accuracy:", accuracy)
print("Recall:", recall)
print("Precision:", precision)
print("\nClassification Report:\n", classification_report(y_test, y_pred))

Accuracy: 0.7597402597402597
Recall: 0.7597402597402597
Precision: 0.7588095238095239

Classification Report:
               precision    recall  f1-score   support

           0       0.81      0.82      0.81        99
           1       0.67      0.65      0.66        55

    accuracy                           0.76       154
   macro avg       0.74      0.74      0.74       154
weighted avg       0.76      0.76      0.76       154



# **base de données iris :**

**Application svm one classe**

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, recall_score, precision_score, roc_auc_score, classification_report
from sklearn.datasets import load_iris

# Load the Iris dataset
iris = load_iris()
X = iris.data
y = iris.target

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardize the features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Create and train the SVM model
model = SVC(kernel='linear', C=1.0)
model.fit(X_train_scaled, y_train)

# Make predictions
y_pred = model.predict(X_test_scaled)

# Evaluate the model
accuracy = accuracy_score(y_test, y_pred)
recall = recall_score(y_test, y_pred, average='weighted')  # For multi-class
precision = precision_score(y_test, y_pred, average='weighted')  # For multi-class
auc = roc_auc_score(pd.get_dummies(y_test), model.decision_function(X_test_scaled), multi_class='ovr')  # 'ovr' for multi-class AUC

print("Accuracy:", accuracy)
print("Recall:", recall)
print("Precision:", precision)
print("AUC:", auc)
print("\nClassification Report:\n", classification_report(y_test, y_pred))


Accuracy: 0.9666666666666667
Recall: 0.9666666666666667
Precision: 0.9694444444444444
AUC: 0.980599647266314

Classification Report:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        10
           1       1.00      0.89      0.94         9
           2       0.92      1.00      0.96        11

    accuracy                           0.97        30
   macro avg       0.97      0.96      0.97        30
weighted avg       0.97      0.97      0.97        30



**Application svm multi-classe**

In [None]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, recall_score, precision_score, roc_auc_score, classification_report

# Load the Iris dataset
iris = load_iris()
X = iris.data
y = iris.target

# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardize the features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Create and train the SVM model
model = SVC(kernel='linear', C=1.0)
model.fit(X_train_scaled, y_train)

# Make predictions
y_pred = model.predict(X_test_scaled)

# Evaluate the model
accuracy = accuracy_score(y_test, y_pred)
recall = recall_score(y_test, y_pred, average='weighted')  # For multi-class
precision = precision_score(y_test, y_pred, average='weighted')  # For multi-class
auc = roc_auc_score(pd.get_dummies(y_test), pd.get_dummies(y_pred), multi_class='ovr')  # 'ovr' for multi-class AUC

print("Accuracy:", accuracy)
print("Recall:", recall)
print("Precision:", precision)
print("AUC:", auc)
print("\nClassification Report:\n", classification_report(y_test, y_pred))


Accuracy: 0.9666666666666667
Recall: 0.9666666666666667
Precision: 0.9694444444444444
AUC: 0.9727095516569201

Classification Report:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        10
           1       1.00      0.89      0.94         9
           2       0.92      1.00      0.96        11

    accuracy                           0.97        30
   macro avg       0.97      0.96      0.97        30
weighted avg       0.97      0.97      0.97        30

