# SVM
Implémentation d'un SVM avec une recherche d'hyper-paramètres.
<br>
### Etapes

1. **Chargement des données** à partir des dossiers déjà splités (train/test).
2. **Pré-traîtement** des données. 
3. **Initialisation et entraînement du modèle**.
5. **Evaluation du modèle** et **prédiction**.

## Chargement et split des données en fonction du dossier

Les images sont redimensionnées à 64x64 pixels pour avoir une taille uniforme et plus légère.


In [2]:
from sklearn.model_selection import train_test_split

from src.preprocessing import load_images_from_folder
import os

base_path = os.path.abspath(os.path.join(os.getcwd(), "../../data/raw_test"))

train_path = os.path.join(base_path, "train")

X, y = load_images_from_folder(train_path, image_size=(128, 128))

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)

## Pré-traitement des données

- Normalisation des images pour "rescaler" les valeurs des pixels dans une plage uniforme.
- Aplanissement des images (2D -> 1D) pour les rendre compatibles.

In [3]:
import numpy as np
from src.preprocessing import normalize_images

normalized_images = normalize_images(X_train)
flattened_images = np.array([x.flatten() for x in normalized_images])

test_normalized_images = normalize_images(X_test)
test_flattened_images = np.array([x.flatten() for x in test_normalized_images])

## Initialisation et entraînement du modèle

- Initialisation du modèle basé sur un SVM.
- Entraînement du modèle.

In [4]:
from sklearn.svm import SVC

svc = SVC()
svc.fit(flattened_images, y_train)

## Evaluation du meilleur modèle sélectionné

- Validation croisée pour évaluer les performances du modèle.
- Prédiction et évaluation du modèle sur les données de test.

In [5]:
from sklearn.model_selection import cross_val_score

scores = cross_val_score(svc, flattened_images, y_train, cv=5, scoring='accuracy')
print(f"Scores de validation croisée : {scores}")
print(f"Score moyen de validation croisée : {np.mean(scores)}")

y_pred = svc.predict(test_flattened_images)

from sklearn.metrics import classification_report, accuracy_score

print(f"Accuracy sur les données de test : {accuracy_score(y_test, y_pred)}")
print(f"Rapport de classification :\n {classification_report(y_test, y_pred)}")

Scores de validation croisée : [0.95066414 0.9544592  0.96204934 0.95066414 0.94117647]
Score moyen de validation croisée : 0.9518026565464895
Accuracy sur les données de test : 0.9385665529010239
Rapport de classification :
               precision    recall  f1-score   support

           0       0.90      0.87      0.88       159
           1       0.95      0.96      0.96       427

    accuracy                           0.94       586
   macro avg       0.93      0.92      0.92       586
weighted avg       0.94      0.94      0.94       586

