# Chat ou Chien !! une méthode d'apprentissage automatique.

Dans une entreprise de marketing, on veut faire une étude sur les clients qui fréquentent un grand magasin. L'idée est d'estimer le pourcentage de clients qui ont des chats et ceux qui ont des chiens, afin de prendre des décisions marketing ciblées. Vous proposez d'utiliser une caméra pour détecter et compter les deux animaux dans le magasin. La première étape du projet est de développer un modèle qui peut détecter le chat ou le chien. Ainsi, dans ce brief, en utilisant une base de données, vous allez entrainer un modèle d'apprentissage automatique avec un apprentissage supervisé.

# Veille technologique: Opencv python

- Préparation données imagerie pour méthode classique d'apprentissage automatique
- Entrainement et évaluation (similaire aux briefs précédents)

## Operations Simples

In [1]:
# use opencv to load and display the image
import os
import cv2
from skimage.io import imread, imsave, imshow
import numpy as np
from PIL import Image


In [2]:
# Préparer les données
size = (150, 150)
image_directory = 'PetImages/'
images = []  # liste pour les images
label = []  # liste pour les labels (0 ou 1) pour deux classes
 
# Créer les répertoires de sortie s'ils n'existent pas
os.makedirs('catsanddogs/ResizedImages/Cat/', exist_ok=True)
os.makedirs('catsanddogs/ResizedImages/Dog/', exist_ok=True)
 
# Lire les noms des images dans chaque sous-dossier
cat_images = os.listdir(image_directory + 'Cat/')
dog_images = os.listdir(image_directory + 'Dog/')
 
# Boucle pour les images de chats
for img_name in cat_images:
    img_path = image_directory + 'Cat/' + img_name
    try:
        img = cv2.imread(img_path)
        if img is None:
            raise ValueError(f"Image corrompue ou inexistante: {img_path}")
        img_resized = cv2.resize(img, size)
        # Construire le nouveau chemin avec l'extension correcte
        save_path = f'catsanddogs/ResizedImages/Cat/{img_name}'
        cv2.imwrite(save_path, img_resized)
        images.append(img_resized)
        label.append(0)
    except Exception as e:
        print(f"Erreur: {e}")
 
# Boucle pour les images de chiens
for img_name in dog_images:
    img_path = image_directory + 'Dog/' + img_name
    try:
        img = cv2.imread(img_path)
        if img is None:
            raise ValueError(f"Image corrompue ou inexistante: {img_path}")
        img_resized = cv2.resize(img, size)
        # Construire le nouveau chemin avec l'extension correcte
        save_path = f'catsanddogs/ResizedImages/Dog/{img_name}'
        cv2.imwrite(save_path, img_resized)
        images.append(img_resized)
        label.append(1)
    except Exception as e:
        print(f"Erreur: {e}")
 
# Enregistrer les labels en tant que tableau NumPy
np.save('catsanddogs/ResizedImages/Label.npy', label)
 
# Afficher la forme
print("Forme des images: ", np.array(images).shape)
print("Forme des labels: ", np.array(label).shape)

Erreur: Image corrompue ou inexistante: PetImages/Cat/10125.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/10404.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/10501.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/10820.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/11210.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/11565.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/11874.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/11935.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/140.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/2663.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/3300.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/3491.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/4833.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/5553.jpg
Erreur: Image corrompue ou inexistante: PetImages/Cat/660.jpg
Erreur: Image corrompue ou inexistante: PetImages

In [3]:
# prepare data for classical machine learning model

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
 
# Convertir `images` en un tableau numpy si ce n'est pas déjà fait
images_np = np.array(images)
 
# Redimensionner les données images pour le modèle d'apprentissage automatique
images_reshaped = images_np.reshape(images_np.shape[0], -1)
 
# Split les données en ensembles d'entraînement et de test avec stratification
X_train, X_test, y_train, y_test = train_test_split(images_reshaped, label, test_size=0.2, stratify=label, random_state=42)
 
# initialiser le classifier
clf = RandomForestClassifier(random_state=42, n_jobs=-1)
 
# entrainer le classifier
clf.fit(X_train, y_train)

In [6]:
# evaluate classifier
from sklearn.metrics import classification_report
# predire
y_pred = clf.predict(X_test)
# evaluer avec classification_report
print(classification_report(y_test, y_pred))

              precision    recall  f1-score   support

           0       0.65      0.70      0.67      2496
           1       0.67      0.62      0.64      2494

    accuracy                           0.66      4990
   macro avg       0.66      0.66      0.66      4990
weighted avg       0.66      0.66      0.66      4990



# Neural networ MLP

Entrainer un modèle MLP pour detecter la class Dog ou Cat.

In [40]:
from tensorflow.keras.layers import Input, Dense, Dropout, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam

# creer un reseau de neurone avec une couche d'entrée de taille (150*150*3), deux couches caché de taille 128 et une activation "relu". 
# Dernière couche de taille 1 avec une activation sigmoid. Choisir la bonne "loss function" et "optimizer"
 
input_shape = (150*150*3,)
 
inputs = Input(shape=input_shape)
 
x = Dense(128, activation='relu')(inputs)
x = Dense(128, activation='relu')(x)
 
outputs = Dense(1, activation='sigmoid')(x)
 
model = Model(inputs, outputs)
 
model.compile(optimizer='sgd', loss='binary_crossentropy', metrics=['accuracy'])

 
model.summary()


In [41]:
# entrainer le modèle avec validation_split = 2, epochs = 20, et un batch_size = 128
X_train_flat = X_train.reshape(-1, 150*150*3)


# Entraîner le modèle avec validation_split = 0.2, epochs = 20, et un batch_size = 128
model.fit(X_train_flat, y_train, validation_split=0.2, epochs=20, batch_size=128)


Epoch 1/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 78ms/step - accuracy: 0.5047 - loss: 580801970142629513396224.0000 - val_accuracy: 0.5055 - val_loss: 0.6931
Epoch 2/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 81ms/step - accuracy: 0.4997 - loss: 0.6932 - val_accuracy: 0.5055 - val_loss: 0.6931
Epoch 3/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 134ms/step - accuracy: 0.5016 - loss: 0.6932 - val_accuracy: 0.4945 - val_loss: 0.6932
Epoch 4/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m18s[0m 138ms/step - accuracy: 0.5036 - loss: 0.6931 - val_accuracy: 0.4945 - val_loss: 0.6932
Epoch 5/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 109ms/step - accuracy: 0.5093 - loss: 0.6931 - val_accuracy: 0.4945 - val_loss: 0.6932
Epoch 6/20
[1m125/125[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 112ms/step - accuracy: 0.5006 - loss: 0.6932 - val_accuracy: 0.4945 - val_lo

<keras.src.callbacks.history.History at 0x22bc90d1890>

In [20]:
# evaluate MLP
# evaluate classifier
from sklearn.metrics import classification_report
# predire

# evaluer avec classification_report
X_test = X_test.reshape(-1, 150, 150, 3)

# Prédire les étiquettes pour l'ensemble de test
y_pred = model.predict(X_test)

# Convertir les probabilités en étiquettes binaires
y_pred = np.round(y_pred)

# Afficher les métriques d'évaluation
print(classification_report(y_test, y_pred))


[1m156/156[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 13ms/step
              precision    recall  f1-score   support

           0       0.50      1.00      0.67      2496
           1       0.00      0.00      0.00      2494

    accuracy                           0.50      4990
   macro avg       0.25      0.50      0.33      4990
weighted avg       0.25      0.50      0.33      4990



  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
