# Chat ou Chien !! une méthode d'apprentissage automatique.

Dans une entreprise de marketing, on veut faire une étude sur les clients qui fréquentent un grand magasin. L'idée est d'estimer le pourcentage de clients qui ont des chats et ceux qui ont des chiens, afin de prendre des décisions marketing ciblées. Vous proposez d'utiliser une caméra pour détecter et compter les deux animaux dans le magasin. La première étape du projet est de développer un modèle qui peut détecter le chat ou le chien. Ainsi, dans ce brief, en utilisant une base de données, vous allez entrainer un modèle d'apprentissage automatique avec un apprentissage supervisé.

# Veille technologique: Opencv python

- Préparation données imagerie pour méthode classique d'apprentissage automatique
- Entrainement et évaluation (similaire aux briefs précédents)

## Operations Simples

In [3]:
# use opencv to load and display the image
import cv2
from skimage.io import imread, imsave, imshow

In [1]:
import os
import numpy as np
from PIL import Image

# Définir le répertoire contenant les images
image_directory = 'C:/Users/moon/pets'

# Taille de l'image cible
size = (150, 150)

# Initialiser des listes pour stocker les images et les labels
images = []
labels = []

# Fonction pour charger et prétraiter une image
def load_image(file_path):
    try:
        img = Image.open(file_path)
        img = img.resize(size)
        img = np.array(img) / 255.0  # Normaliser les valeurs de pixel
        return img
    except Exception as e:
        print(f"Erreur lors du chargement de l'image {file_path}: {e}")
        return None

# Parcourir chaque sous-dossier (Cat et Dog)
for label_name in ['Cat', 'Dog']:
    label = 0 if label_name == 'Cat' else 1  # 0 pour Cat, 1 pour Dog
    label_directory = os.path.join(image_directory, label_name)
    
    # Parcourir chaque image dans le sous-dossier
    for file_name in os.listdir(label_directory):
        file_path = os.path.join(label_directory, file_name)
        
        # Charger et prétraiter l'image
        img = load_image(file_path)
        if img is not None:
            # Vérifier si l'image a les dimensions correctes
            if img.shape == (size[0], size[1], 3):
                images.append(img)
                labels.append(label)
            else:
                print(f"Ignorer l'image {file_path} avec dimensions incorrectes: {img.shape}")

# Convertir les listes en tableaux numpy
images = np.array(images)
labels = np.array(labels)

# Enregistrer les données sous forme de fichiers ".npy"
np.save('images.npy', images)
np.save('labels.npy', labels)

# Afficher la forme des données
print("Shape des images:", images.shape)
print("Shape des labels:", labels.shape)



Ignorer l'image C:/Users/moon/pets\Cat\10125.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\10501.jpg avec dimensions incorrectes: (150, 150)


KeyboardInterrupt: 

In [22]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
import numpy as np

# Charger les données d'images et les labels
images = np.load('images.npy')
labels = np.load('labels.npy')

# Redimensionner les données d'images
images = images.reshape(images.shape[0], -1)  # Redimensionner chaque image en un vecteur (flatten)

# Séparer les données en ensemble d'entraînement et ensemble de test
X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42, stratify=labels)



MemoryError: Unable to allocate 12.5 GiB for an array with shape (1682842500,) and data type float64

In [4]:
# initialiser le classifier
model = RandomForestClassifier()

# entrainer le classifier
model.fit(X_train, y_train)

In [6]:
# evaluate classifier
from sklearn.metrics import classification_report


# Évaluer le modèle sur l'ensemble de test
accuracy = model.score(X_test, y_test)
print("Accuracy:", accuracy)

# predire
y_pred = model.predict(X_test)

# evaluer avec classification_report
target_names = ['chat', 'chien'] # remplacez les noms de classe par ceux de votre problème
print(classification_report(y_test, y_pred, target_names=target_names))


Accuracy: 0.6627230800080208
              precision    recall  f1-score   support

        chat       0.65      0.72      0.68      2494
       chien       0.68      0.60      0.64      2493

    accuracy                           0.66      4987
   macro avg       0.66      0.66      0.66      4987
weighted avg       0.66      0.66      0.66      4987



### Essayer de normaliser chaque image entre 0 et 255 et rentrainer le modèle. Y a-t-il une amélioration ?

In [19]:
# Normalize image to between 0 and 255
images_normal = images/(images.max()/255.0)

# Normalize image to between 0 and 255
labels_normal = labels/(labels.max()/255.0)

In [20]:
# Enregistrer les données sous forme de fichiers ".npy"
np.save('images_normal.npy', images_normal)
np.save('labels_normal.npy', labels_normal)

# Afficher la forme des données
print("Shape des images:", images_normal.shape)
print("Shape des labels:", labels_normal.shape)

Shape des images: (24931, 67500)
Shape des labels: (24931,)


In [9]:
# Charger les données d'images et les labels
images_normal = np.load('images_normal.npy')
labels_normal = np.load('labels_normal.npy')

# Redimensionner les données d'images
images_normal = images_normal.reshape(images_normal.shape[0], -1)  # Redimensionner chaque image en un vecteur (flatten)

# Séparer les données en ensemble d'entraînement et ensemble de test
X_train, X_test, y_train, y_test = train_test_split(images_normal, labels_normal, test_size=0.2, random_state=42, stratify=labels)

In [10]:
# initialiser le classifier
model = RandomForestClassifier()

# entrainer le classifier
model.fit(X_train, y_train)

In [11]:
# Évaluer le modèle sur l'ensemble de test
accuracy = model.score(X_test, y_test)
print("Accuracy:", accuracy)

# predire
y_pred = model.predict(X_test)

# evaluer avec classification_report
target_names = ['chat', 'chien'] # remplacez les noms de classe par ceux de votre problème
print(classification_report(y_test, y_pred, target_names=target_names))

Accuracy: 0.6641267294966914
              precision    recall  f1-score   support

        chat       0.65      0.73      0.68      2494
       chien       0.69      0.60      0.64      2493

    accuracy                           0.66      4987
   macro avg       0.67      0.66      0.66      4987
weighted avg       0.67      0.66      0.66      4987



# Neural networ MLP

Entrainer un modèle MLP pour detecter la class Dog ou Cat.

In [4]:
import os
import numpy as np
from PIL import Image

# Définir le répertoire contenant les images
image_directory = 'C:/Users/moon/pets'

# Taille de l'image cible
size = (150, 150)

# Initialiser des listes pour stocker les images et les labels
images = []
labels = []

# Fonction pour charger et prétraiter une image
def load_image(file_path):
    try:
        img = Image.open(file_path)
        img = img.resize(size)
        img = np.array(img) / 255.0  # Normaliser les valeurs de pixel
        return img
    except Exception as e:
        print(f"Erreur lors du chargement de l'image {file_path}: {e}")
        return None

# Parcourir chaque sous-dossier (Cat et Dog)
for label_name in ['Cat', 'Dog']:
    label = 0 if label_name == 'Cat' else 1  # 0 pour Cat, 1 pour Dog
    label_directory = os.path.join(image_directory, label_name)
    
    # Parcourir chaque image dans le sous-dossier
    for file_name in os.listdir(label_directory):
        file_path = os.path.join(label_directory, file_name)
        
        # Charger et prétraiter l'image
        img = load_image(file_path)
        if img is not None:
            # Vérifier si l'image a les dimensions correctes
            if img.shape == (size[0], size[1], 3):
                images.append(img)
                labels.append(label)
            else:
                print(f"Ignorer l'image {file_path} avec dimensions incorrectes: {img.shape}")

Ignorer l'image C:/Users/moon/pets\Cat\10125.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\10501.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\10820.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\11095.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\11210.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\11565.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\11874.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\11935.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\12080.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\140.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users/moon/pets\Cat\2663.jpg avec dimensions incorrectes: (150, 150)
Ignorer l'image C:/Users



Ignorer l'image C:/Users/moon/pets\Dog\9078.jpg avec dimensions incorrectes: (150, 150, 4)
Ignorer l'image C:/Users/moon/pets\Dog\9188.jpg avec dimensions incorrectes: (150, 150)
Erreur lors du chargement de l'image C:/Users/moon/pets\Dog\Thumbs.db: cannot identify image file 'C:\\Users\\moon\\pets\\Dog\\Thumbs.db'


In [5]:
# Convertir les listes en tableaux numpy
images = np.array(images)
labels = np.array(labels)

# Enregistrer les données sous forme de fichiers ".npy"
np.save('images.npy', images)
np.save('labels.npy', labels)

# Afficher la forme des données
print("Shape des images:", images.shape)
print("Shape des labels:", labels.shape)

Shape des images: (24931, 150, 150, 3)
Shape des labels: (24931,)


In [6]:
from tensorflow.keras.layers import Input, Dense, Dropout, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.losses import binary_crossentropy


# creer un reseau de neurone avec une couche d'entrée de taille (150*150*3), deux couches caché de taille 128 et une activation "relu". 

import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42)

# Aplatir les images
X_train_flat = X_train.reshape(-1, X_train.shape[1] * X_train.shape[2] * X_train.shape[3])
X_test_flat = X_test.reshape(-1, X_test.shape[1] * X_test.shape[2] * X_test.shape[3])

# Entraîner le modèle MLP
mlp = MLPClassifier(hidden_layer_sizes=(128, 64), activation='relu', solver='adam', max_iter=1000)
mlp.fit(X_train_flat, y_train)

# Évaluer le modèle
y_pred = mlp.predict(X_test_flat)
accuracy = accuracy_score(y_test, y_pred)
print("Précision :", accuracy)
print("Rapport de classification :")
print(classification_report(y_test, y_pred))
print("Matrice de confusion :")
print(confusion_matrix(y_test, y_pred))



In [3]:
images.shape

AttributeError: 'list' object has no attribute 'shape'

In [2]:
import numpy as np

batch_size = 100
num_batches = len(images) // batch_size

for i in range(num_batches):
    batch_images = images[i*batch_size : (i+1)*batch_size]
    max_value = batch_images.max()
    images[i*batch_size : (i+1)*batch_size] = batch_images / (max_value / 255.0)

AttributeError: 'list' object has no attribute 'max'

In [22]:
from sklearn.preprocessing import LabelEncoder

# Convertir les étiquettes en entiers
labels_encoded = LabelEncoder().fit_transform(labels)

# Convertir les images en float32
X_train_normal = X_train_normal.astype(np.float32)
X_test_normal = X_test_normal.astype(np.float32)

X_train_flat = X_train_normal.reshape(-1, X_train_normal.shape[1] * X_train_normal.shape[2] * X_train_normal.shape[3])
X_test_flat = X_test_normal.reshape(-1, X_test_normal.shape[1] * X_test_normal.shape[2] * X_test_normal.shape[3])

# Train the MLP model
mlp = MLPClassifier(hidden_layer_sizes=(128, 64), activation='relu', solver='adam', max_iter=1000)
mlp.fit(X_train_flat, y_train_encoded)

# Evaluate the model
y_pred = mlp.predict(X_test_flat)
accuracy = accuracy_score(y_test_encoded, y_pred)
print("Accuracy :", accuracy)
print("Classification Report :")
print(classification_report(y_test_encoded, y_pred))
print("Confusion Matrix :")
print(confusion_matrix(y_test_encoded, y_pred))



MemoryError: Unable to allocate 10.0 GiB for an array with shape (19944, 150, 150, 3) and data type float64

In [None]:
# evaluate MLP
# evaluate classifier
from sklearn.metrics import classification_report
# predire

# evaluer avec classification_report