# Réseau de Neurones pour la Classification des Galaxies

Ce carnet entraîne un réseau de neurones convolutionnel pour classifier les galaxies en utilisant le dataset Galaxy10 DECals. Il explore différents optimisateurs et taux d'apprentissage pour trouver la meilleure combinaison.

In [2]:
# Importer les bibliothèques nécessaires
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from datasets import load_dataset
from PIL import Image
from datetime import datetime

2024-06-12 23:14:29.978813: I tensorflow/core/util/port.cc:113] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2024-06-12 23:14:30.021287: I tensorflow/core/platform/cpu_feature_guard.cc:210] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 AVX512F AVX512_VNNI FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.
  from .autonotebook import tqdm as notebook_tqdm


## Prétraitement des Données

La fonction suivante prétraite le dataset en redimensionnant les images à 64x64 pixels et en les normalisant. Le dataset est ensuite divisé en ensembles d'entraînement et de test.

In [3]:
def preprocess_data(dataset):
    new_size = (64, 64)
    images = np.array([np.array(Image.fromarray(np.array(image['image'])).resize(new_size)) for image in dataset['train']])
    labels = np.array(dataset['train']['label'])

    images = images / 255.0

    return train_test_split(images, labels, test_size=0.2, random_state=42)

## Construction du Modèle

La fonction suivante construit un modèle de réseau de neurones convolutionnel avec les paramètres spécifiés.

In [4]:
def build_model(layer1_neuron, layer2_neuron, layer3_neuron, layer4_neuron, lr, kernel_size, activation_function, dropout_value, opt_name):
    model = tf.keras.models.Sequential([
        tf.keras.layers.Input(shape=(64, 64, 3)),
        tf.keras.layers.Conv2D(layer1_neuron, kernel_size, activation=activation_function),
        tf.keras.layers.MaxPooling2D((2, 2)),
        tf.keras.layers.Conv2D(layer2_neuron, kernel_size, activation=activation_function),
        tf.keras.layers.MaxPooling2D((2, 2)),
        tf.keras.layers.Conv2D(layer3_neuron, kernel_size, activation=activation_function),
        tf.keras.layers.MaxPooling2D((2, 2)),
        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(layer4_neuron, activation=activation_function),
        tf.keras.layers.Dropout(dropout_value),
        tf.keras.layers.Dense(10, activation='softmax')
    ])
    model.compile(optimizer=opt_name(learning_rate=lr),
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    return model

## Paramètres

Nous définissons ici les paramètres pour le réseau de neurones, les optimiseurs, et les taux d'apprentissage.

In [5]:
# Paramètres
nb_epochs = 15  # Nombre d'époques
layer1_neuron = 32
layer2_neuron = 64
layer3_neuron = 128
layer4_neuron = 64

kernel_size = (3, 3)
activation_function = 'relu'
dropout_value = 0.5

optimizers = {
    'SGD': tf.keras.optimizers.SGD,
    'Adagrad': tf.keras.optimizers.Adagrad,
    'Adam': tf.keras.optimizers.Adam
    # Rajouter d'autres optimizers pour tester
}

learning_rates = [1e-3, 1e-2, 1e-1]# Rajouter d'autres learning rates pour tester

## Chargement du Dataset

Charger le dataset Galaxy10 DECals et le prétraiter.

In [6]:
print("\nChargement du Dataset...\n")
dataset = load_dataset("matthieulel/galaxy10_decals")
train_images, test_images, train_labels, test_labels = preprocess_data(dataset)


Chargement du Dataset...



## Entraînement et Évaluation

Itérer à travers chaque combinaison d'optimiseur et de taux d'apprentissage, entraîner le modèle et évaluer ses performances. TensorBoard est utilisé pour surveiller le processus d'entraînement.

In [7]:
best_opt = ''
best_lr = 0
best_acc = 0

print("\nItération sur chaque optimiseur et chaque taux d'apprentissage\n")
for opt_name, opt_class in optimizers.items():
    for lr in learning_rates:
        # Créer un répertoire de logs
        log_dir = f"runs/{opt_name}_lr_{lr}_" + datetime.now().strftime("%Y%m%d-%H%M%S")
        tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
        print(f"\nCréation du fichier {log_dir}\n")

        # Entraînement et test du réseau de neurones
        print("\nEntraînement...\n")
        model = build_model(layer1_neuron, layer2_neuron, layer3_neuron, layer4_neuron, lr, kernel_size, activation_function, dropout_value, opt_class)
        model.fit(train_images, train_labels, epochs=nb_epochs, validation_data=(test_images, test_labels), callbacks=[tensorboard_callback])
        test_loss, test_acc = model.evaluate(test_images, test_labels)
        if best_acc < test_acc:
            best_acc = test_acc
            best_lr = lr
            best_opt = opt_name
        print(f"Optimiseur: {opt_name}, lr: {lr} - Précision sur le test: {test_acc*100:.2f}%\n")

print(f"\nMeilleure combinaison: (Optimiseur: {best_opt} - Taux d'Apprentissage: {best_lr} - Précision: {best_acc*100:.4f})\n")


Itération sur chaque optimiseur et chaque taux d'apprentissage


Création du fichier runs/Adam_lr_0.001_20240612-231622


Entraînement...



2024-06-12 23:16:29.875977: I external/local_xla/xla/stream_executor/cuda/cuda_executor.cc:984] could not open file to read NUMA node: /sys/bus/pci/devices/0000:01:00.0/numa_node
Your kernel may have been built without NUMA support.
2024-06-12 23:16:29.882710: W tensorflow/core/common_runtime/gpu/gpu_device.cc:2251] Cannot dlopen some GPU libraries. Please make sure the missing libraries mentioned above are installed properly if you would like to use GPU. Follow the guide at https://www.tensorflow.org/install/gpu for how to download and setup the required libraries for your platform.
Skipping registering GPU devices...


Epoch 1/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 42ms/step - accuracy: 0.2138 - loss: 2.1050 - val_accuracy: 0.4366 - val_loss: 1.6072
Epoch 2/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 38ms/step - accuracy: 0.3862 - loss: 1.6714 - val_accuracy: 0.5343 - val_loss: 1.3628
Epoch 3/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 38ms/step - accuracy: 0.4771 - loss: 1.4334 - val_accuracy: 0.5393 - val_loss: 1.2693
Epoch 4/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m14s[0m 36ms/step - accuracy: 0.5372 - loss: 1.3041 - val_accuracy: 0.5800 - val_loss: 1.1735
Epoch 5/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m16s[0m 41ms/step - accuracy: 0.5680 - loss: 1.2256 - val_accuracy: 0.6342 - val_loss: 1.0846
Epoch 6/15
[1m400/400[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 38ms/step - accuracy: 0.5934 - loss: 1.1453 - val_accuracy: 0.6311 - val_loss: 1.0457
Epoch 7/15
[1m4

## Exécution de TensorBoard

Pour surveiller le processus d'entraînement, exécutez la commande suivante dans votre terminal :
```bash
tensorboard --logdir=runs
```
Ensuite, ouvrez un navigateur web et allez à l'URL fournie par TensorBoard (généralement `http://localhost:6006`).