[![Ouvrir sur Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/SkatAI/deeplearning/blob/master/notebooks/deep_dream_claude.ipynb)

# DeepDream ‚Äî Quand les r√©seaux de neurones hallucinent

**Deep Learning par la pratique ‚Äî Alexis Perrier**

---

## Qu'est-ce que DeepDream ?

En 2015, des ing√©nieurs de Google se sont pos√© une question simple : **que "voit" un r√©seau de neurones quand il regarde une image ?**

Pour r√©pondre, ils ont invers√© le processus habituel :

| Processus normal | DeepDream |
|---|---|
| On modifie les **poids** du r√©seau pour qu'il reconnaisse mieux les images | On modifie **l'image elle-m√™me** pour amplifier ce que le r√©seau y "voit" d√©j√† |
| Descente de gradient sur les poids | **Mont√©e** de gradient sur les pixels |
| Le r√©seau apprend | Le r√©seau **hallucine** |

Le r√©sultat : des images psych√©d√©liques o√π le r√©seau projette ses propres patterns ‚Äî yeux, visages d'animaux, textures fractales ‚Äî sur n'importe quelle photo.

### Pourquoi c'est int√©ressant ?

- C'est une fen√™tre sur ce que les couches du r√©seau ont **r√©ellement appris**
- Les couches basses voient des **textures et motifs g√©om√©triques**
- Les couches hautes voient des **formes complexes** (yeux, museaux, plumes)
- C'est aussi devenu un **outil artistique** √† part enti√®re

---

## √âtape 0 ‚Äî Setup

In [None]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras.applications import inception_v3
import IPython.display as display
from PIL import Image
import time

print(f"TensorFlow version: {tf.__version__}")
print(f"GPU disponible: {tf.config.list_physical_devices('GPU')}")

---

## √âtape 1 ‚Äî Charger une image de d√©part

On commence avec une image riche en textures et en d√©tails ‚Äî c'est ce qui donne les meilleurs r√©sultats avec DeepDream.

In [None]:
# T√©l√©charger une image spectaculaire
url = 'https://storage.googleapis.com/download.tensorflow.org/example_images/YellowLabradorLooking_new.jpg'
image_path = keras.utils.get_file('labrador.jpg', url)

# Fonctions utilitaires pour charger et afficher les images
def load_image(path, max_dim=512):
    """Charge une image et la redimensionne."""
    img = Image.open(path)
    img.thumbnail((max_dim, max_dim))
    img = np.array(img)
    return img

def show_image(img, title=''):
    """Affiche une image."""
    if isinstance(img, tf.Tensor):
        img = img.numpy()
    img = np.clip(img, 0, 255).astype(np.uint8)
    plt.figure(figsize=(10, 10))
    plt.imshow(img)
    plt.axis('off')
    if title:
        plt.title(title, fontsize=16)
    plt.show()

# Charger et afficher
original_img = load_image(image_path)
show_image(original_img, 'Image originale')

---

## √âtape 2 ‚Äî Charger le mod√®le InceptionV3

DeepDream a √©t√© invent√© avec le r√©seau **InceptionV3** de Google ‚Äî c'est le mod√®le classique pour cet effet.

Ce r√©seau a √©t√© entra√Æn√© sur ImageNet (1,4 million d'images, 1000 cat√©gories). Il a appris √† reconna√Ætre des textures, des formes, des objets, des animaux.

On ne va pas l'utiliser pour classifier des images. On va regarder **√† l'int√©rieur** pour voir ce que chaque couche a appris.

In [None]:
# Charger InceptionV3 pr√©-entra√Æn√©
base_model = inception_v3.InceptionV3(include_top=False, weights='imagenet')

# Lister quelques couches int√©ressantes
print(f"Nombre total de couches : {len(base_model.layers)}\n")
print("Quelques couches disponibles :")
for layer in base_model.layers:
    if 'mixed' in layer.name:
        print(f"  - {layer.name:20s}  ‚Üí  output shape: {layer.output.shape}")

### ü§ñ GEMINI

Demandez √† Gemini :

> *"Qu'est-ce que le r√©seau InceptionV3 ? Pourquoi s'appelle-t-il Inception ? Quelle est la diff√©rence entre les couches 'mixed0' (d√©but du r√©seau) et 'mixed10' (fin du r√©seau) en termes de ce qu'elles d√©tectent ?"*

---

## √âtape 3 ‚Äî Comprendre le principe : gradient ascent

Quand on entra√Æne un r√©seau normalement, on fait de la **descente de gradient** : on modifie les poids pour **minimiser** une erreur.

Avec DeepDream, on fait l'inverse ‚Äî de la **mont√©e de gradient** (gradient ascent) :
- On choisit une couche du r√©seau
- On calcule les activations de cette couche pour notre image
- On modifie **les pixels de l'image** (pas les poids !) pour **maximiser** ces activations
- Le r√©seau amplifie ce qu'il "voit" d√©j√† dans l'image

C'est comme demander au r√©seau : *"Qu'est-ce que tu vois ? Montre-le-moi encore plus fort !"*

### 3.1 ‚Äî Choisir les couches

Le choix des couches d√©termine le type d'hallucinations :
- **Couches basses** (mixed0, mixed1) ‚Üí textures, motifs g√©om√©triques, ondulations
- **Couches interm√©diaires** (mixed3, mixed4) ‚Üí formes r√©p√©titives, yeux, spirales
- **Couches hautes** (mixed7, mixed10) ‚Üí objets complets, visages d'animaux, structures complexes

In [None]:
# On choisit les couches dont on veut amplifier les activations
# Chaque couche a un poids qui contr√¥le son influence

dream_layers = {
    'mixed3': 0.5,
    'mixed5': 1.5,
}

# Cr√©er le mod√®le DeepDream
outputs = [base_model.get_layer(name).output for name in dream_layers]
dream_model = keras.Model(inputs=base_model.input, outputs=outputs)

print("Couches s√©lectionn√©es pour le r√™ve :")
for name, weight in dream_layers.items():
    print(f"  - {name} (poids: {weight})")

### 3.2 ‚Äî La fonction de perte et le gradient ascent

In [None]:
def compute_loss(image, model, layer_weights):
    """Calcule la perte = somme pond√©r√©e des activations des couches choisies.
    Plus la perte est √©lev√©e, plus le r√©seau 'voit' des choses dans l'image."""
    # Pr√©-traitement pour InceptionV3
    img = inception_v3.preprocess_input(image)
    # Obtenir les activations des couches choisies
    activations = model(img)
    if not isinstance(activations, list):
        activations = [activations]

    losses = []
    weights = list(layer_weights.values())
    for activation, weight in zip(activations, weights):
        # La perte = la moyenne des activations √ó le poids
        loss = tf.reduce_mean(activation) * weight
        losses.append(loss)

    return tf.reduce_sum(losses)


@tf.function
def deepdream_step(image, model, layer_weights, step_size):
    """Une √©tape de gradient ascent : modifier l'image pour amplifier les activations."""
    with tf.GradientTape() as tape:
        tape.watch(image)
        loss = compute_loss(image, model, layer_weights)

    # Calculer le gradient par rapport aux pixels de l'image
    gradients = tape.gradient(loss, image)

    # Normaliser les gradients
    gradients /= tf.math.reduce_std(gradients) + 1e-8

    # MONT√âE de gradient : on AJOUTE le gradient (au lieu de le soustraire)
    image = image + gradients * step_size

    # Garder les valeurs de pixels dans une plage raisonnable
    image = tf.clip_by_value(image, -1, 1)

    return image, loss

print("Fonctions DeepDream pr√™tes !")

### ‚ùì QUESTION

Regardez la ligne `image = image + gradients * step_size` dans le code ci-dessus.

- Dans l'entra√Ænement classique d'un r√©seau, on √©crirait `weights = weights **-** learning_rate * gradients`. Quelle est la diff√©rence ?
- Pourquoi ajoute-t-on le gradient au lieu de le soustraire ?

*(votre r√©ponse ici)*

---

## √âtape 4 ‚Äî Premier r√™ve !

On lance DeepDream sur notre image. On va voir le r√©seau projeter ses hallucinations sur la photo.

In [None]:
def run_deepdream_simple(image, model, layer_weights, steps=100, step_size=0.01):
    """Lance DeepDream sur une image pendant un certain nombre d'√©tapes."""
    # Convertir en float32 et ajouter la dimension batch
    img = tf.constant(np.array(image), dtype=tf.float32)
    img = tf.expand_dims(img, axis=0)

    for step in range(steps):
        img, loss = deepdream_step(img, model, layer_weights, step_size)
        if step % 25 == 0:
            print(f"  √âtape {step:3d}, perte = {loss.numpy():.2f}")

    # Retirer la dimension batch et remettre en [0, 255]
    result = img[0].numpy()
    result = ((result + 1) / 2 * 255)  # de [-1,1] vers [0,255]
    result = np.clip(result, 0, 255).astype(np.uint8)
    return result


print("üåÄ DeepDream en cours...")
start_time = time.time()

dream_img = run_deepdream_simple(
    original_img,
    dream_model,
    dream_layers,
    steps=100,
    step_size=0.01
)

elapsed = time.time() - start_time
print(f"\n‚úÖ Termin√© en {elapsed:.1f} secondes")

# Afficher c√¥te √† c√¥te
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 8))
ax1.imshow(original_img)
ax1.set_title('Image originale', fontsize=14)
ax1.axis('off')
ax2.imshow(dream_img)
ax2.set_title('DeepDream', fontsize=14)
ax2.axis('off')
plt.tight_layout()
plt.show()

### ‚ùì QUESTION

- Quels patterns voyez-vous appara√Ætre dans l'image ?
- Reconnaissez-vous des formes d'animaux, des yeux, des textures ?
- Pourquoi le r√©seau projette-t-il ces formes en particulier ? (indice : sur quel dataset a-t-il √©t√© entra√Æn√© ?)

*(vos observations ici)*

---

## √âtape 5 ‚Äî Explorer les couches : que voit le r√©seau √† chaque profondeur ?

C'est la partie la plus r√©v√©latrice. On va appliquer DeepDream avec **diff√©rentes couches** pour voir comment les features √©voluent dans le r√©seau.

In [None]:
# Tester 4 configurations de couches diff√©rentes
experiments = {
    'Couches basses\n(textures)': {'mixed0': 1.0, 'mixed1': 1.0},
    'Couches moyennes\n(motifs)': {'mixed3': 1.0, 'mixed4': 1.0},
    'Couches hautes\n(formes)': {'mixed5': 1.0, 'mixed7': 1.0},
    'Couches tr√®s hautes\n(objets)': {'mixed8': 1.0, 'mixed10': 1.0},
}

fig, axes = plt.subplots(1, 4, figsize=(24, 6))

for ax, (title, layers_config) in zip(axes, experiments.items()):
    print(f"\nüåÄ {title.replace(chr(10), ' ')}...")

    # Cr√©er le mod√®le pour ces couches
    layer_outputs = [base_model.get_layer(name).output for name in layers_config]
    model = keras.Model(inputs=base_model.input, outputs=layer_outputs)

    # Lancer DeepDream
    result = run_deepdream_simple(
        original_img, model, layers_config,
        steps=80, step_size=0.01
    )

    ax.imshow(result)
    ax.set_title(title, fontsize=13)
    ax.axis('off')

plt.suptitle('DeepDream ‚Äî Impact de la profondeur des couches', fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

### ‚ùì QUESTION

Comparez les 4 images :
- **Couches basses** : quel type de patterns voyez-vous ? (textures ? motifs g√©om√©triques ?)
- **Couches hautes** : les patterns sont-ils plus figuratifs ? Reconnaissez-vous des formes ?
- Que nous apprend cette progression sur la fa√ßon dont un r√©seau de neurones "comprend" une image ?

*(vos observations ici)*

---

## √âtape 6 ‚Äî DeepDream multi-scale (octaves)

La version basique produit des r√©sultats un peu flous. La technique des **octaves** donne des r√©sultats bien plus nets et spectaculaires.

Le principe :
1. R√©duire l'image
2. Appliquer DeepDream sur la petite version
3. Agrandir le r√©sultat
4. Ajouter les d√©tails perdus
5. R√©appliquer DeepDream
6. R√©p√©ter √† plusieurs √©chelles

Chaque passage √† une √©chelle sup√©rieure s'appelle une **octave** (comme en musique).

In [None]:
def run_deepdream_octaves(image, model, layer_weights,
                          steps_per_octave=50, step_size=0.01,
                          num_octaves=3, octave_scale=1.3):
    """DeepDream multi-scale avec octaves pour des r√©sultats plus nets."""

    img = tf.constant(np.array(image), dtype=tf.float32)
    img = tf.expand_dims(img, axis=0)

    original_shape = tf.shape(img)[1:3]

    for octave in range(num_octaves):
        # Calculer la taille pour cette octave
        scale = octave_scale ** (num_octaves - 1 - octave)
        new_size = tf.cast(tf.cast(original_shape, tf.float32) / scale, tf.int32)

        # Redimensionner l'image
        img = tf.image.resize(img, new_size)

        print(f"  Octave {octave + 1}/{num_octaves} ‚Äî taille: {new_size[0].numpy()}x{new_size[1].numpy()}")

        # Appliquer DeepDream √† cette √©chelle
        for step in range(steps_per_octave):
            img, loss = deepdream_step(img, model, layer_weights, step_size)

        print(f"    ‚Üí perte = {loss.numpy():.2f}")

    # Remettre √† la taille originale
    img = tf.image.resize(img, original_shape)

    # Post-traitement
    result = img[0].numpy()
    result = ((result + 1) / 2 * 255)
    result = np.clip(result, 0, 255).astype(np.uint8)
    return result


# Recr√©er le mod√®le avec les couches de r√™ve
dream_layers_octave = {'mixed3': 0.5, 'mixed5': 1.5}
outputs_octave = [base_model.get_layer(name).output for name in dream_layers_octave]
dream_model_octave = keras.Model(inputs=base_model.input, outputs=outputs_octave)

print("üåÄ DeepDream multi-scale (octaves) en cours...")
start_time = time.time()

dream_octave = run_deepdream_octaves(
    original_img,
    dream_model_octave,
    dream_layers_octave,
    steps_per_octave=50,
    step_size=0.01,
    num_octaves=3,
    octave_scale=1.3
)

elapsed = time.time() - start_time
print(f"\n‚úÖ Termin√© en {elapsed:.1f} secondes")

# Comparer les 3 versions
fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(20, 7))
ax1.imshow(original_img)
ax1.set_title('Originale', fontsize=14)
ax1.axis('off')
ax2.imshow(dream_img)
ax2.set_title('DeepDream simple', fontsize=14)
ax2.axis('off')
ax3.imshow(dream_octave)
ax3.set_title('DeepDream octaves', fontsize=14)
ax3.axis('off')
plt.tight_layout()
plt.show()

### ‚ùì QUESTION

Comparez les versions "simple" et "octaves" :
- Laquelle produit des d√©tails plus fins ?
- La version octaves contient-elle des patterns √† diff√©rentes √©chelles ?

*(vos observations ici)*

---

## √âtape 7 ‚Äî Exp√©rimenter

### 7.1 ‚Äî Modifier l'intensit√© du r√™ve

Le param√®tre `step_size` contr√¥le l'intensit√© de l'effet. Plus il est √©lev√©, plus les hallucinations sont prononc√©es.

In [None]:
intensities = [0.005, 0.01, 0.03]
labels = ['Subtil', 'Mod√©r√©', 'Intense']

fig, axes = plt.subplots(1, 3, figsize=(20, 7))

for ax, step_size, label in zip(axes, intensities, labels):
    print(f"\nüåÄ {label} (step_size={step_size})...")
    result = run_deepdream_simple(
        original_img, dream_model, dream_layers,
        steps=80, step_size=step_size
    )
    ax.imshow(result)
    ax.set_title(f'{label}\n(step_size={step_size})', fontsize=13)
    ax.axis('off')

plt.suptitle("Impact de l'intensit√© (step_size)", fontsize=16, y=1.02)
plt.tight_layout()
plt.show()

### ü§ñ GEMINI ‚Äî Exp√©rimenter avec d'autres combinaisons

Demandez √† Gemini :

> *"Modifie le dictionnaire `dream_layers` pour utiliser uniquement la couche 'mixed7' avec un poids de 2.0. Relance DeepDream avec 100 √©tapes et step_size=0.01. Affiche le r√©sultat √† c√¥t√© de l'original."*

Puis essayez d'autres combinaisons et demandez :

> *"Quelles couches d'InceptionV3 produisent les effets les plus psych√©d√©liques ? Pourquoi les couches profondes g√©n√®rent-elles des formes d'animaux ?"*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI



---

## √âtape 8 ‚Äî Testez avec vos propres images !

Uploadez n'importe quelle image et voyez ce que le r√©seau y hallucine.

**Suggestions** :
- une de vos cr√©ations 3D / Blender
- un paysage, un b√¢timent, un portrait
- une texture, un motif abstrait
- une photo du quotidien

Les images avec beaucoup de textures et de d√©tails donnent les r√©sultats les plus spectaculaires.

In [None]:
from google.colab import files

print("Uploadez une image :")
uploaded = files.upload()

In [None]:
for filename in uploaded.keys():
    print(f"\nüì∑ Image : {filename}")

    # Charger l'image
    my_img = load_image(filename, max_dim=512)

    # Lancer DeepDream avec octaves
    my_layers = {'mixed3': 0.5, 'mixed5': 1.5}
    my_outputs = [base_model.get_layer(name).output for name in my_layers]
    my_model = keras.Model(inputs=base_model.input, outputs=my_outputs)

    print("üåÄ DeepDream en cours...")
    my_dream = run_deepdream_octaves(
        my_img, my_model, my_layers,
        steps_per_octave=50, step_size=0.01,
        num_octaves=3, octave_scale=1.3
    )

    # Afficher
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 8))
    ax1.imshow(my_img)
    ax1.set_title('Votre image', fontsize=14)
    ax1.axis('off')
    ax2.imshow(my_dream)
    ax2.set_title('DeepDream', fontsize=14)
    ax2.axis('off')
    plt.tight_layout()
    plt.show()

### ü§ñ GEMINI ‚Äî Aller plus loin avec vos images

Demandez √† Gemini :

> *"Modifie le code pour tester mon image avec 3 configurations de couches diff√©rentes c√¥te √† c√¥te : couches basses (mixed0, mixed1), couches moyennes (mixed3, mixed5), couches hautes (mixed8, mixed10). Affiche les 3 r√©sultats dans une grille."*

Ou bien :

> *"Ajoute le code pour sauvegarder l'image DeepDream en haute r√©solution dans un fichier PNG."*

In [None]:
# VOTRE CODE G√âN√âR√â PAR GEMINI ICI



---

## √âtape 9 ‚Äî Synth√®se

### Ce qu'on a appris

| Concept | Ce qu'on a vu |
|---|---|
| **Gradient ascent** | Au lieu de minimiser une erreur, on maximise les activations ‚Üí le r√©seau amplifie ce qu'il "voit" |
| **Hi√©rarchie des features** | Les couches basses d√©tectent des textures, les couches hautes des objets complexes |
| **Biais du dataset** | Le r√©seau hallucine des animaux parce qu'il a √©t√© entra√Æn√© sur ImageNet (beaucoup d'animaux) |
| **Octaves** | Travailler √† plusieurs √©chelles produit des d√©tails plus fins et plus nets |

### ‚ùì QUESTIONS FINALES

1. Si on entra√Ænait le r√©seau sur un dataset de b√¢timents au lieu d'ImageNet, que verrait-on appara√Ætre dans les r√™ves ?

2. DeepDream est souvent pr√©sent√© comme un outil artistique. Mais en quoi est-ce aussi un outil de **compr√©hension** des r√©seaux de neurones ?

3. Comment pourriez-vous int√©grer DeepDream dans un projet cr√©atif (3D, design, art g√©n√©ratif) ?

*(vos r√©ponses ici)*

---

## Pour aller plus loin (optionnel)

Quelques pistes d'exploration avec Gemini :

- **Cr√©er une animation** : appliquer DeepDream de mani√®re it√©rative (chaque output devient l'input suivant) et assembler les frames en GIF
- **Style transfer** : combiner DeepDream avec le Neural Style Transfer pour appliquer le style d'un tableau sur une photo
- **R√™ve progressif** : augmenter graduellement le step_size pour montrer l'image qui "plonge" dans le r√™ve
- **Zoomer dans le r√™ve** : appliquer DeepDream + zoom au centre √† chaque it√©ration (effet de plong√©e infinie)

In [None]:
# VOTRE EXPLORATION ICI

