# RNN (R√©seaux de Neurones R√©currents) - Version Simplifi√©e

## üéØ Objectifs de ce notebook

1. **Comprendre** ce qu'est un RNN et pourquoi on l'utilise
2. **Visualiser** comment un RNN traite les donn√©es s√©quentielles
3. **Impl√©menter** un RNN simple avec TensorFlow
4. **Appliquer** les RNN √† un probl√®me concret : l'analyse de sentiment
5. **Identifier** les limites des RNN basiques

---

## 1. ü§î Qu'est-ce qu'un RNN ?

### Analogie simple :
Imaginez que vous lisez une phrase mot par mot. √Ä chaque mot, vous :
- **Regardez** le mot actuel
- **Vous souvenez** de ce que vous avez lu avant
- **Formez** une nouvelle compr√©hension

C'est exactement ce que fait un RNN !

### Diff√©rence avec les r√©seaux classiques :
- **R√©seau classique** : Une image ‚Üí Une pr√©diction
- **RNN** : Une s√©quence (texte, audio, s√©rie temporelle) ‚Üí Une ou plusieurs pr√©dictions

### Exemples d'applications :
- üì± **Traduction automatique** : "Hello" ‚Üí "Bonjour"
- üòä **Analyse de sentiment** : "J'adore ce film" ‚Üí Positif
- üìà **Pr√©diction de s√©ries temporelles** : Prix des actions
- üéµ **G√©n√©ration de musique** : Composer de nouvelles m√©lodies

## 2. üì¶ Installation et imports

In [1]:
# Installation des biblioth√®ques n√©cessaires
!pip install tensorflow numpy matplotlib scikit-learn

[31mERROR: Could not find a version that satisfies the requirement tensorflow (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for tensorflow[0m[31m
[0m

In [2]:
# Imports n√©cessaires
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from sklearn.model_selection import train_test_split

# Configuration pour l'affichage
plt.style.use('default')

print(f"‚úÖ TensorFlow version: {tf.__version__}")
print(f"‚úÖ Imports termin√©s !")

ModuleNotFoundError: No module named 'tensorflow'

## 3. üß† Comment fonctionne un RNN ?

### Visualisation conceptuelle

Un RNN traite une s√©quence √©tape par √©tape :

```
Mot 1: "J'"     ‚Üí √âtat cach√© h1
Mot 2: "adore"  ‚Üí √âtat cach√© h2 (utilise h1 + "adore")
Mot 3: "ce"     ‚Üí √âtat cach√© h3 (utilise h2 + "ce")
Mot 4: "film"   ‚Üí √âtat cach√© h4 (utilise h3 + "film")
                ‚Üí Pr√©diction finale: POSITIF
```

### Formule math√©matique (simplifi√©e) :
```
√âtat cach√©(t) = tanh(Poids √ó [√âtat pr√©c√©dent, Mot actuel])
```

In [None]:
# Visualisation simple du fonctionnement d'un RNN
def visualiser_rnn():
    fig, ax = plt.subplots(1, 1, figsize=(12, 6))
    
    # Positions des √©l√©ments
    positions = [1, 3, 5, 7]
    mots = ["J'", "adore", "ce", "film"]
    
    # Dessiner les cellules RNN
    for i, (pos, mot) in enumerate(zip(positions, mots)):
        # Cellule RNN
        rect = plt.Rectangle((pos-0.3, 2), 0.6, 1, 
                           facecolor='lightblue', edgecolor='darkblue', linewidth=2)
        ax.add_patch(rect)
        ax.text(pos, 2.5, 'RNN', ha='center', va='center', fontsize=12, fontweight='bold')
        
        # Mot d'entr√©e
        ax.text(pos, 1, mot, ha='center', va='center', fontsize=12, 
                bbox=dict(boxstyle="round,pad=0.3", facecolor='lightgreen'))
        
        # Fl√®che d'entr√©e
        ax.arrow(pos, 1.5, 0, 0.4, head_width=0.1, head_length=0.1, fc='green', ec='green')
        
        # √âtat cach√©
        ax.text(pos, 3.5, f'h{i+1}', ha='center', va='center', fontsize=10,
                bbox=dict(boxstyle="round,pad=0.2", facecolor='orange'))
        
        # Fl√®che de sortie
        ax.arrow(pos, 3.1, 0, 0.3, head_width=0.1, head_length=0.1, fc='orange', ec='orange')
        
        # Connexion horizontale (sauf pour le dernier)
        if i < len(positions) - 1:
            ax.arrow(pos + 0.3, 2.5, 1.4, 0, head_width=0.1, head_length=0.1, 
                    fc='red', ec='red', linewidth=2)
    
    # Pr√©diction finale
    ax.text(8.5, 2.5, 'POSITIF', ha='center', va='center', fontsize=14, fontweight='bold',
            bbox=dict(boxstyle="round,pad=0.5", facecolor='gold'))
    ax.arrow(7.3, 2.5, 0.9, 0, head_width=0.1, head_length=0.1, fc='blue', ec='blue')
    
    # L√©gendes
    ax.text(4, 0.2, 'Mots d\'entr√©e', ha='center', fontsize=10, color='green')
    ax.text(4, 4.2, '√âtats cach√©s', ha='center', fontsize=10, color='orange')
    ax.text(4, 1.8, 'Connexions r√©currentes', ha='center', fontsize=10, color='red')
    
    ax.set_xlim(0, 10)
    ax.set_ylim(0, 5)
    ax.set_title('üß† Comment un RNN traite la phrase "J\'adore ce film"', 
                fontsize=16, fontweight='bold', pad=20)
    ax.axis('off')
    
    plt.tight_layout()
    plt.show()

visualiser_rnn()

## 4. üõ†Ô∏è Premier RNN avec TensorFlow

Cr√©ons notre premier RNN √©tape par √©tape :

In [None]:
# √âtape 1: Cr√©er un RNN simple
def creer_rnn_simple():
    """
    Cr√©e un RNN basique pour comprendre la structure
    """
    model = models.Sequential([
        # Couche RNN simple
        # - 64: nombre de neurones dans l'√©tat cach√©
        # - input_shape: (longueur_sequence, dimensions_features)
        layers.SimpleRNN(64, input_shape=(10, 1)),
        
        # Couche de sortie pour classification binaire
        layers.Dense(1, activation='sigmoid')
    ])
    
    return model

# Cr√©er le mod√®le
mon_premier_rnn = creer_rnn_simple()

# Voir la structure
print("üìã Structure de notre premier RNN :")
mon_premier_rnn.summary()

In [None]:
# √âtape 2: Tester avec des donn√©es factices
print("üß™ Test avec des donn√©es exemple :")

# Cr√©er des donn√©es d'exemple
# Format: (nombre_exemples, longueur_sequence, features)
donnees_test = np.random.randn(5, 10, 1)  # 5 exemples, s√©quences de 10, 1 feature

print(f"üìä Forme des donn√©es d'entr√©e: {donnees_test.shape}")

# Faire une pr√©diction
predictions = mon_premier_rnn.predict(donnees_test, verbose=0)

print(f"üìà Forme des pr√©dictions: {predictions.shape}")
print(f"üìã Premi√®res pr√©dictions: {predictions.flatten()[:3]}")

print("\n‚úÖ Notre RNN fonctionne ! Il prend des s√©quences et produit des pr√©dictions.")

## 5. üìù Projet pratique : Analyse de sentiment

Maintenant, appliquons les RNN √† un probl√®me r√©el : d√©terminer si un commentaire est positif ou n√©gatif.

### √âtapes :
1. **Cr√©er** des donn√©es d'exemple
2. **Preprocesser** le texte
3. **Construire** le mod√®le RNN
4. **Entra√Æner** le mod√®le
5. **Tester** sur de nouveaux exemples

In [None]:
# √âtape 1: Cr√©er nos donn√©es d'entra√Ænement
def creer_donnees_sentiment():
    """
    Cr√©e un petit dataset pour l'analyse de sentiment
    """
    # Commentaires POSITIFS
    positifs = [
        "Ce film est absolument fantastique",
        "J'ai ador√© cette exp√©rience",
        "Excellent service, tr√®s satisfait",
        "Produit de qualit√© exceptionnelle",
        "Une exp√©rience merveilleuse",
        "Superbe performance des acteurs",
        "Je recommande vivement",
        "Tr√®s bonne qualit√©",
        "Service client parfait",
        "Vraiment impressionnant"
    ]
    
    # Commentaires N√âGATIFS
    negatifs = [
        "Film tr√®s d√©cevant et ennuyeux",
        "Tr√®s mauvaise exp√©rience",
        "Produit de mauvaise qualit√©",
        "Je suis tr√®s d√©√ßu",
        "√Ä √©viter absolument",
        "Service client inexistant",
        "Qualit√© vraiment m√©diocre",
        "Perte de temps total",
        "Je regrette cet achat",
        "Vraiment catastrophique"
    ]
    
    # Combiner les donn√©es
    tous_textes = positifs + negatifs
    
    # Labels: 1 = positif, 0 = n√©gatif
    labels = [1] * len(positifs) + [0] * len(negatifs)
    
    # Multiplier les donn√©es pour avoir plus d'exemples
    tous_textes = tous_textes * 5  # 100 exemples au total
    labels = labels * 5
    
    return tous_textes, np.array(labels)

# Cr√©er les donn√©es
textes, sentiments = creer_donnees_sentiment()

print(f"üìä Nombre total d'exemples: {len(textes)}")
print(f"üìä Positifs: {np.sum(sentiments)}, N√©gatifs: {len(sentiments) - np.sum(sentiments)}")
print("\nüìã Exemples:")
for i in range(3):
    emoji = "üòä" if sentiments[i] == 1 else "üòû"
    print(f"  {emoji} {textes[i]}")

In [None]:
# √âtape 2: Preprocesser les textes
print("üîß Pr√©paration des donn√©es...")

# Configuration
MAX_MOTS = 1000  # Vocabulaire maximum
MAX_LONGUEUR = 15  # Longueur maximale des phrases

# Cr√©er le tokenizer (convertit les mots en nombres)
tokenizer = Tokenizer(num_words=MAX_MOTS)
tokenizer.fit_on_texts(textes)

print(f"üìö Taille du vocabulaire: {len(tokenizer.word_index)}")

# Convertir les textes en s√©quences de nombres
sequences = tokenizer.texts_to_sequences(textes)

print(f"üìã Exemple de conversion:")
print(f"  Texte: '{textes[0]}'")
print(f"  S√©quence: {sequences[0]}")

# √âgaliser la longueur des s√©quences (padding)
X = pad_sequences(sequences, maxlen=MAX_LONGUEUR)
y = sentiments

print(f"\nüìä Forme finale des donn√©es: {X.shape}")
print(f"üìä Exemple apr√®s padding: {X[0]}")

# Diviser en train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

print(f"\n‚úÖ Donn√©es pr√™tes !")
print(f"   Train: {X_train.shape[0]} exemples")
print(f"   Test: {X_test.shape[0]} exemples")

In [None]:
# √âtape 3: Construire le mod√®le RNN pour l'analyse de sentiment
def creer_rnn_sentiment():
    """
    Cr√©e un RNN sp√©cialis√© pour l'analyse de sentiment
    """
    model = models.Sequential([
        # 1. Couche d'embedding (convertit les nombres en vecteurs)
        layers.Embedding(
            input_dim=MAX_MOTS,      # Taille du vocabulaire
            output_dim=50,           # Dimension des vecteurs de mots
            input_length=MAX_LONGUEUR # Longueur des s√©quences
        ),
        
        # 2. Couche RNN
        layers.SimpleRNN(
            64,                      # 64 neurones dans l'√©tat cach√©
            dropout=0.3              # Pour √©viter le surapprentissage
        ),
        
        # 3. Couche de sortie (positif ou n√©gatif)
        layers.Dense(1, activation='sigmoid')
    ])
    
    # Compiler le mod√®le
    model.compile(
        optimizer='adam',                    # Algorithme d'optimisation
        loss='binary_crossentropy',         # Fonction de perte pour classification binaire
        metrics=['accuracy']                # M√©trique √† suivre
    )
    
    return model

# Cr√©er le mod√®le
modele_sentiment = creer_rnn_sentiment()

print("üèóÔ∏è Architecture du mod√®le RNN pour sentiment:")
modele_sentiment.summary()

print("\nüìù Explication des couches:")
print("  üîπ Embedding: Convertit les mots (nombres) en vecteurs")
print("  üîπ SimpleRNN: Traite la s√©quence et m√©morise le contexte")
print("  üîπ Dense: Pr√©diction finale (0=n√©gatif, 1=positif)")

In [None]:
# √âtape 4: Entra√Æner le mod√®le
print("üöÄ D√©but de l'entra√Ænement...")

# Entra√Æner le mod√®le
historique = modele_sentiment.fit(
    X_train, y_train,           # Donn√©es d'entra√Ænement
    batch_size=16,              # Traiter 16 exemples √† la fois
    epochs=10,                  # 10 passages sur toutes les donn√©es
    validation_split=0.2,       # 20% des donn√©es pour validation
    verbose=1                   # Afficher les d√©tails
)

print("\n‚úÖ Entra√Ænement termin√© !")

In [None]:
# Visualiser l'entra√Ænement
def visualiser_entrainement(historique):
    """
    Affiche l'√©volution de l'accuracy et de la loss pendant l'entra√Ænement
    """
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 4))
    
    # Graphique de l'accuracy
    ax1.plot(historique.history['accuracy'], 'b-', label='Train', linewidth=2)
    ax1.plot(historique.history['val_accuracy'], 'r-', label='Validation', linewidth=2)
    ax1.set_title('üìà Pr√©cision du mod√®le', fontsize=14)
    ax1.set_xlabel('√âpoque')
    ax1.set_ylabel('Accuracy')
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # Graphique de la loss
    ax2.plot(historique.history['loss'], 'b-', label='Train', linewidth=2)
    ax2.plot(historique.history['val_loss'], 'r-', label='Validation', linewidth=2)
    ax2.set_title('üìâ Erreur du mod√®le', fontsize=14)
    ax2.set_xlabel('√âpoque')
    ax2.set_ylabel('Loss')
    ax2.legend()
    ax2.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()

visualiser_entrainement(historique)

In [None]:
# √âtape 5: Tester le mod√®le
print("üß™ √âvaluation sur les donn√©es de test:")

# √âvaluer sur les donn√©es de test
test_loss, test_accuracy = modele_sentiment.evaluate(X_test, y_test, verbose=0)
print(f"üìä Pr√©cision sur le test: {test_accuracy:.1%}")

# Fonction pour pr√©dire le sentiment d'une nouvelle phrase
def predire_sentiment(phrase):
    """
    Pr√©dit si une phrase est positive ou n√©gative
    """
    # Preprocesser la phrase
    sequence = tokenizer.texts_to_sequences([phrase])
    sequence_paddee = pad_sequences(sequence, maxlen=MAX_LONGUEUR)
    
    # Faire la pr√©diction
    score = modele_sentiment.predict(sequence_paddee, verbose=0)[0, 0]
    
    # Interpr√©ter le r√©sultat
    if score > 0.5:
        return "üòä POSITIF", score
    else:
        return "üòû N√âGATIF", score

# Tester sur de nouvelles phrases
nouvelles_phrases = [
    "Ce restaurant est formidable",
    "Je deteste ce produit",
    "Tr√®s bonne qualit√©",
    "Service d√©cevant",
    "Pas mal mais peut mieux faire"
]

print("\nüîÆ Pr√©dictions sur de nouvelles phrases:")
print("=" * 50)

for phrase in nouvelles_phrases:
    sentiment, score = predire_sentiment(phrase)
    print(f"'{phrase}'")
    print(f"  ‚Üí {sentiment} (confiance: {score:.1%})\n")

## 6. üîç Comprendre les limites des RNN

Les RNN basiques ont quelques probl√®mes importants :

In [None]:
# D√©monstration du probl√®me de m√©moire courte
def tester_memoire_rnn():
    """
    Montre comment les RNN ont du mal avec les longues s√©quences
    """
    # Phrase courte vs phrase longue
    phrase_courte = "Ce film est g√©nial"
    phrase_longue = "Ce film, malgr√© quelques d√©fauts mineurs dans le sc√©nario et des moments qui tra√Ænent un peu en longueur, reste g√©nial"
    
    print("üî¨ Test de m√©moire des RNN:")
    print("\nüìù Phrase courte:")
    print(f"  '{phrase_courte}'")
    sentiment, score = predire_sentiment(phrase_courte)
    print(f"  ‚Üí {sentiment} (confiance: {score:.1%})")
    
    print("\nüìù Phrase longue (m√™me sentiment final):")
    print(f"  '{phrase_longue}'")
    sentiment, score = predire_sentiment(phrase_longue)
    print(f"  ‚Üí {sentiment} (confiance: {score:.1%})")
    
    print("\nüí° Observation:")
    print("   Les RNN ont plus de difficult√© avec les phrases longues")
    print("   car ils 'oublient' le d√©but de la phrase.")

tester_memoire_rnn()

In [None]:
# R√©sum√© des limitations
def afficher_limitations():
    """
    Montre les principales limitations des RNN
    """
    limitations = {
        "üß† M√©moire courte": "Oublient les informations lointaines dans la s√©quence",
        "‚è≥ Lenteur d'entra√Ænement": "Doivent traiter les mots un par un (pas de parall√©lisation)",
        "üìâ Gradient qui dispara√Æt": "Difficult√© √† apprendre sur de longues s√©quences",
        "üîÑ Pas de vision d'ensemble": "Ne voient que ce qui pr√©c√®de, pas la suite"
    }
    
    solutions = {
        "üß† M√©moire courte": "‚Üí LSTM et GRU (avec portes de m√©moire)",
        "‚è≥ Lenteur d'entra√Ænement": "‚Üí Transformers (traitement parall√®le)",
        "üìâ Gradient qui dispara√Æt": "‚Üí LSTM/GRU avec connexions r√©siduelles",
        "üîÑ Pas de vision d'ensemble": "‚Üí Attention mechanisms et Transformers"
    }
    
    print("‚ö†Ô∏è Limitations des RNN basiques:")
    print("=" * 60)
    
    for limitation, description in limitations.items():
        print(f"\n{limitation}")
        print(f"  {description}")
        if limitation in solutions:
            print(f"  {solutions[limitation]}")

afficher_limitations()

## 7. üéØ R√©sum√© et Points Cl√©s

### ‚úÖ Ce que nous avons appris :

1. **Les RNN sont parfaits pour les donn√©es s√©quentielles** (texte, audio, s√©ries temporelles)
2. **Ils maintiennent un "√©tat cach√©"** qui se souvient du contexte pr√©c√©dent
3. **TensorFlow/Keras rend l'impl√©mentation simple** avec quelques lignes de code
4. **Les applications sont nombreuses** : sentiment, traduction, g√©n√©ration de texte

### ‚ö†Ô∏è Limitations importantes :

1. **M√©moire courte** pour les longues s√©quences
2. **Entra√Ænement lent** (traitement s√©quentiel)
3. **Probl√®me du gradient qui dispara√Æt**

### üöÄ Prochaines √©tapes :

- **LSTM et GRU** : Versions am√©lior√©es des RNN
- **Transformers** : Architecture moderne qui r√©sout la plupart des probl√®mes
- **Applications avanc√©es** : Traduction automatique, chatbots

---

### üí° Exercices pour aller plus loin :

1. **Modifiez le dataset** : Ajoutez vos propres phrases positives/n√©gatives
2. **Changez l'architecture** : Testez diff√©rents nombres de neurones
3. **Essayez d'autres probl√®mes** : Classification de genres de films, d√©tection de spam
4. **Comparez avec un mod√®le simple** : Bag of Words vs RNN

F√©licitations ! üéâ Vous ma√Ætrisez maintenant les bases des RNN !