# TD2 Elasticsearch - Guide Explicatif

Ce TD se concentre sur la **gestion des r√©pliques** et les **√©tats du cluster** (green, yellow, red).

## Pr√©requis

Assurez-vous d'avoir install√© la librairie :
```bash
pip install elasticsearch
```

Et que votre cluster Elasticsearch est d√©marr√© sur `http://localhost:9200`


In [None]:
# Import de la librairie et connexion au cluster
from elasticsearch import Elasticsearch
from pprint import pprint

# Connexion au cluster Elasticsearch
es = Elasticsearch("http://localhost:9200")

print("‚úÖ Connexion √©tablie avec Elasticsearch")


## Introduction : √âtats du cluster Elasticsearch

Elasticsearch a trois √©tats principaux pour un cluster :

- **üü¢ Green** : Tous les shards primaires et r√©pliques sont actifs
- **üü° Yellow** : Tous les shards primaires sont actifs, mais certaines r√©pliques ne le sont pas
- **üî¥ Red** : Certains shards primaires ne sont pas actifs

Dans ce TD, nous allons manipuler le facteur de r√©plication pour observer ces diff√©rents √©tats.


## 3a. Cr√©ation d'un index avec facteur de r√©plication 2

Cr√©ons un index "multimedia" avec 1 shard primaire et **2 r√©pliques**. 

‚ö†Ô∏è **Important** : Si vous n'avez qu'un seul n≈ìud dans votre cluster, Elasticsearch ne pourra pas cr√©er les r√©pliques (car une r√©plique doit √™tre sur un n≈ìud diff√©rent du shard primaire). Le cluster passera donc en √©tat **yellow**.


In [None]:
# Supprimer l'index s'il existe d√©j√† (pour repartir √† z√©ro)
if es.indices.exists(index="multimedia"):
    es.indices.delete(index="multimedia")
    print("üóëÔ∏è  Index 'multimedia' supprim√©")

# Cr√©er un index avec 1 shard primaire et 2 r√©pliques
es.indices.create(
    index="multimedia",
    body={
        "settings": {
            "index": {
                "number_of_shards": 1,
                "number_of_replicas": 2
            }
        }
    }
)
print("‚úÖ Index 'multimedia' cr√©√© avec 1 shard et 2 r√©pliques")


## 4a. V√©rification de l'√©tat du cluster (devrait √™tre Yellow)

V√©rifions l'√©tat du cluster. Si vous avez un seul n≈ìud, le cluster devrait √™tre en √©tat **yellow** car les 2 r√©pliques ne peuvent pas √™tre cr√©√©es (elles n√©cessitent 2 n≈ìuds suppl√©mentaires).


In [None]:
# V√©rification de la sant√© du cluster
health = es.cluster.health()
print(f"√âtat du cluster: {health['status'].upper()}")
print(f"Nombre de n≈ìuds: {health['number_of_nodes']}")
print(f"Nombre de n≈ìuds de donn√©es: {health['number_of_data_nodes']}")
print(f"Shards primaires actifs: {health['active_primary_shards']}")
print(f"Shards actifs: {health['active_shards']}")
print(f"Shards non assign√©s: {health['unassigned_shards']}")

if health['status'] == 'yellow':
    print("\nüü° Le cluster est en √©tat YELLOW")
    print("   ‚Üí Tous les shards primaires sont actifs, mais certaines r√©pliques ne peuvent pas √™tre cr√©√©es")
    print("   ‚Üí Cela arrive souvent avec un cluster √† un seul n≈ìud")
elif health['status'] == 'green':
    print("\nüü¢ Le cluster est en √©tat GREEN")
    print("   ‚Üí Tous les shards primaires et r√©pliques sont actifs")
elif health['status'] == 'red':
    print("\nüî¥ Le cluster est en √©tat RED")
    print("   ‚Üí Certains shards primaires ne sont pas actifs")

pprint(health)


## 2b. V√©rification de l'√©tat du cluster (encore Yellow)

V√©rifions √† nouveau l'√©tat du cluster pour confirmer qu'il est toujours en yellow.


In [None]:
# V√©rification de la sant√© du cluster (encore)
health = es.cluster.health()
print(f"√âtat du cluster: {health['status'].upper()}")
print(f"Shards non assign√©s: {health['unassigned_shards']}")

if health['status'] == 'yellow':
    print("\nüü° Le cluster est toujours en √©tat YELLOW")
    print("   ‚Üí Les r√©pliques ne peuvent toujours pas √™tre cr√©√©es")


## 3b. Mise √† jour du facteur de r√©plication √† 1

R√©duisons le facteur de r√©plication √† 1. Cela permettra au cluster de cr√©er une r√©plique (si vous avez au moins 2 n≈ìuds) ou de passer en √©tat **green** si vous n'avez qu'un seul n≈ìud (car 1 r√©plique sur le m√™me n≈ìud n'est pas possible, mais Elasticsearch peut accepter 0 r√©plique assign√©e).

‚ö†Ô∏è **Note** : On peut modifier le nombre de r√©pliques d'un index existant sans le supprimer.


In [None]:
# Mettre √† jour le nombre de r√©pliques √† 1
es.indices.put_settings(
    index="multimedia",
    body={
        "index": {
            "number_of_replicas": 1
        }
    }
)
print("‚úÖ Facteur de r√©plication mis √† jour √† 1")


## 4b. V√©rification de l'√©tat du cluster (devrait √™tre Green)

V√©rifions √† nouveau l'√©tat du cluster. Avec 1 r√©plique et un seul n≈ìud, le cluster devrait maintenant √™tre en √©tat **green** (ou rester en yellow si la r√©plique ne peut toujours pas √™tre cr√©√©e, mais avec moins de shards non assign√©s).


In [None]:
# V√©rification de la sant√© du cluster apr√®s mise √† jour
health = es.cluster.health()
print(f"√âtat du cluster: {health['status'].upper()}")
print(f"Nombre de n≈ìuds: {health['number_of_nodes']}")
print(f"Shards primaires actifs: {health['active_primary_shards']}")
print(f"Shards actifs: {health['active_shards']}")
print(f"Shards non assign√©s: {health['unassigned_shards']}")

if health['status'] == 'green':
    print("\nüü¢ Le cluster est maintenant en √©tat GREEN")
    print("   ‚Üí Tous les shards primaires et r√©pliques sont actifs")
elif health['status'] == 'yellow':
    print("\nüü° Le cluster est toujours en √©tat YELLOW")
    print("   ‚Üí Avec un seul n≈ìud, la r√©plique ne peut pas √™tre cr√©√©e")
    print("   ‚Üí Mais le cluster peut fonctionner normalement")
elif health['status'] == 'red':
    print("\nüî¥ Le cluster est en √©tat RED")
    print("   ‚Üí Certains shards primaires ne sont pas actifs")

pprint(health)


## 5b. V√©rification de l'√©tat du cluster (devrait √™tre Red)

Pour observer un √©tat **red**, il faudrait normalement arr√™ter un n≈ìud qui contient des shards primaires. 

‚ö†Ô∏è **Attention** : Dans un environnement de d√©veloppement avec un seul n≈ìud, si vous arr√™tez ce n≈ìud, vous ne pourrez plus vous connecter √† Elasticsearch.

Pour simuler un √©tat red de mani√®re s√©curis√©e, nous pouvons :
1. V√©rifier l'√©tat actuel
2. Expliquer comment un √©tat red se produit

**Note** : Si vous avez un cluster multi-n≈ìuds, vous pouvez arr√™ter un n≈ìud contenant des shards primaires pour observer l'√©tat red.


In [None]:
# V√©rification de la sant√© du cluster
health = es.cluster.health()
print(f"√âtat du cluster: {health['status'].upper()}")
print(f"Nombre de n≈ìuds: {health['number_of_nodes']}")
print(f"Shards primaires actifs: {health['active_primary_shards']}")
print(f"Shards actifs: {health['active_shards']}")
print(f"Shards non assign√©s: {health['unassigned_shards']}")

if health['status'] == 'red':
    print("\nüî¥ Le cluster est en √©tat RED")
    print("   ‚Üí Certains shards primaires ne sont pas actifs")
    print("   ‚Üí Cela signifie qu'une partie des donn√©es n'est pas accessible")
elif health['status'] == 'yellow':
    print("\nüü° Le cluster est en √©tat YELLOW")
    print("   ‚Üí Tous les shards primaires sont actifs")
elif health['status'] == 'green':
    print("\nüü¢ Le cluster est en √©tat GREEN")
    print("   ‚Üí Tous les shards primaires et r√©pliques sont actifs")

print("\n" + "="*60)
print("Pour observer un √©tat RED dans un environnement de test:")
print("1. Avoir un cluster avec au moins 2 n≈ìuds")
print("2. Arr√™ter un n≈ìud qui contient des shards primaires")
print("3. Le cluster passera en √©tat RED car les shards primaires")
print("   de ce n≈ìud ne seront plus accessibles")
print("="*60)

pprint(health)


## Informations suppl√©mentaires sur l'index

V√©rifions les d√©tails de l'index "multimedia" pour voir sa configuration actuelle.


In [None]:
stats['_all']['total']

In [None]:
# Obtenir les param√®tres de l'index
settings = es.indices.get_settings(index="multimedia")
print("Param√®tres de l'index 'multimedia':")
pprint(settings['multimedia']['settings']['index'])

# Obtenir les statistiques de l'index
stats = es.indices.stats(index="multimedia")
print("\nStatistiques de l'index 'multimedia':")
print(f"Nombre de shards primaires: {stats['indices']['multimedia']['primaries']['docs']['count']}")
print(f"Nombre total de shards: {stats['_shards']['total']}")
print(f"Shards r√©ussis: {stats['_shards']['successful']}")
print(f"Shards √©chou√©s: {stats['_shards']['failed']}")

## Nettoyage

Supprimons l'index pour nettoyer (optionnel).


In [None]:
# Supprimer l'index multimedia
if es.indices.exists(index="multimedia"):
    es.indices.delete(index="multimedia")
    print("üóëÔ∏è  Index 'multimedia' supprim√©")
else:
    print("‚ÑπÔ∏è  L'index 'multimedia' n'existe pas")


## R√©sum√© des op√©rations

Ce notebook a couvert les concepts suivants sur Elasticsearch :

1. ‚úÖ **Cr√©ation d'index avec facteur de r√©plication**
   - Comprendre l'impact du nombre de r√©pliques sur l'√©tat du cluster

2. ‚úÖ **√âtats du cluster**
   - üü¢ **Green** : Tous les shards primaires et r√©pliques sont actifs
   - üü° **Yellow** : Tous les shards primaires sont actifs, mais certaines r√©pliques ne le sont pas
   - üî¥ **Red** : Certains shards primaires ne sont pas actifs

3. ‚úÖ **Modification dynamique des param√®tres**
   - Mise √† jour du nombre de r√©pliques sans supprimer l'index

4. ‚úÖ **Monitoring du cluster**
   - V√©rification de la sant√© du cluster
   - Compr√©hension des m√©triques (shards actifs, non assign√©s, etc.)

### Points cl√©s √† retenir :

- **R√©pliques** : Une r√©plique doit √™tre sur un n≈ìud diff√©rent du shard primaire
- **Cluster √† un seul n≈ìud** : Ne peut pas avoir de r√©pliques, donc √©tat souvent **yellow**
- **Cluster multi-n≈ìuds** : Permet d'avoir des r√©pliques et d'atteindre l'√©tat **green**
- **√âtat red** : Se produit quand des shards primaires ne sont plus accessibles (n≈ìud arr√™t√©, disque plein, etc.)
