# Graphiques possibles pour la page d'accueil

In [19]:
import plotly.graph_objects as go
from datetime import datetime
import math # On a besoin du module math pour le logarithme
import base64

## Nombre d'utilisateurs des LLM

In [20]:
# --- Données ---
# Sources : Annonces d'OpenAI, articles de presse spécialisée, et projections de cabinets d'analyse.
dates = [
    datetime(2022, 11, 30), # Lancement de ChatGPT
    datetime(2023, 1, 31),  # 100 millions d'utilisateurs mensuels
    datetime(2025, 2, 28),  # 400 millions d'utilisateurs hebdomadaires
    datetime(2025, 10, 31), # 800 millions d'utilisateurs hebdomadaires
    datetime(2026, 12, 31)  # Projection de plus d'un milliard d'utilisateurs
]

# Nombre d'utilisateurs en millions
users_in_millions = [0, 100, 400, 800, 1000]

# Textes pour les annotations sur le graphique
annotations_text = [
    "<b>Lancement ChatGPT</b><br>1 million en 5 jours",
    "<b>Record historique</b><br>100M d'utilisateurs mensuels",
    "400M d'utilisateurs<br>hebdomadaires",
    "800M d'utilisateurs<br>hebdomadaires",
    "<b>Projection</b><br>> 1 Milliard d'utilisateurs"
]

# --- Création du graphique ---

# Initialiser la figure
fig = go.Figure()

# Ajouter la ligne de croissance
fig.add_trace(go.Scatter(
    x=dates,
    y=users_in_millions,
    mode='lines+markers',
    name="Nombre d'utilisateurs",
    line=dict(color='royalblue', width=4, shape='spline'), # Ligne lissée
    marker=dict(color='darkblue', size=10, symbol='circle-open-dot'),
    hovertemplate="<b>%{x|%B %Y}</b><br>%{y} millions d'utilisateurs<extra></extra>"
))

# Ajouter les annotations pour les points clés
for i, txt in enumerate(annotations_text):
    fig.add_annotation(
        x=dates[i],
        y=users_in_millions[i],
        text=txt,
        showarrow=True,
        arrowhead=4,
        ax=0,
        ay=-40 - (i % 2 * 25), # Positionnement alternatif pour éviter les superpositions
        font=dict(
            family="Arial, sans-serif",
            size=12,
            color="#333"
        ),
        align="center",
        bordercolor="#c7c7c7",
        borderwidth=2,
        borderpad=4,
        bgcolor="#f0f0f0",
        opacity=0.8
    )


# --- Personnalisation de l'apparence ---
fig.update_layout(
    title=dict(
        text="<b>L'Adoption fulgurante des LLM dans le monde</b>",
        font=dict(size=24, color='black'),
        x=0.5
    ),
    xaxis_title="Date",
    yaxis_title="Nombre d'utilisateurs (en millions)",
    xaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGrey'
    ),
    yaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGrey',
        zeroline=True,
        zerolinewidth=2,
        zerolinecolor='black'
    ),
    plot_bgcolor='white', # Fond du graphique
    font=dict(
        family="Helvetica, sans-serif",
        size=14,
        color="black"
    ),
    hovermode="x unified"
)

#### Graphique ci-dessus : à adapter aux couleurs de notre thème et à rendre plus beau si besoin

In [21]:
# --- Affichage ---
# Pour voir le graphique en local (en dehors de Streamlit)
#fig.show()

# Dans Streamlit, il faudra utiliser la ligne suivante :
# import streamlit as st
# st.plotly_chart(fig, use_container_width=True)

## Consommation des LLM

In [25]:
# # --- Données (en Mégawattheures - MWh) ---
# # Sources : Études de l'Université de Stanford, RTE, calculateurs d'empreinte carbone.
# categories = [
#     "1 Aller-Retour<br>Paris-NY (1 passager)",
#     "Consommation<br>d'un foyer français (1 an)",
#     "Voiture thermique<br>(1 an / 12 000 km)",
#     "Entraînement du<br>modèle LLM 'BLOOM'",
#     "Entraînement d'un<br>modèle type GPT-3"
# ]

# valeurs_mwh = [3.5, 4.7, 16, 433, 1287]

# # Pour rendre le graphique plus lisible, nous allons utiliser une échelle logarithmique.
# # Cela permet de visualiser des ordres de grandeur très différents.
# # On ajoute des textes personnalisés pour l'infobulle.
# textes_hover = [
#     "Équivalent à ~3.5 MWh",
#     "Moyenne nationale ~4.7 MWh",
#     "Équivalent à ~16 MWh",
#     "A nécessité 433 MWh",
#     "Estimation à 1 287 MWh"
# ]

# # Calcul du nombre de foyers pour les annotations
# nb_foyers_bloom = round(433 / 4.7)
# nb_foyers_gpt3 = round(1287 / 4.7)

# # --- Création du graphique ---
# fig = go.Figure()

# # Ajout des barres
# fig.add_trace(go.Bar(
#     x=categories,
#     y=valeurs_mwh,
#     text=[f'{v:,.0f} MWh'.replace(',', ' ') for v in valeurs_mwh], # Texte affiché sur les barres
#     textposition='auto',
#     marker_color=['#4c78a8', '#f58518', '#e45756', '#72b7b2', '#54a24b'], # Palette de couleurs
#     hovertemplate="<b>%{x}</b><br>%{customdata}<extra></extra>",
#     customdata=textes_hover
# ))

# # --- Personnalisation de l'apparence ---
# fig.update_layout(
#     title=dict(
#         text="<b>Consommation d'énergie : que représente l'entraînement d'un LLM ?</b>",
#         font=dict(size=22),
#         x=0.5
#     ),
#     xaxis=dict(tickangle=0),
#     yaxis=dict(
#         title="Consommation d'énergie (en MWh, échelle logarithmique)",
#         type='log', # Échelle logarithmique pour la lisibilité
#         gridcolor='LightGrey'
#     ),
#     plot_bgcolor='white',
#     font=dict(family="Helvetica, sans-serif", size=14, color="black"),
#     showlegend=False
# )

# # Ajout d'annotations pour l'impact
# fig.add_annotation(
#     x=categories[3], y=valeurs_mwh[3],
#     text=f"<b>= {nb_foyers_bloom} ans</b><br>de consommation<br>d'un foyer",
#     showarrow=True, arrowhead=2, ax=0, ay=-80,
#     font=dict(size=14, color="white"),
#     bgcolor="#3d8f8a", borderpad=4
# )
# fig.add_annotation(
#     x=categories[4], y=valeurs_mwh[4],
#     text=f"<b>= {nb_foyers_gpt3} ans</b><br>de consommation<br>d'un foyer",
#     showarrow=True, arrowhead=2, ax=0, ay=-80,
#     font=dict(size=14, color="white"),
#     bgcolor="#43823b", borderpad=4
# )

In [23]:
# # --- Données ---
# categories = [
#     "1 Aller-Retour<br>Paris-NY (1 passager)",
#     "Consommation<br>d'un foyer français (1 an)",
#     "Voiture thermique<br>(1 an / 12 000 km)",
#     "Entraînement du<br>modèle LLM 'BLOOM'",
#     "Entraînement d'un<br>modèle type GPT-3"
# ]

# valeurs_mwh = [3.5, 4.7, 16, 433, 1287]

# # --- Image locale → base64 ---
# image_path = r"C:\Users\chloe\Documents\Chloe\TN\3A\Hackathon\Hack-LORIA\app\assets\lightbulb.png"
# with open(image_path, "rb") as f:
#     img_b64 = base64.b64encode(f.read()).decode()

# # --- Taille des ampoules (log compressé) ---
# sizes = [math.log(v) * 0.9 for v in valeurs_mwh]

# # --- Graphique vide ---
# fig = go.Figure()

# # On trace uniquement les catégories sur l'axe X
# fig.add_trace(go.Scatter(
#     x=categories,
#     y=valeurs_mwh,
#     mode="markers",
#     marker=dict(color="rgba(0,0,0,0)", size=1),
#     hoverinfo="skip"
# ))

# # --- Ajout des ampoules (MÉTHODE CORRIGÉE) ---
# # On itère avec "enumerate" pour accéder facilement à la valeur MWh correspondante
# for i, (cat, s) in enumerate(zip(categories, sizes)):
#     fig.add_layout_image(
#         dict(
#             source=f"data:image/png;base64,{img_b64}",
#             x=cat,
#             # On ancre le HAUT de l'image à la valeur sur l'axe Y
#             y=valeurs_mwh[i],
#             yanchor="top",  # <-- Changement clé
#             xref="x",
#             yref="y",
#             sizex=s,
#             sizey=s,
#             sizing="contain",
#             opacity=0.95
#         )
#     )

# # --- Annotations ---
# for cat, val, s in zip(categories, valeurs_mwh, sizes):
#     fig.add_annotation(
#         x=cat,
#         y=val,
#         text=f"<b>{val} MWh</b>",
#         showarrow=False,
#         yshift=30,  # yshift peut être ajusté si nécessaire
#         font=dict(size=14)
#     )

# # --- Layout ---
# fig.update_layout(
#     title="<b>Consommation d'énergie : L'impact lumineux de l'entraînement d'un LLM</b>",
#     height=600,
#     yaxis=dict(
#         title="Consommation (MWh, échelle log)",
#         type="log",
#     ),
#     plot_bgcolor="white",
#     margin=dict(b=120)
# )

# fig.show()

In [24]:
# --- Données ---
categories = [
    "1 Aller-Retour<br>Paris-NY (1 passager)",
    "Conso. d'un foyer<br>français (1 an)",
    "Voiture thermique<br>(1 an / 12 000 km)",
    "Entraînement du modèle<br>BLOOM (open source)",
    "Entraînement<br>de GPT-3"
]

valeurs_mwh = [3.5, 4.7, 16, 433, 1287]

# --- Image (Votre code) ---
# Assurez-vous que le chemin est correct ou utilisez une URL pour le web
image_path = r"C:\Users\chloe\Documents\Chloe\TN\3A\Hackathon\Hack-LORIA\app\assets\lightbulb.png"
# Pour l'exemple, si l'image n'est pas chargée, le code plantera, 
# donc assurez-vous que img_b64 est bien rempli comme dans votre code.
with open(image_path, "rb") as f:
    img_b64 = base64.b64encode(f.read()).decode()

# --- 1. Calcul de la taille des ampoules ---
# Pour une représentation visuelle honnête, on lie souvent l'aire à la valeur.
# Donc la hauteur/largeur (size) doit être proportionnelle à la racine carrée de la valeur.
# Si vous préférez votre échelle LOG pour mieux voir les petites, décommentez la ligne 'Log'

# Option A : Proportionnel à la racine carrée (plus réaliste physiquement)
sizes_raw = [math.sqrt(v) for v in valeurs_mwh]

# Option B : Votre échelle Log (si vous voulez que les petites soient plus grosses)
# sizes_raw = [math.log(v) for v in valeurs_mwh]

# --- 2. Normalisation ---
# On veut que la plus grosse ampoule ait une taille max définie (ex: 0.8 unité de grille)
# pour ne pas qu'elle dépasse sur les voisins.
max_val = max(sizes_raw)
max_display_size = 0.8  # La plus grosse ampoule prendra 80% de la largeur d'une colonne
sizes_normalized = [(s / max_val) * max_display_size for s in sizes_raw]

# --- Graphique ---
fig = go.Figure()

# On ajoute une trace invisible juste pour définir les catégories en X
fig.add_trace(go.Scatter(
    x=categories,
    y=[0] * len(categories),
    mode="markers",
    marker=dict(opacity=0)
))

# --- Ajout des ampoules ---
for i, cat in enumerate(categories):
    size = sizes_normalized[i]
    val = valeurs_mwh[i]
    
    # Ajout de l'image
    fig.add_layout_image(
        dict(
            source=f"data:image/png;base64,{img_b64}",
            x=cat,
            y=0,               # On pose tout le monde au sol (0)
            xref="x",
            yref="y",
            yanchor="bottom",  # L'image grandit vers le haut à partir de 0
            sizex=size,        # Largeur
            sizey=size,        # Hauteur (garder le ratio carré)
            xanchor="center",  # Centré horizontalement sur la catégorie
            opacity=0.9,
            layer="above"
        )
    )
    
    # Ajout du texte au-dessus de l'ampoule
    # On place le texte à une hauteur = taille de l'image + une petite marge
    fig.add_annotation(
        x=cat,
        y=size, # Le haut de l'ampoule
        text=f"<b>{val} MWh</b>",
        showarrow=False,
        yshift=20, # Décale le texte un peu vers le haut (en pixels)
        font=dict(size=14, color="black")
    )

# --- Layout Épuré ---
fig.update_layout(
    title=dict(
        text="Impact énergétique de l'entraînement d'un LLM",
        x=0.5, # Titre centré
        font=dict(size=20)
    ),
    height=600,
    plot_bgcolor="white",
    # On fixe l'axe Y manuellement pour laisser de la place à la plus grosse ampoule + texte
    yaxis=dict(
        range=[0, max_display_size * 1.2], 
        visible=False, # On cache l'axe Y (graduations, lignes)
        fixedrange=True # Empêche le zoom sur Y
    ),
    xaxis=dict(
        showgrid=False,
        zeroline=False,
        fixedrange=True,
        # On définit manuellement les limites de l'axe X.
        # Il y a 5 catégories (indices 0 à 4).
        # On commence à -0.6 (pour la marge gauche)
        # On finit à 4.6 (pour laisser de la place à droite de la dernière ampoule)
        range=[-0.6, len(categories) - 1 + 0.6] 
    ),
    # Vous pouvez aussi augmenter la marge droite globale si ça ne suffit pas
    margin=dict(l=20, r=50, t=80, b=20) 
)

fig.show()

## Quelques chiffres :

- Environ 2.5 milliards de prompts par jour (rien que sur ChatGPT)
- L'impact carbone de la politesse : 125 millions de prompts par jour servent uniquement à dire "bonjour", "merci" ou "au revoir". Cela représente 250 Tonnes de CO2 / jour, soit 50 fois le tour de la Terre en voiture thermique, 60 000 steaks jetés à la poubelle, ou la fonte de 3 terrains de tennis de banquise chaque jour.
- GPT-4 représente 21 cerveaux humains assemblés (en nombre de neurones). --> Mettre des images de personnes ou de cerveaux.

## Autres pistes :

-    L'eau, l'autre coût caché de l'IA : La consommation d'eau pour le refroidissement des data centers est un impact environnemental souvent méconnu. On estime qu'il faudrait 4 à 6 fois la consommation annuelle en eau du Danemark rien que pour refroidir les centres de données d'IA d'ici 2027[11]. (Faire éventuellement un graphique comparant la consommation d'eau d'une session avec un LLM à des actions du quotidien (boire un café, prendre une douche))

-    Comparaison n'est pas raison : L'efficacité énergétique des modèles : Tous les modèles ne se valent pas en termes de consommation. L'entraînement de GPT-4 a nécessité 502 tonnes de CO2, contre "seulement" 25 tonnes pour le modèle Bloom[10]. Un comparatif visuel de l'empreinte carbone de différents modèles (propriétaires vs open-source, plus récents vs plus anciens) pour accomplir une même tâche serait très instructif. Il existe un écart de consommation d'un facteur de 61 000 entre les modèles les plus et les moins énergivores pour certaines tâches[13].

-    L'impact de la géographie : L'empreinte carbone d'une requête dépend fortement du mix énergétique du pays où sont situés les serveurs. Vous pourriez proposer une carte interactive où l'utilisateur verrait l'empreinte carbone d'une même requête varier en fonction de la localisation du data center.

## L'explosion de la taille des modèles (nombre de paramètres)

In [26]:
# --- Données : L'histoire de l'obésité numérique ---
# Année, Nom, Taille (Milliards de paramètres / B)
data = [
    (2018.2, "ELMo", 0.094),       # 94 Millions
    (2018.5, "GPT-1", 0.117),      # 117 Millions
    (2018.8, "BERT-Large", 0.340), # 340 Millions
    (2019.2, "GPT-2", 1.5),        # 1.5 Milliards
    (2019.8, "Megatron", 8.3),
    (2020.1, "T-NLG", 17),
    (2020.5, "GPT-3", 175),        # Le grand saut
    (2021.5, "Gopher", 280),
    (2022.3, "PaLM", 540),
    (2023.3, "GPT-4 (Est.)", 1760), # Estimation courante (MoE)
    (2024.5, "Llama 3.1", 405),     # Retour à l'optimisation (optionnel)
]

years = [d[0] for d in data]
names = [d[1] for d in data]
params = [d[2] for d in data]

# --- Calcul de la taille des bulles ---
# On veut que la surface de la bulle représente la taille du modèle.
# Aire = pi * r^2  =>  r = sqrt(Aire)
# On multiplie par un facteur pour que ce soit visible à l'écran
bubble_sizes = [math.sqrt(p) * 2.5 for p in params]

# Couleurs : Du vert (léger) au rouge (lourd)
colors = params

# --- Graphique ---
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=years,
    y=params,
    mode='markers+text',
    text=names,
    textposition="top center",
    marker=dict(
        size=bubble_sizes,
        color=colors,
        colorscale='Turbo', # Une échelle de couleur bien contrastée
        showscale=True,
        colorbar=dict(title="Milliards de<br>Paramètres"),
        opacity=0.8,
        line=dict(width=1, color='DarkSlateGrey')
    ),
    hovertext=[f"<b>{n}</b><br>Année: {int(y)}<br>Taille: {p} Milliards" for n, y, p in zip(names, years, params)],
    hoverinfo="text"
))

# --- Ajout d'une flèche pour montrer l'explosion ---
fig.add_annotation(
    x=2023.3, y=math.log10(1760), # Position sur GPT-4
    xref="x", yref="y",
    ax=2018.2, ay=math.log10(0.1), # Pointe vers le début
    axref="x", ayref="y",
    text="",
    arrowhead=2,
    arrowsize=1,
    arrowwidth=2,
    arrowcolor="gray",
    opacity=0.5
)

# Annotation textuelle du facteur
fig.add_annotation(
    x=2021, y=1000, # Au milieu haut
    text="<b>x 15 000</b><br>en 5 ans",
    font=dict(size=25, color="#D62728"),
    showarrow=False
)

# --- Layout ---
fig.update_layout(
    title=dict(
        text="<b>L'Explosion de la taille des modèles</b><br><span style='font-size:14px'>Nombre de paramètres (en Milliards)</span>",
        x=0.5
    ),
    xaxis=dict(
        title="Année",
        range=[2017.5, 2025], # Un peu de marge
        dtick=1
    ),
    yaxis=dict(
        title="Paramètres (Échelle Logarithmique)",
        type="log", # INDISPENSABLE pour voir les petits et les gros
        tickvals=[0.1, 1, 10, 100, 1000],
        ticktext=["100 M", "1 Md", "10 Mds", "100 Mds", "1 000 Mds"]
    ),
    height=600,
    plot_bgcolor="white",
    margin=dict(t=80)
)

fig.show()

#### En changeant les couleurs ça peut être pas mal

# Les LLM vs le cerveau humain

Ouais c'est bof ce graphique

In [29]:
# # --- Données ---
# # Le Cerveau (Bio)
# cerveau = {
#     "nom": "Cerveau Humain",
#     "params": 86,    # Milliards (X)
#     "watts": 20,     # Watts (Y) - Très bas, donc très écolo
#     "icon": "🧠",
#     "desc": "L'efficacité ultime"
# }

# # Les IA (Silicium) - Watts estimés en charge
# ias = [
#     {"nom": "GPT-2", "params": 1.5, "watts": 400, "icon": "📱", "desc": "Petit"},
#     {"nom": "Llama-3 (70B)", "params": 70, "watts": 1400, "icon": "🦙", "desc": "Moyen"},
#     {"nom": "GPT-3", "params": 175, "watts": 5000, "icon": "⚡", "desc": "Gros"},
#     {"nom": "GPT-4 (Est.)", "params": 1760, "watts": 30000, "icon": "🦖", "desc": "Monstre"}
# ]

# fig = go.Figure()

# # --- TRACE 1 : Les IA (En Rouge, en Haut) ---
# fig.add_trace(go.Scatter(
#     x=[d["params"] for d in ias],
#     y=[d["watts"] for d in ias],
#     mode="text", # <--- ON UTILISE LE MODE TEXTE DIRECTEMENT
#     text=[d["icon"] for d in ias],
#     textfont=dict(size=40), # Taille des émojis
#     name="Modèles IA",
#     hovertext=[f"<b>{d['nom']}</b><br>{d['watts']} Watts" for d in ias],
#     hoverinfo="text"
# ))

# # --- TRACE 2 : Le Cerveau (En Vert, en Bas) ---
# fig.add_trace(go.Scatter(
#     x=[cerveau["params"]],
#     y=[cerveau["watts"]],
#     mode="text",
#     text=[cerveau["icon"]],
#     textfont=dict(size=60), # Le cerveau un peu plus gros pour le style
#     name="Humain",
#     hovertext=[f"<b>{cerveau['nom']}</b><br>{cerveau['watts']} Watts seulement !"],
#     hoverinfo="text"
# ))

# # --- Annotations pour expliciter le graphique ---

# # Flèche explicative : Efficacité
# fig.add_annotation(
#     x=cerveau["params"], y=cerveau["watts"], # Départ (Cerveau)
#     ax=70, ay=1400, # Arrivée (Llama 3 - complexité proche)
#     xref="x", yref="y", axref="x", ayref="y",
#     text="<b>À complexité égale,<br>l'IA consomme<br>70x plus !</b>",
#     font=dict(color="red", size=14),
#     arrowcolor="red",
#     arrowhead=2,
#     arrowwidth=2,
#     standoff=20
# )

# # --- Layout ---
# fig.update_layout(
#     title=dict(
#         text="<b>Biologie vs Machine : Le choc énergétique</b>",
#         x=0.5
#     ),
#     # AXE X : Complexité (Log)
#     xaxis=dict(
#         title="Complexité (Milliards de neurones/paramètres)",
#         type="log", 
#         range=[0.5, 3000], # On force les limites pour tout voir
#         gridcolor="#eee"
#     ),
#     # AXE Y : Consommation (Log)
#     yaxis=dict(
#         title="Consommation d'énergie (Watts) - Échelle Log",
#         type="log",
#         # On définit manuellement les ticks pour que ce soit clair
#         tickvals=[10, 100, 1000, 10000, 100000],
#         ticktext=["10W (Ampoule LED)", "100W", "1000W (Four)", "10 kW", "100 kW"],
#         range=[0.8, 5], # log10(10) à log10(100000)
#         gridcolor="#eee"
#     ),
#     height=600,
#     plot_bgcolor="white",
#     legend=dict(x=0.02, y=0.98),
#     margin=dict(t=80, b=50)
# )

# fig.show()