In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression

# Convertir les dates en datetime
df["dt"] = pd.to_datetime(df["dt"], errors="coerce")

# Filtrer pour l'√©t√© (juin √† ao√ªt) √† New York
targetedTime = df[
    (df["City"] == "New York") & (df["dt"].dt.year >= 2000) & (df["dt"].dt.month.isin([6, 7, 8]))
]

# Grouper par ann√©e et calculer la moyenne
df_summer_grouped = targetedTime.groupby(df["dt"].dt.year)["AverageTemperature"].mean().reset_index()

# Ajouter une colonne "Type" pour indiquer qu'il s'agit de vraies donn√©es
df_summer_grouped["Type"] = "R√©el"

# S√©parer les variables
X = df_summer_grouped["dt"].values.reshape(-1, 1)  # Ann√©es en colonne
y = df_summer_grouped["AverageTemperature"].values  # Temp√©ratures

# Entra√Æner le mod√®le de r√©gression
model = LinearRegression()
model.fit(X, y)

# Pr√©dire jusqu'en 2020
future_years = np.arange(df_summer_grouped["dt"].max() + 1, 2021).reshape(-1, 1)
predictions = model.predict(future_years)

# Cr√©er un DataFrame pour les pr√©dictions
df_predictions = pd.DataFrame({"dt": future_years.flatten(), "AverageTemperature": predictions, "Type": "Pr√©diction"})

# Fusionner les vraies valeurs et les pr√©dictions
df_combined = pd.concat([df_summer_grouped, df_predictions])

# --- üé® VISUALISATION --- #
plt.figure(figsize=(12, 6))

# Tracer les barres des valeurs r√©elles
sns.barplot(
    x=df_summer_grouped["dt"],
    y=df_summer_grouped["AverageTemperature"],
    color="blue",
    label="Donn√©es R√©elles"
)

# Tracer les barres des pr√©dictions
sns.barplot(
    x=df_predictions["dt"],
    y=df_predictions["AverageTemperature"],
    color="red",
    label="Pr√©dictions"
)

# Am√©lioration du style
plt.xlabel("Ann√©es")
plt.ylabel("Temp√©rature Moyenne (¬∞C)")
plt.title("Pr√©diction des Temp√©ratures Estivales √† New York")
plt.legend()
plt.xticks(rotation=45)
plt.show()


: 