# Modélisation empreinte carbone

Développement et optimisation des calculs d'empreinte carbone pour les différents modes de transport.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import sys
sys.path.append('../')

from src.utils.data_loader import data_loader
from src.utils.preprocessing import preprocess_carbon_data, calculate_distance_haversine

## 1. Analyse des modes de transport

In [None]:
# Charger les données de transport
transport_df = await data_loader.load_transport_modes()
print(f"Modes de transport disponibles: {len(transport_df)}")
transport_df

In [None]:
# Visualisation des facteurs CO2
plt.figure(figsize=(10, 6))
transport_df.plot(x='name', y='co2_factor_per_km', kind='bar')
plt.title('Facteurs CO2 par mode de transport')
plt.xlabel('Mode de transport')
plt.ylabel('kg CO2 / km')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 2. Analyse des trajets utilisateurs

In [None]:
# Charger les trajets utilisateurs
trips_df = await data_loader.load_user_trips(limit=5000)
print(f"Nombre de trajets: {len(trips_df)}")
trips_df.head()

In [None]:
# Distribution des distances
plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.hist(trips_df['distance_km'], bins=50, alpha=0.7)
plt.title('Distribution des distances')
plt.xlabel('Distance (km)')
plt.ylabel('Fréquence')

plt.subplot(1, 2, 2)
plt.hist(trips_df['co2_saved_kg'], bins=50, alpha=0.7, color='green')
plt.title('Distribution CO2 économisé')
plt.xlabel('CO2 économisé (kg)')
plt.ylabel('Fréquence')

plt.tight_layout()
plt.show()

## 3. Optimisation des calculs

In [None]:
# Test de performance du calcul de distance
import time

# Coordonnées test (Paris)
lat1, lon1 = 48.8566, 2.3522
lat2, lon2 = 48.8606, 2.3376

start_time = time.time()
for _ in range(10000):
    distance = calculate_distance_haversine(lat1, lon1, lat2, lon2)
end_time = time.time()

print(f"Distance calculée: {distance:.3f} km")
print(f"Temps pour 10k calculs: {(end_time - start_time)*1000:.2f} ms")