In [None]:
import matplotlib.pyplot as plt

# Calcul des émissions totales par mode de transport
co2_by_mode = df.groupby("Leg_Mode")["co2_equivalent_t_wtw"].sum()

# Affichage des résultats
print("Émissions totales par mode de transport :")
print(co2_by_mode)

# Visualisation
plt.figure(figsize=(8, 5))
co2_by_mode.plot(kind='bar', color='skyblue')
plt.title("Émissions totales de CO2 par mode de transport")
plt.xlabel("Mode de Transport")
plt.ylabel("CO2 Equivalent (t wtw)")
plt.show()


In [None]:
# Ajouter une colonne pour les émissions par tonne.km
df["co2_per_tonne_km"] = df["co2_equivalent_t_wtw"] / df["Distance"]

# Afficher les résultats par mode de transport
efficiency = df.groupby("Leg_Mode")["co2_per_tonne_km"].mean()
print("Efficacité (CO2 par tonne.km) par mode de transport :")
print(efficiency)

# Visualisation
plt.figure(figsize=(8, 5))
efficiency.plot(kind='bar', color='orange')
plt.title("Efficacité CO2 par tonne.km")
plt.xlabel("Mode de Transport")
plt.ylabel("CO2 Equivalent par tonne.km")
plt.show()


In [None]:
# Trier les données par émissions de CO2
top_emitters = df.sort_values(by="co2_equivalent_t_wtw", ascending=False)

# Afficher les top 5 contributeurs
print("Top 5 contributeurs aux émissions de CO2 :")
print(top_emitters.head())

# Visualiser les résultats
plt.figure(figsize=(8, 5))
plt.bar(top_emitters["Carriage_Type"], top_emitters["co2_equivalent_t_wtw"], color='red')
plt.title("Émissions de CO2 par type de transport")
plt.xlabel("Type de Transport")
plt.ylabel("CO2 Equivalent (t wtw)")
plt.xticks(rotation=45)
plt.show()


In [None]:
# Calcul des émissions par phase
co2_by_phase = df.groupby("Carriage_Type")["co2_equivalent_t_wtw"].sum()

# Affichage
print("Répartition des émissions de CO2 par phase :")
print(co2_by_phase)

# Visualisation
plt.figure(figsize=(8, 5))
co2_by_phase.plot(kind='pie', autopct='%1.1f%%', colors=['lightblue', 'lightgreen', 'lightcoral'])
plt.title("Répartition des émissions de CO2 par phase du transport")
plt.ylabel("")
plt.show()


In [None]:
# Moyenne des émissions par transporteur
co2_by_carrier = df.groupby("Carrier")["co2_equivalent_t_wtw"].mean()

# Affichage des résultats
print("Émissions moyennes par transporteur :")
print(co2_by_carrier)

# Visualisation
plt.figure(figsize=(8, 5))
co2_by_carrier.plot(kind='barh', color='purple')
plt.title("Émissions moyennes de CO2 par transporteur")
plt.xlabel("CO2 Equivalent (t wtw)")
plt.ylabel("Transporteur")
plt.show()


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# ============================
# 1. Chargement des données
# ============================
data = {
    "ShipmentId": ["ID_17", "ID_17", "ID_17"],
    "OriginCityCode": ["Shenzhen", "Shenzhen", "Shenzhen"],
    "OriginCountryCode": ["CN", "CN", "CN"],
    "DestinationCityCode": ["Sydney", "Sydney", "Sydney"],
    "DestinationCountryCode": ["AU", "AU", "AU"],
    "Leg_Mode": ["Truck", "Ocean", "Truck"],
    "CarriageType": ["PreCarriage", "MainCarriage", "PostCarriage"],
    "Carrier": ["LGI", "KINETSU", "Damco"],
    "Distances_km": [50, 8298.673, 45],
    "FreightWeight": [1292, 1292, 1292],
    "co2_equivalent_t_ttw": [0.0063, 0.27268, 0.005],
    "co2_equivalent_t_wtw": [0.0063, 0.312551, 0.005],
    "co2e_p_tkm_grammepertonnekilometers_ttw": [7.173782, 7.173782, 7.173782],
    "co2e_p_tkm_grammepertonnekilometers_wtw": [8.222733, 8.222733, 8.222733],
    "ProductLine": ["PL_7", "PL_7", "PL_7"],
    "BusinessUnit": ["Printing", "Printing", "Printing"]
}

df = pd.DataFrame(data)

# ============================
# 2. Analyse descriptive
# ============================
print("Aperçu des données :")
print(df.head())
print("\nRésumé statistique :")
print(df.describe())

# ============================
# 3. Analyse des émissions CO2
# ============================

# a) Émissions totales par mode de transport
co2_by_mode = df.groupby("Leg_Mode")[["co2_equivalent_t_wtw", "co2_equivalent_t_ttw"]].sum()
print("\nÉmissions totales par mode de transport (Well-to-Wheel et Tank-to-Wheel) :")
print(co2_by_mode)

# Visualisation
co2_by_mode.plot(kind='bar', figsize=(8, 5), title="Émissions de CO2 par mode de transport")
plt.ylabel("CO2 Equivalent (t)")
plt.xlabel("Mode de Transport")
plt.show()

# b) Émissions par distance (efficacité CO2)
df["co2_per_km_wtw"] = df["co2_equivalent_t_wtw"] / df["Distances_km"]
co2_efficiency = df.groupby("Leg_Mode")["co2_per_km_wtw"].mean()

print("\nEfficacité CO2 par kilomètre (Well-to-Wheel) :")
print(co2_efficiency)

# Visualisation
co2_efficiency.plot(kind='bar', color='orange', title="Efficacité CO2 par km")
plt.ylabel("CO2 Equivalent par km")
plt.xlabel("Mode de Transport")
plt.show()

# ============================
# 4. Analyse par transporteur
# ============================
co2_by_carrier = df.groupby("Carrier")["co2_equivalent_t_wtw"].sum()
print("\nÉmissions totales par transporteur :")
print(co2_by_carrier)

# Visualisation
co2_by_carrier.plot(kind='bar', color='purple', title="Émissions totales par transporteur")
plt.ylabel("CO2 Equivalent (t)")
plt.xlabel("Transporteur")
plt.show()

# ============================
# 5. Analyse par phase de transport
# ============================
co2_by_phase = df.groupby("CarriageType")["co2_equivalent_t_wtw"].sum()
print("\nÉmissions totales par phase de transport :")
print(co2_by_phase)

# Visualisation
co2_by_phase.plot(kind='pie', autopct='%1.1f%%', title="Répartition des émissions par phase")
plt.ylabel("")
plt.show()

# ============================
# 6. Suggestion d'améliorations
# ============================
print("\n--- Suggestions d'amélioration ---")
print("1. Prioriser les transporteurs avec les émissions les plus faibles (ex: LGI ou Damco).")
print("2. Optimiser les phases de 'MainCarriage' où les émissions sont les plus élevées.")
print("3. Réduire les distances parcourues ou explorer des itinéraires alternatifs pour le transport 'Ocean'.")
print("4. Encourager les modes de transport avec une meilleure efficacité CO2 par km.")
print("5. Investir dans des solutions à faible émission de CO2 pour les transporteurs principaux (ex: biocarburants ou électrique).")


In [None]:
import seaborn as sns

# Détection des outliers avec un boxplot
plt.figure(figsize=(10, 6))
sns.boxplot(x="Leg_Mode", y="co2_per_km_wtw", data=df)
plt.title("Distribution des émissions de CO₂ par km selon le mode de transport")
plt.ylabel("CO2 Equivalent par km")
plt.xlabel("Mode de Transport")
plt.show()

# Identification des lignes anormales (z-score)
from scipy.stats import zscore

# Calcul des z-scores pour les émissions par km
df['z_score_co2'] = zscore(df['co2_per_km_wtw'])

# Filtrer les anomalies (z-score > 3 ou < -3)
anomalies = df[(df['z_score_co2'] > 3) | (df['z_score_co2'] < -3)]
print("\nLignes avec des émissions CO2 anormales :")
print(anomalies)


#####  Routes inefficaces

In [None]:
# Calcul des émissions par route
df["Route"] = df["OriginCityCode"] + " → " + df["DestinationCityCode"]

# Somme des émissions par route
co2_by_route = df.groupby("Route")[["co2_equivalent_t_wtw", "Distances_km", "FreightWeight"]].sum()

# Calcul des émissions par tonne-km
co2_by_route["co2_per_tonne_km"] = co2_by_route["co2_equivalent_t_wtw"] / (co2_by_route["Distances_km"] * co2_by_route["FreightWeight"])

# Trier par inefficacité (émissions les plus élevées)
inefficient_routes = co2_by_route.sort_values(by="co2_per_tonne_km", ascending=False)

print("\nRoutes les plus inefficaces (émissions par tonne-km) :")
print(inefficient_routes)

# Visualisation
plt.figure(figsize=(10, 6))
inefficient_routes["co2_per_tonne_km"].head(10).plot(kind='bar', color='red')
plt.title("Top 10 des routes les plus inefficaces (CO2 par tonne-km)")
plt.ylabel("CO2 Equivalent par tonne-km")
plt.xlabel("Route")
plt.show()


##### Performances de transporteurs

In [None]:
# Regrouper les statistiques par transporteur
carrier_stats = df.groupby("Carrier").agg({
    "co2_equivalent_t_wtw": "sum",
    "Distances_km": "sum",
    "FreightWeight": "sum",
    "ShipmentId": "count"
})

# Calculer l'efficacité CO2 par tonne-km et la moyenne des émissions par trajet
carrier_stats["co2_per_tonne_km"] = carrier_stats["co2_equivalent_t_wtw"] / (carrier_stats["Distances_km"] * carrier_stats["FreightWeight"])
carrier_stats["avg_co2_per_shipment"] = carrier_stats["co2_equivalent_t_wtw"] / carrier_stats["ShipmentId"]

# Trier par inefficacité
carrier_stats = carrier_stats.sort_values(by="co2_per_tonne_km", ascending=False)

print("\nPerformances des transporteurs :")
print(carrier_stats)

# Visualisation
fig, ax = plt.subplots(1, 2, figsize=(14, 6))

carrier_stats["co2_per_tonne_km"].plot(kind='bar', ax=ax[0], color='orange')
ax[0].set_title("CO2 par tonne-km par transporteur")
ax[0].set_ylabel("CO2 Equivalent par tonne-km")
ax[0].set_xlabel("Transporteur")

carrier_stats["avg_co2_per_shipment"].plot(kind='bar', ax=ax[1], color='green')
ax[1].set_title("Émissions moyennes par trajet")
ax[1].set_ylabel("CO2 Equivalent par trajet")
ax[1].set_xlabel("Transporteur")

plt.tight_layout()
plt.show()


In [None]:
# Scénario : Réduire les émissions des transports "Ocean" de 20%
reduction_factor = 0.2

# Filtrer les lignes pour le mode "Ocean"
ocean_transport = df[df["Leg_Mode"] == "Ocean"].copy()

# Appliquer une réduction de 20% sur les émissions
ocean_transport["co2_equivalent_t_wtw_reduced"] = ocean_transport["co2_equivalent_t_wtw"] * (1 - reduction_factor)

# Comparer les résultats
print("\nImpact de la réduction des émissions sur le transport 'Ocean' :")
print("Émissions initiales totales : ", ocean_transport["co2_equivalent_t_wtw"].sum())
print("Émissions après réduction de 20% : ", ocean_transport["co2_equivalent_t_wtw_reduced"].sum())

# Visualisation
plt.figure(figsize=(8, 5))
plt.bar(["Initial", "Réduit de 20%"], [ocean_transport["co2_equivalent_t_wtw"].sum(),
                                      ocean_transport["co2_equivalent_t_wtw_reduced"].sum()],
        color=["red", "green"])
plt.title("Impact de la réduction des émissions sur le transport Ocean")
plt.ylabel("CO2 Equivalent total (t wtw)")
plt.show()
