# Battery study

- link capacity / autonomie
- Efficiency of the battery



In [None]:

from core.sql_utils import get_sqlalchemy_engine
from core.spark_utils import *
import pandas as pd
import numpy as np 
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

In [None]:
engine = get_sqlalchemy_engine()
df_dbeaver = pd.read_sql("""SELECT o.oem_name, m.make_name, vm.model_name, vm.type, vm.version, vm.autonomy, b.battery_chemistry, b.capacity, b.net_capacity FROM vehicle_model vm
join battery b on b.id=vm.battery_id 
join make m on m.id=vm.make_id
join oem o on o.id=vm.oem_id""", engine)

In [None]:
df_dbeaver['model_type'] = df_dbeaver['model_name'] + ' ' + df_dbeaver['type']

## Study

### Capacity VS Autonomy

In [None]:
fig = px.scatter(
    df_dbeaver,
    x="net_capacity",
    y="autonomy",
    color="battery_chemistry",
    hover_data={
        "model_name": True,
        "type": True
    },
    title="Autonomy WLTP over battery net capacity"
)

fig.show()

In [None]:
import statsmodels.api as sm

X = df_dbeaver.dropna(subset=["net_capacity", "autonomy"])["net_capacity"]
y = df_dbeaver.dropna(subset=["net_capacity", "autonomy"])["autonomy"]

# Ajout d'une constante pour l'intercept
X = sm.add_constant(X)

# R√©gression
model = sm.OLS(y, X).fit()

print(model.summary())

Capacity ‚Üî Range Relationship

- En moyenne, chaque kWh suppl√©mentaire ajoute **5.43 km** d'autonomie WLTP.
- **73.5%** de la variabilit√© de l'autonomie est expliqu√©e par la capacit√© seule (R¬≤ = 0.735).
- L'√©quation du mod√®le : **Autonomie = 76.86 + 5.43 √ó Capacit√© nette**

Facteurs suppl√©mentaires impactant l'autonomie

- **Configuration du moteur**  
‚Üí Les versions performance tendent √† r√©duire l'autonomie.     
*Exemple Volvo EX30 (capacit√© nette 65 kWh) : Single Motor : 476 km WLTP | Twin Motor Performance : 450 km WLTP*


Vehicle size and aerodynamics:   
‚Üí Larger or less aerodynamic vehicles could have lower efficiency and reduced range.   
*Example citro√´n e-c3 326km WLTP vs e-c3 aircross 300km WLTP for the same battery*

In [None]:
df_clean = df_dbeaver.dropna(subset=["net_capacity", "autonomy"]).copy()


df_clean['autonomy_pred'] = 76.8606 + 5.4315 * df_clean['net_capacity']


fig = go.Figure()


for segment in df_clean['model_type'].unique():
    df_segment = df_clean[df_clean['model_type'] == segment]
    fig.add_trace(go.Scatter(
        x=df_segment['net_capacity'],
        y=df_segment['autonomy'],
        mode='markers',
        name=segment,
        marker=dict(size=8, opacity=0.6),
        hovertemplate='<b>%{customdata[0]}</b><br>' +
                      'model_type: %{customdata[1]}<br>' +
                      'Capacit√©: %{x:.1f} kWh<br>' +
                      'Autonomie: %{y:.0f} km<br>' +
                      '<extra></extra>',
        customdata=df_segment[['model_name', 'model_type']].values
    ))


x_range = np.linspace(df_clean['net_capacity'].min(), df_clean['net_capacity'].max(), 100)
y_pred = 76.8606 + 5.4315 * x_range

fig.add_trace(go.Scatter(
    x=x_range,
    y=y_pred,
    mode='lines',
    name='R√©gression lin√©aire<br>y = 76.86 + 5.43x',
    line=dict(color='red', width=3, dash='dash'),
    hovertemplate='Pr√©diction: %{y:.0f} km<br><extra></extra>'
))

fig.update_layout(
    title={
        'text': 'Relation Capacit√© batterie vs Autonomie WLTP',
        'x': 0.5,
        'xanchor': 'center'
    },
    xaxis_title='Capacit√© nette (kWh)',
    yaxis_title='Autonomie WLTP (km)',
    hovermode='closest',
    legend=dict(
        yanchor="top",
        y=1,
        xanchor="left",
        x=100
    ),
    height=600,
    template='plotly_white'
)

fig.show()

# Sauvegarder le graphique
fig.write_html('/Users/hugo/bib/data_ev/src/eda/results/graph/scatter_capacity_autonomy_regression.html')


üí° **Insight visuel** : La relation est lin√©aire avec un R¬≤ de 0.735, indiquant que la capacit√© de la batterie explique 73.5% de la variance de l'autonomie. Les points dispers√©s autour de la ligne de r√©gression refl√®tent les diff√©rences importantes d'efficacit√© entre v√©hicules selon leur segment, a√©rodynamique, poids et motorisation.


## Efficacit√© √©nerg√©tique


In [None]:
# Calcul de l'efficacit√© √©nerg√©tique (km/kWh)
df_efficiency = df_dbeaver.dropna(subset=["net_capacity", "autonomy"]).copy()
df_efficiency['efficiency'] = df_efficiency['autonomy'] / df_efficiency['net_capacity']

# Cr√©er le graphique d'efficacit√©
fig = px.scatter(
    df_efficiency,
    x="net_capacity",
    y="efficiency",
    color="type",
    hover_data={
        "model_name": True,
        "type": True,
        "autonomy": True,
        "net_capacity": ":.1f",
        "efficiency": ":.2f"
    },
    labels={
        "net_capacity": "Capacit√© nette (kWh)",
        "efficiency": "Efficacit√© √©nerg√©tique (km/kWh)",
        "type": "Segment"
    },
    title="Efficacit√© √©nerg√©tique en fonction de la capacit√© batterie"
)

# Ajouter une ligne de tendance
from scipy import stats
x_eff = df_efficiency['net_capacity'].values
y_eff = df_efficiency['efficiency'].values
slope, intercept, r_value, p_value, std_err = stats.linregress(x_eff, y_eff)

x_line = np.linspace(x_eff.min(), x_eff.max(), 100)
y_line = slope * x_line + intercept

fig.add_trace(go.Scatter(
    x=x_line,
    y=y_line,
    mode='lines',
    name=f'Tendance (R¬≤={r_value**2:.3f})',
    line=dict(color='gray', width=2, dash='dash')
))

fig.update_layout(
    height=600,
    template='plotly_white',
    hovermode='closest'
)

fig.show()
fig.write_html('/Users/hugo/bib/data_ev/src/eda/results/graph/efficiency_vs_capacity.html')


L'efficacit√© √©nerg√©tique varie m√™me √† capacit√© √©gale. Les diff√©rences d'a√©rodynamique, de poids et de motorisation influencent l'efficacit√©. 

**Exemples notables** :
- Citro√´n e-C3 : environ 7.4 km/kWh (v√©hicule compact et l√©ger)
- Volvo EX30 Performance : environ 6.9 km/kWh (moteur plus puissant, SUV)


### Efficacit√© moyenne par segment


In [None]:
# Calculer les statistiques par mod√®le
efficiency_by_segment = df_efficiency.groupby("model_name").agg({
    'net_capacity': 'mean', 
    'autonomy': "mean", 
    'efficiency': "mean",
    'model_type': "count",
    "make_name": "first"}).round(2)

efficiency_by_segment.columns = ['Capacit√© moyenne (kWh)', 'Autonomie moyenne (km)', 'Efficacit√© (km/kWh)', 'Nombre de mod√®le', 'make_name']
efficiency_by_segment = efficiency_by_segment.reset_index().sort_values('Capacit√© moyenne (kWh)')
efficiency_by_segment.columns = ['Mod√®le', 'Capacit√© moyenne (kWh)', 'Autonomie moyenne (km)', 'Efficacit√© (km/kWh)', 'Nombre de mod√®le',  'make_name']


In [None]:

fig = go.Figure()


makes = sorted(efficiency_by_segment['make_name'].unique())


for make in makes:
    df_make = efficiency_by_segment[efficiency_by_segment['make_name'] == make]
    
    fig.add_trace(go.Bar(
        x=df_make['Mod√®le'],
        y=df_make['Efficacit√© (km/kWh)'],
        text=df_make['Efficacit√© (km/kWh)'].round(2),
        textposition='outside',
        name=make,
        marker=dict(
            color=df_make['Capacit√© moyenne (kWh)'],
            colorscale='Viridis',
            showscale=True,
            colorbar=dict(title="Capacit√©<br>moyenne<br>(kWh)")
        ),
        hovertemplate='<b>%{x}</b><br>' +
                      'Marque: ' + make + '<br>' +
                      'Efficacit√©: %{y:.2f} km/kWh<br>' +
                      'Capacit√©: %{customdata[0]:.1f} kWh<br>' +
                      'Autonomie: %{customdata[1]:.0f} km<br>' +
                      'Nombre de mod√®le: %{customdata[2]:.0f}<br>' +
                      '<extra></extra>',
        customdata=df_make[['Capacit√© moyenne (kWh)', 'Autonomie moyenne (km)', 'Nombre de mod√®le']].values,
        visible=False  # Toutes les traces sont invisibles par d√©faut
    ))


fig.add_trace(go.Bar(
    x=efficiency_by_segment['Mod√®le'],
    y=efficiency_by_segment['Efficacit√© (km/kWh)'],
    text=efficiency_by_segment['Efficacit√© (km/kWh)'].round(2),
    textposition='outside',
    name='Toutes',
    marker=dict(
        color=efficiency_by_segment['Capacit√© moyenne (kWh)'],
        colorscale='Viridis',
        showscale=True,
        colorbar=dict(title="Capacit√©<br>moyenne<br>(kWh)")
    ),
    hovertemplate='<b>%{x}</b><br>' +
                  'Marque: %{customdata[3]}<br>' +
                  'Efficacit√©: %{y:.2f} km/kWh<br>' +
                  'Capacit√©: %{customdata[0]:.1f} kWh<br>' +
                  'Autonomie: %{customdata[1]:.0f} km<br>' +
                  'Nombre de mod√®le: %{customdata[2]:.0f}<br>' +
                  '<extra></extra>',
    customdata=efficiency_by_segment[['Capacit√© moyenne (kWh)', 'Autonomie moyenne (km)', 'Nombre de mod√®le', 'make_name']].values,
    visible=True  
))


buttons = []


visible_all = [False] * len(makes) + [True]
buttons.append(dict(
    label='Toutes les marques',
    method='update',
    args=[{'visible': visible_all},
          {'title': 'Efficacit√© √©nerg√©tique moyenne par mod√®le - Toutes les marques'}]
))

# Boutons pour chaque marque
for i, make in enumerate(makes):
    visible = [False] * (len(makes) + 1)
    visible[i] = True
    buttons.append(dict(
        label=make,
        method='update',
        args=[{'visible': visible},
              {'title': f'Efficacit√© √©nerg√©tique moyenne par mod√®le - {make}'}]
    ))


fig.update_layout(
    title='Efficacit√© √©nerg√©tique moyenne par mod√®le - Toutes les marques',
    xaxis_title='Mod√®le',
    yaxis_title='Efficacit√© √©nerg√©tique (km/kWh)',
    height=600,
    template='plotly_white',
    showlegend=False,
    updatemenus=[
        dict(
            buttons=buttons,
            direction='down',
            pad={'r': 10, 't': 10},
            showactive=True,
            x=0.01,
            xanchor='left',
            y=1.15,
            yanchor='top',
            bgcolor='rgba(255, 255, 255, 0.9)',
            bordercolor='#BCCCDC',
            borderwidth=1
        )
    ]
)

fig.show()

# Sauvegarder le graphique
fig.write_html('/Users/hugo/bib/data_ev/src/eda/results/graph/efficiency_by_segment.html')


**R√©sultats:**

- **La capacit√© explique une part importante de l'autonomie** (R¬≤ = 0.735), avec une relation lin√©aire : +5.43 km par kWh suppl√©mentaire.
- **L'efficacit√© √©nerg√©tique varie fortement selon le segment** : Les v√©hicules plus compacts et l√©gers (citadines) ont tendance √† avoir une meilleure efficacit√© (km/kWh) que les SUV ou berlines premium. Cette variation explique pourquoi le R¬≤ n'est pas plus √©lev√©.
- **Facteurs d'efficacit√©** : L'a√©rodynamique, le poids du v√©hicule, la motorisation (single vs dual motor) et les √©quipements impactent significativement l'efficacit√© m√™me √† capacit√© √©gale. Ces facteurs expliquent les ~26% de variance non expliqu√©e par la seule capacit√©.
- **Compromis performance/efficacit√©** : Les versions performance (dual motor, plus de puissance) sacrifient g√©n√©ralement de l'autonomie pour de meilleures performances.


üìä R√âSULTATS DE L'√âTUDE
1. Relation Capacit√© - Autonomie : Analyse de R√©gression
Donn√©es analys√©es : 847 mod√®les de v√©hicules √©lectriques
Mod√®le de r√©gression lin√©aire :
Statistiques cl√©s :
La capacit√© de la batterie explique 73.5% de la variance de l'autonomie
Coefficient = 5.43 km/kWh : Chaque kWh suppl√©mentaire de capacit√© ajoute en moyenne 5.43 km d'autonomie WLTP
2. Efficacit√© √ânerg√©tique par Mod√®le
L'analyse de l'efficacit√© √©nerg√©tique (km/kWh) r√©v√®le des variations importantes entre les mod√®les :
Facteurs influen√ßant l'efficacit√© :
Segment du v√©hicule : Les citadines compactes (type Citro√´n e-C3) affichent jusqu'√† 7.4 km/kWh
Motorisation : Les versions performance (dual motor) r√©duisent l'efficacit√© de 5-10%
A√©rodynamique et poids : Impact significatif sur la consommation
Exemples concrets :
Citro√´n e-C3 : ~7.4 km/kWh (v√©hicule compact, optimis√© pour l'efficacit√©)
Volvo EX30 Performance : ~6.9 km/kWh (SUV, dual motor, plus puissant)
Diff√©rence sur m√™me capacit√© : Citro√´n e-C3 (326 km) vs e-C3 Aircross (300 km) avec la m√™me batterie

üéØ CONCLUSIONS
1. La capacit√© est un pr√©dicteur majeur mais pas unique
La capacit√© de la batterie explique environ 3/4 de l'autonomie. Les 25% restants sont attribuables √† :
L'efficacit√© √©nerg√©tique du v√©hicule (a√©rodynamique, poids)
La configuration du moteur (single vs dual motor)
Le segment et la taille du v√©hicule
Les √©quipements et accessoires
2. L'efficacit√© √©nerg√©tique varie fortement selon le segment
Point cl√© : Deux v√©hicules avec la m√™me capacit√© de batterie peuvent avoir des autonomies tr√®s diff√©rentes :
Un v√©hicule compact l√©ger optimisera l'autonomie (7+ km/kWh)
Un SUV performance privil√©giera les performances au d√©triment de l'autonomie (5-6 km/kWh)

3. Impact de la configuration moteur
Exemple Volvo EX30 (65 kWh) :
Single Motor : 476 km WLTP
Twin Motor Performance : 450 km WLTP
Perte d'autonomie : -26 km (-5.5%) pour gagner en performance
Compromis √† consid√©rer : Les versions performance r√©duisent l'autonomie de 5 √† 10% en moyenne.


-
