Ce notebook permet de voir la différence entre l'autonomie réelle et l'autonomie annoncée par Tesla.
Et donc de voir si cette autonomie diminue en fonction du SoH 

Conclusion:
- L'autonomie réelle (en hiver) equivaut à environ 67% de l'autonomie annoncée
- l'autonomie réelle diminue en fonction du SoH pour 20% de SoH perdu la perte d'autonomie réelle est en moyenne de 25%. 

L'étude a été faite sur les tesla de chez Ayvens qu'on a observé durant la période hivernale.


In [None]:
from transform.processed_tss.ProcessedTimeSeries import *
import pandas as pd
from core.pandas_utils import *
from transform.raw_results.config import *
import plotly.express as px
import plotly.graph_objects as go
import plotly.figure_factory as ff

from transform.raw_results.tesla_results import get_results


In [None]:
from core.sql_utils import *
engine = get_sqlalchemy_engine()
con = engine.connect()

with engine.connect() as connection:
    dbeaver_df = pd.read_sql(text("""SELECT * FROM vehicle_data vd
            join vehicle v
            on v.id = vd.vehicle_id
            join vehicle_model vm 
            on vm.id = v.vehicle_model_id
            join fleet f
            on f.id = v.fleet_id
            join oem o
            on o.id=vm.oem_id
            WHERE f.id not in ('70260bd9-2449-4f5b-81f2-73d9cb6b4b93') 
            AND o.oem_name = 'tesla';"""), con)

dbeaver_df.columns

In [None]:
dbeaver_df['vin'] = dbeaver_df.vin.astype('category').astype(str)
dbeaver_df.sort_values('timestamp', inplace=True)
dbeaver_df['timestamp'] =pd.to_datetime(dbeaver_df['timestamp'])

In [None]:
df_discharge = TeslaProcessedTimeSeries("tesla", force_update=False, filters=[("trimmed_in_discharge", "==", True)]) 
df_discharge_with_speed = df_discharge[df_discharge['speed'] > 0]

In [None]:
ts_discharge = (df_discharge_with_speed.groupby(["vin", "trimmed_in_discharge_idx"], observed=True, as_index=False)
        .agg(
            energy_added_min=pd.NamedAgg("charge_energy_added", "min"),
            energy_added_end=pd.NamedAgg("charge_energy_added", "last"),
            soc_diff=pd.NamedAgg("soc", series_start_end_diff),
            inside_temp=pd.NamedAgg("inside_temp", "mean"),
            outside_temp=pd.NamedAgg("outside_temp", "mean"),
            capacity=pd.NamedAgg("capacity", "first"),
            odometer_diff=pd.NamedAgg('odometer', series_start_end_diff),
            odometer_start=pd.NamedAgg("odometer", "first"),
            odometer_end=pd.NamedAgg("odometer", "last"),
            version=pd.NamedAgg("version", "first"),
            size=pd.NamedAgg("soc", "size"),
            model=pd.NamedAgg("model", "first"),
            date=pd.NamedAgg("date", "first"),
            charging_power=pd.NamedAgg("charging_power", "median"),
            tesla_code=pd.NamedAgg("tesla_code", "first"),
            start_date=pd.NamedAgg("start_date", "first"),
            soc_start=pd.NamedAgg("soc", "first"),
            soc_end=pd.NamedAgg("soc", "last"),
            est_battery_range_start=pd.NamedAgg('est_battery_range', 'first'),
            est_battery_range_end=pd.NamedAgg('est_battery_range', 'last'),
            est_battery_range_diff=pd.NamedAgg('est_battery_range', series_start_end_diff),
            speed=pd.NamedAgg('speed', 'mean')
        )
)
ts_discharge['vin'] = ts_discharge.vin.astype(str)
ts_discharge.sort_values('date', inplace=True)
ts_discharge['date'] =pd.to_datetime(ts_discharge['date'].dt.date)

In [None]:
df_merge_discharge = pd.merge_asof(ts_discharge, dbeaver_df[['timestamp', 'vin','soh', 'autonomy', 'model_name', 'type']], 
                                   left_on=['date'], right_on=['timestamp'], by='vin', direction='forward')

In [None]:
# drop MT336 pour éviter tout problème
df_merge_discharge_no_mt336 = df_merge_discharge[df_merge_discharge['tesla_code']!='MT336']

In [None]:
df_merge_discharge_no_mt336['ratio_km_soc'] = df_merge_discharge_no_mt336['odometer_diff'] / df_merge_discharge_no_mt336['soc_diff'].abs() 
df_merge_discharge_no_mt336['ratio_km_soc_autonomy'] = 100 * df_merge_discharge_no_mt336['ratio_km_soc'] /  df_merge_discharge_no_mt336['autonomy']

In [None]:
px.imshow(df_merge_discharge_no_mt336.select_dtypes(['int', 'float']).corr()[['ratio_km_soc', 'soh']].round(2), text_auto=True, width=600, height=800)

Le SoH ne semble pas corrélé direcetement avec le ratio_km_soc. Le soh n'est pas corréllé avec le nombre de km parcourus pendant la décharge. 

Le ratio et donc le nombre de km parcouru sur une décharge dépend majoritairemement de facteurs externes a la voiture:
- type de conduite (acceleration)
- parcours (dénivelé)
- condition ext (météo, vent ...)


## Study for one kind of vehicule

on récupère les modèles 3 rwd

In [None]:
df_merge_discharge_no_mt336['autonomy'].unique()

In [None]:
model_3_rwd = df_merge_discharge_no_mt336[(df_merge_discharge_no_mt336['model']=="model 3") & (df_merge_discharge_no_mt336['type']=="rwd") ]

In [None]:
model_3_rwd = (model_3_rwd[['vin', 'soc_diff', 'inside_temp', 'outside_temp', 'odometer_diff', 'soc_start', 'soc_end', 'speed', 'soh', 'autonomy', 'ratio_km_soc']]
               [(model_3_rwd['soc_diff'] < -1) & (model_3_rwd['odometer_diff'] > 0)])

In [None]:
med_ratio = model_3_rwd.groupby('vin')[["ratio_km_soc", "soh", "inside_temp"]].median()

In [None]:
px.histogram(model_3_rwd[model_3_rwd['vin']=="LRW3E7FSXRC069268"], x='ratio_km_soc', nbins=100, title="répartition du ratios Km parcouru / nombre SoC points perdu pour le vin LRW3E7FSXRC069268",)

In [None]:
px.scatter(med_ratio, x='soh', y='ratio_km_soc',  
           title="distribution des ratio median par rapport au SoH des vin pour des tesla model 3 rwd", 
           )

## Graph on all vehicules

In [None]:
# on utilise la mediane ici pour éviter d'être biaisé par des valeurs trop élevées/faibles de ratio 
gb_vin = df_merge_discharge_no_mt336[df_merge_discharge_no_mt336['soh'] > .83].groupby(['vin', 'model', 'type', 'capacity'], as_index=False)[['soh', 'ratio_km_soc', 'ratio_km_soc_autonomy']].median()

In [None]:
gb_vin.vin.nunique()

In [None]:
# on veut éviter les outliers 
gb_vin = gb_vin.dropna()[(gb_vin["ratio_km_soc"] < 7) & (gb_vin["ratio_km_soc"] > 1) ]

In [None]:
from sklearn.linear_model import LinearRegression

model = LinearRegression(fit_intercept=True).fit(gb_vin[['soh']], gb_vin['ratio_km_soc_autonomy'])

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=gb_vin['soh'], y=gb_vin["ratio_km_soc_autonomy"], mode='markers', name="Points"))

fig.add_trace(go.Scatter(x=np.array([0.8, 1]), 
                         y=model.predict(pd.DataFrame({'soh':[.8, 1]})), 
                         mode='lines', name="Ligne", line=dict(color='red')))

fig.show()

In [None]:

model.predict(pd.DataFrame({'soh':[.8]})) / model.predict(pd.DataFrame({'soh':[1]}))

On constate une dégradation moyenne de 27.1% pour l'autonomie pour une dégradation de supposé de 20% pour le SoH en prenant l'ensemble des véhicules.  
Ce qui signifie que lorsque le soh se dégrade de 1 point on perd en moyenne 1.04 % d'autonomie. 

In [None]:
gb_vin.columns

In [None]:

# Filtrer les données
filtered_data = gb_vin[(gb_vin['ratio_km_soc_autonomy'] > 0) & 
                        (gb_vin['ratio_km_soc_autonomy'] < 3)][['soh', 'ratio_km_soc_autonomy', 'model']].dropna()

# Créer un histogramme (barplot)
px.histogram(filtered_data, 
             x='ratio_km_soc_autonomy', 
             color='model',  
             title='Répartition autonomie réelle',
             opacity=.5)



In [None]:

fig = ff.create_distplot([gb_vin[ 
                                             (gb_vin['ratio_km_soc_autonomy'] > 0) & 
                                             (gb_vin['ratio_km_soc_autonomy'] < 3)][['soh', 'ratio_km_soc_autonomy']].dropna()['ratio_km_soc_autonomy'].values],
                         ['ratio_km_soc_autonomy'], 
                         colors= ['green'],
                         bin_size=.01,
             
             )
fig.show()

## decroissance par model de vehicules

In [None]:
gb_vin.model.unique()

In [None]:
sub_set = gb_vin[(gb_vin['model']=='model 3') & (gb_vin['type']=='rwd')]

In [None]:
model = LinearRegression(fit_intercept=True).fit(sub_set[['soh']], sub_set['ratio_km_soc_autonomy'])

In [None]:
fig = go.Figure()
fig.add_trace(go.Scatter(x=sub_set['soh'], y=sub_set["ratio_km_soc_autonomy"], mode='markers'))

fig.add_trace(go.Scatter(x=np.array([0.8, 1]), 
                         y=model.predict(pd.DataFrame({'soh':[.8, 1]})), 
                         mode='lines',  line=dict(color='red')))
fig.update_layout(title=dict(text='Relation entre SoH et le ratio km_soc/autonomy'))
fig.update_xaxes(title='SoH')
fig.update_yaxes(title='km/soc/autonomy')
fig.update_traces(showlegend=False)
fig.show()

In [None]:
model.predict(pd.DataFrame({'soh':[.8]})) / model.predict(pd.DataFrame({'soh':[1]}))