In [5]:
import pandas as pd
import numpy as np

df_car = pd.read_csv("car_prices.csv", delimiter=',',encoding='utf-8') # Ouverture du fichier .csv

df_car.drop(['vin','state','seller'], axis=1, inplace= True) # Supprésion des colonnes inutiles

df_car.rename(columns={ # Renommer les colonnes
    'year': 'Année',
    'make': 'Marque',
    'model': 'Modèle',
    'trim' : 'Version',
    'body': 'Type de carrosserie',
    'transmission': 'Transmission',
    'condition': 'État',
    'odometer': 'Kilométrage',
    'color': 'Couleur',
    'interior': 'Intérieur',
    'mmr': 'Valeur marchande',
    'sellingprice': 'Prix de vente',
    'saledate':'Date de vente'
},inplace=True)


df_car['Année'] = df_car['Année'] + 8 # Ajouter 8 années aux dates initiales


from datetime import datetime

def transform_date(date_str): # Fonction pour changer la date de vente en format JJ-MM-AA + ajout de 8 années
    if isinstance(date_str, str):
        date_parts = ' '.join(pd.Series(date_str.split()).drop([0, 4, 5, 6], errors='ignore').tolist())
    
        try:
            date_object = datetime.strptime(date_parts, '%b %d %Y')
            return date_object.replace(year=date_object.year + 8).strftime('%d-%m-%y')
        except ValueError:
            return None


df_car['Date de vente'] = df_car['Date de vente'].apply(transform_date) # Appliquer la fonction à la colonne
#df_car.loc[:4 , 'Date de vente'] = df_car.loc[:4, 'Date de vente'].apply(transform_date) # Appliquer la fonction aux 5 premières lignes de la colonne


df_car = df_car[df_car['Année'] >= 2014] # Afficher uniquement les voitures ayant moins de 10 ans d’ancienneté


# Suppression des NaN + extraire dans un fichier .csv différent
index_with_nan = df_car.index[df_car.isnull().any(axis=1)] 
df_nan = df_car[df_car.isna().any(axis=1)].copy()
df_nan.to_csv('car_prices_nan.csv', index=False)
df_car.dropna(inplace=True)


color_categories = { # Création de catégories pour les couleurs
    'Autres': {'red', 'burgundy','blue', 'turquoise','silver','brown','yellow','lime','green','purple','pink','orange','gold'},
    'Noir': {'black', 'charcoal'},
    'Blanc': {'white', 'off-white', 'beige'},
    'Gris': {'gray'}
}


color_df = {} # Boucle pour associer les couleurs à leurs catégories
for category, colors in color_categories.items():
    for color in colors:
        color_df[color] = category


df_car['Catégorie couleur'] = df_car['Couleur'].map(color_df).fillna('Autres') 



for i, row in df_car.iterrows() :
    if row['Kilométrage'] <= 10000 :
        df_car.at[i,'Catégorie Kilométrage'] = "0km - 9 999km"
    elif row['Kilométrage'] <= 30000 :
        df_car.at[i,'Catégorie Kilométrage'] = "10 000km - 29 999km"
    elif row['Kilométrage'] <= 50000 :
        df_car.at[i,'Catégorie Kilométrage'] = "30 000km - 49 999km"
    elif row['Kilométrage'] <= 80000 :
        df_car.at[i,'Catégorie Kilométrage'] = "50 000km - 79 999km"
    elif row['Kilométrage'] <= 100000 :
        df_car.at[i,'Catégorie Kilométrage'] = "80 000km - 99 999km"
    elif row['Kilométrage'] <= 150000 :
        df_car.at[i,'Catégorie Kilométrage'] = "100 000km - 149 999km"
    elif row['Kilométrage'] <= 200000 :
        df_car.at[i,'Catégorie Kilométrage'] = "150 000km - 199 999km"
    elif row['Kilométrage'] <= 300000 :
        df_car.at[i,'Catégorie Kilométrage'] = "200 000km - 299 999km"
    elif row['Kilométrage'] <= 500000 :
        df_car.at[i,'Catégorie Kilométrage'] = "300 000km - 499 999km"
    elif row['Kilométrage'] > 500000 :
        df_car.at[i,'Catégorie Kilométrage'] = "+500 000km"


df_car.loc[:,['Année','Marque','Modèle','Version','Type de carrosserie','Transmission','État','Kilométrage','Catégorie Kilométrage','Couleur','Catégorie couleur','Intérieur','Valeur marchande','Prix de vente','Date de vente']]

67345
        Année  Marque               Modèle      Version Type de carrosserie  \
0        2023     Kia              Sorento           LX                 SUV   
1        2023     Kia              Sorento           LX                 SUV   
2        2022     BMW             3 Series   328i SULEV               Sedan   
3        2023   Volvo                  S60           T5               Sedan   
4        2022     BMW  6 Series Gran Coupe         650i               Sedan   
...       ...     ...                  ...          ...                 ...   
558831   2019     BMW             5 Series         528i               Sedan   
558833   2020     Ram                 2500  Power Wagon            Crew Cab   
558834   2020     BMW                   X5    xDrive35d                 SUV   
558835   2023  Nissan               Altima        2.5 S               sedan   
558836   2022    Ford                F-150          XLT           SuperCrew   

       Transmission  État  Kilométrage Couleu

Unnamed: 0,Année,Marque,Modèle,Version,Type de carrosserie,Transmission,État,Kilométrage,Catégorie Kilométrage,Couleur,Catégorie couleur,Intérieur,Valeur marchande,Prix de vente,Date de vente
0,2023,Kia,Sorento,LX,SUV,automatic,5.0,16639.0,10 000km - 29 999km,white,Blanc,black,20500.0,21500.0,16-12-22
1,2023,Kia,Sorento,LX,SUV,automatic,5.0,9393.0,0km - 9 999km,white,Blanc,beige,20800.0,21500.0,16-12-22
2,2022,BMW,3 Series,328i SULEV,Sedan,automatic,45.0,1331.0,0km - 9 999km,gray,Gris,black,31900.0,30000.0,15-01-23
3,2023,Volvo,S60,T5,Sedan,automatic,41.0,14282.0,10 000km - 29 999km,white,Blanc,black,27500.0,27750.0,29-01-23
4,2022,BMW,6 Series Gran Coupe,650i,Sedan,automatic,43.0,2641.0,0km - 9 999km,gray,Gris,black,66000.0,67000.0,18-12-22
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
558831,2019,BMW,5 Series,528i,Sedan,automatic,39.0,66403.0,50 000km - 79 999km,white,Blanc,brown,20300.0,22800.0,07-07-23
558833,2020,Ram,2500,Power Wagon,Crew Cab,automatic,5.0,54393.0,50 000km - 79 999km,white,Blanc,black,30200.0,30800.0,08-07-23
558834,2020,BMW,X5,xDrive35d,SUV,automatic,48.0,50561.0,50 000km - 79 999km,black,Noir,black,29800.0,34000.0,08-07-23
558835,2023,Nissan,Altima,2.5 S,sedan,automatic,38.0,16658.0,10 000km - 29 999km,white,Blanc,black,15100.0,11100.0,09-07-23


In [21]:
df_car.head(1000 )

Unnamed: 0,Année,Marque,Modèle,Version,Type de carrosserie,Transmission,État,Kilométrage,Couleur,Intérieur,Valeur marchande,Prix de vente,Date de vente,Catégorie couleur,Catégorie Kilométrage
0,2023,Kia,Sorento,LX,SUV,automatic,5.0,16639.0,white,black,20500.0,21500.0,16-12-22,Blanc,10 000km - 29 999km
1,2023,Kia,Sorento,LX,SUV,automatic,5.0,9393.0,white,beige,20800.0,21500.0,16-12-22,Blanc,0km - 9 999km
2,2022,BMW,3 Series,328i SULEV,Sedan,automatic,45.0,1331.0,gray,black,31900.0,30000.0,15-01-23,Gris,0km - 9 999km
3,2023,Volvo,S60,T5,Sedan,automatic,41.0,14282.0,white,black,27500.0,27750.0,29-01-23,Blanc,10 000km - 29 999km
4,2022,BMW,6 Series Gran Coupe,650i,Sedan,automatic,43.0,2641.0,gray,black,66000.0,67000.0,18-12-22,Gris,0km - 9 999km
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1107,2020,Ford,Escape,XLT,SUV,automatic,26.0,70977.0,silver,black,12050.0,11200.0,18-12-22,Autres,50 000km - 79 999km
1108,2020,Cadillac,Escalade ESV,Platinum Edition,SUV,automatic,31.0,42547.0,white,brown,46200.0,45750.0,18-12-22,Blanc,30 000km - 49 999km
1109,2020,BMW,X5,xDrive35i Premium,SUV,automatic,48.0,31330.0,gray,black,38000.0,39500.0,18-12-22,Gris,30 000km - 49 999km
1110,2020,BMW,X5,xDrive35d,SUV,automatic,38.0,21278.0,white,gray,39300.0,41000.0,18-12-22,Blanc,10 000km - 29 999km
