<center><img src="https://is1-ssl.mzstatic.com/image/thumb/Purple122/v4/05/e7/67/05e76784-3364-b535-7e20-b3f4946a56b6/AppIcon-0-0-1x_U007emarketing-0-0-0-7-0-0-sRGB-0-0-0-GLES2_U002c0-512MB-85-220-0-0.png/434x0w.webp" style="height:150px"></center>


# Introduction

Vous disposez d'un jeu de données décrivant des accidents de la route ayant eu lieu en janvier 2022. Ce jeu de données a été corrompu et vous devez vous débrouiller pour le réparer.


# Données

Vous disposez de deux jeux de données : 
* **`"accidents.csv"`** : Les données décrivant les conditions de l'accident.
* **`"vehicules.csv"`** : Les données décrivant les véhicules impliqués dans l'accident.

Voici une description de chaque champ présent dans ces fichiers:

**`"accidents.csv"`**:

* **`"Num_acc"`** : Identifiant unique de l'accident.
* **`"Date"`** : Date et heure de l'accident.
* **`"Conditions Lumineuses"`** : Si l'accident a eu lieu en journée ou pendant la nuit.
* **`"Conditions Atmosphériques"`** : Si l'accident a eu lieu sous la pluie ou en temps normal.
* **`"Etat Surface"`** : Si la surface de la route où a eu lieu l'accident était mouillée ou sèche.
* **`"Catégorie Route"`** : La catégorie de la route où l'accident s'est produit ("Voie Communale", "Route Nationale", "Route Départementale", "Autoroute").
* **`"Vitesse Maximale Autorisée"`** : La vitesse maximale autorisée sur la route où a eu lieu l'accident (30, 50, ... , 130).
* **`"Type Collision"`** : Comment les véhicules se sont percutés ("Par l'arrière", "Par le côté", "Frontale", "Autre").
* **`"Nombre Véhicules Impliqués"`** : Le nombre de véhicules impliqués dans l'accident.
* **`"Nombre Usagers Impliqués"`** : Le nombre de passagers présents dans les véhicules impliqués dans l'accident.
* **`"Gravité"`** : Vaut 1 s'il y a eu au moins une personne blessée à l'issue de l'accident, 0 si tout le monde s'en est sortie indemne.

**`"vehicules.csv"`**:

* **`"Num_acc"`** : Identifiant unique de l'accident.
* **`"Catégorie du véhicule"`** : La catégorie du véhicule impliqué dans l'accident ("Véhicule Léger", "Véhicule Utilitaire", "Motocyclette" ou "Byciclette").
* **`"Point de choc"`** : Le point d'impact sur le véhicule ("Avant", "Côté Gauche", "Côté Droit" ou "Arrière").
* **`"Nombre de passagers"`** : Le nombre de passagers présents dans le véhicule au moment de l'accident.
* **`"Obstacle heurté"`** : L'obstacle ou l'élément heurté lors de l'accident ("Véhicule", "Fossé", "Batiment ou Mobilier urbain" ou "Glissière").


# Objectif

À l'aide de vos compétences logiques et analytiques, vous devrez comprendre le contenu des données fournies et trouver des méthodes pour remplir les valeurs manquantes.

**Vous devrez nous remettre un fichier csv dont la structure est identique à celle du fichier `"accidents.csv"` et où vous aurez rempli les valeurs manquantes avec des valeurs appropriées.**

**À vous de jouer!**


In [2]:
import pandas as pd

accidents = pd.read_csv("accidents.csv")
vehicules = pd.read_csv("vehicules.csv")

In [3]:
accidents.head()

Unnamed: 0,Num_acc,Date,Conditions Lumineuses,Conditions Atmosphériques,Etat Surface,Catégorie Route,Vitesse Maximale Autorisée,Type Collision,Nombre Véhicules Impliqués,Nombre Usagers Impliqués,Gravité
0,0,2022-01-06 03:39:36,Nuit,Normal,Sec,,80.0,Frontale,2.0,2.0,
1,1,2022-01-04 05:36:20,Nuit,Pluie,Mouillé,Voie Communale,,Par le coté,2.0,6.0,0.0
2,2,2022-01-13 16:38:18,Jour,Normal,Sec,Route Départementale,,Par le coté,,,0.0
3,3,2022-01-22 18:07:11,Nuit,Normal,,Voie Communale,,Par le coté,2.0,6.0,0.0
4,4,2022-01-10 07:43:14,Nuit,Normal,,Route Départementale,80.0,,1.0,1.0,


In [4]:
vehicules.head()

Unnamed: 0,Num_acc,Catégorie du véhicule,Point de choc,Nombre de passagers,Obstacle heurté
0,0,Véhicule Léger,Avant,1,Véhicule
1,0,Véhicule Léger,Côté Gauche,1,Véhicule
2,1,Véhicule Léger,Avant,5,Véhicule
3,1,Véhicule Léger,Côté Droit,1,Véhicule
4,2,Bicyclette,Avant,1,Fossé


In [5]:
## Pour remplir la colonne vitesse max autorisée:


vitesses = accidents[accidents["Catégorie Route"].notnull()][["Catégorie Route", "Vitesse Maximale Autorisée"]].drop_duplicates()
vitesses.dropna(inplace=True)

print(vitesses)

def replacing_function(x):
    if x == "Autoroute":
        return 130
    elif x == "Route Nationale":
        return 100
    elif x == "Route Départementale":
        return 75
    elif x == "Voie Communale":
        return (30+50)/2
    else:
        return None

accidents["Vitesse Maximale Autorisée"] = accidents["Catégorie Route"].apply(replacing_function)
accidents.head()

          Catégorie Route  Vitesse Maximale Autorisée
4    Route Départementale                        80.0
15         Voie Communale                        30.0
17         Voie Communale                        50.0
19              Autoroute                       130.0
24   Route Départementale                        70.0
176       Route Nationale                        90.0
203       Route Nationale                       110.0


Unnamed: 0,Num_acc,Date,Conditions Lumineuses,Conditions Atmosphériques,Etat Surface,Catégorie Route,Vitesse Maximale Autorisée,Type Collision,Nombre Véhicules Impliqués,Nombre Usagers Impliqués,Gravité
0,0,2022-01-06 03:39:36,Nuit,Normal,Sec,,,Frontale,2.0,2.0,
1,1,2022-01-04 05:36:20,Nuit,Pluie,Mouillé,Voie Communale,40.0,Par le coté,2.0,6.0,0.0
2,2,2022-01-13 16:38:18,Jour,Normal,Sec,Route Départementale,75.0,Par le coté,,,0.0
3,3,2022-01-22 18:07:11,Nuit,Normal,,Voie Communale,40.0,Par le coté,2.0,6.0,0.0
4,4,2022-01-10 07:43:14,Nuit,Normal,,Route Départementale,75.0,,1.0,1.0,
