# <u><span style="font-family: 'Times New Roman'; font-size: 60px;">PROJET DE PYTHON POUR LA DATA SCIENCE</span></u>
# <u>THEME</u>:<span style="font-family: 'Times New Roman'; font-size: 40px;"> Analyse des facteurs socio-démographiques et techniques influençant la gravité des accidents routiers en France.  </span>
## <u>1. Contexte générale</u>  
<span style="font-family: 'Times New Roman'; font-size: 16px;"> &nbsp;&nbsp;&nbsp;&nbsp;Les accidents de la route représentent une problématique majeure de santé publique et de sécurité en France. Chaque année, malgré les nombreux progrès réalisés sur le plan de la sécurité routière(généralisations des radars automatiques, freinage automatique d'urgence, renforcement des infrastructures routières,...), des milliers de personnes sont impliquées dans des accidents, causant des blessures graves, des pertes humaines, et d'important dégâts matériels. Des disparités sont observées dans la gravité des accidents en fonction des caractéristiques des usagers, des véhicules, et des lieux où se produisent ces incidents. Les usagers de la route, par leurs comportements et leurs caractéristiques socio-démographiques (âge, sexe, rôle dans l’accident), jouent un rôle déterminant dans la survenue et la gravité des accidents. Parallèlement, les caractéristiques techniques des véhicules impliqués (type, ancienneté, nombre de passagers) influencent également l’issue des accidents. Enfin, les particularités des infrastructures routières et des zones géographiques contribuent à moduler la gravité des impacts. Dans ce contexte, il est essentiel d'analyser ces différents facteurs pour mieux comprendre leur influence sur la gravité des accidents routiers. Une telle analyse permettra d'identifier les populations et les types de véhicules les plus vulnérables, et de fournir des informations précieuses pour orienter les politiques de prévention et les initiatives visant à améliorer la sécurité routière. C'est dans ce cadre que s'inscrit ce projet. L’objectif est de dresser un portrait complet des facteurs socio-démographiques et techniques associés à la gravité des accidents, à travers des analyses descriptives et une modélisation statistique permettant de hiérarchiser ces facteurs.</span>

In [None]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Étape 1 : URL de la page contenant le fichier CSV
url_page = "https://www.data.gouv.fr/fr/datasets/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/#/resources/68848e2a-28dd-4efc-9d5f-d512f7dbe66f"

# Étape 2 : Charger le contenu HTML de la page
response = requests.get(url_page)
if response.status_code == 200:
    soup = BeautifulSoup(response.text, 'html.parser')

    # Étape 3 : Trouver le lien vers le fichier CSV
    csv_link = None
    for a in soup.find_all('a', href=True):
        if '.csv' in a['href']:
            csv_link = a['href']
            break

    # Étape 4 : Télécharger le fichier CSV si un lien est trouvé
    if csv_link:
        if csv_link.startswith('/'):  # Si le lien est relatif
            csv_link = "https://www.data.gouv.fr" + csv_link
        
        print(f"Téléchargement du fichier CSV depuis : {csv_link}")
        csv_response = requests.get(csv_link)

        if csv_response.status_code == 200:
            # Charger directement le fichier CSV dans une variable
            from io import StringIO
            data = pd.read_csv(StringIO(csv_response.text), sep=';')  # Adapter le séparateur ici (';' ou ',')
            
            # Afficher un aperçu des données
            print("Fichier chargé avec succès dans la variable 'data'.")
            display(data.head())  # Affiche les 5 premières lignes

        else:
            print(f"Erreur lors du téléchargement du fichier CSV : {csv_response.status_code}")
    else:
        print("Lien vers le fichier CSV introuvable.")
else:
    print(f"Erreur lors de la requête HTTP : {response.status_code}")