La voiture : étude d'un fait social

Par Alexandre Pakin et Gilles Massoulié

In [103]:
%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


Introduction

L’usage de la voiture constitue un objet central d’analyse en sociologie, tant il structure les mobilités quotidiennes, les trajectoires sociales et les rapports aux territoires en France. Loin d’être un simple outil de déplacement, l’automobile peut être appréhendée comme un fait social, révélateur d’inégalités de classe, de genre, d’âge et de territoire.

Cette étude a été motivée par une [Vidéo de vulgarisation sociologique sur l’automobile](https://www.youtube.com/watch?v=tR6aujaUh_g)
 proposant une synthèse critique de plusieurs travaux récents sur l’automobile et ses usages sociaux. En mettant en évidence la dimension profondément inégalitaire de la conduite et de la possession d’un véhicule, cette vidéo invite à revenir aux données empiriques afin de reproduire et discuter certaines conclusions à partir de sources ouvertes. Le présent projet s’inscrit ainsi dans une démarche de réanalyse quantitative, visant à confronter des hypothèses sociologiques établies aux données disponibles.

La littérature récente permet de dégager plusieurs axes majeurs. D’une part, des travaux généraux de sociologie de l’automobile, comme [Sociologie de l’automobile](https://www.cairn.info/sociologie-de-l-automobile--9782707196433.htm) de Jean-Pierre Orfeuil et Frédéric Héran (2022) ou [Idées reçues sur l’automobile](https://www.cairn.info/idees-recues-sur-l-automobile--9782715405666.htm) de Frédéric Héran (2021), proposent un cadre théorique permettant de déconstruire les représentations dominantes associées à la voiture. D’autre part, plusieurs études mettent en évidence des usages différenciés selon les caractéristiques sociales des individus. Les dimensions d’âge et de genre sont notamment abordées dans des travaux portant sur la jeunesse automobile ou sur les inégalités et comportements genrés au volant, tandis que d’autres recherches analysent l’automobile comme un marqueur de position sociale et un révélateur des inégalités de classe, notamment à travers les politiques de mobilité et de sécurité routière.

Dans le prolongement de ces travaux, ce projet vise à analyser empiriquement l’usage de la voiture en France à partir de données issues de trois API publiques (data.gouv.fr, INSEE et transport.data.gouv.fr). L’objectif est d’identifier des régularités statistiques et des inégalités sociales liées à l’automobile, tout en illustrant l’apport des outils de programmation en Python pour l’analyse quantitative de phénomènes sociaux.

Sommaire (à faire)

Installation

In [None]:
!pip install -r requirements.txt

# modules 
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from mpl_toolkits.mplot3d import Axes3D
import re
from io import BytesIO
from urllib import request
import requests
from functools import reduce
import requests


# Fonctions
from modules import module_BAAC
from modules import module_region
from modules import graph_baac



Préparation des données

1. Adresses

Toutes les données utilisées dans ce projet sont récupérées directement en ligne, principalement via des interfaces de programmation (API) publiques. Ces API permettent un accès automatisé et reproductible aux données, ce qui s’inscrit pleinement dans une démarche de science des données appliquée aux sciences sociales.

In [105]:
# API Bases de données annuelles des accidents corporels de la circulation routière – 2005 à 2024 (gouvernement.fr)
BAAC_url = "https://www.data.gouv.fr/api/1/datasets/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/"

# URLs d'export CSV : consommation quotidienne d’alcool (Odissé - Santé Publique France)
URL_CONSO = "https://odisse.santepubliquefrance.fr/explore/dataset/alcool-consommation-quotidienne-region/download/?format=csv"

# URLs d'export CSV : alcoolisation ponctuelle importante (Odissé - Santé Publique France)
URL_API   = "https://odisse.santepubliquefrance.fr/explore/dataset/alcool-alcoolisation-ponctuelle-importante-api-mensuel-et-hebdomadaire-region/download/?format=csv"

# URLs d'export .XLSX : impoosition par région (gouvernement.fr)
url_impot = "https://www.impots.gouv.fr/node/25517"   # page with the file

2. Liste des accidents

(à compléter, chaque ligne est un accident)

In [106]:
BAAC_resources = module_BAAC.get_resources(BAAC_url)
pd.set_option("display.max_rows", None)
pd.options.display.max_colwidth = 300
BAAC_resources[["description", "url"]].head(10)

Unnamed: 0,description,url
0,Liste des véhicules immatriculés (hors vélos et engins de déplacement personnel) impliqués dans les accidents corporels issus des BAAC (Bulletin d’Analyse des Accidents Corporels de la circulation) relevés par les forces de l’ordre en 2024.\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251107-100210/2024.csv
1,Liste des véhicules immatriculés (hors vélos et engins de déplacement personnel) impliqués dans les accidents corporels issus des BAAC (Bulletin d’Analyse des Accidents Corporels de la circulation) relevés par les forces de l’ordre en 2023.\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-142813/2023.csv
2,Table des caractéristiques des accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115900/caract-2024.csv
3,Table des lieux des accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115812/lieux-2024.csv
4,Table des véhicules impliqués dans les accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251107-100240/vehicules-2024.csv
5,Table des usagers impliqués dans les accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115506/usagers-2024.csv
6,Liste des véhicules immatriculés (hors vélos et engins de déplacement personnel) impliqués dans les accidents corporels issus des BAAC (Bulletin d’Analyse des Accidents Corporels de la circulation) relevés par les forces de l’ordre en 2022.\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-142722/2022.csv
7,Table des usagers impliqués dans les accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153328/usagers-2023.csv
8,Table des véhicules impliqués dans les accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153253/vehicules-2023.csv
9,Table des lieux des accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153219/lieux-2023.csv


On a sélectionné les catégories suivantes (à rédiger), toutes les tables sauf la première qui est une liste des véhicules immatriculés dans les accidents ont en lien la variable num_acc, donc on les fusionne pour obtenir le dataframe BAAC_table.
Il faudra qd mm utiliser le premier dataframe car il est sûrement intéressant.

In [107]:
selected_BAAC_table = module_BAAC.select_baac_tables(BAAC_resources)
selected_BAAC_table

Unnamed: 0,description,url,table,year
0,Table des caractéristiques des accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115900/caract-2024.csv,caracteristiques,2024
1,Table des lieux des accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115812/lieux-2024.csv,lieux,2024
2,Table des véhicules impliqués dans les accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251107-100240/vehicules-2024.csv,vehicules,2024
3,Table des usagers impliqués dans les accidents corporels de la circulation en 2024 en France (France métropolitaine + DOM + COM +NC).\n,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2024/20251021-115506/usagers-2024.csv,usagers,2024
4,Table des usagers impliqués dans les accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153328/usagers-2023.csv,usagers,2023
5,Table des véhicules impliqués dans les accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153253/vehicules-2023.csv,vehicules,2023
6,Table des lieux des accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241023-153219/lieux-2023.csv,lieux,2023
7,Table des caractéristiques des accidents corporels de la circulation en 2023 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2023/20241028-103125/caract-2023.csv,caracteristiques,2023
8,Table des usagers impliqués dans les accidents corporels de la circulation en 2022 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2021/20231005-094229/usagers-2022.csv,usagers,2022
9,Table des véhicules impliqués dans les accidents corporels de la circulation en 2022 en France (France métropolitaine + DOM + COM +NC).,https://static.data.gouv.fr/resources/bases-de-donnees-annuelles-des-accidents-corporels-de-la-circulation-routiere-annees-de-2005-a-2021/20231005-094147/vehicules-2022.csv,vehicules,2022


Le code peut prendre longtemps à tourner (plus de 10mins) en fonction de la connexion internet.

In [121]:
BAAC_table = module_BAAC.build_baac_dataframe(selected_BAAC_table)
BAAC_table.head(10)

Unnamed: 0,Num_Acc,place,catu,grav,sexe,trajet,secu,locp,actp,etatp,...,dep,year,id_vehicule_x,secu1,secu2,secu3,id_vehicule_y,motor,vma,id_usager
0,200500000001,1,1,4,1,1,11,0,0,0,...,590,2005,,,,,,,,
1,200500000001,1,1,4,1,1,11,0,0,0,...,590,2005,,,,,,,,
2,200500000001,1,1,3,2,3,11,0,0,0,...,590,2005,,,,,,,,
3,200500000001,1,1,3,2,3,11,0,0,0,...,590,2005,,,,,,,,
4,200500000001,2,2,1,1,0,11,0,0,0,...,590,2005,,,,,,,,
5,200500000001,2,2,1,1,0,11,0,0,0,...,590,2005,,,,,,,,
6,200500000001,4,2,1,1,0,31,0,0,0,...,590,2005,,,,,,,,
7,200500000001,4,2,1,1,0,31,0,0,0,...,590,2005,,,,,,,,
8,200500000001,5,2,1,1,0,11,0,0,0,...,590,2005,,,,,,,,
9,200500000001,5,2,1,1,0,11,0,0,0,...,590,2005,,,,,,,,


In [None]:
for i in range(2020, 2025):
    globals()[f'BAAC_table_{i}'] = BAAC_table.loc[BAAC_table['year'] == i]

len(BAAC_table_2024['Num_Acc'])

5621008

In [110]:
BAAC_table = BAAC_table.loc[BAAC_table['year'] == 2024]
len(BAAC_table.head())

5

In [111]:
BAAC_table[['lat','long']].head()

Unnamed: 0,lat,long
5314184,4756277000,675832000
5314185,4756277000,675832000
5314186,4756277000,675832000
5314187,4756277000,675832000
5314188,4702109000,483755000


blabla 2e dataframe

In [120]:
# Chargement en dataframes
df_conso = pd.read_csv(URL_CONSO, sep=';')
df_api   = pd.read_csv(URL_API, sep=';')
df_conso.head()

Unnamed: 0,annee,reg,reglib,sexe,alc_quo_v,alc_quo_icb,alc_quo_ich,alc_quo_typo
0,2000,32,Hauts-de-France,Femmes,11.4334,8.8527,14.6454,B
1,2000,75,Nouvelle Aquitaine,Femmes,14.0312,11.4041,17.1462,B
2,2000,27,Bourgogne et Franche-Comté,Hommes,27.4403,21.9954,33.6515,B
3,2000,28,Normandie,Hommes et Femmes,15.6665,12.685,19.1946,A
4,2000,32,Hauts-de-France,Hommes et Femmes,21.1408,18.4634,24.0918,B


In [116]:
response = requests.get(url_impot)
df1 = pd.read_excel(BytesIO(response.content), sheet_name='regional_nombres')
df2 = pd.read_excel(BytesIO(response.content), sheet_name='regional_montants')
df2

Unnamed: 0.1,Unnamed: 0,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10
0,,,,,,,,,,,(montants en millions d'euros)
1,RÉGIONS,2014.0,2015.0,2016.0,2017.0,2018*,2019**,2020**,2021**,2022**,2023**
2,ILE-DE-FRANCE,24428.6,25745.2,25250.2,26011.4,28162.4,27823.9,26744.4,28949,29743,30191
3,CENTRE VAL DE LOIRE,2136.8,2124.0,2022.5,1976.4,2123.5,2106.8,1995.3,2159,2188,2212
4,BOURGOGNE FRANCHE COMTE,2293.9,2337.3,2231.8,2190.8,2369.4,2363.3,2226.2,2434,2455,2559
5,NORMANDIE,2589.9,2626.0,2500.7,2481.5,2653.3,2650.9,2550,2758,2737,2841
6,HAUTS DE FRANCE,4336.5,4480.7,4235.2,4240.0,4640.1,4546,4372.4,4743,4738,4847
7,GRAND EST,4863.5,4954.4,4736.6,4757.5,5097.6,5045.3,4830.4,5169,5208,5397
8,PAYS DE LA LOIRE,2672.2,2762.2,2649.0,2673.8,2947.5,2998.5,2886.3,3179,3209,3221
9,BRETAGNE,2500.6,2586.5,2448.1,2462.2,2716.2,2730.6,2636.6,2946,2933,3038


In [117]:
df1_fixed = module_region.excel_fix(df1)
df2_fixed = module_region.excel_fix(df2)
df2_fixed

Unnamed: 0,region_id,region,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
0,11,ÎLE-DE-FRANCE,24428.6,25745.2,25250.2,26011.4,28162.4,27823.9,26744.4,28949,29743,30191
1,24,CENTRE-VAL DE LOIRE,2136.8,2124.0,2022.5,1976.4,2123.5,2106.8,1995.3,2159,2188,2212
2,27,BOURGOGNE-FRANCHE-COMTÉ,2293.9,2337.3,2231.8,2190.8,2369.4,2363.3,2226.2,2434,2455,2559
3,28,NORMANDIE,2589.9,2626.0,2500.7,2481.5,2653.3,2650.9,2550.0,2758,2737,2841
4,32,HAUTS DE FRANCE,4336.5,4480.7,4235.2,4240.0,4640.1,4546.0,4372.4,4743,4738,4847
5,44,GRAND EST,4863.5,4954.4,4736.6,4757.5,5097.6,5045.3,4830.4,5169,5208,5397
6,52,PAYS DE LA LOIRE,2672.2,2762.2,2649.0,2673.8,2947.5,2998.5,2886.3,3179,3209,3221
7,53,BRETAGNE,2500.6,2586.5,2448.1,2462.2,2716.2,2730.6,2636.6,2946,2933,3038
8,75,NOUVELLE AQUITAINE,4903.5,5044.8,4743.4,4783.0,5195.8,5162.1,5028.2,5556,5568,5593
9,76,OCCITANIE,4784.4,4992.8,4655.1,4737.6,5133.2,5121.1,4927.2,5460,5342,5371


In [119]:
richesse_df = module_region.compute_richesse(df1_fixed, df2_fixed)
richesse_df


Unnamed: 0,region_id,region,2014,2015,2016,2017,2018,2019,2020,2021,2022,2023
0,11,ÎLE-DE-FRANCE,3.608041,3.780555,3.696251,3.765839,4.035769,3.890366,3.693009,3.994618,4.06881,4.064486
1,24,CENTRE-VAL DE LOIRE,1.475181,1.459593,1.381489,1.334053,1.438393,1.41008,1.3249,1.420395,1.429131,1.433571
2,27,BOURGOGNE-FRANCHE-COMTÉ,1.445978,1.469261,1.401884,1.370449,1.482636,1.459818,1.361757,1.481436,1.478916,1.535093
3,28,NORMANDIE,1.394068,1.408043,1.338704,1.321845,1.41013,1.385802,1.317013,1.411464,1.387228,1.429794
4,32,HAUTS DE FRANCE,1.32944,1.368905,1.292007,1.28372,1.407114,1.359003,1.292271,1.391317,1.379732,1.402894
5,44,GRAND EST,1.592189,1.616233,1.540258,1.535817,1.633375,1.59884,1.517944,1.618347,1.620915,1.668831
6,52,PAYS DE LA LOIRE,1.333234,1.363174,1.295101,1.288082,1.406317,1.398685,1.323323,1.438462,1.430036,1.419568
7,53,BRETAGNE,1.370342,1.403875,1.317954,1.306276,1.433502,1.410507,1.337357,1.468594,1.44057,1.473327
8,75,NOUVELLE AQUITAINE,1.440469,1.469202,1.369579,1.359309,1.471731,1.432206,1.3724,1.495559,1.478492,1.469908
9,76,OCCITANIE,1.444609,1.495388,1.382525,1.383604,1.485129,1.446965,1.366958,1.490175,1.431404,1.421652
