In [26]:
#import des librairies de manipulation de données
from pandas import *
import numpy as np
from scipy import stats, integrate

#import des librairies de visualisation
import seaborn as sns; sns.set(style="ticks", color_codes=True)
import matplotlib as mpl;
import matplotlib.pyplot as plt
%matplotlib inline

In [27]:
#on charge le csv en indiquant que le séparateur est la virgule et que la première ligne contient les en-têtes
df = read_csv('CIMADE_cleaned_v1.csv', sep=',', header=0)

In [28]:
#on affiche un résumé synthétiques des métadonnées du dataframe: nombre de lignes, types de données etc
df.info()

#on affiche 5 lignes choisies au hasard dans le dataframe
df.sample(5)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 234872 entries, 0 to 234871
Data columns (total 7 columns):
departement      234872 non-null int64
prefecture       234872 non-null object
requete          234872 non-null object
date_sondage     234872 non-null object
heure_sondage    234872 non-null object
proposition1     234872 non-null object
proposition2     234872 non-null object
dtypes: int64(1), object(6)
memory usage: 12.5+ MB


Unnamed: 0,departement,prefecture,requete,date_sondage,heure_sondage,proposition1,proposition2
71056,94,Préfecture de Créteil,Demande de naturalisation,2016-02-12T00:00:00Z,09:25:41,,
117984,13,Sous-préfecture d'Arles,Rendez-vous pour les associations loi 1901,2016-03-15T00:00:00Z,01:09:03,2016-03-15,2016-03-16
153105,92,Sous-préfecture de Boulogne,Échange de permis de conduire étranger,2016-04-07T00:00:00Z,08:30:56,2016-04-12,2016-04-14
31767,29,Sous-préfecture de Brest,Première demande et renouvellement de titre de...,2016-01-08T00:00:00Z,17:07:54,,
194413,30,Préfecture de Nîmes,"Première demande de titre de séjour, sauf admi...",2016-05-03T00:00:00Z,21:11:44,,


In [29]:
#on nettoie les données de date_sondage et on la fusionne avec heure_sondage
df['date_sondage'] = df['date_sondage'].str.replace('T00:00:00Z',' ') + df['heure_sondage']
df = df.drop('heure_sondage',1)

#on affiche les 5 premières lignes du nouveau dataframe
df.head(5)

Unnamed: 0,departement,prefecture,requete,date_sondage,proposition1,proposition2
0,91,Préfecture d'Évry,Renouvellement de carte de séjour « étudiant »,2015-11-29 20:07:04,,
1,91,Préfecture d'Évry,Renouvellement de la carte de séjour « scienti...,2015-11-29 20:07:06,,
2,91,Préfecture d'Évry,Renouvellement de carte de séjour « conjoint d...,2015-11-29 20:07:07,,
3,91,Préfecture d'Évry,Renouvellement de carte de séjour « mineur pri...,2015-11-29 20:07:09,,
4,91,Préfecture d'Évry,Renouvellement de carte de séjour « mineur pri...,2015-11-29 20:07:10,,


In [30]:
#on utilise to.datetime pour assigner un type adapté aux données temporelle
df['date_sondage'] = to_datetime(df['date_sondage'])
df['proposition1'] = to_datetime(df['proposition1'], errors='coerce')
df['proposition2'] = to_datetime(df['proposition2'], errors='coerce')

#on vérifie les différents types du dataframe
df.dtypes

departement              int64
prefecture              object
requete                 object
date_sondage    datetime64[ns]
proposition1    datetime64[ns]
proposition2    datetime64[ns]
dtype: object

In [31]:
#on assigne date_sondage à l'index
df.index = df['date_sondage']

df.head(5)

Unnamed: 0_level_0,departement,prefecture,requete,date_sondage,proposition1,proposition2
date_sondage,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-11-29 20:07:04,91,Préfecture d'Évry,Renouvellement de carte de séjour « étudiant »,2015-11-29 20:07:04,NaT,NaT
2015-11-29 20:07:06,91,Préfecture d'Évry,Renouvellement de la carte de séjour « scienti...,2015-11-29 20:07:06,NaT,NaT
2015-11-29 20:07:07,91,Préfecture d'Évry,Renouvellement de carte de séjour « conjoint d...,2015-11-29 20:07:07,NaT,NaT
2015-11-29 20:07:09,91,Préfecture d'Évry,Renouvellement de carte de séjour « mineur pri...,2015-11-29 20:07:09,NaT,NaT
2015-11-29 20:07:10,91,Préfecture d'Évry,Renouvellement de carte de séjour « mineur pri...,2015-11-29 20:07:10,NaT,NaT


In [32]:
df_grouped = df.groupby(TimeGrouper('1M'))

In [33]:
df_grouped.count()

Unnamed: 0_level_0,departement,prefecture,requete,date_sondage,proposition1,proposition2
date_sondage,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-11-30,292,292,292,292,117,115
2015-12-31,22690,22690,22690,22690,9647,8112
2016-01-31,34617,34617,34617,34617,15446,13083
2016-02-29,39358,39358,39358,39358,16751,14839
2016-03-31,47007,47007,47007,47007,20474,18318
2016-04-30,46092,46092,46092,46092,21092,18699
2016-05-31,44816,44816,44816,44816,22005,19370


In [44]:
df_grouped2 = df.groupby(['prefecture', 'requete']).count()
df_grouped2.unstack()

Unnamed: 0_level_0,departement,departement,departement,departement,departement,departement,departement,departement,departement,departement,...,proposition2,proposition2,proposition2,proposition2,proposition2,proposition2,proposition2,proposition2,proposition2,proposition2
requete,Demande de naturalisation,Demande d’acquisition de la nationalité à raison du mariage,Demande d’admission exceptionnelle au séjour,Documents de voyage pour réfugiés,Documents pour mineurs étrangers,Garagistes,Livret de circulation pour les gens du voyage,Modification de titre de séjour,Permis de conduire,Plaques automobiles,...,Renouvellement de la carte de séjour « scientifique »,Renouvellement de titre de séjour,"Renouvellement de titre de séjour, sauf étudiant",Renouvellement d’une carte de résident,Renouvellement d’une carte de séjour temporaire,Service des cartes grises,Visite médicale après suspension de permis de conduire,Visite médicale après suspension du permis de conduire,Voitures étrangères,Échange de permis de conduire étranger
prefecture,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
Préfecture d'Orléans,,,,,,,,,,,...,,,,,,,,,,
Préfecture d'Évry,,,,,,,,,,,...,0.0,,,,,,,,,
Préfecture de Bobigny,3842.0,,,,,,,,,,...,,,,,,,,,,
Préfecture de Chartres,,,,,,,,,,,...,,,,,92.0,1016.0,,,,
Préfecture de Créteil,3816.0,3820.0,3845.0,,,3843.0,,,,3841.0,...,,,,,,,,,1264.0,
Préfecture de Lyon,,,,,,,3776.0,,,,...,,,,586.0,,,,2569.0,,138.0
Préfecture de Mets,,,,,,,,,,,...,,,,,,,,,,
Préfecture de Montpellier,,,,,,,,,,,...,,,1180.0,,,2865.0,,,,62.0
Préfecture de Nanterre,3610.0,3622.0,,,,,,,,,...,,,,,,,,,,
Préfecture de Nîmes,,,,,,,,2576.0,,,...,,461.0,,,,2046.0,,,,1205.0


In [37]:
df_grouped2.head

<bound method NDFrame.head of                                                                                               departement  \
prefecture                                requete                                                           
Préfecture d'Orléans                      Première demande de titre de séjour et renouvel...         4030   
Préfecture d'Évry                         Rendez-vous pour les associations loi 1901                 4132   
                                          Renouvellement de carte de séjour « conjoint de...         4128   
                                          Renouvellement de carte de séjour « mineur pris...         4132   
                                          Renouvellement de carte de séjour « mineur pris...         4125   
                                          Renouvellement de carte de séjour « salarié »              4123   
                                          Renouvellement de carte de séjour « étudiant »          