In [1]:
import pandas as pd

In [2]:
url = r"Raw Data\que-faire-a-paris-.csv"
events = pd.read_csv(url, sep = ";")

In [3]:
events.shape

(2729, 68)

In [4]:
events.isnull().sum()

ID                            0
Event ID                      0
URL                           0
Titre                         0
Chapeau                       4
                           ... 
URL WhatsApp associée      2720
URL Instagram associée     1686
URL Messenger associée     2716
URL Pinterest associée     2728
URL Soundcloud associée    2726
Length: 68, dtype: int64

In [5]:
# Remove columns that have more than 1500 null values

def drop_col_null_values(df):
    cols_to_drop = [col for col in df.columns if df[col].isnull().sum() > 1000]
    return df.drop(columns=cols_to_drop)


In [6]:
events = drop_col_null_values(events)

In [7]:
events.isnull().sum().sort_values(ascending=False)

title_event                  871
Occurrences                  580
contact_organisation_name    363
Nom du lieu                  184
Ville                        181
Adresse du lieu              181
Crédit de l'image            181
Code postal                  181
Date de fin                   70
Description de la date        69
Date de début                 69
Type d'accès                  56
qfap_tags                     46
Coordonnées géographiques     36
locations                     19
Description                    7
Chapeau                        4
weight                         2
URL de l'image                 0
URL                            0
Event ID                       0
ID                             0
Titre                          0
audience                       0
Date de mise à jour            0
Type de prix                   0
group                          0
rank                           0
locale                         0
event_indoor                   0
event_pets

In [8]:
pd.reset_option('display.max_rows')
pd.reset_option('display.max_columns')
pd.reset_option('display.max_colwidth')

In [9]:
events.head(3)

Unnamed: 0,ID,Event ID,URL,Titre,Chapeau,Description,Date de début,Date de fin,Occurrences,Description de la date,...,title_event,audience,group,locale,rank,weight,qfap_tags,event_indoor,event_pets_allowed,contact_organisation_name
0,11148,4414,https://www.paris.fr/evenements/paris-12e-coll...,Paris 12e : collecte de produits d'hygiène,La Bagagerie 188 est une association qui perme...,<p>Les produits collectés : produits d'hygiène...,,,,,...,Paris 12e : collecte de produits d'hygiène,Tout public.,Agenda,fr,458.29,1.0,,1,0,
1,15034,8262,https://www.paris.fr/evenements/premiers-pas-e...,Premiers Pas en ART-THÉRAPIE,Venez participer à une série de 5 ateliers d'a...,<p>L’art-thérapie est un moyen ludique et créa...,,,,,...,Premiers Pas en ART-THÉRAPIE,Public jeunes et adultes. A partir de 16 ans. ...,Aucun,fr,1038.39,2.0,Art contemporain;Atelier;Peinture,1,0,
2,11018,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,...,La folle et inconvenante histoire des femmes,Public jeunes et adultes.,Agenda,fr,731.97,1.0,Théâtre,1,0,Théâtre Le Funambule Montmartre


In [10]:
events['event_pets_allowed'].value_counts()

event_pets_allowed
0    2728
1       1
Name: count, dtype: int64

In [11]:
# Look at the remaining columns with highest number null values and decide to drop them or not
# title_event is a duplicate of title
events.drop(columns=['title_event', 'contact_organisation_name', "Crédit de l'image", 'group', 'locale', 'rank', 'weight', 'event_pets_allowed', "URL de l'image"], axis=1, inplace=True)


In [12]:
print(events.columns.tolist())

['ID', 'Event ID', 'URL', 'Titre', 'Chapeau', 'Description', 'Date de début', 'Date de fin', 'Occurrences', 'Description de la date', 'locations', 'Nom du lieu', 'Adresse du lieu', 'Code postal', 'Ville', 'Coordonnées géographiques', 'Type de prix', "Type d'accès", 'Date de mise à jour', 'audience', 'qfap_tags', 'event_indoor']


In [13]:
pd.set_option('display.max_columns', None)

In [14]:
events.head(3)

Unnamed: 0,ID,Event ID,URL,Titre,Chapeau,Description,Date de début,Date de fin,Occurrences,Description de la date,locations,Nom du lieu,Adresse du lieu,Code postal,Ville,Coordonnées géographiques,Type de prix,Type d'accès,Date de mise à jour,audience,qfap_tags,event_indoor
0,11148,4414,https://www.paris.fr/evenements/paris-12e-coll...,Paris 12e : collecte de produits d'hygiène,La Bagagerie 188 est une association qui perme...,<p>Les produits collectés : produits d'hygiène...,,,,,"[{'accessibility': {'blind': None, 'pmr': None...",Bagagerie 188,188 rue Charenton,75012.0,Paris,"48.8433599932321, 2.38505998737415",gratuit,non,2021-11-08T21:15:40+01:00,Tout public.,,1
1,15034,8262,https://www.paris.fr/evenements/premiers-pas-e...,Premiers Pas en ART-THÉRAPIE,Venez participer à une série de 5 ateliers d'a...,<p>L’art-thérapie est un moyen ludique et créa...,,,,,,,,,,,gratuit sous condition,obligatoire,2022-01-03T10:07:49+01:00,Public jeunes et adultes. A partir de 16 ans. ...,Art contemporain;Atelier;Peinture,1
2,11018,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,"[{'accessibility': {'blind': None, 'pmr': None...",Le funambule montmartre,53 rue des saules,75001.0,Paris,"48.890747, 2.340517",payant,obligatoire,2024-03-05T18:01:24+01:00,Public jeunes et adultes.,Théâtre,1


In [15]:
events.duplicated().value_counts()

False    2729
Name: count, dtype: int64

In [16]:
events['Event ID'].value_counts().sort_values(ascending=False)

Event ID
4414     1
8262     1
4283     1
51498    1
51918    1
        ..
67975    1
66970    1
66528    1
68227    1
68235    1
Name: count, Length: 2729, dtype: int64

In [17]:
events.drop(columns=['ID'], axis=1, inplace=True)


In [18]:
events.dropna(subset=['Coordonnées géographiques'], inplace=True)

In [19]:
pd.set_option('display.max_colwidth', None) 

In [20]:
pd.reset_option('display.max_colwidth')

In [21]:
localisation = events[['locations', 'Adresse du lieu', 'Coordonnées géographiques']].sort_values('Adresse du lieu')

In [22]:
events.drop(columns=['locations'], axis=1, inplace=True)

In [23]:
events

Unnamed: 0,Event ID,URL,Titre,Chapeau,Description,Date de début,Date de fin,Occurrences,Description de la date,Nom du lieu,Adresse du lieu,Code postal,Ville,Coordonnées géographiques,Type de prix,Type d'accès,Date de mise à jour,audience,qfap_tags,event_indoor
0,4414,https://www.paris.fr/evenements/paris-12e-coll...,Paris 12e : collecte de produits d'hygiène,La Bagagerie 188 est une association qui perme...,<p>Les produits collectés : produits d'hygiène...,,,,,Bagagerie 188,188 rue Charenton,75012,Paris,"48.8433599932321, 2.38505998737415",gratuit,non,2021-11-08T21:15:40+01:00,Tout public.,,1
2,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,Le funambule montmartre,53 rue des saules,75001,Paris,"48.890747, 2.340517",payant,obligatoire,2024-03-05T18:01:24+01:00,Public jeunes et adultes.,Théâtre,1
3,51498,https://www.paris.fr/evenements/signatures-ave...,Signatures avec Dominique et Alexandra Duvivier,Encore un nouveau spectacle du duo mythique de...,<p>Peut-être tout simplement la magie de vous ...,2024-10-12T00:00:00+02:00,2025-07-12T01:15:00+02:00,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,Le vendredi 11 juillet 2025<br />de 21h00 à 22...,Théâtre Le Double Fond,1 place du Marché Sainte Catherine,75004,Paris,"48.8553759962578, 2.36257704084858",payant,obligatoire,2024-08-12T14:15:23+02:00,Public jeunes et adultes. A partir de 12 ans.,Théâtre,1
4,51918,https://www.paris.fr/evenements/le-milieu-des-...,"« Le Milieu des choses », une œuvre de Javier ...","En juin 2024, Black Swan Real Estate Capital, ...","<p><strong>Avec cette réalisation, l’approche ...",2024-06-01T02:00:00+02:00,2030-06-02T01:59:59+02:00,,Du samedi 01 juin 2024 au samedi 01 juin 2030 ...,Bureaux Panache,47 rue de Charenton,75012,Paris,"48.8513619866461, 2.37239803298021",gratuit,non,2024-08-26T12:50:56+02:00,Tout public.,Art contemporain,1
5,53204,https://www.paris.fr/evenements/avatar-live-in...,Avatar - Live in concert,"La beauté du film Avatar sur grand écran, acco...",<p><strong>Le phénomène mondial en Ciné-Concer...,2025-09-27T23:00:00+02:00,2025-09-28T02:00:00+02:00,2025-09-27T21:00:00+02:00_2025-09-28T00:00:00+...,Le samedi 27 septembre 2025<br />de 20h00 à 23...,Le Zénith de Paris,211 avenue Jean Jaurès,75019,Paris,"48.8922462, 2.3878126",payant,obligatoire,2024-09-18T12:13:48+02:00,"Public enfants, jeunes et adultes.",Ecrans;Festival,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2724,67975,https://www.paris.fr/evenements/le-systeme-sol...,Le système solaire : exposition,A l'occasion d'Automne de la science 2025 cons...,"<p><strong>Cette exposition, réalisée par le C...",2025-09-02T02:00:00+02:00,2025-09-28T01:59:59+02:00,,Du mardi 02 septembre 2025 au samedi 27 septem...,Bibliothèque Valeyre,24 rue Marguerite de Rochechouart,75009,Paris,"48.877975, 2.34501",gratuit,non,2025-06-25T13:48:50+02:00,Public jeunes et adultes.,Sciences,1
2725,66970,https://www.paris.fr/evenements/paris-en-seine...,Où voir la vasque : toutes les infos pratiques,Vue par des milliers de spectateurs pendant le...,"<p>Du 21 juin, Fête de la Musique, au 14 septe...",2025-06-21T02:00:00+02:00,2025-09-15T01:59:59+02:00,,Du samedi 21 juin 2025 au dimanche 14 septembr...,Jardin des Tuileries,"113, rue de Rivoli",75001,Paris,"48.8638350129425, 2.33144103657986",gratuit,non,2025-06-25T14:02:01+02:00,Tout public.,Loisirs,1
2726,66528,https://www.paris.fr/evenements/initiations-po...,Initiations pour adultes aux danses urbaines a...,"Pour célébrer l'événement Paris en Seine, le C...","<p>L’été dernier, le 8<sup>e</sup> arrondissem...",2025-07-05T20:00:00+02:00,2025-07-20T22:00:00+02:00,2025-07-05T18:00:00+02:00_2025-07-05T20:00:00+...,Le dimanche 20 juillet 2025<br />de 17h00 à 19...,Parc Monceau,"35, boulevard de Courcelles",75008,Paris,"48.8805170119184, 2.31123897354641",gratuit,non,2025-06-25T15:08:04+02:00,Public adultes.,Danse;Loisirs,1
2727,68227,https://www.paris.fr/evenements/atelier-de-pre...,Atelier de préservation de l'environnement de ...,Dans le cadre de la 21e édition de l’Été Solid...,"<p>Du 19 juin au 31 août 2025, <strong>l’Été S...",2025-08-27T18:00:00+02:00,2025-08-27T20:00:00+02:00,2025-08-27T16:00:00+02:00_2025-08-27T18:00:00+...,Le mercredi 27 août 2025<br />de 15h00 à 17h00...,MVAC7,"4, rue Amélie",75007,Paris,"48.8594219828301, 2.30733996364629",gratuit,obligatoire,2025-06-25T17:02:02+02:00,Public enfants. A partir de 8 ans. Jusqu'à 10 ...,Atelier;Enfants;Nature,1


In [24]:
events = events.copy()
events = events[events['Date de fin'] > '2025-06-01']

In [25]:
events.shape

(2632, 20)

In [26]:
split_themes = events['qfap_tags'].str.split(';', expand=True)
split_themes.columns = [f'theme{i+1}' for i in range(split_themes.shape[1])]
events = pd.concat([events, split_themes], axis=1)

In [27]:
events.drop('qfap_tags', axis=1, inplace=True)

In [28]:
events[['latitude', 'longitude']] = events['Coordonnées géographiques'].str.split(',', expand=True)

In [29]:
events.drop('Coordonnées géographiques', axis=1, inplace=True)

In [30]:
import unicodedata

def clean_column_name(col):
    # Normalize accents and remove diacritics
    col = unicodedata.normalize('NFKD', col).encode('ascii', 'ignore').decode('utf-8')
    # Lowercase, replace apostrophes, remove punctuation, replace spaces
    col = (
        col.lower()
        .replace("'", "_")
        .replace("-", "_")
    )
    col = re.sub(r'[^\w\s]', '', col)      # remove punctuation
    col = re.sub(r'\s+', '_', col)         # replace whitespace with _
    return col

import re
events.columns = [clean_column_name(col) for col in events.columns]

In [31]:
events.head(2)

Unnamed: 0,event_id,url,titre,chapeau,description,date_de_debut,date_de_fin,occurrences,description_de_la_date,nom_du_lieu,adresse_du_lieu,code_postal,ville,type_de_prix,type_d_acces,date_de_mise_a_jour,audience,event_indoor,theme1,theme2,theme3,latitude,longitude
2,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,Le funambule montmartre,53 rue des saules,75001,Paris,payant,obligatoire,2024-03-05T18:01:24+01:00,Public jeunes et adultes.,1,Théâtre,,,48.890747,2.340517
3,51498,https://www.paris.fr/evenements/signatures-ave...,Signatures avec Dominique et Alexandra Duvivier,Encore un nouveau spectacle du duo mythique de...,<p>Peut-être tout simplement la magie de vous ...,2024-10-12T00:00:00+02:00,2025-07-12T01:15:00+02:00,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,Le vendredi 11 juillet 2025<br />de 21h00 à 22...,Théâtre Le Double Fond,1 place du Marché Sainte Catherine,75004,Paris,payant,obligatoire,2024-08-12T14:15:23+02:00,Public jeunes et adultes. A partir de 12 ans.,1,Théâtre,,,48.8553759962578,2.36257704084858


In [32]:
events[events['date_de_debut'] == '2530-02-27T19:00:00+01:00']

Unnamed: 0,event_id,url,titre,chapeau,description,date_de_debut,date_de_fin,occurrences,description_de_la_date,nom_du_lieu,adresse_du_lieu,code_postal,ville,type_de_prix,type_d_acces,date_de_mise_a_jour,audience,event_indoor,theme1,theme2,theme3,latitude,longitude
332,65667,https://www.paris.fr/evenements/venez-rencontr...,Venez rencontrer les Louves du Polar à la Fnac...,Les autrices francophones de romans noirs sont...,<h2>SANDRINE COHEN</h2><p><strong>Sandrine Coh...,2530-02-27T19:00:00+01:00,2530-02-27T19:30:00+01:00,2530-02-27T18:00:00+01:00_2530-02-27T18:30:00+...,Le lundi 27 février 2530<br />de 18h00 à 18h30...,Fnac Montparnasse,136 rue de rennes,75006,Paris,gratuit,non,2025-05-20T19:14:13+02:00,Public jeunes et adultes.,1,Littérature,,,48.8459520129701,2.3257039591324


In [33]:
events = events[events['date_de_debut'] != '2530-02-27T19:00:00+01:00']

In [34]:
events.dtypes

event_id                   int64
url                       object
titre                     object
chapeau                   object
description               object
date_de_debut             object
date_de_fin               object
occurrences               object
description_de_la_date    object
nom_du_lieu               object
adresse_du_lieu           object
code_postal               object
ville                     object
type_de_prix              object
type_d_acces              object
date_de_mise_a_jour       object
audience                  object
event_indoor               int64
theme1                    object
theme2                    object
theme3                    object
latitude                  object
longitude                 object
dtype: object

In [35]:
# events = events.copy()
# events['date_de_debut'] = pd.to_datetime(events['date_de_debut'], errors='coerce', utc=True)
# events['date_de_fin'] = pd.to_datetime(events['date_de_fin'], errors='coerce', utc=True)


In [36]:
pd.reset_option('display.max_colwidth', None) 

In [37]:
events[['date_de_debut', 'date_de_fin', 'occurrences', 'description_de_la_date']]

Unnamed: 0,date_de_debut,date_de_fin,occurrences,description_de_la_date
2,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />
3,2024-10-12T00:00:00+02:00,2025-07-12T01:15:00+02:00,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,Le vendredi 11 juillet 2025<br />de 21h00 à 22...
4,2024-06-01T02:00:00+02:00,2030-06-02T01:59:59+02:00,,Du samedi 01 juin 2024 au samedi 01 juin 2030 ...
5,2025-09-27T23:00:00+02:00,2025-09-28T02:00:00+02:00,2025-09-27T21:00:00+02:00_2025-09-28T00:00:00+...,Le samedi 27 septembre 2025<br />de 20h00 à 23...
6,2024-09-21T17:30:00+02:00,2025-06-28T19:00:00+02:00,2025-06-28T15:30:00+02:00_2025-06-28T17:00:00+...,Le samedi 28 juin 2025<br />de 14h30 à 16h00<b...
...,...,...,...,...
2724,2025-09-02T02:00:00+02:00,2025-09-28T01:59:59+02:00,,Du mardi 02 septembre 2025 au samedi 27 septem...
2725,2025-06-21T02:00:00+02:00,2025-09-15T01:59:59+02:00,,Du samedi 21 juin 2025 au dimanche 14 septembr...
2726,2025-07-05T20:00:00+02:00,2025-07-20T22:00:00+02:00,2025-07-05T18:00:00+02:00_2025-07-05T20:00:00+...,Le dimanche 20 juillet 2025<br />de 17h00 à 19...
2727,2025-08-27T18:00:00+02:00,2025-08-27T20:00:00+02:00,2025-08-27T16:00:00+02:00_2025-08-27T18:00:00+...,Le mercredi 27 août 2025<br />de 15h00 à 17h00...


In [38]:
events['occurrences'].fillna('').str.split(';').apply(len).sort_values(ascending=False)

2331    2659
680     2191
1473    1212
1888     788
2334     633
        ... 
19         1
2708       1
2709       1
2710       1
2686       1
Name: occurrences, Length: 2631, dtype: int64

In [39]:
lengths = events['occurrences'].fillna('').str.split(';').apply(len)
count_longer_than_10 = (lengths > 150).sum()
print(count_longer_than_10)

39


In [40]:
lengths = events['occurrences'].fillna('').str.split(';').apply(len)
events = events[lengths <= 150].copy()

In [41]:
events

Unnamed: 0,event_id,url,titre,chapeau,description,date_de_debut,date_de_fin,occurrences,description_de_la_date,nom_du_lieu,adresse_du_lieu,code_postal,ville,type_de_prix,type_d_acces,date_de_mise_a_jour,audience,event_indoor,theme1,theme2,theme3,latitude,longitude
2,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,Le funambule montmartre,53 rue des saules,75001,Paris,payant,obligatoire,2024-03-05T18:01:24+01:00,Public jeunes et adultes.,1,Théâtre,,,48.890747,2.340517
3,51498,https://www.paris.fr/evenements/signatures-ave...,Signatures avec Dominique et Alexandra Duvivier,Encore un nouveau spectacle du duo mythique de...,<p>Peut-être tout simplement la magie de vous ...,2024-10-12T00:00:00+02:00,2025-07-12T01:15:00+02:00,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,Le vendredi 11 juillet 2025<br />de 21h00 à 22...,Théâtre Le Double Fond,1 place du Marché Sainte Catherine,75004,Paris,payant,obligatoire,2024-08-12T14:15:23+02:00,Public jeunes et adultes. A partir de 12 ans.,1,Théâtre,,,48.8553759962578,2.36257704084858
4,51918,https://www.paris.fr/evenements/le-milieu-des-...,"« Le Milieu des choses », une œuvre de Javier ...","En juin 2024, Black Swan Real Estate Capital, ...","<p><strong>Avec cette réalisation, l’approche ...",2024-06-01T02:00:00+02:00,2030-06-02T01:59:59+02:00,,Du samedi 01 juin 2024 au samedi 01 juin 2030 ...,Bureaux Panache,47 rue de Charenton,75012,Paris,gratuit,non,2024-08-26T12:50:56+02:00,Tout public.,1,Art contemporain,,,48.8513619866461,2.37239803298021
5,53204,https://www.paris.fr/evenements/avatar-live-in...,Avatar - Live in concert,"La beauté du film Avatar sur grand écran, acco...",<p><strong>Le phénomène mondial en Ciné-Concer...,2025-09-27T23:00:00+02:00,2025-09-28T02:00:00+02:00,2025-09-27T21:00:00+02:00_2025-09-28T00:00:00+...,Le samedi 27 septembre 2025<br />de 20h00 à 23...,Le Zénith de Paris,211 avenue Jean Jaurès,75019,Paris,payant,obligatoire,2024-09-18T12:13:48+02:00,"Public enfants, jeunes et adultes.",1,Ecrans,Festival,,48.8922462,2.3878126
6,32382,https://www.paris.fr/evenements/club-lecture-l...,Club lecture : Love my romance,Vous aimez la romance ? Ce club est fait pour ...,<p><strong>Un samedi par mois </strong><strong...,2024-09-21T17:30:00+02:00,2025-06-28T19:00:00+02:00,2025-06-28T15:30:00+02:00_2025-06-28T17:00:00+...,Le samedi 28 juin 2025<br />de 14h30 à 16h00<b...,Bibliothèque Assia Djebar,1 rue Reynaldo Hahn,75020,Paris,gratuit,non,2024-09-24T18:29:50+02:00,Public jeunes et adultes. A partir de 13 ans.,1,Littérature,,,48.8492559915638,2.41215901561648
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2724,67975,https://www.paris.fr/evenements/le-systeme-sol...,Le système solaire : exposition,A l'occasion d'Automne de la science 2025 cons...,"<p><strong>Cette exposition, réalisée par le C...",2025-09-02T02:00:00+02:00,2025-09-28T01:59:59+02:00,,Du mardi 02 septembre 2025 au samedi 27 septem...,Bibliothèque Valeyre,24 rue Marguerite de Rochechouart,75009,Paris,gratuit,non,2025-06-25T13:48:50+02:00,Public jeunes et adultes.,1,Sciences,,,48.877975,2.34501
2725,66970,https://www.paris.fr/evenements/paris-en-seine...,Où voir la vasque : toutes les infos pratiques,Vue par des milliers de spectateurs pendant le...,"<p>Du 21 juin, Fête de la Musique, au 14 septe...",2025-06-21T02:00:00+02:00,2025-09-15T01:59:59+02:00,,Du samedi 21 juin 2025 au dimanche 14 septembr...,Jardin des Tuileries,"113, rue de Rivoli",75001,Paris,gratuit,non,2025-06-25T14:02:01+02:00,Tout public.,1,Loisirs,,,48.8638350129425,2.33144103657986
2726,66528,https://www.paris.fr/evenements/initiations-po...,Initiations pour adultes aux danses urbaines a...,"Pour célébrer l'événement Paris en Seine, le C...","<p>L’été dernier, le 8<sup>e</sup> arrondissem...",2025-07-05T20:00:00+02:00,2025-07-20T22:00:00+02:00,2025-07-05T18:00:00+02:00_2025-07-05T20:00:00+...,Le dimanche 20 juillet 2025<br />de 17h00 à 19...,Parc Monceau,"35, boulevard de Courcelles",75008,Paris,gratuit,non,2025-06-25T15:08:04+02:00,Public adultes.,1,Danse,Loisirs,,48.8805170119184,2.31123897354641
2727,68227,https://www.paris.fr/evenements/atelier-de-pre...,Atelier de préservation de l'environnement de ...,Dans le cadre de la 21e édition de l’Été Solid...,"<p>Du 19 juin au 31 août 2025, <strong>l’Été S...",2025-08-27T18:00:00+02:00,2025-08-27T20:00:00+02:00,2025-08-27T16:00:00+02:00_2025-08-27T18:00:00+...,Le mercredi 27 août 2025<br />de 15h00 à 17h00...,MVAC7,"4, rue Amélie",75007,Paris,gratuit,obligatoire,2025-06-25T17:02:02+02:00,Public enfants. A partir de 8 ans. Jusqu'à 10 ...,1,Atelier,Enfants,Nature,48.8594219828301,2.30733996364629


In [42]:
new_cols = events['occurrences'].str.split(';', expand=True)

In [43]:
new_cols

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149
2,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
3,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,2025-07-04T22:00:00+02:00_2025-07-04T23:15:00+...,2025-07-11T22:00:00+02:00_2025-07-11T23:15:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
4,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
5,2025-09-27T21:00:00+02:00_2025-09-28T00:00:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
6,2025-06-28T15:30:00+02:00_2025-06-28T17:00:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2724,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2725,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2726,2025-07-05T18:00:00+02:00_2025-07-05T20:00:00+...,2025-07-06T18:00:00+02:00_2025-07-06T20:00:00+...,2025-07-13T18:00:00+02:00_2025-07-13T20:00:00+...,2025-07-14T18:00:00+02:00_2025-07-14T20:00:00+...,2025-07-18T18:00:00+02:00_2025-07-18T20:00:00+...,2025-07-20T18:00:00+02:00_2025-07-20T20:00:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2727,2025-08-27T16:00:00+02:00_2025-08-27T18:00:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,


In [44]:
pd.reset_option('display.max_colwidth', None) 

In [48]:
# Split into new columns
new_cols = events['occurrences'].str.split(';', expand=True)

# Generate column names: date1, date2, ..., date150
col_names = [f'date{i+1}' for i in range(new_cols.shape[1])]

# Assign back to events with these names
events = events.copy()
events[col_names] = new_cols


In [46]:
events.head(3)

Unnamed: 0,event_id,url,titre,chapeau,description,date_de_debut,date_de_fin,occurrences,description_de_la_date,nom_du_lieu,adresse_du_lieu,code_postal,ville,type_de_prix,type_d_acces,date_de_mise_a_jour,audience,event_indoor,theme1,theme2,theme3,latitude,longitude,date1,date2,date3,date4,date5,date6,date7,date8,date9,date10,date11,date12,date13,date14,date15,date16,date17,date18,date19,date20,date21,date22,date23,date24,date25,date26,date27,date28,date29,date30,date31,date32,date33,date34,date35,date36,date37,date38,date39,date40,date41,date42,date43,date44,date45,date46,date47,date48,date49,date50,date51,date52,date53,date54,date55,date56,date57,date58,date59,date60,date61,date62,date63,date64,date65,date66,date67,date68,date69,date70,date71,date72,date73,date74,date75,date76,date77,date78,date79,date80,date81,date82,date83,date84,date85,date86,date87,date88,date89,date90,date91,date92,date93,date94,date95,date96,date97,date98,date99,date100,date101,date102,date103,date104,date105,date106,date107,date108,date109,date110,date111,date112,date113,date114,date115,date116,date117,date118,date119,date120,date121,date122,date123,date124,date125,date126,date127,date128,date129,date130,date131,date132,date133,date134,date135,date136,date137,date138,date139,date140,date141,date142,date143,date144,date145,date146,date147,date148,date149,date150
2,4283,https://www.paris.fr/evenements/la-folle-et-in...,"La folle et inconvenante histoire des femmes, ...","Une immersion drôle, détonante et décalée dans...",<p>Ce spectacle met en scène une jeune femme q...,2023-10-24T00:00:00+02:00,2026-08-07T01:15:00+02:00,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,Le jeudi 06 août 2026<br />de 21h00 à 22h15<br />,Le funambule montmartre,53 rue des saules,75001,Paris,payant,obligatoire,2024-03-05T18:01:24+01:00,Public jeunes et adultes.,1,Théâtre,,,48.890747,2.340517,2026-08-06T22:00:00+02:00_2026-08-06T23:15:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
3,51498,https://www.paris.fr/evenements/signatures-ave...,Signatures avec Dominique et Alexandra Duvivier,Encore un nouveau spectacle du duo mythique de...,<p>Peut-être tout simplement la magie de vous ...,2024-10-12T00:00:00+02:00,2025-07-12T01:15:00+02:00,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,Le vendredi 11 juillet 2025<br />de 21h00 à 22...,Théâtre Le Double Fond,1 place du Marché Sainte Catherine,75004,Paris,payant,obligatoire,2024-08-12T14:15:23+02:00,Public jeunes et adultes. A partir de 12 ans.,1,Théâtre,,,48.8553759962578,2.36257704084858,2025-06-27T22:00:00+02:00_2025-06-27T23:15:00+...,2025-07-04T22:00:00+02:00_2025-07-04T23:15:00+...,2025-07-11T22:00:00+02:00_2025-07-11T23:15:00+...,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
4,51918,https://www.paris.fr/evenements/le-milieu-des-...,"« Le Milieu des choses », une œuvre de Javier ...","En juin 2024, Black Swan Real Estate Capital, ...","<p><strong>Avec cette réalisation, l’approche ...",2024-06-01T02:00:00+02:00,2030-06-02T01:59:59+02:00,,Du samedi 01 juin 2024 au samedi 01 juin 2030 ...,Bureaux Panache,47 rue de Charenton,75012,Paris,gratuit,non,2024-08-26T12:50:56+02:00,Tout public.,1,Art contemporain,,,48.8513619866461,2.37239803298021,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,


In [47]:
# List of the 150 column names
date_cols = [f'date{i}' for i in range(1, 151)]

# Apply the split to each column
for col in date_cols:
    events[col] = events[col].str.split('_').str[0]