Les références dans votre fichier CSV, comme "MonitoringRef_ArR", "LineRef", et les codes associés, font partie de la nomenclature utilisée pour identifier de manière unique des arrêts de transport et des lignes dans un réseau de transport, très probablement celui de l'Île-de-France Mobilités (IDFM), anciennement connu sous le nom de Syndicat des transports d'Île-de-France (STIF). Voici une explication détaillée de chacun des types de références :

MonitoringRef_ArR : Ce code semble être un identifiant unique pour un point d'arrêt spécifique dans le réseau de transport. Il est probablement utilisé pour le suivi et la gestion des arrêts dans les systèmes informatiques de gestion des transports. Par exemple, "STIF:StopPoint:Q:39806:" identifierait un arrêt spécifique.

LineRef : Ce code réfère à une ligne de transport spécifique. Ce pourrait être une ligne de bus, de tram, de train, ou de métro. L'identifiant contient des informations qui permettent aux systèmes de gestion du transport de reconnaître et de gérer les différentes lignes. Par exemple, "STIF:Line::C02244:" fait référence à une ligne spécifique dans le réseau.

Name_Line : Il s'agit du nom ou du numéro associé à la ligne de transport. Ce nom peut être utilisé pour des affichages publics, des horaires, et des guides de transport. Il peut également inclure des indications sur des changements futurs ou des projets de ligne, comme "O1 (Future 429)".

Ces identifiants sont essentiels pour la coordination des horaires, la gestion des itinéraires, et les systèmes d'information en temps réel destinés aux passagers. Ils permettent également une intégration fluide avec d'autres systèmes informatiques, comme ceux utilisés pour l'information voyageur ou la surveillance de la circulation des véhicules en temps réel.








In [3]:
import pandas as pd

def load_and_filter_data(filepath, start_date, end_date):
    # Charger le fichier CSV
    data = pd.read_csv(filepath, delimiter=';', quotechar='"', encoding='utf-8')
    
    # Convertir les colonnes de dates en datetime
    data['createdDate'] = pd.to_datetime(data['createdDate'])
    data['updatedDate'] = pd.to_datetime(data['updatedDate'])
    
    # Filtrer les données entre deux dates
    filtered_data = data[(data['createdDate'] >= start_date) & (data['createdDate'] <= end_date)]
    
    return filtered_data

def display_information(data):
    # Afficher les informations pertinentes
    for index, row in data.iterrows():
        print(f"Titre: {row['title']}")
        print(f"Description: {row['description']}")
        print(f"Date de création: {row['createdDate']}")
        print(f"Date de mise à jour: {row['updatedDate']}")
        print(f"Lien: {row['link']}")
        print(f"Type de lien: {row['linkType']}")
        print(f"Texte brut de la page: {row['textpage_brute'][:100]}...")  # Affiche les 100 premiers caractères du texte brut
        print("-----\n")

# Chemin du fichier CSV
file_path = 'actualites.csv'

# Dates de début et de fin pour le filtre
start_date = '2024-04-01'
end_date = '2024-04-30'

# Charger les données filtrées
filtered_data = load_and_filter_data(file_path, start_date, end_date)

# Afficher les informations extraites
display_information(filtered_data)


Titre: 🚧 Travaux durant les vacances scolaires
Description: Pour cause de travaux, certaines lignes et stations sont fermées ces vacances scolaires du 06 au 21/04. 
Avant de vous déplacer, pensez à bien vérifier l'état du trafic sur votre ligne.
Date de création: 2024-04-05 12:00:01+00:00
Date de mise à jour: 2024-04-15 07:15:06+00:00
Lien: https://me-deplacer.iledefrance-mobilites.fr/banner/pour-cause-de-travaux-certaines-lignes-et-certaines11121
Type de lien: 2
Texte brut de la page: Lignes de métro   La Défense / Château de Vincennes   Le 21/04 jusqu'à 12h : Trafic interrompu sur l...
-----



In [5]:
import pandas as pd

def extract_location(description):
    # Cette fonction est un exemple et doit être adaptée selon le format des descriptions
    # Recherchez des motifs spécifiques ou des mots clés pour extraire les lieux
    words = description.split()
    locations = [word for word in words if "place" in word or "city" in word]  # Exemple simpliste
    return ", ".join(locations)

# Charger le fichier CSV
data = pd.read_csv('actualites.csv', delimiter=';', quotechar='"', encoding='utf-8')

# Convertir les colonnes de dates en datetime
data['createdDate'] = pd.to_datetime(data['createdDate']).dt.date

# Créer une nouvelle colonne pour les lieux extraits
data['Location'] = data['description'].apply(extract_location)

# Sélectionner les colonnes d'intérêt
result_table = data[['createdDate', 'title', 'description', 'Location']]

# Afficher le tableau
print(result_table.head())


  createdDate                                    title  \
0  2024-04-05  🚧 Travaux durant les vacances scolaires   

                                         description   Location  
0  Pour cause de travaux, certaines lignes et sta...  déplacer,  
