In [1]:
import pandas as pd
import json
import numpy as np
from collections import Counter
import re

In [None]:
df = pd.read_csv("data/travaux-engages-metropole-lyon.csv", sep=";")
print(df.describe())
display(df)

In [None]:
# --- 1. G√âN√âRATION DU FICHIER POINTS ROUGES (Coordonn√©es + Description) ---

with open('data_coord/points-rouges-200046977.geojson', 'r') as f:
    geojson_data = json.load(f)

# Extraction des coordonn√©es (longitude, latitude) et des propri√©t√©s
points_rouges_data = []
for feature in geojson_data['features']:
    props = feature['properties']
    coords = feature['geometry']['coordinates']
    
    points_rouges_data.append({
        'longitude': coords[0],
        'latitude': coords[1],
        'commune_insee': props.get('commune'), 
        'description': props.get('description') 
    })

df_points_rouges_final = pd.DataFrame(points_rouges_data)

# Sauvegarde du premier fichier
df_points_rouges_final.to_csv('points_rouges_lyon_complet.csv', index=False)


# --- 2. G√âN√âRATION DU FICHIER R√âPONSES (Questionnaire + Lieu) ---

# Chargement du CSV original
df_reponses = pd.read_csv('data_coord/reponses-epci-200046977.csv', low_memory=False, quotechar='"')

# S√©lection des colonnes strat√©giques selon la notice [cite: 86, 88, 90]
cols_reponses = [
    'insee',        # Lieu (Code INSEE) [cite: 21, 29]
    'q6',           # Fr√©quence de pratique [cite: 86]
    'q14',          # Sentiment de s√©curit√© [cite: 86]
    'q18',          # Dangerosit√© carrefours [cite: 88]
    'q21',          # √âtat de l'entretien [cite: 88]
    'q28',          # Conflit stationnement motoris√© [cite: 88]
    'q34_texte',    # Les 3 priorit√©s d'am√©lioration [cite: 88]
    'q35',          # Commentaire libre (NLP) [cite: 88]
    'q38_texte',    # Situations de violence v√©cues [cite: 90]
    'score'         # Note globale de la commune [cite: 30]
]

# Filtrage et nettoyage
df_reponses_final = df_reponses[cols_reponses].copy()
df_reponses_final['q35'] = df_reponses_final['q35'].str.replace(r'\r+|\n+', ' ', regex=True).fillna('')

# Sauvegarde du second fichier
df_reponses_final.to_csv('reponses_questionnaire_lyon.csv', index=False)

print("Les deux fichiers ont √©t√© g√©n√©r√©s avec succ√®s :")
print("- points_rouges_lyon_complet.csv (Donn√©es cartographiques)")
print("- reponses_questionnaire_lyon.csv (Donn√©es th√©matiques et profils)")

In [None]:
# --- 1. CONFIGURATION R√âF√âRENTIELLE ---
# On centralise ici la connaissance m√©tier : Urgence et Facilit√© par type de probl√®me
CONFIG_PROBLEMES = {
    'Infrastructure manquante': {'mots': r'piste|manque|absence|discontinuit√©|coupure', 'urgence': 3, 'facilite': 3},
    'Carrefours dangereux': {'mots': r'carrefour|intersection|rond-point|travers√©e', 'urgence': 3, 'facilite': 3},
    'Vitesse excessive': {'mots': r'vitesse|rapide|trop vite|ralentir', 'urgence': 3, 'facilite': 2},
    'Violence routi√®re': {'mots': r'violence|insulte|intimidation|agression', 'urgence': 3, 'facilite': 2},
    'Entretien pistes': {'mots': r'entretien|entretenir|nid de poule|trou|verre', 'urgence': 2, 'facilite': 1},
    'Stationnement g√™nant': {'mots': r'stationnement|gar√©|voiture|parking|double file', 'urgence': 2, 'facilite': 2},
    'Stationnement v√©lo': {'mots': r'stationnement v√©lo|parking v√©lo|garage v√©lo', 'urgence': 2, 'facilite': 1},
    'Limitation trafic': {'mots': r'limiter trafic|r√©duire trafic|moins de voiture', 'urgence': 2, 'facilite': 3},
    'Signalisation': {'mots': r'panneau|feu|signalisation|marquage', 'urgence': 1, 'facilite': 1},
    'Conflit pi√©tons': {'mots': r'pi√©ton|trottoir|partag√©|quai', 'urgence': 1, 'facilite': 2},
}

def get_label_facilite(score):
    if score <= 1.5: return "üü¢ Facile"
    if score <= 2.5: return "üü° Moyen"
    return "üî¥ Difficile"

# --- 2. FONCTIONS D'ANALYSE ---
def detecter_themes(texte):
    if pd.isna(texte) or texte == "": return []
    return [nom for nom, cfg in CONFIG_PROBLEMES.items() if re.search(cfg['mots'], str(texte).lower())]

# --- 3. CHARGEMENT ET TRAITEMENT ---
print(" Chargement des donn√©es...")
df = pd.read_csv('reponses_questionnaire_lyon.csv', low_memory=False)

# Fusion des textes et d√©tection
df['verbatim'] = df[['q34_texte', 'q35', 'q38_texte']].fillna('').agg(' '.join, axis=1)
df['problemes_list'] = df['verbatim'].apply(detecter_themes)

# --- 4. ANALYSE PAR TYPE DE PROBL√àME (FACILIT√â G√âN√âRALE) ---
print("\n ANALYSE DE LA FACILIT√â PAR TYPE DE PROBL√àME")
all_p = [p for sub in df['problemes_list'] for p in sub]
counts_global = Counter(all_p)

analyse_p = []
for nom, cfg in CONFIG_PROBLEMES.items():
    analyse_p.append({
        'Probl√®me': nom,
        'Citations': counts_global[nom],
        'Urgence': cfg['urgence'],
        'Facilit√©': cfg['facilite'],
        'Type': get_label_facilite(cfg['facilite'])
    })

df_facilite_theme = pd.DataFrame(analyse_p).sort_values(by='Facilit√©')
print(df_facilite_theme.to_string(index=False))

# --- 5. ANALYSE PAR COMMUNE (TOP 10 + FACILIT√â MOYENNE) ---
print("\n ANALYSE PAR COMMUNE (TOP 10 ET FAISABILIT√â)")

resultats_communes = []
for insee, group in df.groupby('insee'):
    # Extraction de tous les probl√®mes de la commune
    commune_probs = [p for sub in group['problemes_list'] for p in sub]
    top_10_list = Counter(commune_probs).most_common(10)
    
    if top_10_list:
        # Calcul de la facilit√© moyenne des probl√®mes cit√©s dans cette commune
        moy_facilite = np.mean([CONFIG_PROBLEMES[p]['facilite'] for p, _ in top_10_list])
        top_10_str = " | ".join([f"{p} ({c})" for p, c in top_10_list])
        
        resultats_communes.append({
            'INSEE': insee,
            'R√©ponses': len(group),
            'S√©curit√©_Moy': round(group['q14'].mean(), 2),
            'Facilit√©_Action': get_label_facilite(moy_facilite),
            'Top_10_Problemes': top_10_str
        })

df_communes = pd.DataFrame(resultats_communes).sort_values(by='R√©ponses', ascending=False)

# --- 6. AFFICHAGE FINAL ---
pd.set_option('display.max_colwidth', 100)
print("\n" + "="*120)
print(df_communes.head(15).to_string(index=False))
print("="*120)