In [1]:
import streamlit as st
import pandas as pd

# ------------------------------------------------------
# 1. Chargement des données
# ------------------------------------------------------
@st.cache_data
def load_data(path: str = "rpps_long_clean.csv") -> pd.DataFrame:
    # adapte les dtypes si besoin
    df = pd.read_csv(
        path,
        dtype={
            "dept_code": "string",
            "dept_code_clean": "string",
        }
    )
    return df

df = load_data()  # <-- lit rpps_long_clean.csv dans le même dossier


# ------------------------------------------------------
# 2. Titre et description
# ------------------------------------------------------
st.title("Densité et effectifs des médecins par spécialité (RPPS)")

st.write(
    "Données issues du fichier **rpps_long_clean.csv** "
    "avec agrégation par **spécialité** et **département**."
)


# ------------------------------------------------------
# 3. Menu déroulant des spécialités
# ------------------------------------------------------
# on suppose que ta colonne s'appelle bien 'specialite'
specialites = sorted(df["specialite"].dropna().unique().tolist())

selected_specialite = st.selectbox(
    "Choisir une spécialité",
    options=specialites,
    index=0,
)

# Choix de l'indicateur
metric = st.radio(
    "Indicateur à afficher",
    options=["densite", "effectif"],
    format_func=lambda x: "Densité (pour 100 000 hab.)" if x == "densite" else "Effectif (nombre de médecins)",
    horizontal=True,
)


# ------------------------------------------------------
# 4. Filtrage des données
# ------------------------------------------------------
df_filtered = (
    df[df["specialite"] == selected_specialite]
    .copy()
)

# si jamais plusieurs lignes par dept (par ex. doublons),
# on agrège par département
df_grouped = (
    df_filtered
    .groupby("dept_code_clean", as_index=False)[metric]
    .sum()
    .sort_values("dept_code_clean")
)

if df_grouped.empty:
    st.warning("Aucune donnée trouvée pour cette spécialité.")
    st.stop()


# ------------------------------------------------------
# 5. Tableau
# ------------------------------------------------------
st.subheader(f"Tableau – {selected_specialite}")

st.dataframe(
    df_grouped,
    use_container_width=True,
)


# ------------------------------------------------------
# 6. Graphique
# ------------------------------------------------------
st.subheader(f"Graphique – {metric} par département")

st.bar_chart(
    df_grouped.set_index("dept_code_clean")[metric]
)


2025-11-20 10:39:09.021 
  command:

    streamlit run /home/vidux/.pyenv/versions/Artefact/lib/python3.11/site-packages/ipykernel_launcher.py [ARGUMENTS]
