# Défi open data : Offre culturelle

En 2019, 21 600 équipements culturels maillaient le territoire français : bibliothèques, théâtres, cinémas, musées, monuments, conservatoires, etc. Cette riche offre culturelle résulte d’un héritage historique et d’une politique volontariste menée par l’Etat et les collectivités territoriales. Malheureusement, **elle n’est encore pas connue de toutes et tous**.

En parallèle, et à l’instar des plateformes [Culture chez nous](https://www.culturecheznous.gouv.fr/) et [Histoire des arts](https://histoiredesarts.culture.gouv.fr/), se développent en ligne **de nouveaux moyens d’accès aux œuvres et aux contenus culturels**. Ces ressources se présentent comme une première solution pour atteindre davantage de publics.

**La problématique du défi**

Ce projet portera sur deux enjeux :
* **Comment valoriser l’offre culturelle (physique et numérique) et ainsi favoriser l’accès à la culture pour le plus grand nombre ?**
* **Comment les pouvoirs publics peuvent-ils assurer une répartition équilibrée de l'offre culturelle sur un territoire ?**

Pour ce défi, il faudra faire attention à la définition de l’offre culturelle. Par exemple, le fait qu’une ville possède plusieurs monuments classés n’est pas forcément lié à son dynamisme culturel.

Beaucoup de données ouvertes sont mises à disposition pour vous permettre de répondre à ce sujet. Plusieurs jeux de données ont déjà été chargés dans cet environnement ([cf. liste](https://defis.data.gouv.fr/defis/65b10aa72d0c187ecf296930/)) et vous pouvez bien évidemment en ajouter d’autres selon vos besoins.

Une fois vos travaux terminés, partagez-les avec l’ensemble de la communauté [en publiant une réutilisation sur data.gouv.fr](https://guides.data.gouv.fr/guide-data.gouv.fr/reutilisations) !

# Importer des données
Nous mettons à disposition une fonction utilitaire qui permet de charger la majorité des ressources de data.gouv.fr à partir de leur identifiant sur le site (exemple : `"2876a346-d50c-4911-934e-19ee07b0e503"`). Vous pouvez l'utiliser comme suit :

In [1]:
from utils import load_table_from_resource_id

df = load_table_from_resource_id('47ac11c2-8a00-46a7-9fa8-9b802643f975')
df

Unnamed: 0,nom_du_festival,envergure_territoriale,region_principale_de_deroulement,departement_principal_de_deroulement,commune_principale_de_deroulement,code_postal_de_la_commune_principale_de_deroulement,code_insee_commune,code_insee_epci_collage_en_valeur,libelle_epci_collage_en_valeur,numero_de_voie,...,sous_categorie_musique,sous_categorie_musique_cnm,sous_categorie_cinema_et_audiovisuel,sous_categorie_arts_visuels_et_arts_numeriques,sous_categorie_livre_et_litterature,periode_principale_de_deroulement_du_festival,identifiant_agence_a,identifiant,geocodage_xy,identifiant_cnm
0,Festival andalou,Régionale,Provence-Alpes-Côte d'Azur,Vaucluse,Avignon,84000,84007,248400251,CA du Grand Avignon (COGA),,...,Musiques du monde,09- Pluridisciplinaire,,,,Avant-saison (1er janvier - 20 juin),,FEST_84007_514,"43.9352448339, 4.84071572505",1558.0
1,Festival Rêves d'enfants,,Provence-Alpes-Côte d'Azur,Hautes-Alpes,Briançon,5105,5023,240500439,CC du Briançonnais,,...,,,,,Fiction,Avant-saison (1er janvier - 20 juin),,FEST_05023_1069,"44.8994986041, 6.64947524018",
2,Printemps de Paroles,,Île-de-France,Seine-et-Marne,Bussy-Saint-Martin,77600,77059,247700594,Marne et Gondoire,,...,,,,,,Avant-saison (1er janvier - 20 juin),,FEST_77059_1118,"48.8462454012, 2.67900406868",
3,Pharaonic,,Auvergne-Rhône-Alpes,Savoie,Chambéry,73000,73065,200069110,CA du Grand Chambéry,,...,Musiques amplifiées ou électroniques,02- Musiques amplifiées ou électroniques,,,,Avant-saison (1er janvier - 20 juin),,FEST_73065_1434,"45.583182552, 5.90903392417",2282.0
4,Sarcus Festival,,Centre-Val de Loire,Indre-et-Loire,Chemillé-sur-Indrois,37460,37069,200071587,CC Loches Sud Touraine,,...,"Musiques électroniques, techno",02- Musiques amplifiées ou électroniques,,,,Après-saison (6 septembre - 31 décembre),,FEST_37069_1605,"47.1535504221, 1.15871292042",5668.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7278,Les Z'arpetes,,Nouvelle-Aquitaine,Gironde,Villenave-d'Ornon,33140,33550,243300316,Bordeaux Métropole,,...,,,,,,Avant-saison (1er janvier - 20 juin),LA186,FEST_33550_7100,"44.773185218, -0.558212256384",
7279,Jazz à Ville sur Auzon,,Provence-Alpes-Côte d'Azur,Vaucluse,Villes-sur-Auzon,84570,84148,200035723,CC Ventoux Sud,,...,Jazz,,,,,Saison (21 juin - 5 septembre),,FEST_84148_7131,"44.0660605145, 5.25707803023",
7280,Parlez-moi d'humour,,Bretagne,Ille-et-Vilaine,Vitré,35500,35360,200039022,CA Vitré Communauté,,...,,,,,,Saison (21 juin - 5 septembre),,FEST_35360_7168,"48.1140815063, -1.19370720718",
7281,Festival des cultures du monde,,Auvergne-Rhône-Alpes,Isère,Voiron,38500,38563,243800984,CA du Pays Voironnais,45,...,,,,,,Saison (21 juin - 5 septembre),,FEST_38563_7192,"45.3791720843, 5.58240310671",


## Exemple de réalisation : calculer le nombre de bibliothèques par habitant pour chaque département

In [1]:
import pandas as pd

In [2]:
# on charge les données sur les bibliothèques du Ministère de la Culture
bibliotheques = load_table_from_resource_id(
    '806a8aa1-952f-404d-9857-3f27b7c0ca86',
    dtype=str,
)
bibliotheques

Unnamed: 0,cp,code_bib,surface,amplitude_horaire,nom_de_l_etablissement,libelle_2,complement,adresse,code_region,region,...,cedex,code_insee_commune,population_commune,longitude,latitude,statut,type_adresse,nombre_de_salaries,nombre_de_benevoles,geolocalisation
0,01300,6.0,731.0,17.0,Médiathèque Municipale de Belley,,,rue des Cordeliers,84.0,Auvergne-Rhône-Alpes,...,,01034,9582,5.687846,45.75903,Bibliothèque municipale,Bâtiment ouvert,7.0,0.0,"45.75903, 5.687846"
1,01120,7.0,,,"Médiathèque C,D,Lire",,,358 RUE JOSEPH GUINET,84.0,Auvergne-Rhône-Alpes,...,,01049,3356,5.03549,45.841465,Bibliothèque municipale,Bâtiment ouvert,,,"45.841465, 5.03549"
2,01270,14.0,150.0,6.0,Bibliothèque Municipale de Coligny,,,Chemin des Ecoliers,84.0,Auvergne-Rhône-Alpes,...,,01108,1200,5.306798,46.351707,Bibliothèque municipale,Bâtiment ouvert,1.0,11.0,"46.351707, 5.306798"
3,01200,19.0,93.0,8.0,Bibliotheque Municipale,,,6A Rue des écoles,84.0,Auvergne-Rhône-Alpes,...,,01189,1141,5.800822,46.048465,Bibliothèque municipale,Bâtiment ouvert,1.0,3.0,"46.048465, 5.800822"
4,01290,20.0,111.0,5.0,Bibliotheque Municipale,,,87 RUE DES ECOLES,84.0,Auvergne-Rhône-Alpes,...,,01203,1355,4.88932,46.248512,Bibliothèque municipale,Bâtiment ouvert,1.0,13.0,"46.248512, 4.88932"
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
15877,79000,,,,79 - MEDIATHEQUE DEPARTEMENTALE DES DEUX-SEVRES,,,298 ROUTE de COULONGES,75.0,Nouvelle-Aquitaine,...,,79191,61027,,,Bibliothèque départementale,Bibliothèque départementale,,,
15878,84700,,,,84 - SERVICE LIVRE ET LECTURE DE VAUCLUSE,,,410 Chemin de Brantes,93.0,Provence-Alpes-Côte d'Azur,...,,84129,19127,,,Bibliothèque départementale,Bibliothèque départementale,,,
15879,85000,,,,85 - BIBLIOTHEQUE DEPARTEMENTALE,DE LA VENDEE,,9 IMPASSE Ampère,52.0,Pays de la Loire,...,0,85191,58103,,,Bibliothèque départementale,Bibliothèque départementale,,,
15880,89000,,,,89 - BIBLIOTHEQUE DEPARTEMENTALE,DE L'YONNE,,10 RUE DU MOULIN,27.0,Bourgogne-Franche-Comté,...,,89346,3368,,,Bibliothèque départementale,Bibliothèque départementale,,,


In [17]:
# on calcule le nombre de bibliothèques par département
count_dep = bibliotheques['code_departement'].value_counts().reset_index()
count_dep.rename(
    {'index': 'code_departement', 'code_departement': 'nb_bibliotheques'},
    axis=1,
    inplace=True,
)
count_dep

Unnamed: 0,code_departement,nb_bibliotheques
0,59,417
1,38,345
2,35,309
3,62,291
4,33,285
...,...,...
98,973,15
99,976,14
100,978,1
101,977,1


In [47]:
# on va chercher le nmbre d'habitants par département selon INSEE
# le fichier excel n'est pas très agréable à manipuler, en règle générale on préfère le csv
insee_pop = pd.read_excel(
    'https://www.insee.fr/fr/statistiques/fichier/2012692/TCRD_021.xlsx',
    # le fichier "commence" à la 3e ligne, 2e colonne
    header=3,
    index_col=1,
)
insee_pop.rename(
    {'Unnamed: 0': 'code_departement', 'Ensemble': 'population_2024'},
    axis=1,
    inplace=True,
)
insee_pop = insee_pop[['code_departement', 'population_2024']].reset_index().dropna(subset='population_2024')
insee_pop

Unnamed: 0,index,code_departement,population_2024
0,Ain,01,679498.0
1,Aisne,02,521632.0
2,Allier,03,332708.0
3,Alpes-de-Haute-Provence,04,168161.0
4,Hautes-Alpes,05,141661.0
...,...,...,...
99,Martinique,972,349925.0
100,Guyane,973,295385.0
101,La Réunion,974,885700.0
102,Mayotte,976,320901.0


In [56]:
# on recoupe les deux sources de données et on calcule l'indicateur
stats = pd.merge(
    count_dep,
    insee_pop,
    on='code_departement',
    how='left',
)
stats['nb_bibliotheque_pour_1000_hab'] = stats['nb_bibliotheques'] / stats['population_2024'] * 1000
stats = (
    stats.sort_values('nb_bibliotheque_pour_1000_hab', ascending=False)
    .dropna(subset='nb_bibliotheque_pour_1000_hab')
    .reset_index(drop=True)
)
stats

Unnamed: 0,code_departement,nb_bibliotheques,index,population_2024,nb_bibliotheque_pour_1000_hab
0,15,145,Cantal,143567.0,1.009981
1,48,70,Lozère,76647.0,0.913278
2,23,102,Creuse,113922.0,0.895349
3,46,149,Lot,175800.0,0.847554
4,43,189,Haute-Loire,226900.0,0.832966
...,...,...,...,...,...
94,973,15,Guyane,295385.0,0.050781
95,93,79,Seine-Saint-Denis,1701072.0,0.046441
96,976,14,Mayotte,320901.0,0.043627
97,92,72,Hauts-de-Seine,1651407.0,0.043599


In [58]:
# top 5
for idx, row in stats.iterrows():
    if idx > 5:
        break
    print(
        f"Le département {row['index']} ({row['code_departement']}) "
        f"a {round(row['nb_bibliotheque_pour_1000_hab'], 3)} bibliothèque pour 1000 habitants"
    )

Le département Cantal (15) a 1.01 bibliothèque pour 1000 habitants
Le département Lozère (48) a 0.913 bibliothèque pour 1000 habitants
Le département Creuse (23) a 0.895 bibliothèque pour 1000 habitants
Le département Lot (46) a 0.848 bibliothèque pour 1000 habitants
Le département Haute-Loire (43) a 0.833 bibliothèque pour 1000 habitants
Le département Haute-Marne (52) a 0.826 bibliothèque pour 1000 habitants
