# Análisis de datos de las visitas a los Museos de Madrid

![cris](./img/cristina_garcia_rodero.png) 

# Análisis de datos de las visitas en los Museos de Madrid

### Proyecto focalizado en el análisis de datos sobre los visitantes en los museos de la Comunidad de Madrid. 
*Revelación de patrones clave influenciados por factores estacionales, demográficos, económicos, interés cultural, oferta temática...*

# ⭐ Hipótesis principal del proyecto:

Existen variaciones de interés culturales muy marcados según el género o la edad en las visitas a los principales museos de Madrid.

***

***

***




## ⭐⭐⭐ Hipótesis secundarias:

***

***

***

## 📅 Patrones estacionales 
Existen picos de visitas en **vacaciones** y **días festivos**, y se pueden identificar tendencias según el **día de la semana** o **eventos especiales**.

***

## 👥 Preferencias demográficas  
Los **jóvenes** prefieren museos de **arte contemporáneo**, mientras que las **personas mayores** optan por museos de **arte clásico o histórico**.

***

## 🏛️ Conservación y popularidad  
Las obras **mejor conservadas** atraen a más visitantes, y las **restauraciones** aumentan el interés de los visitantes.

***

## 🖼️ Afluencia y exposiciones temporales  
Las **exposiciones temporales** generan más visitas que las **colecciones permanentes**.

***

## 📊 Predicción del flujo de visitantes  
La afluencia puede predecirse mediante factores como el **clima** y **eventos locales**.

***

## 🔍 Recomendaciones personalizadas  
Algoritmos de **recomendación basados en intereses previos** pueden mejorar la **satisfacción** y aumentar las **visitas repetidas**.

***

## 🎨 Impacto de las restauraciones  
Las obras **recién restauradas** atraen más visitantes que las que no han sido **renovadas recientemente**.

***

## ✈️ Segmentación por origen y edad  
Los **turistas internacionales** prefieren museos **históricos**, mientras que los **locales** tienden a interesarse por museos **más contemporáneos**.


## OBTENCIÓN DE LOS DATOS

### DATASETS Y FUENTES ALTERNATIVAS DE DATOS

In [2]:
import pandas as pd

In [None]:
fuente_datos_museos_1 = "https://datos.gob.es/es/catalogo/l01280796-museos-de-la-ciudad-de-madrid"
datos_museos_1 = pd.read_csv('./datos/otros_datos/https-datos-madrid-es-egob-catalogo-201132-0-museos-3.csv' , sep=";", encoding='latin')
datos_museos_1.head()

In [None]:
fuente_datos_museos_2 = "https://datos.gob.es/es/catalogo/l01280796-estudio-de-satisfaccion-de-las-personas-usuarias-de-los-museos-y-exposiciones-municipales"
datos_museos_2 = pd.read_csv("./datos/otros_datos/estudioSatisfaccion2023.csv", sep=";", encoding='utf-8')
datos_museos_2.head() 

In [None]:
fuente_datos_museos_2 = "https://datos.gob.es/es/catalogo/l01280796-museos-de-la-ciudad-de-madrid"
datos_museos_3 = pd.read_csv("./datos/otros_datos/actividades_culturales.csv", sep=",", encoding='utf-8')
datos_museos_3.head()

In [None]:
fuente_datos_museos_4 = "https://datos.gob.es/es/catalogo/l01280796-estudio-de-satisfaccion-de-las-personas-usuarias-de-los-museos-y-exposiciones-municipales"
datos_museos_4 = pd.read_csv("./datos/otros_datos/MuseosdeMadrid_-1519955177370181428.csv", sep=",", encoding='utf-8')
datos_museos_4.head()

In [35]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2024 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2024.csv", sep=";", encoding='utf-8')
jobo_usuarios_2024.head()

Unnamed: 0,Fecha extracción,ID,Fecha de nacimiento,Ciudad,País,Código postal
0,02/07/2024 11:30,7,03/07/1997,,,
1,02/07/2024 11:30,12,03/07/1997,,,
2,02/07/2024 11:30,13,03/07/1997,,,
3,02/07/2024 11:30,18,03/07/1997,,,
4,02/07/2024 11:30,19,03/07/1997,,,


In [36]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2024 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2024.csv", sep=";", encoding='utf-8')
jobo_entradas_2024.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2024,Enero,Teatro Circo Price,CIRCO PRICE EN NAVIDAD,28
1,2024,Febrero,Teatro Circo Price,MAGIA DE CERCA,85
2,2024,Febrero,Teatro Circo Price,GALA INTERNACIONAL DE MAGIA EN ESCENA,516
3,2024,Marzo,Teatro Circo Price,"À deux roues, la vie!",13
4,2024,Abril,Teatro Circo Price,NUYE,95


In [37]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2023 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2023.csv", sep=";", encoding='utf-8')
jobo_usuarios_2023.head()

Unnamed: 0,Fecha extracción,Fecha de nacimiento,Ciudad,País,Código postal,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10
0,23/01/2024 14:20,21/11/1997,A CORUÑA,España,15009.0,,,,,,
1,23/01/2024 14:20,15/12/1997,A CORUÑA,España,15110.0,,,,,,
2,23/01/2024 14:20,30/01/1998,A CORUÑA,España,15007.0,,,,,,
3,23/01/2024 14:20,21/11/1998,A CORUÑA,España,15011.0,,,,,,
4,23/01/2024 14:20,12/12/1999,A CORUÑA,España,15660.0,,,,,,


In [38]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2023 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2023.csv", sep=";", encoding='utf-8')
jobo_entradas_2023.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2023,enero,Circo Price,CIRCO PRICE EN NAVIDAD,59
1,2023,febrero,Circo Price,GALA INTERNACIONAL DE MAGIA EN ESCENA,247
2,2023,febrero,Circo Price,MAGIA DE CERCA,43
3,2023,marzo,Circo Price,EL VENTRÍLOCUO,34
4,2023,marzo,Circo Price,GALA INTERNACIONAL DE MAGIA EN ESCENA,233


In [39]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2022 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2022.csv", sep=";", encoding='utf-8')
jobo_usuarios_2022.head()

Unnamed: 0,Fecha descarga,Fecha nacimiento,Ciudad,Código Postal
0,7-7-22 14:01,28/03/1996,A CORUÑA,15174.0
1,7-7-22 14:01,28/08/1995,A CORUÑA,15704.0
2,7-7-22 14:01,19/09/1996,A CORUÑA,15006.0
3,7-7-22 14:01,21/11/1997,A CORUÑA,15009.0
4,7-7-22 14:01,15/12/1997,A CORUÑA,15110.0


In [40]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2022 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2022.csv", sep=";", encoding='utf-8')
jobo_entradas_2022.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2022.0,abril,Cineteca,Adiós al lenguaje,17.0
1,2022.0,abril,Cineteca,Bajo el volcán,7.0
2,2022.0,abril,Cineteca,Bella durmiente,5.0
3,2022.0,abril,Cineteca,El almuerzo desnudo,24.0
4,2022.0,abril,Cineteca,El cantar de los cantares,15.0


In [41]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2021 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2021.csv", sep=";", encoding='utf-8')
jobo_usuarios_2021.head()

Unnamed: 0,Fecha descarga,Fecha de nacimiento,Ciudad,País,Código postal
0,02/07/2021,28/03/1996,A CORUÑA,España,15174
1,02/07/2021,21/11/1998,A CORUÑA,España,15011
2,02/07/2021,15/12/1997,A CORUÑA,España,15110
3,02/07/2021,12/12/1999,A CORUÑA,España,15660
4,02/07/2021,19/09/1996,A CORUÑA,España,15006


In [42]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2021 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2021.csv", sep=";", encoding='utf-8')
jobo_entradas_2021.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2021,enero,Conde Duque,Cine - El país de las maravillas - Le meraviglie,0
1,2021,enero,Conde Duque,Cine - Fukuoka,27
2,2021,enero,Conde Duque,Cine - Los jóvenes del barrio + Aquells joves,25
3,2021,enero,Conde Duque,Música - Amorante,19
4,2021,enero,Conde Duque,Música - Jansky,0


In [43]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2020 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2020.csv", sep=";", encoding='latin')
jobo_usuarios_2020.head()

Unnamed: 0,Fecha descarga,Tratamiento,Fecha de nacimiento,Ciudad,País,Código postal
0,07/01/2021 11:40,Señor,23/05/1994,A CAÑIZA,España,36880
1,07/01/2021 11:40,Señora,28/03/1996,A CORUÑA,España,15174
2,07/01/2021 11:40,Señor,21/11/1998,A CORUÑA,España,15011
3,07/01/2021 11:40,Señora,15/03/1994,A CORUÑA,España,15004
4,07/01/2021 11:40,Señor,15/12/1997,A CORUÑA,España,15110


In [44]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2020 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2020.csv", sep=";", encoding='latin')
jobo_entradas_2020.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2020,Enero,Cineteca,An elephant sitting still,54.0
1,2020,Enero,Cineteca,Another year,30.0
2,2020,Enero,Cineteca,Ask Dr. Ruth,58.0
3,2020,Enero,Cineteca,Blow-up (Deseo de una mañana de verano),60.0
4,2020,Enero,Cineteca,Caché (Escondido),60.0


In [45]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_usuarios_2019 = pd.read_csv("./datos/JOBO/JOBO_usuarios_2019.csv", sep=";", encoding='latin')
jobo_usuarios_2019.head()

Unnamed: 0,Fecha descarga,Tratamiento,Fecha de nacimiento,Ciudad,País,Código postal
0,3-1-20 16:40,Señor,23/05/1994,A CAÑIZA,España,36880
1,3-1-20 16:40,Señor,21/11/1998,A CORUÑA,España,15011
2,3-1-20 16:40,Señora,28/03/1996,A CORUÑA,España,15174
3,3-1-20 16:40,Señora,15/03/1994,A CORUÑA,España,15004
4,3-1-20 16:40,Señora,30/04/1996,A CORUÑA,España,15004


In [46]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2019 = pd.read_csv("./datos/JOBO/JOBO_entradas_emitidas_2019.csv", sep=";", encoding='latin')
jobo_entradas_2019.head()

Unnamed: 0,Año,Mes,Organismo,Evento,Entradas
0,2019,Enero,Cineteca,Bertsolari,55.0
1,2019,Enero,Cineteca,"Bowie, back to earth: The man who fell to earth",64.0
2,2019,Enero,Cineteca,"Bowie, back to earth: Twin Peaks. Fuego camina...",32.0
3,2019,Enero,Cineteca,I see red people,90.0
4,2019,Enero,Cineteca,Last days in Shibati,52.0


In [47]:
fuente_jobo = "https://datos.gob.es/es/catalogo/l01280796-jobo-joven-bono-cultural-entradas-emitidas-y-personas-usuarias"
jobo_entradas_2018 = pd.read_csv("./datos/JOBO/JOBO_entradas_2018.csv", sep=";", encoding='latin')
jobo_entradas_2018.head()

Unnamed: 0,Año Evento,Mes Evento,Organismo,Evento,Entradas
0,2018,Enero,Cineteca,Amazona,10.0
1,2018,Enero,Cineteca,CICLO DOCMA: El becerro pintado + Oírse,9.0
2,2018,Enero,Cineteca,CICLO LA CÁMARA COMO ESCRITURA. PRIMO LEJANO,5.0
3,2018,Enero,Cineteca,DOCSBARCELONA DEL MES. Machines,10.0
4,2018,Enero,Cineteca,El séptimo de Cineteca. Muziko,2.0


In [50]:
tarifas = pd.read_csv("./datos/VISITANTES_GENERAL/tarifas_museos_madrid.csv", sep=",", encoding='utf-8')
tarifas.head()

Unnamed: 0.1,Unnamed: 0,Museo,Entrada general,Día gratuito,Precio reducido,Descuento por edad,Notas adicionales
0,0,Museo del Prado,15€,"Lunes a Sábado 18:00-20:00, Domingos 17:00-19:00","7,50€ (estudiantes, mayores de 65)",Gratis menores de 18 y mayores de 65,Entrada gratuita para desempleados
1,1,Museo Reina Sofía,10€,"Lunes y Miércoles a Sábado 19:00-21:00, Doming...","8€ (estudiantes, mayores de 65)",Gratis menores de 18 y mayores de 65,Gratis para jubilados y desempleados
2,2,Museo Thyssen-Bornemisza,13€,Lunes 12:00-16:00 (colección permanente),"9€ (estudiantes, mayores de 65)",Gratis menores de 18 y mayores de 65,Entrada combinada con exposiciones temporales
3,3,Museo Arqueológico Nacional,3€,"Sábados desde 14:00, Domingos y festivos","1,50€ (estudiantes, mayores de 65)",Gratis menores de 18 y mayores de 65,Entrada gratuita en fechas señaladas
4,4,Museo Sorolla,3€,"Sábados desde 14:00, Domingos y festivos","1,50€ (estudiantes, mayores de 65)",Gratis menores de 18 y mayores de 65,Exposiciones temporales incluidas


In [49]:
visitantes = pd.read_csv("./datos/VISITANTES_GENERAL/visitantes_museos_madrid_visitas.csv", sep=",", encoding='utf-8')
visitantes.head()

Unnamed: 0,Museo,Visitantes_Hombres (%),Visitantes_Mujeres (%),Edad_<18 (%),Edad_18-35 (%),Edad_36-50 (%),Edad_>50 (%),Locales (%),Nacionales (%),Internacionales (%)
0,Museo del Prado,45,55,10,35,30,25,40,35,25
1,Museo Reina Sofía,43,57,12,40,25,23,35,40,25
2,Museo Thyssen-Bornemisza,47,53,9,38,28,25,30,35,35
3,Museo Arqueológico Nacional,50,50,8,30,35,27,25,45,30
4,Museo Sorolla,42,58,5,28,30,37,50,30,20


In [48]:
visitantes_renta_estudios = pd.read_csv("./datos/VISITANTES_GENERAL/visitantes_museos_madrid_amplio.csv", sep=",", encoding='utf-8')
visitantes_renta_estudios.head() 

Unnamed: 0,Museo,Género,Renta Anual (€),Nivel de Estudios,Edad,Visitantes por Grupo
0,Museo Nacional de Ciencias Naturales,No Binario,">40,000€",Educación Primaria,18-35,115
1,Museo Nacional de Ciencias Naturales,No Binario,"<20,000€",Educación Secundaria,>50,98
2,Museo Sorolla,No Binario,"<20,000€",Educación Primaria,<18,151
3,CaixaForum Madrid,Masculino,"<20,000€",Estudios Universitarios,<18,45
4,Museo Sorolla,No Binario,">40,000€",Postgrado o Doctorado,<18,176


---

***

In [None]:
caixa_forum = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/caixaforum_madrid_visitantes_filtrados.csv", sep=",", encoding='utf-8')
caixa_forum.head()  

In [None]:
arqueologico = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_arqueológico_nacional_visitantes_filtrados.csv", sep=",", encoding='utf-8')
arqueologico.head()  

In [None]:
cerralbo = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_cerralbo_visitantes_filtrados.csv", sep=",", encoding='utf-8')
cerralbo.head()

In [None]:
historia_madrid = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_de_historia_de_madrid_visitantes_filtrados.csv", sep=",", encoding='utf-8')
historia_madrid.head()

In [None]:
prado = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_del_prado_visitantes_filtrados.csv", sep=",", encoding='utf-8')
prado.head()

In [None]:
romanticismo = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_del_romanticismo_visitantes_filtrados.csv", sep=",", encoding='utf-8')
romanticismo.head()

In [None]:
nacional_de_ciencias_naturales = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_nacional_de_ciencias_naturales_visitantes_filtrados.csv", sep=",", encoding='utf-8')
nacional_de_ciencias_naturales.head()

In [None]:
reina_sofia = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_reina_sofia_visitantes_filtrados.csv", sep=",", encoding='utf-8')
reina_sofia.head()

In [None]:
santiago_bernabeu = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_santiago_bernabeu_visitantes_filtrados.csv", sep=",", encoding='utf-8')
santiago_bernabeu.head()

In [None]:
sorolla = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_sorolla_visitantes_filtrados.csv", sep=",", encoding='utf-8')
sorolla.head()

In [None]:
thyssen = pd.read_csv("./datos/MUSEOS_INDIVIDUALES/museo_thyssen_bornemisza_visitantes_filtrados.csv", sep=",", encoding='utf-8')
thyssen.head()

___

___

Añadir Santiago Bernabéu, Caixa Forum, Fundación Telefónica.... 

**OUTLAYERS:** restauraciones chocantes, adquisiciones extraordinarias...

![fin](./img/7ba470c8aec13d944d23e3f5865ef8f9.jpg) 