# EDA Viajando: antes vs después de la pandemia en España  
Proyecto de análisis de datos sobre la evolución de los viajes en el contexto post-pandémico en España.

![camera-1130731_1280.jpg](attachment:camera-1130731_1280.jpg)

## Introducción

La pandemia de la COVID-19 cambió radicalmente nuestras vidas y también nuestras ganas de movernos. Durante meses, las restricciones sanitarias mantuvieron a mucha gente en casa. Pero, ¿qué pasó cuando volvimos a salir? ¿Viajamos más? ¿Lo hicimos de forma diferente? ¿Hemos recuperado nuestro espíritu viajero?

Este proyecto de análisis exploratorio de datos (EDA) nace con la intención de entender cómo ha cambiado el comportamiento de los viajeros en España desde que comenzó la pandemia. Para ello, utilizaremos datos oficiales procedentes de fuentes como la Encuesta de Turismo de Residentes (ETR) y FRONTUR, con los que analizaremos las tendencias antes y después del año 2020.

Este análisis no solo trata de números, sino también de entender cómo ha evolucionado nuestra forma de viajar. A lo largo del proyecto, exploraremos estos temas con gráficos, comparaciones y datos visuales que nos ayudarán a responder cada hipótesis de forma clara y visual.

### Prepárate para un viaje a través de los datos. ¡Empezamos!




## Hipótesis

Nos planteamos las siguientes preguntas clave:

1. Se viaja más despúes de la _pandemia_? Viajes de residentes antes y después de la pandemia.
    - En España, el número de viajes ha aumentado tras la pandemia (2020).
2. Se viaja más por ocio que por trabajo? Motivos de viaje: _turismo_ vs _negocios_
    - El turismo nacional de ocio ha aumentado más que los viajes por otros motivos (trabajo, estudios, etc.).  
    - Utilizar la variable «Motivo del viaje» en la ETR para segmentar.
3. Inlfuyen los festivos en el número de viajes? Las estaciones (tendencias _estacionales_)?
4. Los españoles viajan más dentro de España o prefieren el extranejo después de la pandemia?
5. El turismo internacional se ha recuperado más rápidamente que el nacional.
    - Comprobar si los turistas extranjeros regresaron en mayor número o antes que los residentes nacionales.
    - Comparar la evolución año a año desde 2020.
6. Tras la pandemia, los destinos costeros se han convertido en la opción preferida.
    - Analizar por comunidad autónoma o provincia en ETR o FRONTUR si hay más viajes hacia zonas como Andalucía, Comunidad Valenciana, Canarias, Islas Baleares, etc.
7.  Ciertas comunidades autónomas han experimentado un mayor crecimiento turístico.


## Datos necesarios  

* Volumen de viajes por año: `antes`, `durante` y `después`

* Segmentación de datos:
    - país/ region
    - mes/ año
    - motivo del viaje: _ocio_, _trabajo_, _estudios_, _salud_, _visitas a familiares_.

* Eventos relevantes:  
    - fechas clave: inicio de la pandemia, cuarentenas, levantamiento de restricciones

::: center
| Variable                | Fuente recomendada         | Detalle                                                                 |
|-------------------------|----------------------------|-------------------------------------------------------------------------|
| Turistas internacionales| INE – Frontur              | Número de turistas por mes, país de origen                             |
| Turistas nacionales     | INE – Movilidad / Egatur   | Desplazamientos por provincias / gasto medio                           |
| Gasto turístico         | INE – Egatur               | Comparar gasto antes y después de la pandemia                          |
| Transporte de viajeros  | INE – Transporte           | Avión, tren, bus; muestra la recuperación de la movilidad              |
| Ocupación hotelera      | INE – Coyuntura turística  | Cuántas personas se alojan, noches, origen                             |
| Fechas relevantes COVID | BOE / medios               | Fechas de restricciones/fin de estado de alarma                        |  

:::


## Periodos a comparar

* __Antes de la pandemia__:     2018, 2019
* __Durante pandemia__:         2020, 2021
* __Post_pandemia__:            2022, 2023, 2024


## Fuentes de datos

* [__INE__](https://www.ine.es/) : tiene datos mensuales de turistas
    - __ETR__ - Encuesta de turismo de Residentes
    - __FRONTUR__ - Turistas Internacionales por mes
    - __Egatur__ -Gasto turistico
* [Datos Abiertos del Gobierno de España](https://datos.gob.es)
    - redirigen a INE
* __Webscrapping__: [calendarios laborales por años](https://www.calendarioslaborales.com)
* __Eurostat__: Estadísticas de transporte y turismo para la UE.


## Ideas

* Evolución anual del número de viajeros.
* Comparativa 2019 vs. 2023/2024.
* Distribución por CCAA.  
* Impacto por CCAA, nacional vs. internacional.
* Analizar el gasto turístico. Duración media del viaje y gasto.
* Mapas de calor por región y año
* Comparar con otros paises.

## Referencias adicionales
* [__Dataestur__](https://www.dataestur.es/): Plataforma que ofrece una selección de los datos más relevantes del turismo en España, con visualizaciones y cuadros de mando interactivos.
* [text](https://datosmacro.expansion.com/comercio/turismo-internacional/espana)
* [__EpData__](https://www.epdata.es/) : Portal que proporciona datos y gráficos sobre diversos aspectos del turismo en España, incluyendo transporte de viajeros y ocupación hotelera.
    - [Transporte de viajeros](https://www.epdata.es/datos/transporte-viajeros-ine-datos-graficos/123/espana/106)
    - [Ocupación hotelera](https://www.epdata.es/datos/ocupacion-hotelera-hoteles-datos-graficos/94/espana/106)

## Plan de trabajo

1. __Descarga, limpieza y preparación de datos__ (eliminación de valores nulos, formato de fechas, etc.)
    - Filtrar por años clave: 2018, 2019
    - Filtrar por motivos
    - Agrupar por año -> número de viajes por turismo
2. __Análisis exploratorio__: 
- Analizar gráficamente la evolución del turismo tras la pandemia mediante gráficos como:
    + Evolución de viajes turísticos (línea por año)
    + Comparativa: antes y después de la pandemia (barras 2019 vs. 2023)
    + Reparto por tipo de viaje (solo si tienes más motivos en el dataset)
- Explorar las tendencias en los datos, identificar patrones y comparar los diferentes periodos.
3. __Interpretación y validación de las hipótesis__:  
Contestar: `¿se viaja más ahora?`  
    - ¿Se han incrementado los viajes de ocio respecto a 2019?  
    - ¿En qué año se recuperó?  
    - ¿Hay diferencia entre los viajes nacionales y los internacionales?  
    - ¿Hay algún mes o temporada que destaque?  
3. __Visualización de resultados y conclusiones__: mediante gráficos y tablas que ilustren claramente las diferencias en los patrones de viaje antes y después de la pandemia.

## Datasets para el análisis

In [2]:
import pandas as pd
import numpy as np

class display(object):
    """Representador HTML de múltiples objetos"""
    template = """<div style="float: left; padding: 10px;">
    <p style='font-family:"Courier New", Courier, monospace'>{0}</p>{1}
    </div>"""
    def __init__(self, *args):
        self.args = args
        
    def _repr_html_(self):
        return '\n'.join(self.template.format(a, eval(a)._repr_html_())
                         for a in self.args)
    
    def __repr__(self):
        return '\n\n'.join(a + '\n' + repr(eval(a))
                           for a in self.args)


### [Número de turistas según motivo principal del viaje](https://www.ine.es/jaxiT3/Tabla.htm?t=13864&L=0) - FRONTUR
- Descripción: Número de visitantes no residentes que acceden a España por las distintas vías de acceso.
- Variables: Mes, país de origen, comunidad autónoma de destino, motivo del viaje, duración de la estancia.

![alt](./img/13864.png)

In [7]:
#  Carga 13864.csv

df_extranjeros = pd.read_csv("./data/13864(6).csv", sep=";")
df_extranjeros.head()

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total
0,Total,Dato base,2025M03,6.593.604
1,Total,Dato base,2025M02,5.397.279
2,Total,Dato base,2025M01,5.065.094
3,Total,Dato base,2024M12,5.264.375
4,Total,Dato base,2024M11,5.670.219


In [8]:
df_extranjeros[114:]

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total
114,"Ocio, recreo y vacaciones",Dato base,2025M03,5.306.743
115,"Ocio, recreo y vacaciones",Dato base,2025M02,4.422.360
116,"Ocio, recreo y vacaciones",Dato base,2025M01,4.119.870
117,"Ocio, recreo y vacaciones",Dato base,2024M12,4.257.518
118,"Ocio, recreo y vacaciones",Dato base,2024M11,4.622.268
...,...,...,...,...
451,Otros motivos,Dato base,2016M02,423.403
452,Otros motivos,Dato base,2016M01,506.662
453,Otros motivos,Dato base,2015M12,579.120
454,Otros motivos,Dato base,2015M11,435.490


In [9]:
df_extranjeros['Tipo de dato'].unique()

array(['Dato base'], dtype=object)

In [20]:
df_extra = df_extranjeros.iloc[:114,:]
display("df_extra.head()", "df_extra.tail()")

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total
0,Total,Dato base,2025M03,6.593.604
1,Total,Dato base,2025M02,5.397.279
2,Total,Dato base,2025M01,5.065.094
3,Total,Dato base,2024M12,5.264.375
4,Total,Dato base,2024M11,5.670.219

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total
109,Total,Dato base,2016M02,3.678.726
110,Total,Dato base,2016M01,3.526.537
111,Total,Dato base,2015M12,3.512.914
112,Total,Dato base,2015M11,3.754.802
113,Total,Dato base,2015M10,6.432.341


In [4]:
# Divide el DataFrame en bloques de 114 filas
n = 114
bloques = [df_extranjeros.iloc[i:i+n].reset_index(drop=True) for i in range(0, len(df_extranjeros), n)]

# Renombra las columnas de cada bloque (excepto el primero) para evitar duplicados
for idx, bloque in enumerate(bloques[1:], start=2):
    bloque.columns = [f"{col}_{idx}" for col in bloque.columns]

# Une los bloques por columnas (axis=1)
df_unido = pd.concat(bloques, axis=1)

display("df_unido.head()", "df_unido.tail()")

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total,Motivo del viaje_2,Tipo de dato_2,Periodo_2,Total_2,Motivo del viaje_3,Tipo de dato_3,Periodo_3,Total_3,Motivo del viaje_4,Tipo de dato_4,Periodo_4,Total_4
0,Total,Dato base,2025M03,6.593.604,"Ocio, recreo y vacaciones",Dato base,2025M03,5.306.743,"Negocio, motivos profesionales",Dato base,2025M03,561.801,Otros motivos,Dato base,2025M03,725.06
1,Total,Dato base,2025M02,5.397.279,"Ocio, recreo y vacaciones",Dato base,2025M02,4.422.360,"Negocio, motivos profesionales",Dato base,2025M02,402.453,Otros motivos,Dato base,2025M02,572.465
2,Total,Dato base,2025M01,5.065.094,"Ocio, recreo y vacaciones",Dato base,2025M01,4.119.870,"Negocio, motivos profesionales",Dato base,2025M01,244.325,Otros motivos,Dato base,2025M01,700.898
3,Total,Dato base,2024M12,5.264.375,"Ocio, recreo y vacaciones",Dato base,2024M12,4.257.518,"Negocio, motivos profesionales",Dato base,2024M12,287.335,Otros motivos,Dato base,2024M12,719.521
4,Total,Dato base,2024M11,5.670.219,"Ocio, recreo y vacaciones",Dato base,2024M11,4.622.268,"Negocio, motivos profesionales",Dato base,2024M11,463.667,Otros motivos,Dato base,2024M11,584.284

Unnamed: 0,Motivo del viaje,Tipo de dato,Periodo,Total,Motivo del viaje_2,Tipo de dato_2,Periodo_2,Total_2,Motivo del viaje_3,Tipo de dato_3,Periodo_3,Total_3,Motivo del viaje_4,Tipo de dato_4,Periodo_4,Total_4
109,Total,Dato base,2016M02,3.678.726,"Ocio, recreo y vacaciones",Dato base,2016M02,2.814.264,"Negocio, motivos profesionales",Dato base,2016M02,441.059,Otros motivos,Dato base,2016M02,423.403
110,Total,Dato base,2016M01,3.526.537,"Ocio, recreo y vacaciones",Dato base,2016M01,2.671.999,"Negocio, motivos profesionales",Dato base,2016M01,347.876,Otros motivos,Dato base,2016M01,506.662
111,Total,Dato base,2015M12,3.512.914,"Ocio, recreo y vacaciones",Dato base,2015M12,2.631.906,"Negocio, motivos profesionales",Dato base,2015M12,301.888,Otros motivos,Dato base,2015M12,579.12
112,Total,Dato base,2015M11,3.754.802,"Ocio, recreo y vacaciones",Dato base,2015M11,2.926.298,"Negocio, motivos profesionales",Dato base,2015M11,393.014,Otros motivos,Dato base,2015M11,435.49
113,Total,Dato base,2015M10,6.432.341,"Ocio, recreo y vacaciones",Dato base,2015M10,5.311.088,"Negocio, motivos profesionales",Dato base,2015M10,469.568,Otros motivos,Dato base,2015M10,651.685


### Turistas nacionales - ETR
* Descripción: Datos sobre viajes realizados por los residentes en España, tanto dentro como fuera del país.
* Variables: Número de viajes de residentes por mes, destino (interior o exterior), motivo del viaje, duración, gasto medio.

![Turistas nacionales](./img/24919.png)


In [None]:
# TODO: limpiar caracteres raros
df_residentes = pd.read_csv("./data/24919.csv", sep=";")
df_residentes.head()

### Resultados detallados mensuales FRONTUR

![Img](./img/13884.png)

In [None]:
# TODO: limpiar caracteres raros
df_residentes = pd.read_csv("./data/13884.csv", sep=";")
df_residentes.head()

### Viajes, pernoctaciones y duración media por principales características de los viajes ETR

![img](./img/15797.png)

In [None]:
# TODO: limpiar caracteres raros
df_residentes = pd.read_csv("./data/15797(1).csv", sep=";")
df_residentes.head()

### Webscrapping festivos España

[Calendarios laborales](https://www.calendarioslaborales.com)

![img](./img/calendarios.PNG)