# Memoria del Análisis de Datos Turísticos en Gran Canaria 2022


![Analisis](https://static.eldiario.es/clip/675ca052-0d1f-4b75-ba7a-67206ebbd308_16-9-discover-aspect-ratio_default_0.webp)

## 1. Introducción
Este estudio tiene como objetivo analizar los datos de turistas que visitaron **Gran Canaria** en **2022** y hacer una comparativa con el 2019 con la finalidad de ver cómo afectó la pandemia a este secto concreto. Se realiza una exploración de las variables clave para comprender el comportamiento de los visitantes, segmentar perfiles sociodemográficos y evaluar patrones de viaje, preferencias de alojamiento y otras tendencias significativas.

---

 **Hipótesis**

Ante la incertidumbre económica que sufrieron las familias por la pandemia y las restricciones sanitarias postpantemia, se plantean las siguientes preguntas.
* ¿Se vió afectada de manera directa la duración promedio de la estancia?
* ¿Hubo cambio de perfil de alojamientos hoteleros frente a casas particualer?
* ¿Turismo con más presencia nacional que internacional?
* ¿Recuperación del Turismo tras la pandemia?
* Estacionalidad debido al atractivo climático y la preferencia de los mercados europeos por escapadas invernales.



***Finalidad***

* Comprender la evolución y las características del perfil turístico en Gran Canaria durante el año 2022, para evaluar los efectos de la pandemia y las restricciones en la recuperación del sector turístico.

* Examinar las características demográficas de los visitantes (edad, origen, género).

* Analizar preferencias de alojamiento, duración de la estancia y horas fuera del alojamiento.

* Analizar el gasto en destino.

* Examinar cómo variaron los principales mercados emisores (Reino Unido, Alemania, España, etc.) en términos de volumen y comportamiento.

* Comparar el comportamiento del turismo en temporadas alta y baja para determinar si se mantuvieron los patrones habituales o si hubo alteraciones.

* Ayudar a los organismos públicos y privados a adaptar sus estrategias turísticas frente a cambios en el perfil y comportamiento de los visitantes.

---

## 2. Estructura de los Datos

### Fuentes de los Datos
El Instituto Canario de Estadística (ISTAC) proporciona información sobre turismo, incluyendo encuestas de gasto turístico, estadísticas de alojamientos y flujos de visitantes. Los datos son accesibles, descargables y tienen autirización para usarlos en este análisis. 

Si deseas tener más información sobre cómo es la estructura de la encuesta, y su metodología, consultar los siguientes links.
- [Metodología](https://www.gobiernodecanarias.org/istac/descargas/C00028A/2018/EGT-2018-metodologia.pdf)

- [Encuesta](https://www.gobiernodecanarias.org/istac/descargas/C00028A/2022/Cuestionario-Gran-Canaria-2022.PDF)

Se dispone de dos bases de datos correspondientes a los años **2019** y **2022**, estructuradas en columnas con las siguientes variables principales:
- **Edad**: Edad del turista.
- **Noches**: Número de noches de estancia.
- **Coste_vuelos**: Coste de los vuelos en euros.
- **Coste_alojamiento**: Coste del alojamiento en euros.
- **Gastos**: Gastos adicionales durante el viaje.
- **Horas_fuera_alojamiento**: Horas dedicadas fuera del alojamiento.
- **Visitas_totales_Islas**: Total de visitas a otras islas Canarias.
- **Visitas_total_GC**: Total de visitas dentro de Gran Canaria.
- **Personas_hogar**: Número de personas que conviven en el hogar del turista.
- **Nacionalidad**: Nacionalidad del visitante.
- **Tipo_alojamiento**: Tipo de alojamiento utilizado.
- **Cuatrimestre**: Periodo del año dividido en cuatro bloques.
- **Sexo, Educación, Situación laboral**: Variables sociodemográficas adicionales.

### Estructura Temporal
Se organiza la información por **cuatrimestres** de cada año, permitiendo comparar tendencias estacionales.

---

## 3. Metodología
Se realiza un **Análisis Exploratorio de Datos (EDA)** que incluye las siguientes etapas:
1. **Limpieza de Datos**:
   - Imputación de valores nulos.
   - Conversión de tipos de datos.
   - Verificación de duplicados.
   - Detección y tratamieto de outliers
2. **Análisis de las Variables**:
   - Análisis de cardinalidad.
   - Tipología (numéricas, categóricas).
   - Análisis univariante de las variables categóricas y numéricas
3. **Análisis Bivariante**
   - Visualización Gráfica (boxplots, scatterplots, mapas de calor)..
   - Distribuciones y comparaciones entre variables clave.
   - Análisis Estadístico
   - Pruebas Chi-cuadrado para relaciones categóricas.
   - Comparación de medias con ANOVA.
4. **Análisis Multivariante**:
   - PCA (Análisis de Componentes Principales) para reducir la dimensionalidad.
   - Segmentación mediante clustering (K-means).

---

## 4. Resultados del Análisis
### 4.1 Análisis Temporal del Número de Turistas
![image.png](attachment:image.png)
  Se observa un **descenso significativo** en el número total de turistas en **2022** respecto a **2019**, influenciado por factores como la pandemia.

  ![image-2.png](attachment:image-2.png)
  - **2019**: La afluencia es más constante a lo largo del año.
  - **2022**: Existe mayor variabilidad entre los cuatrimestres, con recuperación parcial en la segunda mitad del año.

### 4.2 Perfil Sociodemográfico de los Turistas
![image-3.png](attachment:image-3.png)
- Los turistas **mayores de 45 años** predominan en ambos años.
- Distribución por **sexo**:
  - Hombres y mujeres mantienen proporciones similares, con pequeñas diferencias según la nacionalidad.

![image-4.png](attachment:image-4.png)
- La mayoría de turistas tienen **educación secundaria o universitaria**.
- La **situación laboral** muestra predominancia de trabajadores activos y jubilados.

### 4.3 Tipo de Alojamiento
- El uso de **hoteles** sigue siendo la principal elección en ambos años.
- Aumenta la preferencia por **apartamentos vacacionales** en **2022**, especialmente en el primer cuatrimestre.
- El turista del 2022 pasa más horas en el alojamiento, esto puede deberse a las restricciones sanitarias de esta época.

#### Relación con el Cuatrimestre
- Se observa una relación significativa (χ2 test) entre el tipo de alojamiento y el cuatrimestre.

### 4.4 Gasto Turístico y Duración de la Estancia
- **Duración Promedio**:
  - Los turistas de **2019** registran una estancia promedio de **7.5 noches**, mientras que en **2022** desciende ligeramente.
- **Gastos**:
  - Existe una **asociación directa** entre el número de noches y el gasto total.

### 4.5 Relación entre Variables (Análisis Multivariante)
#### PCA (Componentes Principales)
- Dos componentes explican el **35.3% de la varianza** de los datos.
- Variables como **"Coste_alojamiento"**, **"Gastos"** y **"Visitas_totales_Islas"** tienen mayor peso en los componentes principales.

#### Clustering (K-means)
Se identifican **tres clústeres** de turistas:
1. **Cluster 0**: Turistas de perfil económico, estancias cortas.
2. **Cluster 1**: Turistas con mayores gastos en vuelos y alojamiento, estancias más largas.
3. **Cluster 2**: Turistas de gama media, con moderado gasto y duración.

![image-5.png](attachment:image-5.png)
---

## 5. Conclusiones
1. **Descenso General de Visitantes**:
   La pandemia impactó considerablemente en 2022, aunque hubo una leve recuperación en la segunda mitad del año. Siendo el turismo nacional clave en esta recuperación.

2. **Cambios en el Perfil del Turista**:
   - La duración promedio de la estancia no se vio significativamente afectada.
   - Se observó una mayor presencia de turistas mayores.
   - Aumentó el uso de alojamientos alternativos. Hubo un aumento en la preferencia por alojamientos no hoteleros (casas particulares, apartamentos) en 2022, posiblemente como respuesta a la pandemia, donde se buscaba mayor privacidad.

3. **Relación entre Variables Clave**:
   - Se observa una ligera reducción en el gasto promedio, posiblemente debido a la incertidumbre económica post-pandemia.
   - Existe una fuerte relación entre **gastos** y **número de noches**.
   - Los clústeres identificados permiten segmentar a los turistas según sus preferencias y gasto.

4. **Oportunidades para el Sector**:
   - Enfocar estrategias en turistas con mayor gasto (Cluster 1).
   - Promover estancias más largas y el uso de alojamientos diversificados.

5. **Estacionalidad**:
   - El atractivo climático de Gran Canaria sigue consolidando la temporada alta en los meses de invierno.

---

## 6. Recomendaciones

- Adaptar la oferta turística:Potenciar el turismo nacional, que mostró mayor resiliencia.
- Promover ofertas en apartamentos y casas particulares para satisfacer la nueva demanda.
- Enfocar campañas en mercados europeos tradicionales (Alemania y Reino Unido) para fomentar su recuperación.
- Fortalecer el turismo en temporadas bajas mediante promociones y experiencias adaptadas..
- Optimizar el gasto turístico en destino mediante experiencias únicas y de mayor valor añadido.
- Incentivar el uso de alojamientos alternativos y experiencias turísticas que aumenten los gastos locales.

---

## 7. Anexos

[Código Utilizado](../código)

[Tablas y Gráficos Complementarios](../main.ipynb)

