## Título: Análisis de la evolución de crisis económicas: impacto de la inflación y expectativas de crecimiento en el consumo del sector turístico/hotelero"

## I. Abstract

- La propuesta de negocio consiste en desarrollar un modelo de Machine Learning avanzado que analice el historial de consumo de los clientes y lo relacione con las variables económicas clave, como la inflación y el Producto Interno Bruto (PIB). El objetivo es proporcionar a las empresas y a los analistas económicos una herramienta poderosa para comprender las tendencias de consumo en relación con el entorno económico y tomar decisiones informadas.

### A. Presentación de la hipótesis

- La relación entre la inflación, el consumo y el PIB no es lineal y puede variar en diferentes situaciones económicas. Un aumento moderado en la inflación puede estimular el consumo y el crecimiento económico, ya que los consumidores pueden optar por gastar su dinero antes de que los precios sigan aumentando.

- La asociación entre la inflación, el consumo y el PIB es compleja y puede influirse mutuamente. La inflación alta puede afectar negativamente el consumo y el PIB, pero los efectos pueden variar dependiendo de las circunstancias económicas y las políticas implementadas.

- Durante este análisis exploratorio intentaremos dar claridad a cómo cohabitan las tres variables, así como predecir, en función de los indicadores de un momento determinado, cómo evolucionan los hábitos de consumo.

- Por último, intentaremos predecir con el modelo dichos hábitos para potenciar acciones de negocio que permitan evolucionar en un mercado cada vez más competitivo.

### B. Objetivos de la memoria

#### Objetivo general

Estudio de la evolución de la afectación del consumo en el ámbito internacional integrando dos vertientes macro:

- Inflación
- Expectativas de crecimiento económico

Contraste de la magnitud del binomio causalidad-efecto, en los diferentes acontecimientos destacados desde los registros obtenidos.

#### Objetivos específicos:

- Recopilar y preprocesar datos históricos de inflación, consumo y PIB.
- Realizar un análisis descriptivo de las variables.
- Explorar relaciones y patrones entre las variables mediante visualización y técnicas estadísticas.
- Desarrollar un modelo de predicción utilizando técnicas de aprendizaje automático.
- Evaluar el rendimiento del modelo y utilizarlo para predecir el consumo en el sector turístico.

### C. Descripción de las variables de interés

- Inflación
    - Explicación del concepto de inflación y su importancia en la economía. Fuentes de datos utilizadas.
- Consumo
    - Descripción de cómo se define y mide el consumo en el sector turístico. Mención de fuentes de datos utilizadas.
- PIB
    - Explicación del PIB y su relevancia como indicador económico. Mención de fuentes de datos utilizadas.


II. Metodología

- A. Data collection

    - Descripción de las fuentes utilizadas y el proceso de recopilación de datos para las variables inflación, consumo y PIB.

In [None]:
'''
Para este projecto usaremos las siguientes librerías:
'''
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.graph_objects as go

In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline


- B. Data extraction

    - Descripción de las técnicas utilizadas para eliminar valores atípicos, manejar datos faltantes y asegurar la calidad de los datos.
    - Explicación de cómo se realizaron las transformaciones necesarias para preparar los datos para el análisis

In [None]:

# Consumptions Global
df = pd.read_excel(r'C:\Users\34680\Desktop\Eda-Infration_GDP\src\data\Consumption global.xls')
# Gdp Global
df_GDP1 = pd.read_excel(r'C:\Users\34680\Desktop\Eda Consumo\GDP global.xls')
#Inflation
df_inflation = pd.read_csv(r'C:\Users\34680\Desktop\Eda Consumo\Inflation.csv')


- Procedemos a una limpieza quitando valores NaN así como features que no aportan valor al posterior análisis.

In [None]:
df_1 =df_1.drop('NaN Count', axis=1)

df_1 = df_1_sorted.reset_index(drop=True)
df_1 = df_1.rename(columns={'Country Code': 'LOCATION'})
df_1.columns = df_1.columns.astype(str).str.split('.').str[0]
df_1 = df_1.rename(columns=lambda x: x.split('.')[0] if '.' in x else x)

- Filtrado del DataFrame para su posterior relación con el mismo periodo en las variables x, y y z.
    En este primer estudio nos centramos en ver las modificaciones de los valores históricos.

In [None]:
# Filtrar el DataFrame para Asia
df_I_Asia = df_inflation[df_inflation['LOCATION'].isin(lista_Asia)]

# Filtrar el DataFrame para Norteamérica
df_Consumption_NA = df_1[df_1['LOCATION'].isin(lista_NA)]

# Filtrar el DataFrame para la UE
df_GDP_G20 = df_GDP1[df_GDP1['LOCATION'].isin(list_G20)]

In [2]:
import os

ruta = os.getcwd()
print(ruta)

c:\Users\34680\Desktop\Eda-Infration_GDP\src\Notebooks


In [3]:
ruta_archivo = os.path.join(ruta, "Notebooks", "Clustering.ipynb")
print(ruta_archivo)


c:\Users\34680\Desktop\Eda-Infration_GDP\src\Notebooks\Notebooks\Clustering.ipynb



[Notebooks Clustering](c:\Users\34680\Desktop\Eda-Infration_GDP\src\Notebooks\Notebooks\Clustering.ipynb)

- C. Análisis descriptivo de las variables inflación, consumo y PIB
    
    - Procedemos a observar relaciones y patrones para cada variable.
        
        

In [None]:
fig, ax = plt.subplots(figsize=(14, 6))

for i in range(len(df_list_I)):
    df_region = df_list_I[i]
    region_title = region_titles[i]

    # Obtener los datos de inflación para la región actual
    datos_y = df_region.iloc[:, 3:].mean().values  # Calcular el promedio de los datos para cada año

    # Trazar la línea utilizando los datos de x e y para la región actual
    x = df_region.columns[3:]  # Omitir las primeras tres columnas (nombre del país, código y tema)
    ax.plot(x, datos_y, label=region_title)

# Mostrar la gráfica
plt.show()

- D. Exploración de relaciones y patrones entre las variables
    
       - Análisis de correlaciones entre las variables inflación, consumo y PIB.

       - Comparativa de intervalos temporales para obtener la big picture del comportamiento de las variables en dicho tramo.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

- Analisis de estadisticos como media, mediana, desviación estándar, etc.

- Funciones para crear nuevos valores para posteriomente hacer crear nuevos data frames para avanzar hacia las correlacione.

In [None]:
def get_average_consumption(df):
    datos_y = df.iloc[:, 3:].mean().values  # Calcular el promedio de los datos para cada año
    return datos_y

- Definicion de formula ratio de crecimiento para calcular vectores de cada subtipo a estudiar.

In [None]:
def growth(vector):
    tasas = []
    for i in range(1, len(vector)):
        tasa = ((vector[i] - vector[i-1]) / vector[i-1]) * 100
        tasas.append(tasa)
    return tasas


    # To be Continued...
   
    
    E. Selección de técnicas de predicción adecuadas
    
        - Revisión de las diferentes técnicas de aprendizaje automático utilizadas para la predicción del consumo.
        - Justificación de la elección de la técnica más adecuada para el problema en estudio.
    
    F. Implementación del modelo de predicción
    
        - Descripción detallada de cómo se implementó el modelo de predicción utilizando la técnica seleccionada.
        - Explicación de los parámetros utilizados y el proceso de entrenamiento del modelo.

III. Análisis de relación de variables inflación, consumo y PIB

    A. Análisis univariado de cada variable
  
        - Presentación de estadísticas descriptivas y visualización de la distribución de cada variable por separado.
        - Interpretación de los resultados para comprender mejor las características individuales de las variables.
    
    B. Análisis bivariado para identificar correlaciones
    
        - Uso de gráficos y medidas de correlación para analizar la relación entre las variables inflación, consumo y PIB.
        - Interpretación de las correlaciones encontradas y su relevancia para el consumo en el sector turístico.
    
    C. Visualización de los datos mediante gráficos y tablas
    
        - Utilización de gráficos (gráficos de línea, barras, etc.) y tablas para visualizar las tendencias y patrones de las variables a lo largo del tiempo.
        - Descripción de cómo se interpretan los gráficos y tablas en relación con el consumo en el sector turístico.
    
    D. Interpretación de los resultados obtenidos
    
        - Análisis de los hallazgos clave y su relación con el comportamiento del consumo en el sector turístico.
        - Discusión de posibles explicaciones y consideraciones adicionales sobre los resultados.



IV. Desarrollo del modelo de predicción

    A. Selección del algoritmo de aprendizaje automático adecuado
    
        - Descripción de los diferentes algoritmos considerados y su idoneidad para el problema de predicción del consumo en el sector turístico.
        - Justificación de la elección del algoritmo seleccionado y su capacidad para capturar las relaciones entre las variables.
    
    B. División de los datos en conjuntos de entrenamiento y prueba
    
        - Explicación de cómo se dividieron los datos históricos en conjuntos de entrenamiento y prueba para el desarrollo del modelo de predicción.
        - Consideraciones sobre el tamaño de los conjuntos de datos y la proporción utilizada.
    
    C. Entrenamiento del modelo utilizando los datos históricos
    
        - Descripción del proceso de entrenamiento del modelo utilizando el conjunto de datos de entrenamiento.
        - Mención de las métricas utilizadas para evaluar el rendimiento del modelo durante el entrenamiento.
    
    D. Evaluación del rendimiento del modelo
    
        - Aplicación del modelo entrenado al conjunto de prueba para evaluar su rendimiento.
        - Utilización de métricas de evaluación (como el error medio cuadrado o la precisión) para medir la calidad de las predicciones.
    
    E. Ajuste del modelo y validación de resultados
    
        - Descripción de cómo se ajustaron los parámetros del modelo y se iteró para mejorar su rendimiento.
        - Validación de los resultados del modelo mediante técnicas como la validación cruzada o el uso de conjuntos de validación adicionales.




V. Predicción del consumo en el sector turístico

    A. Utilización del modelo entrenado para realizar predicciones
    
        - Aplicación del modelo de predicción a nuevos datos para predecir el comportamiento del consumo en el sector turístico.
        - Descripción del proceso de generación de predicciones utilizando el modelo entrenado.
    
    B. Interpretación de los resultados de las predicciones
    
        - Análisis de las predicciones obtenidas y su relevancia para el sector turístico.
        - Discusión de posibles implicaciones y consideraciones para la toma de decisiones en el ámbito turístico.
    
    C. Análisis de la confiabilidad de las predicciones
    
        - Evaluación de la confiabilidad de las predicciones a través de métricas de rendimiento y técnicas de validación.
        - Consideración de posibles fuentes de incertidumbre y limitaciones en las predicciones.

In [None]:






VI. Conclusiones

    A. Resumen de los hallazgos principales
    
        - Recapitulación de los resultados clave obtenidos a lo largo del análisis exploratorio de datos y el desarrollo del modelo de predicción.
        - Destacar las relaciones identificadas entre las variables inflación, consumo y PIB en el sector turístico.
    
    B. Contribución del EDA y el modelo de predicción al sector turístico
    
        - Discusión sobre cómo el análisis exploratorio de datos y el modelo de predicción pueden ayudar a comprender y predecir el consumo en el sector turístico.
        - Mención de posibles aplicaciones prácticas y beneficios para el sector turístico y las decisiones empresariales.
    
    C. Limitaciones del estudio y posibles mejoras futuras
    
        - Identificación de las limitaciones del enfoque utilizado y las variables consideradas.
        - Sugerencias para futuras investigaciones y mejoras en el análisis y la predicción del consumo en el sector turístico.

VII. Referencias bibliográficas

    A. Cita de las fuentes utilizadas para fundamentar el trabajo.
    
        - Incluir referencias académicas, libros, artículos y recursos en línea utilizados como base teórica y metodológica.

VIII. Anexos

    A. Código fuente de Python utilizado para el EDA y la predicción.
    
        - Incluir extractos relevantes del código utilizado, con comentarios explicativos.
    
    B. Tablas y gráficos adicionales
