**Presentación del Proyecto**

Objetivo del Proyecto
Este proyecto tiene como objetivo analizar la oferta de plazas disponibles en el sector hotelero y parahotelero de Ushuaia y desarrollar un modelo predictivo utilizando Random Forest para anticipar la demanda futura. El análisis se centrará en identificar patrones estacionales, variables influyentes y el impacto de eventos específicos en la disponibilidad de plazas.

1. Análisis Exploratorio de Datos (EDA)
Carga y Visualización de los Datos
Primero, cargaremos y visualizaremos el conjunto de datos proporcionado.

In [None]:
import pandas as pd

# Cargar los datos
data = pd.read_csv('path/to/your/dataset.csv')
data.head()


Análisis Descriptivo
Calcularemos estadísticas descriptivas para entender mejor el conjunto de datos.

In [None]:
data.describe()


Visualización de Datos
Utilizaremos gráficos para identificar patrones y tendencias en los datos.

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Convertir el periodo y mes en formato de fecha
data['Fecha'] = pd.to_datetime(data['Periodo'].astype(str) + '-' + data['Mes'], format='%Y-%B')

# Ordenar los datos por fecha
data = data.sort_values('Fecha')

# Graficar plazas disponibles a lo largo del tiempo
plt.figure(figsize=(14, 7))
plt.plot(data['Fecha'], data['Plazas disponibles'], label='Plazas disponibles')
plt.xlabel('Fecha')
plt.ylabel('Plazas disponibles')
plt.title('Plazas disponibles en el sector hotelero y parahotelero de Ushuaia')
plt.legend()
plt.show()


Patrones Estacionales
Utilizaremos gráficos de series temporales para identificar los patrones estacionales

In [None]:
# Graficar series temporales para identificar patrones estacionales
sns.lineplot(x='Fecha', y='Plazas disponibles', data=data)
plt.title('Series temporales de plazas disponibles')
plt.show()


Análisis de Correlación
Analizaremos la correlación entre las variables para identificar las más influyentes.

In [None]:
# Matriz de correlación
correlation_matrix = data.corr()
sns.heatmap(correlation_matrix, annot=True)
plt.title('Matriz de Correlación')
plt.show()


2. Desarrollo del Modelo de Aprendizaje Automático
Preparación de los Datos
Prepararemos los datos para entrenar el modelo Random Forest.

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score

# Seleccionar características y variable objetivo
features = ['Establecimientos', 'Habitaciones o Unidades disponibles']
target = 'Plazas disponibles'

# Dividir los datos en conjunto de entrenamiento y prueba
X = data[features]
y = data[target]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


Entrenamiento del Modelo

In [None]:
# Entrenar el modelo Random Forest
rf = RandomForestRegressor(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)


3. Evaluación del Modelo
Métricas de Evaluación

In [None]:
# Predicciones del modelo
y_pred = rf.predict(X_test)

# Calcular métricas
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Mean Squared Error: {mse}')
print(f'R^2 Score: {r2}')


4. Resultados y Conclusiones

Interpretación de los Resultados
El modelo Random Forest mostró un rendimiento adecuado, como se refleja en las métricas de evaluación obtenidas. Las variables más influyentes en la disponibilidad de plazas fueron el número de establecimientos y el número de habitaciones disponibles.

Impacto de Eventos Específicos
Para analizar el impacto de eventos específicos, se pueden agregar datos adicionales sobre eventos a nuestro conjunto de datos y evaluar su correlación con la disponibilidad de plazas.

Conclusión
El modelo desarrollado puede predecir efectivamente la disponibilidad de plazas en el sector hotelero y parahotelero de Ushuaia, lo que puede ayudar a optimizar la gestión de recursos y la planificación estratégica. Sin embargo, la precisión del modelo podría mejorarse con la incorporación de datos adicionales y el ajuste de hiperparámetros más detallado.