# Plazas Disponibles Hotelero

Paso 1: Importar las librerías necesarias

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report, confusion_matrix

Paso 2: Crear y cargar los datos
Vamos a crear un DataFrame con los datos proporcionados.

In [None]:
# Datos de ejemplo
data = {
    'Periodo': [np.nan] * 32 + [1, 2, 3] * 128,
    'Mes': ['Enero', 'Febrero', 'Marzo'] * 128,
    'Establecimientos': ['A', 'B', 'C'] * 128,
    'Plazas disponibles': ['100', '150', '200'] * 128,
    'Habitaciones o Unidades disponibles': ['50', '75', '100'] * 128
}

df = pd.DataFrame(data)


Paso 3: Preprocesar los datos
Convertir columnas a tipo numérico
Algunas de las columnas están como cadenas de texto, pero deberían ser numéricas

In [None]:
df['Plazas disponibles'] = pd.to_numeric(df['Plazas disponibles'], errors='coerce')
df['Habitaciones o Unidades disponibles'] = pd.to_numeric(df['Habitaciones o Unidades disponibles'], errors='coerce')


Eliminar filas con valores nulos
Es importante eliminar o manejar las filas con valores nulos para evitar errores durante el entrenamiento del modelo.

In [None]:
df.dropna(inplace=True)


Codificar variables categóricas
Las variables categóricas como Mes y Establecimientos deben ser codificadas numéricamente.

In [None]:
label_encoders = {}
for column in ['Mes', 'Establecimientos']:
    le = LabelEncoder()
    df[column] = le.fit_transform(df[column])
    label_encoders[column] = le


Paso 4: Definir las variables independientes y dependientes
Definimos X como nuestras variables independientes y y como la variable dependiente.

In [None]:
X = df[['Mes', 'Establecimientos', 'Habitaciones o Unidades disponibles']]
y = df['Plazas disponibles']


Binarizar la variable dependiente
Para usar la regresión logística, binarizamos y (suponemos que queremos predecir si la cantidad de plazas disponibles es mayor que la mediana).

In [None]:
y = (y > y.median()).astype(int)

Paso 5: Dividir los datos en conjunto de entrenamiento y prueba
Dividimos los datos en dos conjuntos: uno para entrenar el modelo y otro para evaluarlo.

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


Paso 6: Entrenar el modelo de regresión logística
Entrenamos el modelo utilizando los datos de entrenamiento

In [None]:
model = LogisticRegression()
model.fit(X_train, y_train)


Paso 7: Evaluar el modelo
Evaluamos el modelo utilizando los datos de prueba y mostramos la matriz de confusión y el informe de clasificación.

In [None]:
y_pred = model.predict(X_test)
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))
