In [None]:
# Instalar las bibliotecas necesarias
!pip install pandas matplotlib seaborn scikit-learn

In [None]:
# Importar las bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
import numpy as np

# Cargar los datos sintéticos
# Puedes subir el archivo desde tu máquina local a Google Colab usando la función de carga de archivos
from google.colab import files
uploaded = files.upload()

# Suponiendo que el archivo subido es 'datos_carnaval_sinteticos.csv'
df = pd.read_csv("datos_carnaval_sinteticos.csv")

# Convertir la columna de fecha a datetime
df['Fecha'] = pd.to_datetime(df['Fecha'])

# 1. Resumen Estadístico
def resumen_estadistico(dataframe):
    resumen = dataframe.describe()
    return resumen

# 2. Visualización de Datos
def visualizar_datos(dataframe):
    plt.figure(figsize=(10, 5))
    
    # Gráfico de líneas para el número de turistas
    plt.subplot(1, 2, 1)
    sns.lineplot(x='Fecha', y='Número de Turistas', data=dataframe, marker='o')
    plt.title('Evolución del Número de Turistas')
    plt.xlabel('Fecha')
    plt.ylabel('Número de Turistas')
    
    # Gráfico de barras para la capacidad de alojamiento
    plt.subplot(1, 2, 2)
    sns.barplot(x='Fecha', y='Capacidad de Alojamiento (%)', data=dataframe)
    plt.title('Capacidad de Alojamiento (%)')
    plt.xlabel('Fecha')
    plt.ylabel('Capacidad de Alojamiento (%)')
    plt.xticks(rotation=45)
    
    plt.tight_layout()
    plt.show()
    
    # Gráfico de barras para los incidentes reportados
    plt.figure(figsize=(10, 5))
    sns.barplot(x='Fecha', y='Incidentes Reportados', data=dataframe)
    plt.title('Incidentes Reportados por Día')
    plt.xlabel('Fecha')
    plt.ylabel('Incidentes Reportados')
    plt.xticks(rotation=45)
    plt.show()
    
    # Gráfico de dispersión para tráfico y incidentes
    plt.figure(figsize=(7, 5))
    sns.scatterplot(x='Tráfico (Personas/Minuto)', y='Incidentes Reportados', data=dataframe)
    plt.title('Relación entre Tráfico y Incidentes Reportados')
    plt.xlabel('Tráfico (Personas/Minuto)')
    plt.ylabel('Incidentes Reportados')
    plt.show()

# 3. Predicción de Afluencia
def predecir_afluencia(dataframe, dias_futuros=3):
    # Convertir la columna de fecha en números para el modelo
    dataframe['Día'] = (dataframe['Fecha'] - dataframe['Fecha'].min()).dt.days
    
    # Preparar los datos para el modelo
    X = dataframe[['Día']]
    y = dataframe['Número de Turistas']
    
    # Ajustar el modelo de regresión lineal
    modelo = LinearRegression()
    modelo.fit(X, y)
    
    # Predecir para días futuros
    ultimo_dia = dataframe['Día'].max()
    dias_futuros = np.arange(ultimo_dia + 1, ultimo_dia + 1 + dias_futuros)
    predicciones = modelo.predict(dias_futuros.reshape(-1, 1))
    
    # Resultado de las predicciones
    resultados = pd.DataFrame({
        'Día Futuro': dias_futuros,
        'Predicción de Turistas': predicciones
    })
    
    return resultados

# Ejecución de las funciones
resumen = resumen_estadistico(df)
visualizar_datos(df)
predicciones = predecir_afluencia(df)

# Mostrar resultados
print("Resumen Estadístico:")
print(resumen)
print("\nPredicciones de Afluencia:")
print(predicciones)