In [None]:
# Importar las librerías necesarias
import pandas as pd

# Cargar los datos desde las rutas absolutas
eventos_df = pd.read_csv('/workspace/eventos.csv')
aficionados_df = pd.read_csv('/workspace/aficionados.csv')
promociones_df = pd.read_csv('/workspace/promociones.csv')

# Eliminar filas con valores nulos en los DataFrames
eventos_df = eventos_df.dropna()
aficionados_df = aficionados_df.dropna()
promociones_df = promociones_df.dropna()

# Combinar los DataFrames en base a la columna 'id_evento'
df_combinado = pd.merge(eventos_df, aficionados_df, on="id_evento", how="inner")
df_combinado = pd.merge(df_combinado, promociones_df, on="id_evento", how="inner")

# Responder a las preguntas de negocio

# ¿Cuál es el evento con mayor asistencia total?
evento_max_asistencia = df_combinado.loc[df_combinado['asistentes_totales'].idxmax()]
print("Evento con mayor asistencia:")
print(evento_max_asistencia[['nombre_evento', 'asistentes_totales']])

# ¿Qué rango de edad asiste más frecuentemente a los eventos?
bins = [18, 30, 40, 50, 60, 100]  # Ejemplo de rangos de edad
labels = ['18-30', '31-40', '41-50', '51-60', '61+']
aficionados_df['rango_edad'] = pd.cut(aficionados_df['edad'], bins=bins, labels=labels, right=False)

# Contar cuántos aficionados hay en cada grupo
rango_edad_mas_frecuente = aficionados_df['rango_edad'].value_counts().idxmax()
print(f"El rango de edad más frecuente es: {rango_edad_mas_frecuente}")

# ¿Qué medio publicitario ha generado mayor impacto en términos de asistencia?
df_combinado['impacto_promocion'] = df_combinado['asistentes_totales'] / df_combinado['presupuesto_promocion']

# Agrupar por medio publicitario para ver qué medio tuvo el mayor impacto
medio_publicitario_max_impacto = df_combinado.groupby('medio_publicitario')['impacto_promocion'].max().idxmax()
print(f"El medio publicitario que generó mayor impacto es: {medio_publicitario_max_impacto}")

# ¿Cuál es la ubicación de residencia que más aficionados aporta a los eventos?
ubicacion_max_aficionados = df_combinado.groupby('ubicacion_residencia')['id_aficionado'].count().idxmax()
print(f"La ubicación de residencia que más aficionados aporta es: {ubicacion_max_aficionados}")

# Exportar el DataFrame final con los análisis a un archivo CSV
df_combinado.to_csv('/workspace/reporte_eventos.csv', index=False)
