# Generate proposals database

## Activities

In [1]:
import pandas as pd
import numpy as np
import random
from itertools import product

# Definir estructura de categorías y subcategorías con sus plantillas
category_templates = {
    'Deporte': {
        'Fitness': [
            'Entrenamiento HIIT de {tiempo} minutos',
            'Rutina de pesas para {objetivo}',
            'Sesión de cardio {intensidad}',
            'Entrenamiento funcional {nivel}',
            'Clase de aeróbics {estilo}',
            'Boot camp {intensidad}',
            'Circuito de ejercicios {tipo}',
            'Entrenamiento con kettlebells',
            'TRX {nivel}',
            'CrossFit WOD del día'
        ],
        'Deportes de equipo': [
            'Partido amistoso de algún tipo de deporte',
            'Entrenamiento de algún tipo de deporte para {nivel}',
            'Práctica de técnicas de algún tipo de deporte',
            'Torneo informal de algún tipo de deporte',
            'Clase de iniciación a algún tipo de deporte',
            'Juego en equipo de algún tipo de deporte',
            'Mini torneo de algún tipo de deporte',
            'Sesión táctica de algún tipo de deporte',
            'Partido de algún tipo de deporte en {lugar}',
            'Práctica de algún tipo de deporte recreativo'
        ]
    },
    'Cultura': {
        'Museos': [
            'Visita al museo de {tipo}',
            'Exposición temporal de {tema}',
            'Tour guiado por {museo}',
            'Visita virtual al museo {nombre}',
            'Taller interactivo en {museo}',
            'Exposición de {artista}',
            'Recorrido temático por {museo}',
            'Visita nocturna a {museo}',
            'Exhibición especial de {tema}',
            'Tour privado por {museo}'
        ],
        'Teatro': [
            'Obra de teatro {género}',
            'Monólogo de {temática}',
            'Musical {título}',
            'Improvisación teatral',
            'Teatro experimental {estilo}',
            'Microteatro {temática}',
            'Performance artística',
            'Teatro infantil {tema}',
            'Comedia en vivo',
            'Drama contemporáneo'
        ]
    },
    'Gastronomía': {
        'Cocina internacional': [
            'Taller de cocina {país}',
            'Clase de {plato} tradicional',
            'Degustación de {cocina}',
            'Preparación de {plato} típico',
            'Curso de cocina {estilo}',
            'Masterclass de {plato}',
            'Demostración de cocina {país}',
            'Cena temática {país}',
            'Workshop de {técnica} culinaria',
            'Experiencia gastronómica {país}'
        ]
    }
}

# Datos para rellenar las plantillas - extendido
template_data = {
    'tiempo': ['15', '20', '30', '45', '60', '75', '90', '105', '120', '135', '150', '180'],
    'objetivo': ['principiantes', 'tonificación', 'pérdida de peso', 'fuerza', 'resistencia', 'flexibilidad', 'estabilidad', 'postura', 'cardio', 'movilidad'],
    'intensidad': ['baja', 'media', 'alta', 'adaptativa', 'intensa', 'suave', 'moderada', 'extrema', 'variada'],
    'nivel': ['principiante', 'intermedio', 'avanzado', 'experto', 'maestro', 'novato', 'medio', 'profesional'],
    'estilo': ['clásico', 'moderno', 'fusión', 'experimental', 'vintage', 'retro', 'contemporáneo', 'minimalista', 'urbano', 'futurista'],
    'tipo': ['cuerpo completo', 'core', 'tren superior', 'tren inferior', 'cardio intenso', 'movilidad articular', 'potencia', 'resistencia', 'equilibrio', 'flexibilidad'],
    'deporte': ['fútbol', 'baloncesto', 'voleibol', 'balonmano', 'hockey', 'rugby', 'tenis', 'bádminton', 'ping-pong', 'pádel'],
    'lugar': ['parque local', 'polideportivo', 'centro deportivo', 'playa', 'pista al aire libre', 'gimnasio', 'cancha municipal', 'centro recreativo', 'zona deportiva'],
    'tipo': ['arte contemporáneo', 'historia', 'ciencia', 'tecnología', 'fotografía', 'escultura', 'arquitectura', 'naturaleza', 'pintura', 'cine'],
    'tema': ['naturaleza', 'historia local', 'arte moderno', 'innovación', 'fotografía antigua', 'mitología', 'ingeniería', 'ciencias naturales', 'humanidades'],
    'museo': ['museo nacional', 'museo local', 'galería de arte', 'centro cultural', 'museo de la ciencia', 'museo histórico', 'museo interactivo', 'museo del cine'],
    'nombre': ['Principal', 'Histórico', 'Moderno', 'De la Ciudad', 'Cultural', 'Artístico', 'Nacional', 'Regional', 'Tecnológico'],
    'artista': ['artista local', 'artista internacional', 'artista emergente', 'artista de renombre', 'artista clásico', 'artista conceptual', 'artista moderno'],
    'género': ['comedia', 'drama', 'musical', 'experimental', 'policiaco', 'histórico', 'romántico', 'fantasía', 'documental', 'tragedia'],
    'temática': ['social', 'histórica', 'contemporánea', 'familiar', 'política', 'moral', 'cultural', 'psicológica', 'clásica', 'futurista'],
    'título': ['El Fantasma', 'Cats', 'Chicago', 'El Rey León', 'Hamlet', 'Romeo y Julieta', 'El Lago de los Cisnes', 'Drácula', 'Frankenstein', 'Cenicienta'],
    'país': ['italiana', 'japonesa', 'mexicana', 'india', 'francesa', 'china', 'tailandesa', 'peruana', 'brasileña', 'marroquí'],
    'plato': ['sushi', 'pasta', 'tacos', 'curry', 'paella', 'ceviche', 'ramen', 'tapas', 'pizza', 'empanadas'],
    'cocina': ['mediterránea', 'asiática', 'latinoamericana', 'fusión', 'europea', 'africana', 'nórdica', 'centroamericana', 'del medio oriente', 'tradicional'],
    'técnica': ['tradicional', 'moderna', 'molecular', 'fusión', 'artesanal', 'industrial', 'innovadora', 'clásica', 'minimalista', 'creativa']
}

def generate_unique_activities(n_activities):
    activities = []
    used_names = set()
    
    # Generar todas las combinaciones posibles de categoría y subcategoría
    all_combinations = []
    for category in category_templates:
        for subcategory in category_templates[category]:
            all_combinations.append((category, subcategory))
    
    while len(activities) < n_activities:
        # Seleccionar una combinación aleatoria
        category, subcategory = random.choice(all_combinations)
        
        # Seleccionar una plantilla aleatoria
        template = random.choice(category_templates[category][subcategory])
        
        # Rellenar la plantilla
        activity_name = template
        for key in template_data:
            if '{' + key + '}' in activity_name:
                activity_name = activity_name.replace('{' + key + '}', random.choice(template_data[key]))
        
        # Verificar si el nombre es único
        if activity_name not in used_names:
            used_names.add(activity_name)
            
            indoor_outdoor = 'Indoor' if category in ['Cultura', 'Gastronomía'] else 'Outdoor'
            
            activities.append({
                'ID': len(activities) + 1,
                'Nombre_Tarea': activity_name,
                'Categoria_Principal': category,
                'Subcategoria': subcategory,
                'Indoor_Outdoor': indoor_outdoor,
                'Temp_Min': 18 if indoor_outdoor == 'Indoor' else 15,
                'Temp_Max': 28 if indoor_outdoor == 'Indoor' else 30,
                'Tiempo_Estimado_Minutos': random.choice([30, 45, 60, 90, 120, 180, 240]),
                'Requiere_Ubicacion': subcategory in ['Museos', 'Teatro', 'Cine', 'Cocina internacional'],
                'API_Categoria': 'place_category' if subcategory in ['Museos', 'Teatro', 'Cine'] else None,
                'Descripcion': f"Explora una emocionante {activity_name} dentro de la categoría de {category}"
            })
    
    return activities

# Generar actividades en bloques de 200
all_activities = []
for _ in range(10):
    activities = generate_unique_activities(200)
    df_temp = pd.DataFrame(activities)
    
    # Eliminar duplicados
    df_temp = df_temp.drop_duplicates(subset='Nombre_Tarea')
    
    all_activities.append(df_temp)

# Combinar todas las actividades
df_final = pd.concat(all_activities).drop_duplicates(subset='Nombre_Tarea').reset_index(drop=True)

# Guardar en CSV
df_final.to_csv('data/drafts/no_more_bored_activities_large.csv', index=False)

# Mostrar estadísticas básicas
print("\nDistribución de categorías principales:")
print(df_final['Categoria_Principal'].value_counts())
print("\nDistribución Indoor/Outdoor:")
print(df_final['Indoor_Outdoor'].value_counts())
print("\nEjemplos de actividades generadas:")
print(df_final['Nombre_Tarea'].head(10))



Distribución de categorías principales:
Categoria_Principal
Deporte        238
Cultura        147
Gastronomía     99
Name: count, dtype: int64

Distribución Indoor/Outdoor:
Indoor_Outdoor
Indoor     246
Outdoor    238
Name: count, dtype: int64

Ejemplos de actividades generadas:
0                       Drama contemporáneo
1            Partido amistoso de baloncesto
2          Entrenamiento HIIT de 75 minutos
3         Taller interactivo en museo local
4         Práctica de técnicas de balonmano
5             Práctica de técnicas de tenis
6    Recorrido temático por galería de arte
7                      Masterclass de ramen
8                     Improvisación teatral
9        Práctica de técnicas de baloncesto
Name: Nombre_Tarea, dtype: object
