# Generate proposals database

## Activities at home

In [1]:
import pandas as pd
import numpy as np
import random
from itertools import product

# Definir estructura de categorías y subcategorías con sus plantillas
category_templates = {
    'Deporte': {
        'Fitness': [
            'Entrenamiento HIIT de {tiempo} minutos',
            'Rutina de pesas para {objetivo}',
            'Sesión de cardio {intensidad}',
            'Entrenamiento funcional {nivel}',
            'Clase de aeróbics {estilo}',
            'Boot camp {intensidad}',
            'Circuito de ejercicios {tipo}',
            'Entrenamiento con kettlebells',
            'TRX {nivel}',
            'CrossFit WOD del día'
        ],
        'Deportes de equipo': [
            'Partido amistoso de algún tipo de deporte',
            'Entrenamiento de algún tipo de deporte para {nivel}',
            'Práctica de técnicas de algún tipo de deporte',
            'Torneo informal de algún tipo de deporte',
            'Clase de iniciación a algún tipo de deporte',
            'Juego en equipo de algún tipo de deporte',
            'Mini torneo de algún tipo de deporte',
            'Sesión táctica de algún tipo de deporte',
            'Partido de algún tipo de deporte en {lugar}',
            'Práctica de algún tipo de deporte recreativo'
        ]
    },
    'Cultura': {
        'Museos': [
            'Visita al museo de {tipo}',
            'Exposición temporal de {tema}',
            'Tour guiado por {museo}',
            'Visita virtual al museo {nombre}',
            'Taller interactivo en {museo}',
            'Exposición de {artista}',
            'Recorrido temático por {museo}',
            'Visita nocturna a {museo}',
            'Exhibición especial de {tema}',
            'Tour privado por {museo}'
        ],
        'Teatro': [
            'Obra de teatro {género}',
            'Monólogo de {temática}',
            'Musical {título}',
            'Improvisación teatral',
            'Teatro experimental {estilo}',
            'Microteatro {temática}',
            'Performance artística',
            'Teatro infantil {tema}',
            'Comedia en vivo',
            'Drama contemporáneo'
        ]
    },
    'Gastronomía': {
        'Cocina internacional': [
            'Taller de cocina {país}',
            'Clase de {plato} tradicional',
            'Degustación de {cocina}',
            'Preparación de {plato} típico',
            'Curso de cocina {estilo}',
            'Masterclass de {plato}',
            'Demostración de cocina {país}',
            'Cena temática {país}',
            'Workshop de {técnica} culinaria',
            'Experiencia gastronómica {país}'
        ]
    }
}

# Datos para rellenar las plantillas - extendido
template_data = {
    'tiempo': ['15', '20', '30', '45', '60', '75', '90', '105', '120', '135', '150', '180'],
    'objetivo': ['principiantes', 'tonificación', 'pérdida de peso', 'fuerza', 'resistencia', 'flexibilidad', 'estabilidad', 'postura', 'cardio', 'movilidad'],
    'intensidad': ['baja', 'media', 'alta', 'adaptativa', 'intensa', 'suave', 'moderada', 'extrema', 'variada'],
    'nivel': ['principiante', 'intermedio', 'avanzado', 'experto', 'maestro', 'novato', 'medio', 'profesional'],
    'estilo': ['clásico', 'moderno', 'fusión', 'experimental', 'vintage', 'retro', 'contemporáneo', 'minimalista', 'urbano', 'futurista'],
    'tipo': ['cuerpo completo', 'core', 'tren superior', 'tren inferior', 'cardio intenso', 'movilidad articular', 'potencia', 'resistencia', 'equilibrio', 'flexibilidad'],
    'deporte': ['fútbol', 'baloncesto', 'voleibol', 'balonmano', 'hockey', 'rugby', 'tenis', 'bádminton', 'ping-pong', 'pádel'],
    'lugar': ['parque local', 'polideportivo', 'centro deportivo', 'playa', 'pista al aire libre', 'gimnasio', 'cancha municipal', 'centro recreativo', 'zona deportiva'],
    'tipo': ['arte contemporáneo', 'historia', 'ciencia', 'tecnología', 'fotografía', 'escultura', 'arquitectura', 'naturaleza', 'pintura', 'cine'],
    'tema': ['naturaleza', 'historia local', 'arte moderno', 'innovación', 'fotografía antigua', 'mitología', 'ingeniería', 'ciencias naturales', 'humanidades'],
    'museo': ['museo nacional', 'museo local', 'galería de arte', 'centro cultural', 'museo de la ciencia', 'museo histórico', 'museo interactivo', 'museo del cine'],
    'nombre': ['Principal', 'Histórico', 'Moderno', 'De la Ciudad', 'Cultural', 'Artístico', 'Nacional', 'Regional', 'Tecnológico'],
    'artista': ['artista local', 'artista internacional', 'artista emergente', 'artista de renombre', 'artista clásico', 'artista conceptual', 'artista moderno'],
    'género': ['comedia', 'drama', 'musical', 'experimental', 'policiaco', 'histórico', 'romántico', 'fantasía', 'documental', 'tragedia'],
    'temática': ['social', 'histórica', 'contemporánea', 'familiar', 'política', 'moral', 'cultural', 'psicológica', 'clásica', 'futurista'],
    'título': ['El Fantasma', 'Cats', 'Chicago', 'El Rey León', 'Hamlet', 'Romeo y Julieta', 'El Lago de los Cisnes', 'Drácula', 'Frankenstein', 'Cenicienta'],
    'país': ['italiana', 'japonesa', 'mexicana', 'india', 'francesa', 'china', 'tailandesa', 'peruana', 'brasileña', 'marroquí'],
    'plato': ['sushi', 'pasta', 'tacos', 'curry', 'paella', 'ceviche', 'ramen', 'tapas', 'pizza', 'empanadas'],
    'cocina': ['mediterránea', 'asiática', 'latinoamericana', 'fusión', 'europea', 'africana', 'nórdica', 'centroamericana', 'del medio oriente', 'tradicional'],
    'técnica': ['tradicional', 'moderna', 'molecular', 'fusión', 'artesanal', 'industrial', 'innovadora', 'clásica', 'minimalista', 'creativa']
}

def generate_unique_activities(n_activities):
    activities = []
    used_names = set()
    
    # Generar todas las combinaciones posibles de categoría y subcategoría
    all_combinations = []
    for category in category_templates:
        for subcategory in category_templates[category]:
            all_combinations.append((category, subcategory))
    
    while len(activities) < n_activities:
        # Seleccionar una combinación aleatoria
        category, subcategory = random.choice(all_combinations)
        
        # Seleccionar una plantilla aleatoria
        template = random.choice(category_templates[category][subcategory])
        
        # Rellenar la plantilla
        activity_name = template
        for key in template_data:
            if '{' + key + '}' in activity_name:
                activity_name = activity_name.replace('{' + key + '}', random.choice(template_data[key]))
        
        # Verificar si el nombre es único
        if activity_name not in used_names:
            used_names.add(activity_name)
            
            indoor_outdoor = 'Indoor' if category in ['Cultura', 'Gastronomía'] else 'Outdoor'
            
            activities.append({
                'ID': len(activities) + 1,
                'Nombre_Tarea': activity_name,
                'Categoria_Principal': category,
                'Subcategoria': subcategory,
                'Indoor_Outdoor': indoor_outdoor,
                'Temp_Min': 18 if indoor_outdoor == 'Indoor' else 15,
                'Temp_Max': 28 if indoor_outdoor == 'Indoor' else 30,
                'Tiempo_Estimado_Minutos': random.choice([30, 45, 60, 90, 120, 180, 240]),
                'Requiere_Ubicacion': subcategory in ['Museos', 'Teatro', 'Cine', 'Cocina internacional'],
                'API_Categoria': 'place_category' if subcategory in ['Museos', 'Teatro', 'Cine'] else None,
                'Descripcion': f"Explora una emocionante {activity_name} dentro de la categoría de {category}"
            })
    
    return activities

# Generar actividades en bloques de 200
all_activities = []
for _ in range(10):
    activities = generate_unique_activities(200)
    df_temp = pd.DataFrame(activities)
    
    # Eliminar duplicados
    df_temp = df_temp.drop_duplicates(subset='Nombre_Tarea')
    
    all_activities.append(df_temp)

# Combinar todas las actividades
df_final = pd.concat(all_activities).drop_duplicates(subset='Nombre_Tarea').reset_index(drop=True)

# Guardar en CSV
df_final.to_csv('data/drafts/no_more_bored_activities_large.csv', index=False)

# Mostrar estadísticas básicas
print("\nDistribución de categorías principales:")
print(df_final['Categoria_Principal'].value_counts())
print("\nDistribución Indoor/Outdoor:")
print(df_final['Indoor_Outdoor'].value_counts())
print("\nEjemplos de actividades generadas:")
print(df_final['Nombre_Tarea'].head(10))



Distribución de categorías principales:
Categoria_Principal
Deporte        238
Cultura        147
Gastronomía     99
Name: count, dtype: int64

Distribución Indoor/Outdoor:
Indoor_Outdoor
Indoor     246
Outdoor    238
Name: count, dtype: int64

Ejemplos de actividades generadas:
0                       Drama contemporáneo
1            Partido amistoso de baloncesto
2          Entrenamiento HIIT de 75 minutos
3         Taller interactivo en museo local
4         Práctica de técnicas de balonmano
5             Práctica de técnicas de tenis
6    Recorrido temático por galería de arte
7                      Masterclass de ramen
8                     Improvisación teatral
9        Práctica de técnicas de baloncesto
Name: Nombre_Tarea, dtype: object


## Activities out home

In [2]:
import pandas as pd
import random

# Definir estructura de categorías y subcategorías con sus plantillas para actividades al aire libre
category_templates = {
    'Deportes al Aire Libre': {
        'Running': [
            'Correr {distancia} km en {lugar}',
            'Hacer entrenamiento de intervalos en {lugar}',
            'Participar en una carrera local de {distancia} km',
            'Correr por senderos naturales en {lugar}',
            'Hacer un entrenamiento de cuestas en {lugar}',
            'Participar en un maratón urbano',
            'Correr con un grupo de running en {lugar}',
            'Hacer sprints en {lugar}',
            'Entrenar para una media maratón en {lugar}',
            'Correr al amanecer por {lugar}'
        ],
        'Ciclismo': [
            'Hacer una ruta en bicicleta por {lugar}',
            'Participar en una excursión ciclista de {distancia} km',
            'Explorar senderos en mountain bike por {lugar}',
            'Hacer ciclismo de carretera en {ruta}',
            'Participar en un evento ciclista local',
            'Hacer una ruta de cicloturismo por {lugar}',
            'Explorar rutas ciclistas urbanas',
            'Hacer descenso en bicicleta en {lugar}',
            'Participar en una carrera de ciclismo de montaña',
            'Hacer una ruta panorámica en bicicleta por {lugar}'
        ],
        'Senderismo': [
            'Hacer una caminata por {lugar}',
            'Explorar un sendero nuevo en {lugar}',
            'Hacer trekking de {dificultad} en {lugar}',
            'Participar en una excursión guiada por {lugar}',
            'Hacer una ruta de senderismo con observación de aves',
            'Explorar un parque natural cercano',
            'Hacer una caminata nocturna con luna llena',
            'Participar en una ruta interpretativa por {lugar}',
            'Hacer una excursión fotográfica por {lugar}',
            'Explorar senderos históricos en {lugar}'
        ],
        'Escalada': [
            'Practicar boulder en {lugar}',
            'Hacer escalada deportiva en {lugar}',
            'Participar en una sesión de escalada guiada',
            'Hacer escalada en roca natural en {lugar}',
            'Practicar técnicas de escalada en {lugar}',
            'Hacer una ruta de varios largos en {lugar}',
            'Participar en un curso de iniciación a la escalada',
            'Hacer escalada tradicional en {lugar}',
            'Practicar técnicas de aseguramiento en {lugar}',
            'Hacer una sesión de escalada con amigos'
        ]
    },
    'Actividades Acuáticas': {
        'Natación': [
            'Nadar en aguas abiertas en {lugar}',
            'Hacer entrenamiento de natación en {lugar}',
            'Participar en un evento de natación al aire libre',
            'Hacer snorkel en {lugar}',
            'Practicar técnicas de natación en {lugar}',
            'Hacer una travesía a nado en {lugar}',
            'Participar en una competición de aguas abiertas',
            'Hacer ejercicios de natación en {lugar}',
            'Practicar natación de larga distancia en {lugar}',
            'Hacer una sesión de natación recreativa'
        ],
        'Surf': [
            'Tomar una clase de surf en {playa}',
            'Practicar surf en {playa}',
            'Hacer bodyboard en {playa}',
            'Participar en una sesión de surf guiada',
            'Practicar técnicas de surf en {playa}',
            'Hacer paddle surf en {lugar}',
            'Tomar una clase de longboard en {playa}',
            'Practicar maniobras de surf en {playa}',
            'Hacer surf al atardecer en {playa}',
            'Participar en una competición local de surf'
        ],
        'Kayak': [
            'Hacer kayak en {lugar}',
            'Participar en una excursión en kayak por {lugar}',
            'Hacer kayak de mar en {lugar}',
            'Practicar técnicas de kayak en {lugar}',
            'Hacer una ruta en kayak por {río}',
            'Participar en un curso de kayak',
            'Hacer kayak de aguas bravas en {río}',
            'Explorar la costa en kayak',
            'Hacer una excursión nocturna en kayak',
            'Practicar eskimotaje en kayak'
        ]
    },
    'Deportes de Equipo': {
        'Fútbol': [
            'Jugar un partido de fútbol en {lugar}',
            'Participar en un torneo local de fútbol',
            'Organizar un partido amistoso en {lugar}',
            'Hacer entrenamiento de fútbol en {lugar}',
            'Jugar fútbol 5 al aire libre',
            'Participar en una liga amateur de fútbol',
            'Hacer ejercicios técnicos de fútbol en {lugar}',
            'Organizar un torneo de fútbol con amigos',
            'Jugar fútbol playa en {lugar}',
            'Participar en un entrenamiento de fútbol grupal'
        ],
        'Voleibol': [
            'Jugar voleibol playa en {lugar}',
            'Participar en un torneo de voleibol al aire libre',
            'Organizar un partido de voleibol en {lugar}',
            'Hacer entrenamiento de voleibol en {lugar}',
            'Jugar voleibol con amigos al aire libre',
            'Participar en una liga de voleibol playa',
            'Hacer ejercicios técnicos de voleibol en {lugar}',
            'Organizar un torneo de voleibol playa',
            'Jugar voleibol mixto al aire libre',
            'Participar en clases de voleibol'
        ],
        'Baloncesto': [
            'Jugar baloncesto en {lugar}',
            'Participar en un torneo de streetball',
            'Organizar un partido de baloncesto 3x3',
            'Hacer entrenamiento de baloncesto en {lugar}',
            'Jugar baloncesto con amigos al aire libre',
            'Participar en una liga local de baloncesto',
            'Hacer ejercicios de tiro en {lugar}',
            'Organizar un torneo de baloncesto callejero',
            'Jugar partidos informales de baloncesto',
            'Participar en entrenamientos grupales'
        ]
    },
    'Aventura y Exploración': {
        'Campamento': [
            'Acampar en {lugar}',
            'Hacer una acampada de fin de semana en {lugar}',
            'Participar en un campamento de aventura',
            'Hacer camping salvaje en {lugar}',
            'Organizar una acampada con amigos',
            'Hacer camping en {parque natural}',
            'Participar en un campamento de supervivencia',
            'Hacer una acampada familiar en {lugar}',
            'Organizar un campamento temático',
            'Hacer camping junto al {lugar}'
        ],
        'Geocaching': [
            'Buscar tesoros de geocaching en {lugar}',
            'Participar en un evento de geocaching',
            'Explorar nuevas ubicaciones de geocaching',
            'Hacer una ruta de geocaching por {lugar}',
            'Organizar una búsqueda del tesoro con GPS',
            'Participar en un multi-cache en {lugar}',
            'Hacer geocaching urbano',
            'Explorar caches misteriosos en {lugar}',
            'Participar en un evento CITO de geocaching',
            'Hacer geocaching nocturno'
        ],
        'Exploración Urbana': [
            'Explorar ruinas abandonadas en {lugar}',
            'Hacer una ruta fotográfica urbana',
            'Participar en una visita guiada histórica',
            'Explorar barrios antiguos de {ciudad}',
            'Hacer una ruta de arte urbano',
            'Participar en una búsqueda del tesoro urbana',
            'Explorar lugares secretos de {ciudad}',
            'Hacer una ruta arquitectónica',
            'Participar en una excursión histórica',
            'Explorar túneles antiguos'
        ]
    },
    'Jardinería y Agricultura': {
        'Huerto Urbano': [
            'Trabajar en el huerto comunitario de {lugar}',
            'Participar en un taller de agricultura urbana',
            'Cultivar verduras de temporada en {lugar}',
            'Hacer mantenimiento del huerto en {lugar}',
            'Organizar una jornada de siembra comunitaria',
            'Participar en un intercambio de semillas',
            'Hacer compostaje en el huerto comunitario',
            'Organizar un taller de agricultura ecológica',
            'Cultivar plantas aromáticas en {lugar}',
            'Participar en la cosecha comunitaria'
        ],
        'Jardinería Comunitaria': [
            'Participar en el mantenimiento de jardines públicos',
            'Hacer voluntariado en jardinería en {lugar}',
            'Plantar árboles en {lugar}',
            'Mantener un jardín comunitario en {lugar}',
            'Organizar una jornada de limpieza de jardines',
            'Participar en un proyecto de reforestación',
            'Hacer mantenimiento de parques públicos',
            'Organizar un taller de jardinería',
            'Crear un jardín de mariposas en {lugar}',
            'Participar en la poda de árboles urbanos'
        ]
    },
    'Arte al Aire Libre': {
        'Pintura': [
            'Pintar paisajes al aire libre en {lugar}',
            'Participar en una sesión de pintura en {lugar}',
            'Hacer acuarelas en la naturaleza',
            'Pintar escenas urbanas en {lugar}',
            'Organizar un taller de pintura al aire libre',
            'Participar en un evento de arte callejero',
            'Hacer bocetos de naturaleza en {lugar}',
            'Organizar una exposición al aire libre',
            'Pintar junto al {lugar}',
            'Participar en un concurso de pintura rápida'
        ],
        'Fotografía': [
            'Hacer una sesión fotográfica en {lugar}',
            'Participar en un safari fotográfico',
            'Fotografiar {tema} en {lugar}',
            'Hacer fotos nocturnas en {lugar}',
            'Organizar una caminata fotográfica',
            'Participar en un taller de fotografía al aire libre',
            'Hacer fotos de naturaleza en {lugar}',
            'Organizar una exposición fotográfica callejera',
            'Fotografiar el amanecer en {lugar}',
            'Participar en un reto fotográfico'
        ]
    }
}

# Datos para rellenar las plantillas
template_data = {
    'lugar': ['el parque local', 'la montaña', 'el bosque', 'la playa', 'el lago', 'la reserva natural', 
              'el centro histórico', 'el jardín botánico', 'la sierra', 'el valle'],
    'distancia': ['5', '10', '15', '20', '25', '30', '42'],
    'playa': ['la playa local', 'la costa salvaje', 'la cala escondida', 'la playa urbana', 
              'la playa norte', 'la playa sur', 'la playa del faro'],
    'río': ['el río local', 'el río de montaña', 'el río tranquilo', 'el río salvaje', 
            'el río urbano', 'el canal'],
    'ruta': ['la costa', 'la montaña', 'el valle', 'el circuito urbano', 'la vía verde', 
             'la ruta panorámica', 'el camino histórico'],
    'dificultad': ['baja', 'media', 'alta', 'extrema'],
    'parque natural': ['el parque nacional', 'la reserva natural', 'el parque regional', 
                      'el área protegida', 'el parque forestal'],
    'ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla', 'Bilbao', 'Málaga', 
               'Zaragoza', 'Valladolid', 'La Coruña', 'Granada'],
    'tema': ['arquitectura', 'naturaleza', 'vida urbana', 'deportes', 'eventos culturales', 
             'arte callejero', 'mercados', 'festivales']
}

def generate_unique_activities(n_activities):
    activities = []
    used_names = set()

    # Generar todas las combinaciones posibles de categoría y subcategoría
    all_combinations = []
    for category in category_templates:
        for subcategory in category_templates[category]:
            all_combinations.append((category, subcategory))

    while len(activities) < n_activities:
        # Seleccionar una combinación aleatoria
        category, subcategory = random.choice(all_combinations)

        # Seleccionar una plantilla aleatoria
        template = random.choice(category_templates[category][subcategory])

        # Rellenar la plantilla
        activity_name = template
        for key in template_data:
            if '{' + key + '}' in activity_name:
                activity_name = activity_name.replace('{' + key + '}', random.choice(template_data[key]))

        # Verificar si el nombre es único
        if activity_name not in used_names:
            used_names.add(activity_name)

            activities.append({
                'ID': len(activities) + 1,
                'Nombre_Tarea': activity_name,
                'Categoria_Principal': category,
                'Subcategoria': subcategory,
                'Indoor_Outdoor': 'Outdoor',
                'Tiempo_Estimado_Minutos': random.choice([30, 60, 90, 120, 180, 240]),
                'Requiere_Ubicacion': True,
                'API_Categoria': None,
                'Descripcion': f"Disfruta de {activity_name} al aire libre dentro de la categoría de {category}"
            })

    return activities

# Generar actividades en bloques de 200
all_activities = []
for _ in range(50):
    activities = generate_unique_activities(200)
    df_temp = pd.DataFrame(activities)

    # Eliminar duplicados
    df_temp = df_temp.drop_duplicates(subset='Nombre_Tarea')

    all_activities.append(df_temp)

# Combinar todas las actividades
df_final = pd.concat(all_activities).drop_duplicates(subset='Nombre_Tarea').reset_index(drop=True)

# Guardar en CSV
df_final.to_csv('data/cleaned/outdoor_activities.csv', index=False)

# Mostrar estadísticas básicas
print("\nDistribución de categorías principales:")
print(df_final['Categoria_Principal'].value_counts())
print("\nEjemplos de actividades generadas:")
print(df_final[['Categoria_Principal', 'Subcategoria', 'Nombre_Tarea']].head(10))


Distribución de categorías principales:
Categoria_Principal
Deportes al Aire Libre      358
Actividades Acuáticas       190
Arte al Aire Libre          153
Aventura y Exploración      142
Deportes de Equipo          138
Jardinería y Agricultura     92
Name: count, dtype: int64

Ejemplos de actividades generadas:
        Categoria_Principal            Subcategoria  \
0    Aventura y Exploración      Exploración Urbana   
1     Actividades Acuáticas                   Kayak   
2     Actividades Acuáticas                   Kayak   
3  Jardinería y Agricultura           Huerto Urbano   
4     Actividades Acuáticas                    Surf   
5     Actividades Acuáticas                Natación   
6  Jardinería y Agricultura  Jardinería Comunitaria   
7    Deportes al Aire Libre              Senderismo   
8        Deportes de Equipo                  Fútbol   
9     Actividades Acuáticas                    Surf   

                                        Nombre_Tarea  
0                      H