<a href="https://colab.research.google.com/github/cbadenes/curso-pln/blob/main/utils/generador_valoraciones.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import json
import random

# Plantillas para diferentes tipos de establecimientos
tipos_establecimiento = [
    "Restaurante", "Bar", "Cafetería", "Taberna", "Pizzería",
    "Brasería", "Cervecería", "Mesón", "Asador", "Bistró",
    "Gastrobar", "Tasca", "Tapería", "Marisquería", "Vinoteca"
]

# Nombres de establecimientos (elementos típicos)
elementos_nombre = [
    "El", "La", "Los", "Las", "Casa", "Villa", "Rincón", "Plaza",
    "Puerto", "Jardín", "Sabor", "Aroma", "Gusto", "Mar", "Sol",
    "Luna", "Antigua", "Nuevo", "Viejo", "Real", "Imperial"
]

adjetivos_positivos = [
    "excelente", "delicioso", "fresco", "sabroso", "espectacular",
    "impresionante", "extraordinario", "magnífico", "excepcional",
    "increíble", "perfecto", "exquisito", "fantástico", "sublime"
]

adjetivos_negativos = [
    "malo", "terrible", "pésimo", "deficiente", "horrible",
    "mediocre", "insatisfactorio", "decepcionante", "desagradable",
    "inaceptable", "lamentable", "deplorable", "inferior"
]

aspectos_positivos = [
    "El servicio fue impecable",
    "El ambiente era muy acogedor",
    "La relación calidad-precio es excelente",
    "El personal fue muy atento y profesional",
    "La presentación de los platos fue espectacular",
    "Los ingredientes eran de primera calidad",
    "El local estaba muy bien decorado",
    "La carta es muy variada y original",
    "El chef demuestra gran maestría",
    "Las vistas son espectaculares"
]

aspectos_negativos = [
    "El servicio fue muy lento",
    "El local necesita una renovación urgente",
    "Los precios son excesivamente altos",
    "El personal fue poco atento",
    "La comida llegó fría",
    "Los platos estaban mal presentados",
    "El ambiente era ruidoso",
    "La carta es muy limitada",
    "La limpieza deja mucho que desear",
    "El tiempo de espera fue excesivo"
]

platos_especificos = {
    "Restaurante": ["la paella", "el arroz negro", "los macarrones", "la lubina", "el entrecot"],
    "Bar": ["las tapas", "las croquetas", "la tortilla", "los pinchos", "las bravas"],
    "Cafetería": ["el café", "los pasteles", "los bocadillos", "las tostadas", "los zumos"],
    "Pizzería": ["la pizza", "la pasta", "los calzones", "las ensaladas", "el tiramisú"],
    "Taberna": ["el vino", "el jamón", "los quesos", "las conservas", "los embutidos"]
}

def generar_nombre_establecimiento(tipo):
    """Genera un nombre aleatorio para el establecimiento"""
    if random.random() < 0.3:  # 30% de nombres internacionales
        nombres_internacionales = {
            "Restaurante": ["Il Gusto", "Le Bistrot", "La Maison", "El Bodegón", "La Trattoria"],
            "Bar": ["The Corner", "O'Hara's", "Le Bar", "Der Biergarten", "La Bodeguita"],
            "Cafetería": ["Coffee House", "Le Café", "Tea Time", "Dolce Vita", "Sweet Corner"],
            "Pizzería": ["Bella Napoli", "Pizza Express", "Mamma Mia", "Da Marco", "Little Italy"],
            "Taberna": ["Old Tavern", "La Cave", "Der Keller", "El Bodegón", "La Antigua"]
        }
        return f"{tipo} {random.choice(nombres_internacionales.get(tipo, nombres_internacionales['Restaurante']))}"
    else:
        nombre = random.choice(elementos_nombre)
        apellido = random.choice(["Verde", "Viejo", "Nuevo", "Real", "Grande", "Pequeño", "Antiguo", "Moderno"])
        return f"{tipo} {nombre} {apellido}"

def generar_review(id_review):
    """Genera una reseña completa"""
    tipo = random.choice(tipos_establecimiento)
    nombre = generar_nombre_establecimiento(tipo)

    # Determinar el rating y el tono general
    rating = random.choices([1,2,3,4,5], weights=[10,15,25,25,25])[0]

    # Generar el texto de la reseña
    partes = []

    # Nombre del establecimiento
    partes.append(f"{nombre}:")

    # Comentario sobre la comida
    plato = random.choice(platos_especificos.get(tipo, platos_especificos["Restaurante"]))
    if rating >= 4:
        partes.append(f"{plato.capitalize()} estaba {random.choice(adjetivos_positivos)}.")
        partes.extend(random.sample(aspectos_positivos, 2))
    elif rating <= 2:
        partes.append(f"{plato.capitalize()} estaba {random.choice(adjetivos_negativos)}.")
        partes.extend(random.sample(aspectos_negativos, 2))
    else:
        partes.append(f"{plato.capitalize()} estaba aceptable.")
        partes.append(random.choice(aspectos_positivos))
        partes.append(random.choice(aspectos_negativos))

    # Añadir un comentario final
    if rating >= 4:
        partes.append("Definitivamente volveremos.")
    elif rating <= 2:
        partes.append("No lo recomendamos.")
    else:
        partes.append("Podría mejorar en varios aspectos.")

    return {
        "id": id_review,
        "rating": rating,
        "text": " ".join(partes)
    }

# Generar 100 reseñas
reviews = [generar_review(i+1) for i in range(100)]

# Crear el JSON final
data = {"reviews": reviews}

# Guardar en un archivo
with open('valoraciones_restaurante.json', 'w', encoding='utf-8') as f:
    json.dump(data, f, ensure_ascii=False, indent=4)

# Mostrar algunas estadísticas
ratings = [r["rating"] for r in reviews]
print(f"Distribución de ratings:")
for rating in range(1,6):
    count = ratings.count(rating)
    print(f"{rating} estrellas: {count} reseñas ({count/len(ratings)*100:.1f}%)")

# Mostrar algunas reseñas de ejemplo
print("\nEjemplos de reseñas generadas:")
for review in random.sample(reviews, 3):
    print(f"\nID: {review['id']}")
    print(f"Rating: {review['rating']}")
    print(f"Texto: {review['text']}")

Distribución de ratings:
1 estrellas: 6 reseñas (6.0%)
2 estrellas: 19 reseñas (19.0%)
3 estrellas: 24 reseñas (24.0%)
4 estrellas: 26 reseñas (26.0%)
5 estrellas: 25 reseñas (25.0%)

Ejemplos de reseñas generadas:

ID: 80
Rating: 5
Texto: Tasca El Nuevo: El arroz negro estaba excelente. Las vistas son espectaculares Los ingredientes eran de primera calidad Definitivamente volveremos.

ID: 59
Rating: 2
Texto: Restaurante Jardín Antiguo: La lubina estaba insatisfactorio. La comida llegó fría El ambiente era ruidoso No lo recomendamos.

ID: 67
Rating: 5
Texto: Tasca Villa Real: La paella estaba excepcional. El local estaba muy bien decorado La presentación de los platos fue espectacular Definitivamente volveremos.
