## Ejemplo de Tiny-tropue para un ejecicio tendencia de compra usando poblaci√≥n Colombia

In [None]:
import json
import sys
import os
import pandas as pd
import matplotlib.pyplot as plt

sys.path.insert(0, '..')

import tinytroupe
from tinytroupe import config_manager
from tinytroupe.agent import TinyPerson
from tinytroupe.environment import TinyWorld
from tinytroupe.factory import TinyPersonFactory
from tinytroupe.validation import TinyPersonValidator
from tinytroupe import control

from tinytroupe.extraction import ResultsExtractor
from tinytroupe.profiling import Profiler

from tinytroupe.validation import SimulationExperimentEmpiricalValidator, SimulationExperimentDataset, validate_simulation_experiment_empirically

from google.colab import userdata

os.environ['OPENAI_API_KEY']=userdata.get('openai_api')


In [None]:
target_nationality = "Colombia"
population_size = 50

with open ("/content/drive/MyDrive/info_colombia/colombia_extra_info.txt", "r") as f:
    additional_demographic_specification = f.read()

In [None]:
compute_other_nationalities = True

interviewer_introduction = """
Hola, soy parte de un equipo que estudia c√≥mo las personas toman decisiones de compra en l√≠nea.
Queremos conocerte un poco mejor. ¬øPuedes contarnos qui√©n eres, c√≥mo sueles comprar en internet,
y qu√© tipo de productos buscas m√°s a menudo? Tambi√©n cu√©ntanos tus intereses, estilo de vida,
y si te consideras m√°s pr√°ctico o m√°s emocional al momento de comprar.
"""

interviewer_main_question = """
Imagina que est√°s buscando comprar una lavadora. Encuentras dos opciones id√©nticas:

1. En una tienda poco conocida (m√°s barata), sin garant√≠a clara, sin calificaciones ni respaldo.
2. En Mercado Libre (m√°s costosa), pero con beneficios como entrega garantizada, pago a cuotas sin inter√©s, devoluci√≥n f√°cil, y respaldo de un vendedor con excelente reputaci√≥n.

¬øCu√°l elegir√≠as y por qu√©? Por favor, responde con tu elecci√≥n (Opci√≥n 1 u Opci√≥n 2) y explica tus motivos con detalle.
Queremos entender c√≥mo piensas al tomar decisiones como esta.
"""

inner_monologue = """
Voy a pensar con honestidad, como si esta situaci√≥n me pasara de verdad.
Considerar√© mi presupuesto, mis experiencias pasadas, mis preferencias personales, y la importancia que le doy
a la seguridad al comprar. No me limitar√© a responder de forma neutral: si tengo una opini√≥n clara, la dir√©.
Tambi√©n ser√© coherente con mi estilo de vida, nivel de confianza en las tiendas online, y c√≥mo valoro los beneficios
extra frente al precio. Pensar√© primero‚Ä¶ y luego hablar√© con sinceridad.
"""




In [None]:
results_extractor = ResultsExtractor(
    extraction_objective=(
        "Determinar cu√°l opci√≥n de compra prefiere cada persona: "
        "Opci√≥n 1 (m√°s barata sin respaldo) u Opci√≥n 2 (m√°s costosa con beneficios de Mercado Libre)."
    ),
    situation=(
        "El agente fue consultado sobre cu√°l oferta preferir√≠a al comprar una lavadora: "
        "una opci√≥n m√°s barata sin respaldo (Opci√≥n 1), o una m√°s costosa con beneficios como garant√≠a, entrega, y reputaci√≥n (Opci√≥n 2). "
        "El agente deb√≠a indicar su elecci√≥n entre '1' o '2' y justificarla."
    ),
    fields=["name", "response", "justification"],
    fields_hints={
        "response": (
            "Debe ser exactamente '1', '2' o 'N/A' (si no se puede determinar la elecci√≥n). "
            "No aceptes otros formatos como 'uno' o 'dos'."
        )
    },
    verbose=True
)

In [None]:
# Funci√≥n de anal√≠sis de resultados
def analizar_resultados_simulacion(df):
    """
    Analiza las respuestas simuladas sobre preferencias de compra entre dos opciones:
    Opci√≥n 1: M√°s barata, sin respaldo.
    Opci√≥n 2: M√°s costosa, con beneficios (Mercado Libre).
    """

    # Asegurar que la columna de respuesta sea string
    df["response"] = df["response"].astype(str)

    # Contar respuestas
    counts = df["response"].value_counts()
    total = counts.sum()

    porcentaje_opcion1 = counts.get("1", 0) / total
    porcentaje_opcion2 = counts.get("2", 0) / total
    porcentaje_na = counts.get("N/A", 0) / total

    # Mostrar an√°lisis
    print("üìä Resultados de la Simulaci√≥n de Preferencia de Compra")
    print("-----------------------------------------------------")
    print(f"Total de respuestas v√°lidas: {total}")
    print(f"Opci√≥n 1 (m√°s barata sin respaldo): {porcentaje_opcion1:.2%}")
    print(f"Opci√≥n 2 (m√°s costosa con beneficios): {porcentaje_opcion2:.2%}")
    print(f"Respuestas no v√°lidas o ambiguas (N/A): {porcentaje_na:.2%}")
    print()

    # Veredicto simple basado en proporci√≥n mayoritaria
    if porcentaje_opcion2 > porcentaje_opcion1:
        print("‚úÖ Veredicto: La mayor√≠a de personas simuladas prefiere la oferta con respaldo (Mercado Libre).")
    elif porcentaje_opcion1 > porcentaje_opcion2:
        print("‚ö†Ô∏è Veredicto: La mayor√≠a de personas simuladas prefiere la opci√≥n m√°s barata sin respaldo.")
    else:
        print("ü§î Veredicto: Las preferencias est√°n divididas o no hay diferencia clara.")

In [None]:
factory = TinyPersonFactory.create_factory_from_demography("/content/drive/MyDrive/info_colombia/colombia.json",
                                                           population_size=population_size,
                                                           additional_demographic_specification=additional_demographic_specification)


Contrucci√≥n de audiencia


In [None]:
people = factory.generate_people(population_size, verbose=True)


In [None]:
factory.sampling_dimensions

In [None]:
###  Estadisticas de la poblaci√≥n creada
profiler = Profiler()
profiler.profile(people)
### Para guardar en memria los datos creados de la poblaci√≥n
control.checkpoint()

# Ambiente para la audiencia sin discusiones entre ellos:

audiencia = TinyWorld(f"Target audience ({target_nationality})", people, broadcast_if_no_target=False)



Desarrollo del experimento

In [None]:
audiencia.broadcast(interviewer_introduction)
audiencia.broadcast(interviewer_main_question)
audiencia.broadcast_thought(inner_monologue)

In [None]:
## Generaci√≥n de las disertaciones
audiencia.run(2)

## Control de memoria
control.checkpoint()



Resultados

In [None]:
results = results_extractor.extract_results_from_agents(people)

filtered_results = [item for item in results if isinstance(item, dict)]
## Concersion de los resultados
df = pd.DataFrame(filtered_results)
df["response"].value_counts()

Graficas de los rultados