# Generar 1000 registros de visitantes

In [1]:
from pathlib import Path
import csv
import random
from datetime import datetime, timedelta

# 1️⃣ Crear carpeta "data" si no existe
data_path = Path.cwd() / "../data"
data_path.mkdir(parents=True, exist_ok=True)

# 2️⃣ Definir archivo CSV de salida
csv_file = data_path / "visitantes.csv"

# 3️⃣ Listas base para datos turísticos
paises_origen = ["Perú", "Chile", "Colombia", "Estados Unidos", "España", "Brasil", "Argentina", "México", "NA"]
regiones_destinos = {
    "Cusco": ["Machu Picchu", "Valle Sagrado", "Sacsayhuamán"],
    "Puno": ["Lago Titicaca", "Islas Flotantes Uros", "Taquile"],
    "Lima": ["Parque de la Reserva", "Barranco", "Huaca Pucllana"],
    "Arequipa": ["Cañón del Colca", "Plaza de Armas", "Monasterio de Santa Catalina"],
    "Iquitos": ["Río Amazonas", "Reserva Nacional Pacaya Samiria", "Malecón Tarapacá"]
}
medios_transporte = ["Avión", "Bus", "Auto", "Tren", "Mototaxi", "NA", None]
generos = ["M", "F", "Otro"]

# 4️⃣ Generar fecha aleatoria entre enero y septiembre de 2025
def generar_fecha_visita():
    inicio = datetime(2025, 1, 1)
    fin = datetime(2025, 9, 30)  # Hasta finales de septiembre
    delta = fin - inicio
    fecha_random = inicio + timedelta(days=random.randint(0, delta.days))
    return fecha_random.strftime("%Y-%m-%d")

# 5️⃣ Generar 3000 registros simulados
registros = []
for i in range(1, 3001):
    id_visitante = f"V{i:04d}"
    pais_origen = random.choice(paises_origen)
    edad = random.randint(15, 80) if random.random() > 0.02 else None  # 2% nulos
    genero = random.choice(generos)
    
    region = random.choice(list(regiones_destinos.keys()))
    destino = random.choice(regiones_destinos[region])
    
    fecha_visita = generar_fecha_visita()
    dias_estadia = random.randint(1, 14) if random.random() > 0.05 else None  # 5% nulos
    gasto_total = round(random.uniform(200, 5000), 2) if dias_estadia is not None else None
    medio_transporte = random.choice(medios_transporte)

    registros.append([
        id_visitante,
        pais_origen,
        edad,
        genero,
        destino,
        region,
        fecha_visita,
        dias_estadia,
        gasto_total,
        medio_transporte
    ])

# 6️⃣ Escribir en el archivo CSV
with open(csv_file, mode="w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow([
        "id_visitante", "pais_origen", "edad", "genero", "destino",
        "region", "fecha_visita", "dias_estadia", "gasto_total", "medio_transporte"
    ])
    writer.writerows(registros)

print(f"✅ Archivo generado correctamente en: {csv_file}")
print(f"📊 Total de registros: {len(registros)}")


✅ Archivo generado correctamente en: d:\AcutalCiclo\Topicos en sistemas inteligentes\TurismoDigitalB_E1Yoel\scripts\..\data\visitantes.csv
📊 Total de registros: 3000
