In [11]:
import pandas as pd
import matplotlib.pyplot as plt
import os
from urllib.parse import urlparse, parse_qs
import unicodedata

# Cargar datos
df_clima = pd.read_csv("datos_recomendacion_turismo.csv")
df_contenido = pd.read_excel("turismo_departamento_con_clima_y_contenido.xlsx")
df_imagenes = pd.read_excel("../imagenesdepartamentos/imagenes_departamentos24.xlsx")
df_festividades = pd.read_excel("festividades_lugares_contenido.xlsx")
df_actividades = pd.read_csv("../Actividades/actividades_turisticas_peru_getyourguide.csv")
df_alojamientos = pd.read_csv("../Alojamientos/Lugares_recomendados_peru_airbnb.csv")
df_transporte = pd.read_excel("../Transporte/viajes_lima_destinos10.xlsx")  # NUEVO

# Normalizar nombres
def normalizar(texto):
    if pd.isna(texto):
        return ""
    texto = str(texto).strip().upper()
    texto = unicodedata.normalize('NFD', texto).encode('ascii', 'ignore').decode("utf-8")
    return texto

for df in [df_clima, df_contenido, df_imagenes, df_actividades]:
    df["Departamento"] = df["Departamento"].str.strip().str.upper()

df_festividades["Departamento_Original"] = df_festividades["Departamento"]
df_festividades["Departamento"] = df_festividades["Departamento"].apply(normalizar)
df_alojamientos["departamento"] = df_alojamientos["departamento"].str.strip().str.upper()
df_transporte["Destino"] = df_transporte["Destino"].str.strip().str.upper()

# Crear carpeta de salida
os.makedirs("paginas", exist_ok=True)

meses = ["Ene", "Feb", "Mar", "Abr", "May", "Jun", 
         "Jul", "Ago", "Sep", "Oct", "Nov", "Dic"]

imagen_por_defecto = "https://upload.wikimedia.org/wikipedia/commons/thumb/6/65/Bandera_del_Per%C3%BA.png/640px-Bandera_del_Per%C3%BA.png"

def capitalizar(nombre):
    return nombre.title()

def extraer_id_youtube(url):
    parsed = urlparse(url)
    if 'youtube' in parsed.netloc:
        return parse_qs(parsed.query).get('v', [''])[0]
    elif 'youtu.be' in parsed.netloc:
        return parsed.path[1:]
    return ''

template = """
<!DOCTYPE html>
<html lang="es">
<head>
  <meta charset="UTF-8">
  <title>Información Turística - {titulo}</title>
  <style>
    body {{
      font-family: 'Segoe UI', sans-serif;
      background-color: #fffaf4;
      color: #333;
      max-width: 900px;
      margin: auto;
      padding: 30px;
      border-radius: 12px;
      box-shadow: 0 0 12px rgba(0,0,0,0.08);
    }}
    h1 {{ color: #c0392b; }}
    h2 {{ color: #2c3e50; margin-top: 40px; }}
    img {{ max-width: 100%; }}
    .banner-img {{
      width: 100%;
      height: 240px;
      object-fit: cover;
      border-radius: 12px;
      margin-bottom: 20px;
    }}
    .descripcion {{ font-size: 17px; margin: 20px 0; line-height: 1.6; }}
    .info-box {{
      background: #f0fff4;
      padding: 15px;
      border-left: 6px solid #27ae60;
      margin: 20px 0;
      border-radius: 6px;
    }}
    .volver {{
      display: inline-block;
      margin-top: 40px;
      background: #c0392b;
      color: white;
      padding: 10px 20px;
      border-radius: 6px;
      text-decoration: none;
    }}
    .media-grid {{
      display: flex;
      flex-wrap: wrap;
      gap: 20px;
    }}
    .media-column {{
      flex: 1;
      min-width: 300px;
    }}
    .contenido-box {{
      font-size: 14px;
      line-height: 1.4;
      margin-bottom: 16px;
      padding: 12px 15px;
      border-radius: 10px;
      box-shadow: 0 2px 6px rgba(0,0,0,0.05);
    }}
    .noticia {{ background: #fef5f5; border-left: 5px solid #e74c3c; }}
    .video {{ background: #f0f8ff; border-left: 5px solid #2980b9; }}
    .contenido-box a {{
      font-weight: bold;
      display: inline-block;
      margin-top: 5px;
      color: #1a0dab;
      text-decoration: none;
    }}
    .contenido-box a:hover {{ text-decoration: underline; }}
    .video-thumb {{
      margin-top: 10px;
      width: 100%;
      border-radius: 6px;
    }}
    .oculto {{ display: none; }}
    .boton-vermas {{
      background-color: #007bff;
      color: white;
      padding: 8px 16px;
      border: none;
      border-radius: 6px;
      cursor: pointer;
      margin: 20px 0;
    }}
    .boton-vermas:hover {{ background-color: #0056b3; }}
    .festividad-grid {{
      display: grid;
      grid-template-columns: repeat(auto-fit, minmax(280px, 1fr));
      gap: 20px;
      margin: 20px 0;
    }}
    .festividad {{ background: #fdfde7; border-left: 5px solid #f39c12; }}
  </style>
</head>
<body>
  <h1>🌄 {titulo}</h1>
  <h2>Información turística</h2>
  <img class="banner-img" src="{imagen}" alt="Imagen de {titulo}">
  <div class="descripcion">{descripcion}</div>
  <div class="info-box">
    <strong>Clima promedio estimado:</strong> {temperatura:.1f} °C<br>
    <strong>Clasificación del clima:</strong> {clima}<br>
    <strong>Mes de referencia:</strong> {mes}
  </div>
  {seccion_transporte}
  <h2>🎉 Festividades en {titulo}</h2>
  <div class="festividad-grid">{seccion_festividades}</div>
  {boton_ver_festividades}
  <h2>🏕️ Actividades recomendadas en {titulo}</h2>
  <div class="festividad-grid">{seccion_actividades}</div>
  {boton_ver_actividades}
  <h2>🏨 Alojamientos recomendados en {titulo}</h2>
  <div class="festividad-grid">{seccion_alojamientos}</div>
  {boton_ver_alojamientos}
  <h2>🌡️ Clima mensual en {titulo}</h2>
  <img src="{grafico}" alt="Gráfico del clima en {titulo}">
  <h2>📰 Noticias y 📺 Videos recomendados</h2>
  <div class="media-grid">
    <div class="media-column">
      <h3>📰 Noticias</h3>
      {seccion_noticias}
      {boton_ver_mas}
    </div>
    <div class="media-column">
      <h3>📺 Videos</h3>
      {seccion_videos}
    </div>
  </div>
  <a class="volver" href="index.html">← Volver al recomendador</a>
  <script>
    function mostrarNoticias() {{
      document.querySelectorAll('.noticia.oculto').forEach(e => e.style.display = 'block');
      document.getElementById('botonNoticias').style.display = 'none';
    }}
    function mostrarFestividades() {{
      document.querySelectorAll('.festividad.oculto').forEach(e => e.style.display = 'block');
      document.getElementById('botonFestividades').style.display = 'none';
    }}
    function mostrarActividades() {{
      document.querySelectorAll('.festividad.oculto').forEach(e => e.style.display = 'block');
      document.getElementById('botonActividades').style.display = 'none';
    }}
    function mostrarAlojamientos() {{
      document.querySelectorAll('.festividad.oculto').forEach(e => e.style.display = 'block');
      document.getElementById('botonAlojamientos').style.display = 'none';
    }}
  </script>
</body>
</html>
"""
for depto in df_clima["Departamento"].unique():
    df_info = df_clima[df_clima["Departamento"] == depto].iloc[0]
    df_depto_cont = df_contenido[df_contenido["Departamento"] == depto]
    if df_depto_cont.empty:
        continue

    df_depto_mensual = df_clima[df_clima["Departamento"] == depto]
    temperaturas = [
        df_depto_mensual[df_depto_mensual["Mes"].str.lower() == mes.lower()]["Temperatura"].values[0]
        if not df_depto_mensual[df_depto_mensual["Mes"].str.lower() == mes.lower()].empty else None
        for mes in meses
    ]
    plt.figure(figsize=(10, 4))
    plt.plot(meses, temperaturas, marker='o', color="#007b33")
    plt.xticks(rotation=45)
    plt.title(f"Temperatura mensual en {capitalizar(depto)}")
    plt.ylabel("°C")
    min_temp = min([t for t in temperaturas if t is not None])
    max_temp = max([t for t in temperaturas if t is not None])
    plt.ylim(min_temp - 1, max_temp + 1)
    plt.tight_layout()
    ruta_grafico = f"paginas/clima_{depto.lower().replace(' ', '_')}.png"
    plt.savefig(ruta_grafico)
    plt.close()

    # Sección de transporte
    transporte_df = df_transporte[df_transporte["Destino"] == depto]
    seccion_transporte = ""
    if not transporte_df.empty:
        seccion_transporte = "<h2>🚗 Cuánto tardo en llegar desde Lima</h2><div class='info-box'>"
        for row in transporte_df.itertuples():
            seccion_transporte += f"<p>✈️🚌 <strong>{row.Transporte.title()}:</strong> {row._4}</p>"
        seccion_transporte += "</div>"

    # Festividades
    depto_norm = normalizar(depto)
    festividades = df_festividades[df_festividades["Departamento"] == depto_norm]
    seccion_festividades = ""
    for i, row in enumerate(festividades.itertuples()):
        clase_extra = " oculto" if i >= 9 else ""
        yt_id = extraer_id_youtube(row.URL)
        thumb = f'<a href="{row.URL}" target="_blank"><img class="video-thumb" src="https://img.youtube.com/vi/{yt_id}/0.jpg"></a>' if yt_id else ""
        seccion_festividades += f"""
        <div class="contenido-box festividad{clase_extra}">
            <p>🎊 <strong>{row.Festividades}</strong> ({row.Fechas})</p>
            <p>📍 {row.Lugar}</p>
            <p><strong>{row._5}</strong></p>
            <a href="{row.URL}" target="_blank">Ver video</a>
            {thumb}
        </div>
        """
    boton_ver_festividades = ''
    if len(festividades) > 9:
        boton_ver_festividades = '<button id="botonFestividades" class="boton-vermas" onclick="mostrarFestividades()">Ver más festividades</button>'

    # Actividades
    actividades = df_actividades[df_actividades["Departamento"] == depto]
    seccion_actividades = ""
    for i, row in enumerate(actividades.itertuples()):
        clase_extra = " oculto" if i >= 6 else ""
        seccion_actividades += f"""
        <div class="contenido-box festividad{clase_extra}">
            <p>🎯 <strong>{row.Actividad}</strong></p>
            <p>⏱ {row.Duración}</p>
            <p>💵 {row.Precio} | ⭐ {row.Calificación} ({row.Reseñas})</p>
            <a href="{row.Enlace}" target="_blank">Ver actividad</a>
        </div>
        """
    boton_ver_actividades = ''
    if len(actividades) > 6:
        boton_ver_actividades = '<button id="botonActividades" class="boton-vermas" onclick="mostrarActividades()">Ver más actividades</button>'

    # Alojamientos
    alojamientos = df_alojamientos[df_alojamientos["departamento"] == depto]
    seccion_alojamientos = ""
    for i, row in enumerate(alojamientos.itertuples()):
        clase_extra = " oculto" if i >= 6 else ""
        seccion_alojamientos += f"""
        <div class="contenido-box festividad{clase_extra}">
            <p>🏨 <strong>{row.lugar_recomendado}</strong></p>
            <p>{row.descripcion}</p>
            <p>💵 {row.precio} | ⌛ {row.duracion}</p>
            <a href="{row.url}" target="_blank">Ver alojamiento</a>
        </div>
        """
    boton_ver_alojamientos = ''
    if len(alojamientos) > 6:
        boton_ver_alojamientos = '<button id="botonAlojamientos" class="boton-vermas" onclick="mostrarAlojamientos()">Ver más alojamientos</button>'

    # Noticias y videos
    noticias = df_depto_cont[df_depto_cont["Tipo"].str.lower() == "noticia"]
    videos = df_depto_cont[df_depto_cont["Tipo"].str.lower() == "video"]

    def generar_bloques(df, tipo, limitar=None):
        html = []
        for i, row in enumerate(df.itertuples()):
            visible = "" if (limitar is None or i < limitar) else "oculto"
            clase = "noticia" if tipo == "noticia" else "video"
            emoji = "📰" if tipo == "noticia" else "📺"
            thumb = ""
            if tipo == "video":
                yt_id = extraer_id_youtube(row.Fuente)
                if yt_id:
                    thumb_url = f"https://img.youtube.com/vi/{yt_id}/0.jpg"
                    thumb = f'<a href="{row.Fuente}" target="_blank"><img class="video-thumb" src="{thumb_url}"></a>'
            html.append(f"""
                <div class="contenido-box {clase} {visible}">
                    <p>{emoji} <strong>{row.Contenido}</strong></p>
                    <a href="{row.Fuente}" target="_blank">Ver {tipo}</a>
                    {thumb}
                </div>
            """)
        return "\n".join(html)

    seccion_noticias = generar_bloques(noticias, "noticia", limitar=5)
    seccion_videos = generar_bloques(videos, "video")
    boton_ver_mas = ""
    if len(noticias) > 5:
        boton_ver_mas = '<button id="botonNoticias" class="boton-vermas" onclick="mostrarNoticias()">Ver más noticias</button>'

    # Imagen del departamento
    imagen_fila = df_imagenes[df_imagenes["Departamento"] == depto]
    imagen_depto = imagen_fila["Imagen_URL"].values[0] if not imagen_fila.empty else imagen_por_defecto

    # Crear HTML final
    html = template.format(
        titulo=capitalizar(depto),
        descripcion=df_depto_cont.iloc[0]["descripcion"],
        temperatura=float(df_info["Temperatura"]),
        clima=df_info["Clima"],
        mes=df_info["Mes"],
        imagen=imagen_depto,
        grafico=os.path.basename(ruta_grafico),
        seccion_transporte=seccion_transporte,
        seccion_festividades=seccion_festividades,
        boton_ver_festividades=boton_ver_festividades,
        seccion_actividades=seccion_actividades,
        boton_ver_actividades=boton_ver_actividades,
        seccion_alojamientos=seccion_alojamientos,
        boton_ver_alojamientos=boton_ver_alojamientos,
        seccion_noticias=seccion_noticias,
        seccion_videos=seccion_videos,
        boton_ver_mas=boton_ver_mas
    )

    nombre_archivo = f"info_{depto.lower().replace(' ', '_')}.html"
    with open(os.path.join("paginas", nombre_archivo), "w", encoding="utf-8") as f:
        f.write(html)

print("✅ Páginas secundarias generadas ")


✅ Páginas secundarias generadas 
