In [5]:
!pip install pandas openpyxl requests beautifulsoup4



# Extraer 4 filas Excel al Programa

In [10]:
# ========================================
# C√ìDIGO COMPLETO PARA GOOGLE COLAB
# Copiar filas de Excel a celdas espec√≠ficas
# ========================================

# Paso 1: Importar librer√≠as y conectar Google Drive
try:
    from google.colab import drive
    import pandas as pd
    from openpyxl import load_workbook
    import re
    import os

    print("=== CONECTANDO CON GOOGLE DRIVE ===")
    drive.mount('/content/drive')
    print("‚úÖ Google Drive conectado exitosamente!")

except ImportError:
    print("‚ÑπÔ∏è  Ejecut√°ndose fuera de Google Colab")
    import pandas as pd
    from openpyxl import load_workbook
    import re
    import os

# Paso 2: Funci√≥n principal mejorada
def copiar_filas_celdas_especificas(archivo_excel, hoja_origen, hoja_destino, mapeo_celdas, filtro=None, num_filas=None, espaciado=8):
    """
    Copia m√∫ltiples filas de una hoja a celdas espec√≠ficas en otra hoja.

    Par√°metros:
    archivo_excel (str): Ruta del archivo Excel
    hoja_origen (str): Nombre de la hoja de origen
    hoja_destino (str): Nombre de la hoja de destino
    mapeo_celdas (dict): Diccionario que mapea columnas de origen a celdas de destino
    filtro (tuple): (columna, valor) para filtrar filas espec√≠ficas
    num_filas (int): N√∫mero de √∫ltimas filas a copiar
    espaciado (int): N√∫mero de filas de espacio entre cada bloque de datos
    """
    try:
        print(f"\n{'='*60}")
        print("INICIANDO PROCESO DE COPIA")
        print(f"{'='*60}")
        print(f"üìÅ Archivo: {os.path.basename(archivo_excel)}")

        # Verificar que el archivo existe
        if not os.path.exists(archivo_excel):
            raise FileNotFoundError(f"El archivo {archivo_excel} no existe")

        # Leer la hoja de origen
        print(f"\n1Ô∏è‚É£ Leyendo hoja '{hoja_origen}'...")
        df_origen = pd.read_excel(archivo_excel, sheet_name=hoja_origen)
        print(f"   ‚úÖ {len(df_origen)} filas le√≠das")
        print(f"   ‚úÖ {len(df_origen.columns)} columnas encontradas")

        # Aplicar filtro si se especifica
        if filtro:
            columna, valor = filtro
            print(f"\n2Ô∏è‚É£ Aplicando filtro: {columna} = '{valor}'")

            if columna not in df_origen.columns:
                print(f"   ‚ùå Columna '{columna}' no existe")
                print(f"   üìã Columnas disponibles: {list(df_origen.columns)}")
                return

            df_filtrado = df_origen[df_origen[columna] == valor]
            print(f"   ‚úÖ {len(df_filtrado)} filas despu√©s del filtro")

            if len(df_filtrado) == 0:
                print(f"   ‚ö†Ô∏è  No se encontraron filas con {columna} = '{valor}'")
                valores_unicos = df_origen[columna].dropna().unique()
                print(f"   üìä Valores disponibles: {list(valores_unicos)}")
                return
        else:
            df_filtrado = df_origen
            print(f"\n2Ô∏è‚É£ Sin filtro aplicado - usando todas las filas")

        # Seleccionar las √∫ltimas n filas si se especifica
        if num_filas:
            print(f"\n3Ô∏è‚É£ Seleccionando √∫ltimas {num_filas} filas...")
            filas_a_copiar = df_filtrado.tail(num_filas)
        else:
            filas_a_copiar = df_filtrado
            print(f"\n3Ô∏è‚É£ Usando todas las filas filtradas")

        print(f"   ‚úÖ {len(filas_a_copiar)} filas finales a procesar")

        # Verificar columnas del mapeo
        print(f"\n4Ô∏è‚É£ Verificando columnas del mapeo...")
        columnas_encontradas = 0
        columnas_faltantes = []

        for columna in mapeo_celdas.keys():
            if columna in df_origen.columns:
                columnas_encontradas += 1
            else:
                columnas_faltantes.append(columna)

        print(f"   ‚úÖ {columnas_encontradas}/{len(mapeo_celdas)} columnas encontradas")

        if columnas_faltantes:
            print(f"   ‚ö†Ô∏è  Columnas no encontradas: {columnas_faltantes[:3]}...")  # Solo mostrar las primeras 3

        # Cargar el archivo con openpyxl
        print(f"\n5Ô∏è‚É£ Abriendo archivo Excel para escritura...")
        wb = load_workbook(filename=archivo_excel)

        # Verificar que la hoja destino existe
        if hoja_destino not in wb.sheetnames:
            print(f"   ‚ùå Hoja '{hoja_destino}' no existe")
            print(f"   üìÑ Hojas disponibles: {wb.sheetnames}")
            wb.close()
            return

        hoja_dest = wb[hoja_destino]
        print(f"   ‚úÖ Hoja destino '{hoja_destino}' abierta")

        # Funci√≥n para extraer letra y n√∫mero de una celda
        def extraer_coords(celda):
            match = re.match(r'([A-Z]+)(\d+)', celda.upper())
            if match:
                return match.group(1), int(match.group(2))
            else:
                raise ValueError(f"Formato de celda inv√°lido: {celda}")

        # Procesar cada fila
        print(f"\n6Ô∏è‚É£ Copiando datos...")
        valores_copiados = 0

        for idx, (_, fila) in enumerate(filas_a_copiar.iterrows()):
            desplazamiento = idx * (espaciado + 18)  # 18 es el rango original (19-2)
            print(f"   üìù Procesando fila {idx + 1}/{len(filas_a_copiar)} (desplazamiento: {desplazamiento})")

            # Copiar cada valor a su celda correspondiente
            fila_valores = 0
            for columna, celda_base in mapeo_celdas.items():
                try:
                    # Verificar que la columna existe en los datos
                    if columna not in fila.index:
                        continue

                    # Calcular nueva posici√≥n
                    letra, numero = extraer_coords(celda_base)
                    nuevo_numero = numero + desplazamiento
                    nueva_celda = f"{letra}{nuevo_numero}"

                    # Obtener el valor
                    valor = fila[columna]

                    # Manejar valores NaN o None
                    if pd.isna(valor):
                        valor = ""

                    # Asignar el valor a la celda
                    hoja_dest[nueva_celda] = valor
                    valores_copiados += 1
                    fila_valores += 1

                except Exception as e:
                    print(f"      ‚ùå Error en columna '{columna}': {str(e)}")

            print(f"      ‚úÖ {fila_valores} valores copiados en esta fila")

        # Guardar los cambios
        print(f"\n7Ô∏è‚É£ Guardando cambios...")
        wb.save(archivo_excel)
        wb.close()

        print(f"\nüéâ PROCESO COMPLETADO EXITOSAMENTE!")
        print(f"   üìä {valores_copiados} valores totales copiados")
        print(f"   üìÑ {len(filas_a_copiar)} filas procesadas")
        print(f"   üíæ Archivo guardado correctamente")

    except FileNotFoundError as e:
        print(f"‚ùå Error: Archivo no encontrado - {str(e)}")
    except Exception as e:
        print(f"‚ùå Error inesperado: {str(e)}")
        import traceback
        traceback.print_exc()

# Paso 3: Definir el mapeo entre columnas y celdas
mapeo_celdas = {
    'SEMANA': 'B2',
    'PRESIDENCIA': 'O2',
    'ORACI√ìN': 'O3',
    'TESOROS DE LA BIBLIA': 'O5',
    'BUSQUEMOS PERLAS ESCONDIDAS': 'O6',
    'LECTURA DE LA BIBLIA': 'O7',
    'SMM ASIG 1 ESTUD': 'L9',
    'SMM ASIG 1 ACOMP': 'O9',
    'SMM ASIG 2 ESTUD': 'L10',
    'SMM ASIG 2 ACOMP': 'O10',
    'SMM ASIG 3 ESTUD': 'L11',
    'SMM ASIG 3 ACOMP': 'O11',
    'SMM ASIG 4 ESTUD': 'L12',
    'SMM ASIG 4 ACOMP': 'O12',
    'NVC PARTE 1': 'O15',
    'NVC PARTE 2': 'O16',
    'ESTUDIO LIBRO': 'O17',
    'LECTOR LIBRO': 'O18',
    'ORACI√ìN FINAL': 'O19',

}

# Paso 4: Definir la ruta del archivo
archivo_excel = '/content/drive/MyDrive/JW/Super VMC/Programaci√≥n-VMC/Programador_VMC/Programaci√≥n VMC_Septiembre-2024-2025.xlsx'

# Paso 5: EJEMPLOS DE USO
print("="*60)
print("C√ìDIGO LISTO PARA EJECUTAR")
print("="*60)
print("Descomenta una de las opciones siguientes seg√∫n lo que necesites:\n")

# OPCI√ìN 1: Filtrar por mes espec√≠fico
print("# OPCI√ìN 1: Filtrar por mes AGOSTO")
print("copiar_filas_celdas_especificas(")
print("    archivo_excel=archivo_excel,")
print("    hoja_origen='BD ASIG',")
print("    hoja_destino='Formato',")
print("    mapeo_celdas=mapeo_celdas,")
print("    filtro=('MES', 'AGOSTO')")
print(")")

print("\n# OPCI√ìN 2: √öltimas 4 filas")
print("copiar_filas_celdas_especificas(")
print("    archivo_excel=archivo_excel,")
print("    hoja_origen='BD ASIG',")
print("    hoja_destino='Formato',")
print("    mapeo_celdas=mapeo_celdas,")
print("    num_filas=4")
print(")")

print("\n# OPCI√ìN 3: Filtrar por otro mes (ejemplo: SEPTIEMBRE)")
print("# copiar_filas_celdas_especificas(")
print("#     archivo_excel=archivo_excel,")
print("#     hoja_origen='BD ASIG',")
print("#     hoja_destino='Formato',")
print("#     mapeo_celdas=mapeo_celdas,")
print("#     filtro=('MES', 'SEPTIEMBRE')")
print("# )")

print(f"\nüí° INSTRUCCIONES:")
print("1. Copia TODO este c√≥digo en una celda de Colab")
print("2. Ejecuta la celda (aparecer√°n las opciones)")
print("3. Descomenta la opci√≥n que necesites")
print("4. Ejecuta nuevamente")

# Descomenta UNA de estas opciones para ejecutar:

# Para filtrar por mes AGOSTO:
copiar_filas_celdas_especificas(
    archivo_excel=archivo_excel,
    hoja_origen='BD ASIG',
    hoja_destino='Formato',
    mapeo_celdas=mapeo_celdas,
    filtro=('MES', 'AGOSTO')
)

# Para √∫ltimas 4 filas:
# copiar_filas_celdas_especificas(
#     archivo_excel=archivo_excel,
#     hoja_origen='BD ASIG',
#     hoja_destino='Formato',
#     mapeo_celdas=mapeo_celdas,
#     num_filas=4
# )

=== CONECTANDO CON GOOGLE DRIVE ===
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
‚úÖ Google Drive conectado exitosamente!
C√ìDIGO LISTO PARA EJECUTAR
Descomenta una de las opciones siguientes seg√∫n lo que necesites:

# OPCI√ìN 1: Filtrar por mes AGOSTO
copiar_filas_celdas_especificas(
    archivo_excel=archivo_excel,
    hoja_origen='BD ASIG',
    hoja_destino='Formato',
    mapeo_celdas=mapeo_celdas,
    filtro=('MES', 'AGOSTO')
)

# OPCI√ìN 2: √öltimas 4 filas
copiar_filas_celdas_especificas(
    archivo_excel=archivo_excel,
    hoja_origen='BD ASIG',
    hoja_destino='Formato',
    mapeo_celdas=mapeo_celdas,
    num_filas=4
)

# OPCI√ìN 3: Filtrar por otro mes (ejemplo: SEPTIEMBRE)
# copiar_filas_celdas_especificas(
#     archivo_excel=archivo_excel,
#     hoja_origen='BD ASIG',
#     hoja_destino='Formato',
#     mapeo_celdas=mapeo_celdas,
#     filtro=('MES', 'SEPTIEMBRE')
# )

üí° INSTRUCCIONES:

# Extracci√≥n de Datos de Web wol.jw.org - Semanas Reuni√≥n

In [18]:
# ========================================
# SCRIPT: EXTRACTOR DE INFORMACI√ìN WOL - GOOGLE COLAB
# ========================================
# INSTRUCCIONES: Solo necesitas cambiar las URLs de abajo por las semanas que quieres procesar
# Ejemplo de URL: "https://wol.jw.org/es/wol/meetings/r4/lp-s/2024/11/3"

URLS_A_PROCESAR = [
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/32",
    # "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/33",
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/34",
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/35"

    # AGREGAR M√ÅS URLs AQU√ç - UNA POR L√çNEA
    # "https://wol.jw.org/es/wol/meetings/r4/lp-s/2024/12/2",
    # "https://wol.jw.org/es/wol/meetings/r4/lp-s/2024/12/3",
]

# ========================================
# INSTALACI√ìN DE DEPENDENCIAS (SOLO PARA COLAB)
# ========================================

# Instalar dependencias necesarias en Google Colab
try:
    import google.colab
    print("üîß Instalando dependencias para Google Colab...")
    !pip install requests beautifulsoup4 pandas openpyxl -q
    print("‚úÖ Dependencias instaladas correctamente")
except ImportError:
    print("‚ÑπÔ∏è  Ejecut√°ndose fuera de Google Colab - usando dependencias del sistema")

# ========================================
# C√ìDIGO PRINCIPAL
# ========================================

import pandas as pd
import time
import requests
from bs4 import BeautifulSoup
import re
from datetime import datetime

def extraer_informacion(url):
    """
    Extrae informaci√≥n de una p√°gina de WOL de reuni√≥n de entre semana.

    Par√°metros:
    url (str): URL de la p√°gina WOL

    Retorna:
    dict: Diccionario con la informaci√≥n extra√≠da
    """
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
        }
        response = requests.get(url, headers=headers)
        response.raise_for_status()

        soup = BeautifulSoup(response.content, 'html.parser')

        # Inicializar el diccionario de informaci√≥n
        info = {
            "semana": "",
            "libro": "",
            "cancion_inicial": "",
            "tesoros": "",
            "segunda_cancion": "",
            "tercera_cancion": "",
            "titulos_maestros": [],
            "nvc_titulo1": "",
            "nvc_titulo2": "",
            "nvc_titulo3": "",
            "info_lectura_biblia": "",  # NUEVO CAMPO
            "info_estudio_libro": ""  # NUEVO CAMPO PARA ESTUDIO DEL LIBRO
        }

        # 1. EXTRAER SEMANA - Buscar h1 con id='p1'
        semana_elem = soup.find('h1', id='p1')
        if semana_elem:
            info["semana"] = semana_elem.get_text(strip=True)

        # 2. EXTRAER LIBRO DE ESTUDIO - Buscar h2 con id='p2'
        libro_elem = soup.find('h2', id='p2')
        if libro_elem:
            strong_tag = libro_elem.find('strong')
            if strong_tag:
                info["libro"] = strong_tag.get_text(strip=True)
            else:
                info["libro"] = libro_elem.get_text(strip=True)

        # 3. EXTRAER CANCIONES
        # Primera canci√≥n - h3 con id='p3'
        cancion_elem = soup.find('h3', id='p3')
        if cancion_elem:
            cancion_text = cancion_elem.get_text(strip=True)
            match = re.search(r'Canci√≥n\s+(\d+)', cancion_text)
            if match:
                info["cancion_inicial"] = f"Canci√≥n {match.group(1)}"

        # Extraer todas las canciones restantes
        todas_h3 = soup.find_all('h3')
        canciones_encontradas = []
        cancion_inicial_texto = cancion_elem.get_text(strip=True) if cancion_elem else ""

        for h3 in todas_h3:
            texto = h3.get_text(strip=True)
            if "Canci√≥n" in texto and texto != cancion_inicial_texto:
                match = re.search(r'Canci√≥n\s+(\d+)', texto)
                if match:
                    cancion_formateada = f"Canci√≥n {match.group(1)}"
                    if cancion_formateada not in canciones_encontradas:
                        canciones_encontradas.append(cancion_formateada)

        # Asignar segunda y tercera canci√≥n
        if len(canciones_encontradas) >= 1:
            info["segunda_cancion"] = canciones_encontradas[0]
        if len(canciones_encontradas) >= 2:
            info["tercera_cancion"] = canciones_encontradas[1]

        # 4. EXTRAER TESOROS DE LA BIBLIA - Buscar h5, h4 o h3 con id='p5'
        tesoros_elem = soup.find(['h5', 'h4', 'h3'], id='p5')
        if tesoros_elem:
            info["tesoros"] = tesoros_elem.get_text(strip=True)

        # 5. EXTRAER INFORMACI√ìN DE LECTURA DE LA BIBLIA
        # Buscar el div con id="tt28" y extraer el contenido despu√©s de "(X mins.)"
        lectura_div = soup.find('div', id='tt28')
        if lectura_div:
            p_elem = lectura_div.find('p', id='p17')
            if p_elem:
                # Obtener el HTML y preservar espacios
                texto_html = str(p_elem)
                # Remover tags <em> pero mantener el contenido
                texto_html = texto_html.replace('<em>', '').replace('</em>', '')
                # Crear un nuevo soup para procesar
                temp_soup = BeautifulSoup(texto_html, 'html.parser')
                texto_completo = temp_soup.get_text(separator=' ', strip=True)
                # Buscar el patr√≥n "(X mins.)" y extraer todo lo que sigue
                match = re.search(r'\(\d+\s+mins?\.\)\s*(.+)', texto_completo)
                if match:
                    info["info_lectura_biblia"] = match.group(1).strip()

        # 6. EXTRAER INFORMACI√ìN DEL ESTUDIO DEL LIBRO
        # Buscar el encabezado "Estudio b√≠blico de la congregaci√≥n"
        estudio_biblico_encontrado = False
        for h3 in soup.find_all('h3'):
            if h3.find('strong') and "Estudio b√≠blico de la congregaci√≥n" in h3.get_text(strip=True):
                # Buscar el siguiente div que contiene la informaci√≥n del tiempo
                siguiente_div = h3.find_next_sibling('div')
                if siguiente_div:
                    p_elem = siguiente_div.find('p')
                    if p_elem:
                        # Obtener el HTML y preservar espacios
                        texto_html = str(p_elem)
                        # Remover tags <em> pero mantener el contenido
                        texto_html = texto_html.replace('<em>', '').replace('</em>', '')
                        # Crear un nuevo soup para procesar
                        temp_soup = BeautifulSoup(texto_html, 'html.parser')
                        texto_completo = temp_soup.get_text(separator=' ', strip=True)
                        # Buscar el patr√≥n "(X mins.)" y extraer todo lo que sigue
                        match = re.search(r'\(\d+\s+mins?\.\)\s*(.+)', texto_completo)
                        if match:
                            info["info_estudio_libro"] = match.group(1).strip()
                            estudio_biblico_encontrado = True
                            break

        # Si no se encontr√≥ con el m√©todo anterior, buscar por patrones de ID comunes
        if not estudio_biblico_encontrado:
            # Buscar divs que contengan p√°rrafos con "(30 mins.)"
            for div in soup.find_all('div', class_=lambda x: x and 'du-margin-inlineStart' in str(x)):
                p_elem = div.find('p')
                if p_elem and '(30 mins.)' in p_elem.get_text():
                    texto_completo = p_elem.get_text(separator=' ', strip=True)
                    # Verificar si contiene referencias a lecciones (lfb, lmd, etc.)
                    if any(libro in texto_completo.lower() for libro in ['lfb', 'lmd', 'lvs']):
                        # Obtener el HTML y preservar espacios
                        texto_html = str(p_elem)
                        # Remover tags <em> pero mantener el contenido
                        texto_html = texto_html.replace('<em>', '').replace('</em>', '')
                        # Crear un nuevo soup para procesar
                        temp_soup = BeautifulSoup(texto_html, 'html.parser')
                        texto_completo = temp_soup.get_text(separator=' ', strip=True)
                        match = re.search(r'\(\d+\s+mins?\.\)\s*(.+)', texto_completo)
                        if match:
                            info["info_estudio_libro"] = match.group(1).strip()
                            break

        # 7. EXTRAER T√çTULOS DE "SEAMOS MEJORES MAESTROS"
        # Buscar el encabezado de la secci√≥n
        maestros_element = None
        vida_cristiana_element = None

        for h2 in soup.find_all('h2'):
            texto = h2.get_text(strip=True)
            if "SEAMOS MEJORES MAESTROS" in texto:
                maestros_element = h2
            elif "NUESTRA VIDA CRISTIANA" in texto:
                vida_cristiana_element = h2

        # Extraer t√≠tulos entre "SEAMOS MEJORES MAESTROS" y "NUESTRA VIDA CRISTIANA"
        if maestros_element and vida_cristiana_element:
            # M√©todo basado en IDs
            maestros_id = maestros_element.get('id', '')
            vida_id = vida_cristiana_element.get('id', '')

            if maestros_id and vida_id:
                maestros_num = int(maestros_id.replace('p', '')) if maestros_id.replace('p', '').isdigit() else 0
                vida_num = int(vida_id.replace('p', '')) if vida_id.replace('p', '').isdigit() else 1000

                # Buscar h3 con IDs entre estos dos valores
                for h3 in soup.find_all('h3'):
                    h3_id = h3.get('id', '')
                    if h3_id and h3_id.replace('p', '').isdigit():
                        h3_num = int(h3_id.replace('p', ''))
                        if maestros_num < h3_num < vida_num and h3.find('strong'):
                            strong_text = h3.find('strong').get_text(strip=True)
                            if not strong_text.startswith("Canci√≥n"):
                                info["titulos_maestros"].append(strong_text)

        # 7. EXTRAER T√çTULOS DE "NUESTRA VIDA CRISTIANA"
        titulos_nvc = []
        estudio_biblico_texto = None

        if vida_cristiana_element:
            vida_id = vida_cristiana_element.get('id', '')
            if vida_id and vida_id.replace('p', '').isdigit():
                vida_num = int(vida_id.replace('p', ''))

                # Buscar todos los h3 con ID mayor que el de "NUESTRA VIDA CRISTIANA"
                for h3 in soup.find_all('h3'):
                    h3_id = h3.get('id', '')
                    if h3_id and h3_id.replace('p', '').isdigit():
                        h3_num = int(h3_id.replace('p', ''))

                        if h3_num > vida_num and h3.find('strong'):
                            strong_text = h3.find('strong').get_text(strip=True)

                            # Si encontramos "Estudio b√≠blico de la congregaci√≥n"
                            if "Estudio b√≠blico de la congregaci√≥n" in strong_text:
                                estudio_biblico_texto = strong_text
                                break  # Terminamos la b√∫squeda una vez encontrado

                            # Otros t√≠tulos que no son canciones
                            elif not strong_text.startswith("Canci√≥n"):
                                titulos_nvc.append(strong_text)

        # Buscar "Estudio b√≠blico de la congregaci√≥n" si no se encontr√≥ a√∫n
        if not estudio_biblico_texto:
            for h3 in soup.find_all('h3'):
                if h3.find('strong') and "Estudio b√≠blico de la congregaci√≥n" in h3.get_text(strip=True):
                    estudio_biblico_texto = h3.find('strong').get_text(strip=True)
                    break

        # Asignar los t√≠tulos NVC
        info["nvc_titulo1"] = titulos_nvc[0] if len(titulos_nvc) > 0 else ""
        info["nvc_titulo2"] = titulos_nvc[1] if len(titulos_nvc) > 1 else ""
        info["nvc_titulo3"] = estudio_biblico_texto if estudio_biblico_texto else "Estudio b√≠blico de la congregaci√≥n"

        return info

    except Exception as e:
        print(f"Error al extraer informaci√≥n de {url}: {str(e)}")
        return None

def procesar_urls_wol(urls):
    """
    Procesa una lista de URLs de WOL y crea un archivo Excel independiente.

    Par√°metros:
    urls (list): Lista de URLs a procesar

    Retorna:
    tuple: (datos_procesados, nombre_archivo)
    """
    datos = []

    # Nombre del archivo con timestamp para evitar conflictos
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    nombre_archivo = f"info-reunion_{timestamp}.xlsx"

    print("üîç Extrayendo informaci√≥n de las p√°ginas WOL...")
    print("-" * 50)

    # Extraer informaci√≥n de cada URL
    for i, url in enumerate(urls, 1):
        try:
            print(f"üìÑ ({i}/{len(urls)}) Procesando: {url}")
            info = extraer_informacion(url)

            if info is None:
                print("   ‚ùå No se pudo extraer informaci√≥n")
                continue

            # Informaci√≥n b√°sica para el DataFrame
            datos_basicos = {
                "Semana": info["semana"],
                "Libro": info["libro"],
                "Canci√≥n Inicial": info["cancion_inicial"],
                "Tesoros de la Biblia": info["tesoros"],
                "Segunda Canci√≥n": info["segunda_cancion"],
                "Tercera Canci√≥n": info["tercera_cancion"]
            }

            # A√±adir los t√≠tulos de maestros como columnas separadas
            for j, titulo in enumerate(info["titulos_maestros"], 1):
                if j <= 4:  # M√°ximo 4 t√≠tulos
                    datos_basicos[f"Maestros T√≠tulo {j}"] = titulo

            # Rellenar t√≠tulos de maestros faltantes con cadena vac√≠a
            for j in range(len(info["titulos_maestros"]) + 1, 5):
                datos_basicos[f"Maestros T√≠tulo {j}"] = ""

            # A√±adir los t√≠tulos NVC
            datos_basicos["NVC T√≠tulo 1"] = info["nvc_titulo1"]
            datos_basicos["NVC T√≠tulo 2"] = info["nvc_titulo2"]
            datos_basicos["NVC T√≠tulo 3"] = info["nvc_titulo3"]

            # A√±adir Info Lectura Biblia
            datos_basicos["Info Lectura Biblia"] = info["info_lectura_biblia"]

            # A√±adir Info Estudio Libro al final
            datos_basicos["Info Estudio Libro"] = info["info_estudio_libro"]

            datos.append(datos_basicos)
            print(f"   ‚úÖ Semana extra√≠da: {info['semana']}")

            # Mostrar informaci√≥n detallada para verificaci√≥n
            print("   üìã Informaci√≥n extra√≠da:")
            print(f"      ‚Ä¢ Libro: {info['libro']}")
            print(f"      ‚Ä¢ Canciones: {info['cancion_inicial']} | {info['segunda_cancion']} | {info['tercera_cancion']}")
            if info['tesoros']:
                tesoros_corto = info['tesoros'][:50] + "..." if len(info['tesoros']) > 50 else info['tesoros']
                print(f"      ‚Ä¢ Tesoros: {tesoros_corto}")
            if info['info_lectura_biblia']:
                print(f"      ‚Ä¢ Lectura Biblia: {info['info_lectura_biblia']}")
            if info['info_estudio_libro']:
                print(f"      ‚Ä¢ Estudio Libro: {info['info_estudio_libro']}")
            print(f"      ‚Ä¢ Maestros ({len(info['titulos_maestros'])}): {', '.join(info['titulos_maestros'])}")
            print(f"      ‚Ä¢ NVC: {info['nvc_titulo1']} | {info['nvc_titulo2']} | {info['nvc_titulo3']}")
            print()

        except Exception as e:
            print(f"   ‚ùå Error al procesar: {str(e)}")

        time.sleep(1)  # Pausa entre solicitudes

    print("-" * 50)

    # Crear archivo Excel independiente
    if datos:
        try:
            df = pd.DataFrame(datos)

            print(f"üíæ Creando archivo Excel: {nombre_archivo}")

            # Crear el archivo Excel con una sola hoja
            with pd.ExcelWriter(nombre_archivo, engine='openpyxl') as writer:
                df.to_excel(writer, sheet_name='Info-reunion', index=False)

            print(f"   ‚úÖ Archivo creado exitosamente: {nombre_archivo}")
            return datos, nombre_archivo

        except Exception as e:
            print(f"   ‚ùå Error al crear el archivo Excel: {str(e)}")
            return None, None
    else:
        print("   ‚ö†Ô∏è  No hay datos para guardar")
        return None, None

def descargar_archivo_colab(nombre_archivo):
    """
    Funci√≥n para descargar el archivo en Google Colab

    Par√°metros:
    nombre_archivo (str): Nombre del archivo a descargar
    """
    try:
        from google.colab import files
        print(f"üì• Iniciando descarga del archivo: {nombre_archivo}")
        files.download(nombre_archivo)
        print("‚úÖ Descarga iniciada - revisa tus descargas")
    except ImportError:
        print("‚ÑπÔ∏è  No est√°s en Google Colab - el archivo est√° guardado en el directorio actual")
    except Exception as e:
        print(f"‚ùå Error al descargar: {str(e)}")

# ========================================
# EJECUCI√ìN AUTOM√ÅTICA
# ========================================
if __name__ == "__main__":
    print("="*60)
    print("üîÑ EXTRACTOR DE INFORMACI√ìN WOL - VMC (GOOGLE COLAB)")
    print("="*60)
    print(f"üìã Se procesar√°n {len(URLS_A_PROCESAR)} p√°ginas...")
    print()

    # Procesar las URLs y extraer informaci√≥n
    datos_procesados, archivo_creado = procesar_urls_wol(URLS_A_PROCESAR)

    if datos_procesados and archivo_creado:
        print("\n" + "="*60)
        print("‚úÖ INFORMACI√ìN EXTRA√çDA CORRECTAMENTE")
        print("="*60)
        print(f"üìä Total de semanas procesadas: {len(datos_procesados)}")
        print(f"üìÅ Archivo creado: {archivo_creado}")
        print(f"üìã Hoja de datos: 'Info-reuni√≥n'")

        # Intentar descargar autom√°ticamente en Google Colab
        print("\nüîç DESCARGA DEL ARCHIVO:")
        descargar_archivo_colab(archivo_creado)

        print("\nüéâ ¬°EXTRACCI√ìN COMPLETADA EXITOSAMENTE!")

        # Mostrar resumen de los datos
        print("\nüìã RESUMEN DE DATOS EXTRA√çDOS:")
        for i, dato in enumerate(datos_procesados, 1):
            print(f"   {i}. {dato['Semana']}")
            if dato.get('Info Lectura Biblia'):
                print(f"      üìñ Lectura: {dato['Info Lectura Biblia']}")
            if dato.get('Info Estudio Libro'):
                print(f"      üìö Estudio: {dato['Info Estudio Libro']}")

    else:
        print("\n‚ùå No se pudo procesar ninguna URL o crear el archivo")

    print("\n" + "="*60)

üîß Instalando dependencias para Google Colab...
‚úÖ Dependencias instaladas correctamente
üîÑ EXTRACTOR DE INFORMACI√ìN WOL - VMC (GOOGLE COLAB)
üìã Se procesar√°n 3 p√°ginas...

üîç Extrayendo informaci√≥n de las p√°ginas WOL...
--------------------------------------------------
üìÑ (1/3) Procesando: https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/32
   ‚úÖ Semana extra√≠da: 4-10 DE AGOSTO
   üìã Informaci√≥n extra√≠da:
      ‚Ä¢ Libro: PROVERBIOS 25
      ‚Ä¢ Canciones: Canci√≥n 154 | Canci√≥n 123 | Canci√≥n 150
      ‚Ä¢ Tesoros: 1. Sabios consejos para mejorar nuestra forma de h...
      ‚Ä¢ Lectura Biblia: Pr 25:1-17 ( th lecci√≥n 10 ).
      ‚Ä¢ Estudio Libro: lfb lecci√≥n 6 , introducci√≥n a la secci√≥n 3 y lecci√≥n 7 .
      ‚Ä¢ Maestros (3): 4. Empiece conversaciones, 5. Haga revisitas, 6. Discurso
      ‚Ä¢ NVC: 7. Necesidades de la congregaci√≥n |  | 8. Estudio b√≠blico de la congregaci√≥n

üìÑ (2/3) Procesando: https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/34
   ‚

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Descarga iniciada - revisa tus descargas

üéâ ¬°EXTRACCI√ìN COMPLETADA EXITOSAMENTE!

üìã RESUMEN DE DATOS EXTRA√çDOS:
   1. 4-10 DE AGOSTO
      üìñ Lectura: Pr 25:1-17 ( th lecci√≥n 10 ).
      üìö Estudio: lfb lecci√≥n 6 , introducci√≥n a la secci√≥n 3 y lecci√≥n 7 .
   2. 18-24 DE AGOSTO
      üìñ Lectura: Pr 27:1-17 ( th lecci√≥n 5 ).
      üìö Estudio: lfb lecciones 10, 11 .
   3. 25-31 DE AGOSTO
      üìñ Lectura: Pr 28:1-17 ( th lecci√≥n 10 ).
      üìö Estudio: lfb lecciones 12, 13 .



# Copiar informac√≥n de la reuni√≥n a Formato

In [19]:
import pandas as pd
from openpyxl import load_workbook
from openpyxl.cell.cell import MergedCell
import sys # Se usa para verificar el entorno

# --- Funciones (sin cambios) ---

def copiar_info_reunion(archivo_excel, hoja_origen="Info-reunion", hoja_destino="Formato", espaciado=8):
    """
    Copia la informaci√≥n de reuniones de la hoja Info-reunion a celdas espec√≠ficas en la hoja Formato,
    manejando correctamente las celdas combinadas.
    """
    try:
        df_origen = pd.read_excel(archivo_excel, sheet_name=hoja_origen)
        print("üìã Columnas disponibles en la hoja origen:")
        for i, col in enumerate(df_origen.columns, 1):
            print(f"   {i}. {col}")
        print()

        wb = load_workbook(filename=archivo_excel)
        hoja_dest = wb[hoja_destino]

        mapeo_celdas = {
            'Semana': 'B2', 'Libro': 'I2', 'Canci√≥n Inicial': 'D3',
            'Tesoros de la Biblia': 'C5', 'Segunda Canci√≥n': 'D14', 'Tercera Canci√≥n': 'D19',
            'Maestros T√≠tulo 1': 'C9', 'Maestros T√≠tulo 2': 'C10',
            'Maestros T√≠tulo 3': 'C11', 'Maestros T√≠tulo 4': 'C12',
            "NVC T√≠tulo 1": "C15", "NVC T√≠tulo 2": "C16", "NVC T√≠tulo 3": "C17",
            "Info Lectura Biblia": "H7", "Info Estudio Libro": "J17"
        }

        def encontrar_celda_principal(hoja, celda_combinada):
            for rango in hoja.merged_cells.ranges:
                if celda_combinada.coordinate in rango:
                    return hoja.cell(row=rango.min_row, column=rango.min_col)
            return celda_combinada

        filas_procesadas = 0
        for idx, fila in enumerate(df_origen.iterrows()):
            desplazamiento = idx * (espaciado + 18)
            print(f"üîÑ Procesando semana {idx + 1}: {fila[1].get('Semana', 'Sin semana')}")

            for columna, celda_base in mapeo_celdas.items():
                if columna not in df_origen.columns:
                    print(f"   ‚ö†Ô∏è  Columna '{columna}' no encontrada, omitiendo...")
                    continue

                letra = celda_base[0]
                numero = int(celda_base[1:]) + desplazamiento
                nueva_celda = f"{letra}{numero}"
                celda = hoja_dest[nueva_celda]
                valor = fila[1][columna]

                if pd.notna(valor) and str(valor).strip() != "":
                    if isinstance(celda, MergedCell):
                        celda_principal = encontrar_celda_principal(hoja_dest, celda)
                        if celda_principal:
                            celda_principal.value = valor
                    else:
                        celda.value = valor
                    print(f"   ‚úÖ {columna} ‚Üí {nueva_celda}: {str(valor)[:50]}{'...' if len(str(valor)) > 50 else ''}")
                else:
                    print(f"   ‚ö™ {columna} ‚Üí {nueva_celda}: (vac√≠o)")

            filas_procesadas += 1
            print(f"   ‚úÖ Semana {idx + 1} completada\n")

        wb.save(archivo_excel)
        print(f"üéâ Informaci√≥n copiada exitosamente para {filas_procesadas} semanas")
        print(f"üìÅ Archivo guardado: {archivo_excel}")

    except Exception as e:
        print(f"‚ùå Error al copiar la informaci√≥n: {str(e)}")
        print(f"   Tipo de error: {type(e).__name__}")
        if 'df_origen' in locals():
            print(f"   Filas en origen: {len(df_origen)}")
            print(f"   Columnas encontradas: {list(df_origen.columns)}")
    finally:
        if 'wb' in locals():
            wb.close()

def verificar_datos_origen(archivo_excel, hoja_origen="Info-reunion"):
    """Funci√≥n auxiliar para verificar qu√© datos est√°n disponibles en la hoja origen."""
    try:
        df = pd.read_excel(archivo_excel, sheet_name=hoja_origen)
        print("üîç VERIFICACI√ìN DE DATOS ORIGEN")
        print("=" * 50)
        print(f"üìä Total de filas: {len(df)}")
        print(f"üìã Total de columnas: {len(df.columns)}")
        print("\nüìù Columnas disponibles:")
        for i, col in enumerate(df.columns, 1):
            print(f"   {i:2d}. {col}")
        print("\nüìÑ Primeras 3 filas de datos:")
        print(df.head(3).to_string(max_cols=None, max_colwidth=30))
        print("=" * 50)

    except Exception as e:
        print(f"‚ùå Error al verificar datos: {str(e)}")


# --- C√ìDIGO PRINCIPAL - EJECUCI√ìN ---
if __name__ == "__main__":

    # **Detecci√≥n autom√°tica de entorno (Colab o Local)**
    IN_COLAB = 'google.colab' in sys.modules

    if IN_COLAB:
        print("üìç Entorno de Google Colab detectado. Montando Google Drive...")
        from google.colab import drive
        try:
            drive.mount('/content/drive')
            # Ruta para Google Colab, basada en tu captura de pantalla
            archivo = "/content/drive/My Drive/JW/Super VMC/Programaci√≥n-VMC/Programador_VMC/Programaci√≥n VMC_Septiembre-2024-2025.xlsx"
            print("‚úÖ Google Drive montado.")
        except Exception as e:
            print(f"‚ùå Error al montar Google Drive: {e}")
            sys.exit() # Detiene la ejecuci√≥n si no se puede montar Drive

    else:
        print("üñ•Ô∏è  Entorno local detectado.")
        # Ruta local (el archivo Excel debe estar en la misma carpeta que el script)
        archivo = "Programaci√≥n VMC_Septiembre-2024-2025.xlsx"

    print("=" * 60)
    print(f"üöÄ INICIANDO PROCESO PARA EL ARCHIVO:\n{archivo}\n")

    # Paso 1: Verificar datos disponibles
    print("üìã PASO 1: Verificando datos disponibles...")
    verificar_datos_origen(archivo)

    # Paso 2: Copiar informaci√≥n
    print("\nüîÑ PASO 2: Copiando informaci√≥n...")
    copiar_info_reunion(archivo)

    print("\n‚úÖ PROCESO COMPLETADO")
    print("=" * 60)

üìç Entorno de Google Colab detectado. Montando Google Drive...
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
‚úÖ Google Drive montado.
üöÄ INICIANDO PROCESO PARA EL ARCHIVO:
/content/drive/My Drive/JW/Super VMC/Programaci√≥n-VMC/Programador_VMC/Programaci√≥n VMC_Septiembre-2024-2025.xlsx

üìã PASO 1: Verificando datos disponibles...
üîç VERIFICACI√ìN DE DATOS ORIGEN
üìä Total de filas: 3
üìã Total de columnas: 15

üìù Columnas disponibles:
    1. Semana
    2. Libro
    3. Canci√≥n Inicial
    4. Tesoros de la Biblia
    5. Segunda Canci√≥n
    6. Tercera Canci√≥n
    7. Maestros T√≠tulo 1
    8. Maestros T√≠tulo 2
    9. Maestros T√≠tulo 3
   10. Maestros T√≠tulo 4
   11. NVC T√≠tulo 1
   12. NVC T√≠tulo 2
   13. NVC T√≠tulo 3
   14. Info Lectura Biblia
   15. Info Estudio Libro

üìÑ Primeras 3 filas de datos:
            Semana          Libro Canci√≥n Inicial           Tesoros de la Biblia Seg