In [None]:
import pandas as pd
from openpyxl import load_workbook

def copiar_filas_celdas_especificas(archivo_excel, hoja_origen, hoja_destino, mapeo_celdas, filtro=None, num_filas=None, espaciado=8):
    """
    Copia múltiples filas de una hoja a celdas específicas en otra hoja.
    
    Parámetros:
    archivo_excel (str): Ruta del archivo Excel
    hoja_origen (str): Nombre de la hoja de origen
    hoja_destino (str): Nombre de la hoja de destino
    mapeo_celdas (dict): Diccionario que mapea columnas de origen a celdas de destino
    filtro (tuple): (columna, valor) para filtrar filas específicas
    num_filas (int): Número de últimas filas a copiar
    espaciado (int): Número de filas de espacio entre cada bloque de datos
    """
    try:
        # Leer la hoja de origen
        df_origen = pd.read_excel(archivo_excel, sheet_name=hoja_origen)
        
        # Aplicar filtro si se especifica
        if filtro:
            columna, valor = filtro
            df_filtrado = df_origen[df_origen[columna] == valor]
        else:
            df_filtrado = df_origen
            
        # Seleccionar las últimas n filas si se especifica
        if num_filas:
            filas_a_copiar = df_filtrado.tail(num_filas)
        else:
            filas_a_copiar = df_filtrado
            
        # Cargar el archivo con openpyxl
        wb = load_workbook(filename=archivo_excel)
        hoja_dest = wb[hoja_destino]
        
        # Procesar cada fila
        for idx, fila in enumerate(filas_a_copiar.iterrows()):
            desplazamiento = idx * (espaciado + 18)  # 18 es el rango original (19-2)
            
            # Copiar cada valor a su celda correspondiente
            for columna, celda_base in mapeo_celdas.items():
                # Calcular nueva posición
                letra = celda_base[0]
                numero = int(celda_base[1:]) + desplazamiento
                nueva_celda = f"{letra}{numero}"
                
                valor = fila[1][columna]
                hoja_dest[nueva_celda] = valor
                
        # Guardar los cambios
        wb.save(archivo_excel)
        print(f"Valores copiados exitosamente para {len(filas_a_copiar)} filas")
        
    except Exception as e:
        print(f"Error al copiar los valores: {str(e)}")





# Define el mapeo entre columnas de origen y celdas de destino
mapeo_celdas = {
    'SEMANA': 'B2',      # El valor de la columna 'Nombre' irá a la celda B2
    'PRESIDENCIA': 'O2',        # El valor de la columna 'Edad' irá a la celda D7
    'ORACIÓN': 'O3',
    'TESOROS DE LA BIBLIA': 'O5',
    'BUSQUEMOS PERLAS ESCONDIDAS': 'O6',
    'LECTURA DE LA BIBLIA': 'O7',
    'SMM ASIG 1 ESTUD' : 'L9',
    'SMM ASIG 1 ACOMP' : 'O9',
    'SMM ASIG 2 ESTUD' : 'L10',
    'SMM ASIG 2 ACOMP' : 'O10',
    'SMM ASIG 3 ESTUD' : 'L11',
    'SMM ASIG 3 ACOMP' : 'O11',
    'SMM ASIG 4 ESTUD' : 'L12',
    'SMM ASIG 4 ACOMP' : 'O12',
    'NVC PARTE 1' : 'O15',
    'NVC PARTE 2' : 'O16',
    'ESUDIO LIBRO' : 'O17',
    'LECTOR LIBRO': 'O18',
    'ORACIÓN FINAL': 'O19'
}

# Ejemplo de uso para filtrar por mes

copiar_filas_celdas_especificas(
    archivo_excel="Programación VMC_Septiembre-2024-2025.xlsx",
    hoja_origen="BD ASIG",
    hoja_destino="Formato",
    mapeo_celdas=mapeo_celdas,
    filtro=("MES", "MAYO")
)


# Ejemplo de uso para últimas 4 filas
"""
copiar_filas_celdas_especificas(
    archivo_excel="Programación VMC_Septiembre-2024-2025.xlsx",
    hoja_origen="BD ASIG",
    hoja_destino="Formato",
    mapeo_celdas=mapeo_celdas,
    num_filas=4
)
"""

Valores copiados exitosamente para 5 filas


'\ncopiar_filas_celdas_especificas(\n    archivo_excel="Programación VMC_Septiembre-2024-2025.xlsx",\n    hoja_origen="BD ASIG",\n    hoja_destino="Formato",\n    mapeo_celdas=mapeo_celdas,\n    num_filas=4\n)\n'

# Extracción de Datos de Web wol.jw.org - Semanas Reunión

In [1]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import re
import time
import os

def extraer_informacion(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    # Extracciones existentes...
    semana_element = soup.find('h1', id='p1')
    semana = semana_element.get_text(strip=True) if semana_element else "Semana no encontrada"
    
    libro_element = soup.find('h2', id='p2')
    libro = "Libro no encontrado"
    if libro_element:
        strong_tag = libro_element.find('strong')
        if strong_tag:
            libro = strong_tag.get_text(strip=True)
        else:
            libro = libro_element.get_text(strip=True)
    
    cancion_element = soup.find('h3', id='p3')
    cancion = "Canción no encontrada"
    if cancion_element:
        cancion_text = cancion_element.get_text(strip=True)
        match = re.search(r'Canción\s+(\d+)', cancion_text)
        if match:
            cancion = f"Canción {match.group(1)}"
    
    tesoros_element = soup.find(['h5', 'h4', 'h3'], id='p5')
    tesoros = tesoros_element.get_text(strip=True) if tesoros_element else "Tesoros no encontrados"
    
    # Extraer todas las canciones como antes...
    todas_h3 = soup.find_all('h3')
    segunda_cancion = "Segunda canción no encontrada"
    for h3 in todas_h3:
        texto = h3.get_text(strip=True)
        if "Canción" in texto and texto != cancion_text:
            match = re.search(r'Canción\s+(\d+)', texto)
            if match:
                segunda_cancion = f"Canción {match.group(1)}"
                break
    
    tercera_cancion = "Tercera canción no encontrada"
    for h3 in reversed(todas_h3):
        texto = h3.get_text(strip=True)
        if "Canción" in texto and texto != cancion_text and segunda_cancion not in texto:
            match = re.search(r'Canción\s+(\d+)', texto)
            if match:
                tercera_cancion = f"Canción {match.group(1)}"
                break
    
    # Extraer títulos h3 entre SEAMOS MEJORES MAESTROS y NUESTRA VIDA CRISTIANA
    titulos_maestros = []
    
    # Encontrar los elementos h2 que delimitan la sección
    maestros_element = None
    vida_cristiana_element = None
    
    for h2 in soup.find_all('h2'):
        texto = h2.get_text(strip=True)
        if "SEAMOS MEJORES MAESTROS" in texto:
            maestros_element = h2
        elif "NUESTRA VIDA CRISTIANA" in texto:
            vida_cristiana_element = h2
    
    # Si encontramos ambos encabezados, extraemos los h3 entre ellos
    if maestros_element and vida_cristiana_element:
        # Encontrar todos los h3 que están después de "SEAMOS MEJORES MAESTROS"
        elemento_actual = maestros_element.next_sibling
        
        while elemento_actual and elemento_actual != vida_cristiana_element:
            # Si es un h3 con strong, extraer el texto
            if elemento_actual.name == 'h3' and elemento_actual.find('strong'):
                strong_text = elemento_actual.find('strong').get_text(strip=True)
                # No incluir las canciones en esta lista
                if not strong_text.startswith("Canción"):
                    titulos_maestros.append(strong_text)
            
            # Pasar al siguiente elemento
            try:
                elemento_actual = elemento_actual.next_sibling
            except AttributeError:
                break
    
    # En caso de que el método anterior no funcione bien, usamos enfoque alternativo basado en IDs
    if not titulos_maestros and maestros_element:
        # Obtener el ID del elemento maestros
        maestros_id = maestros_element.get('id', '')
        if maestros_id:
            maestros_num = int(maestros_id.replace('p', '')) if maestros_id.replace('p', '').isdigit() else 0
            vida_num = int(vida_cristiana_element.get('id', '').replace('p', '')) if vida_cristiana_element else 1000
            
            # Buscar h3 con IDs entre estos dos valores
            for h3 in soup.find_all('h3'):
                h3_id = h3.get('id', '')
                if h3_id and h3_id.replace('p', '').isdigit():
                    h3_num = int(h3_id.replace('p', ''))
                    if maestros_num < h3_num < vida_num and h3.find('strong'):
                        strong_text = h3.find('strong').get_text(strip=True)
                        if not strong_text.startswith("Canción") and strong_text not in titulos_maestros:
                            titulos_maestros.append(strong_text)
    
    # NUEVO: Extraer títulos h3 dentro de NUESTRA VIDA CRISTIANA hasta "Estudio bíblico de la congregación"
    titulos_nvc = []
    estudio_biblico_encontrado = False
    estudio_biblico_texto = None
    
    # Si encontramos el encabezado de NUESTRA VIDA CRISTIANA
    if vida_cristiana_element:
        elemento_actual = vida_cristiana_element.next_sibling
        
        while elemento_actual:
            # Si es un h3 con strong, extraer el texto
            if elemento_actual.name == 'h3' and elemento_actual.find('strong'):
                strong_text = elemento_actual.find('strong').get_text(strip=True)
                
                # Verificar si es "Estudio bíblico de la congregación"
                if "Estudio bíblico de la congregación" in strong_text:
                    estudio_biblico_encontrado = True
                    estudio_biblico_texto = strong_text
                    break  # Terminamos la búsqueda
                
                # No incluir las canciones en esta lista
                elif not strong_text.startswith("Canción"):
                    titulos_nvc.append(strong_text)
            
            # Pasar al siguiente elemento
            try:
                elemento_actual = elemento_actual.next_sibling
            except AttributeError:
                break
    
    # Método alternativo basado en IDs si el primero no funciona
    if not (titulos_nvc or estudio_biblico_encontrado) and vida_cristiana_element:
        vida_id = vida_cristiana_element.get('id', '')
        if vida_id and vida_id.replace('p', '').isdigit():
            vida_num = int(vida_id.replace('p', ''))
            
            # Buscar todos los h3 con ID mayor que el de "NUESTRA VIDA CRISTIANA"
            for h3 in soup.find_all('h3'):
                h3_id = h3.get('id', '')
                if h3_id and h3_id.replace('p', '').isdigit():
                    h3_num = int(h3_id.replace('p', ''))
                    
                    if h3_num > vida_num and h3.find('strong'):
                        strong_text = h3.find('strong').get_text(strip=True)
                        
                        # Si encontramos "Estudio bíblico de la congregación"
                        if "Estudio bíblico de la congregación" in strong_text:
                            estudio_biblico_encontrado = True
                            estudio_biblico_texto = strong_text
                            break  # Terminamos la búsqueda una vez encontrado
                        
                        # Otros títulos que no son canciones
                        elif not strong_text.startswith("Canción"):
                            titulos_nvc.append(strong_text)
    
    # Buscar "Estudio bíblico de la congregación" si no se encontró aún
    if not estudio_biblico_encontrado:
        for h3 in soup.find_all('h3'):
            if h3.find('strong') and "Estudio bíblico de la congregación" in h3.get_text(strip=True):
                estudio_biblico_encontrado = True
                estudio_biblico_texto = h3.find('strong').get_text(strip=True)
                break
                
    # Preparar los tres títulos NVC según las reglas especificadas
    nvc_titulo1 = titulos_nvc[0] if titulos_nvc else ""
    nvc_titulo2 = ""
    nvc_titulo3 = estudio_biblico_texto if estudio_biblico_encontrado else "Estudio bíblico de la congregación"
    
    # Si hay más títulos además del estudio bíblico
    if len(titulos_nvc) > 1:
        nvc_titulo2 = titulos_nvc[1]
    
    return {
        "semana": semana,
        "libro": libro,
        "cancion_inicial": cancion,
        "tesoros": tesoros,
        "segunda_cancion": segunda_cancion,
        "tercera_cancion": tercera_cancion,
        "titulos_maestros": titulos_maestros,
        "nvc_titulo1": nvc_titulo1,
        "nvc_titulo2": nvc_titulo2,
        "nvc_titulo3": nvc_titulo3
    }

# Ruta al archivo Excel existente
archivo_excel = "Programación VMC_Septiembre-2024-2025.xlsx"
nombre_hoja = "Sheet1"

# Lista de URLs
urls = [
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/19",
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/20",
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/21",
    "https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/22"    
]

# Lista para almacenar los datos
datos = []

# Extraer información de cada URL
# Extraer información de cada URL
# Extraer información de cada URL
for url in urls:
    try:
        print(f"Procesando: {url}")
        info = extraer_informacion(url)
        
        # Información básica para el DataFrame
        datos_basicos = {
            "Semana": info["semana"],
            "Libro": info["libro"],
            "Canción Inicial": info["cancion_inicial"],
            "Tesoros de la Biblia": info["tesoros"],
            "Segunda Canción": info["segunda_cancion"],
            "Canción Final": info["tercera_cancion"]
        }
        
        # Añadir los títulos de maestros como columnas separadas
        for i, titulo in enumerate(info["titulos_maestros"], 1):
            datos_basicos[f"Maestros Título {i}"] = titulo
        
        # Añadir los tres títulos NVC (siempre hay 3 columnas)
        datos_basicos["NVC Título 1"] = info["nvc_titulo1"]
        datos_basicos["NVC Título 2"] = info["nvc_titulo2"]
        datos_basicos["NVC Título 3"] = info["nvc_titulo3"]
        
        datos.append(datos_basicos)
        
        # Mostrar información detallada
        print("\n--- Información Extraída ---")
        for clave, valor in info.items():
            if clave != "titulos_maestros":
                print(f"{clave.capitalize()}: {valor}")
            else:
                print("Títulos de 'Seamos Mejores Maestros':")
                for i, titulo in enumerate(valor, 1):
                    print(f"  {i}. {titulo}")
        print("--------------------------\n")
        
    except Exception as e:
        print(f"Error al procesar {url}: {e}")
    
    time.sleep(1)  # Pausa entre solicitudes
    
# Crear un DataFrame con los datos
df = pd.DataFrame(datos)

# Verificar si el archivo Excel existe
if os.path.exists(archivo_excel):
    try:
        # Leer todas las hojas existentes
        with pd.ExcelWriter(archivo_excel, engine='openpyxl', mode='a', if_sheet_exists='replace') as writer:
            df.to_excel(writer, sheet_name=nombre_hoja, index=False)
        print(f"\nDatos agregados exitosamente a la hoja '{nombre_hoja}' en el archivo '{archivo_excel}'")
        
    except Exception as e:
        print(f"Error al agregar datos al archivo Excel existente: {e}")
        
        # Guardar como respaldo si falla
        nuevo_archivo = "Info_Reuniones_Backup.xlsx"
        df.to_excel(nuevo_archivo, index=False)
        print(f"Datos guardados en archivo de respaldo: '{nuevo_archivo}'")
else:
    print(f"¡Atención! El archivo '{archivo_excel}' no existe en la ubicación actual.")
    
    # Guardar en un nuevo archivo si no existe
    df.to_excel("Info_Reuniones_Nuevas.xlsx", index=False)
    print(f"Datos guardados en un nuevo archivo: 'Info_Reuniones_Nuevas.xlsx'")

# Mostrar la tabla
print("\nResumen de información extraída:")
print(df)

Procesando: https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/19

--- Información Extraída ---
Semana: 5-11 DE MAYO
Libro: PROVERBIOS 12
Cancion_inicial: Canción 101
Tesoros: 1. El trabajo duro tiene su recompensa
Segunda_cancion: Canción 21
Tercera_cancion: Canción 57
Títulos de 'Seamos Mejores Maestros':
  1. 4. Empiece conversaciones
  2. 5. Empiece conversaciones
  3. 6. Haga revisitas
  4. 7. Explique sus creencias
Nvc_titulo1: 8. Afronte los problemas económicos con la ayuda de Jehová
Nvc_titulo2: 
Nvc_titulo3: 9. Estudio bíblico de la congregación
--------------------------

Procesando: https://wol.jw.org/es/wol/meetings/r4/lp-s/2025/20

--- Información Extraída ---
Semana: 12-18 DE MAYO
Libro: PROVERBIOS 13
Cancion_inicial: Canción 34
Tesoros: 1. Que “la lámpara de los malvados” no lo deslumbre
Segunda_cancion: Canción 77
Tercera_cancion: Canción 43
Títulos de 'Seamos Mejores Maestros':
  1. 4. Empiece conversaciones
  2. 5. Empiece conversaciones
  3. 6. Discurso
Nvc_titulo1: 7.

# Copiar informacón de la reunión

In [1]:
import pandas as pd
from openpyxl import load_workbook
from openpyxl.cell.cell import MergedCell

def copiar_info_reunion(archivo_excel, hoja_origen="Info-reunión", hoja_destino="Formato", espaciado=8):
    """
    Copia la información de reuniones de la hoja Info-reunión a celdas específicas en la hoja Formato,
    manejando correctamente las celdas combinadas.
    
    Parámetros:
    archivo_excel (str): Ruta del archivo Excel
    hoja_origen (str): Nombre de la hoja que contiene la información de reuniones
    hoja_destino (str): Nombre de la hoja donde se copiará la información
    espaciado (int): Número de filas de espacio entre cada bloque de datos
    """
    try:
        # Leer la hoja de origen
        df_origen = pd.read_excel(archivo_excel, sheet_name=hoja_origen)
        
        # Cargar el archivo con openpyxl
        wb = load_workbook(filename=archivo_excel)
        hoja_dest = wb[hoja_destino]
        
        # Definir el mapeo de columnas a celdas
        mapeo_celdas = {
            'Semana': 'B2',           # Semana
            'Libro': 'I2',            # Libro de estudio
            'Canción Inicial': 'D3',  # Primera canción
            'Tesoros de la Biblia': 'C5',  # Tesoros
            'Segunda Canción': 'D14',      # Segunda canción
            'Canción Final': 'D19',         # Tercera canción
            'Maestros Título 1': 'C9',     # Asignación de maestros 1
            'Maestros Título 2': 'C10',    # Asignación de maestros 2
            'Maestros Título 3': 'C11',    # Asignación de maestros 3
            "NVC Título 1": "C15",    # Asignación de vida cristiana 1
            "NVC Título 2": "C16",    # Asignación de vida cristiana 2
            "NVC Título 3": "C17",    # Asignación de vida cristiana 3
        }
        
        def encontrar_celda_principal(hoja, celda_combinada):
            """
            Encuentra la celda principal de un rango de celdas combinadas.
            """
            for rango in hoja.merged_cells.ranges:
                if celda_combinada.coordinate in rango:
                    return hoja.cell(row=rango.min_row, column=rango.min_col)
            return celda_combinada

        # Procesar cada fila
        for idx, fila in enumerate(df_origen.iterrows()):
            desplazamiento = idx * (espaciado + 18)
            
            # Copiar cada valor a su celda correspondiente
            for columna, celda_base in mapeo_celdas.items():
                # Calcular nueva posición
                letra = celda_base[0]
                numero = int(celda_base[1:]) + desplazamiento
                nueva_celda = f"{letra}{numero}"
                
                celda = hoja_dest[nueva_celda]
                valor = fila[1][columna]

                # Si es una celda combinada, encontrar la celda principal
                if isinstance(celda, MergedCell):
                    celda_principal = encontrar_celda_principal(hoja_dest, celda)
                    if celda_principal:
                        celda_principal.value = valor
                else:
                    celda.value = valor
                
        # Guardar los cambios
        wb.save(archivo_excel)
        print(f"Información copiada exitosamente para {len(df_origen)} semanas")
        
    except Exception as e:
        print(f"Error al copiar la información: {str(e)}")
    finally:
        wb.close()

# Ejemplo de uso
if __name__ == "__main__":
    archivo = "Programación VMC_Septiembre-2024-2025.xlsx"
    copiar_info_reunion(archivo)

Información copiada exitosamente para 4 semanas
