In [1]:
import os
import pandas as pd
import requests #esta librería se utiliza para descargar archivos de internet

#automatizar la descarga de archivos a partir de links que vienen 
#dentro de un CSV, y los organiza en carpetas según el tipo de información.
def download_file(url, folder):
    try: #Este ciclo hace que, aunque una descarga falle, se siga ejecutando la función
        if pd.notna(url):  # Verificar que no sea NaN
            # Obtener el nombre del archivo del enlace
            filename = url.split('/')[-1] #el archivo se parte a partir de el / y toma el último pedazo
            filepath = os.path.join(folder, filename) #utilizamos os.path.join para denominar
            #el nombre de la carpeta y del archivo
            #ejemplo:
            
            # folder = "DIARIOS"
            # filename = "archivo2025.csv"
            # → DIARIOS/archivo2025.csv


            # Descargar el archivo
            response = requests.get(url) #patición http al servidor
            if response.status_code == 200: #todo salió bien, el archivo está disponible
                with open(filepath, 'wb') as file: #abrir el archivo y trabajar con él, para cerrarlo cuando termine
                    #se utiliza esto porque descargo desde internet texto crudo en forma binaria
                    #w=write b=binary, esto es para guardar exactamente lo que llega del servidor byte por byte
                    #whit evita fugas de recursos, errores raros y archivos dañados
                    file.write(response.content) #esto es para guardar físicamente el archivo descargado
                print(f"Descargado: {filename}")
            else:
                print(f"No se pudo descargar {filename}, Código de estado: {response.status_code}")
    except Exception as e:
        print(f"Error descargando {url}: {e}")

# Rutas de carpetas para cada tipo de archivo
folders = ['DIARIOS', 'EXTREMOS', 'MENSUALES']

# Crear las carpetas si no existen
for folder in folders:
    os.makedirs(folder, exist_ok=True)

# Cargar el archivo
file_path = 'Output_point_layer1.csv'  # Cambiar por la ruta del archivo

df = pd.read_csv(file_path)

# Descargar archivos de cada columna y guardarlos en sus carpetas correspondientes
for index, row in df.iterrows(): #para cada fila del csv.
    download_file(row.get('DIARIOS'), 'DIARIOS')#aquí encuentra el valor de la columna diarios
    download_file(row.get('EXTREMOS'), 'EXTREMOS')
    download_file(row.get('MENSUALES'), 'MENSUALES')

print("\nDescarga completada.")

# Es como si row fuera un diccionario:

# row = {
#   "DIARIOS": "url1",
#   "EXTREMOS": "url2",
#   "MENSUALES": "url3"
# }
#Por eso se usa row y no directamente la columna.
# Porque estás diciendo:

# “Para esta fila, dame el valor que está en la columna DIARIOS.”


Descargado: dia01008.txt
No se pudo descargar medex01008.txt, Código de estado: 500
Descargado: mes01008.txt
Descargado: dia01010.txt
No se pudo descargar medex01010.txt, Código de estado: 500
Descargado: mes01010.txt
Descargado: dia01011.txt
No se pudo descargar medex01011.txt, Código de estado: 500
Descargado: mes01011.txt
Descargado: dia01012.txt
No se pudo descargar medex01012.txt, Código de estado: 500
Descargado: mes01012.txt
Descargado: dia01013.txt
No se pudo descargar medex01013.txt, Código de estado: 500
Descargado: mes01013.txt
Descargado: dia01015.txt
No se pudo descargar medex01015.txt, Código de estado: 500
Descargado: mes01015.txt
Descargado: dia01017.txt
No se pudo descargar medex01017.txt, Código de estado: 500
Descargado: mes01017.txt
Descargado: dia01020.txt
No se pudo descargar medex01020.txt, Código de estado: 500
Descargado: mes01020.txt
Descargado: dia01023.txt
No se pudo descargar medex01023.txt, Código de estado: 500
Descargado: mes01023.txt
Descargado: dia0102

In [1]:
import os
import pandas as pd
import requests

# Lista para registrar los errores de extremos
errores_extremos = []

def download_extremo(url, clave):
    try:
        if pd.notna(url):  # Verificar que no sea NaN
            # Crear carpeta EXTREMOS si no existe
            os.makedirs('EXTREMOS', exist_ok=True)

            # Nombre del archivo
            filename = url.split('/')[-1]
            filepath = os.path.join('EXTREMOS', filename)

            # Encabezado para simular navegador
            headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'}

            # Realizar solicitud con encabezado
            response = requests.get(url, headers=headers)

            if response.status_code == 200:
                with open(filepath, 'wb') as file:
                    file.write(response.content)
                print(f"Descargado: {filename}")
            else:
                print(f"No se pudo descargar {url}, Código de estado: {response.status_code}")
                errores_extremos.append({'Clave': clave, 'URL': url, 'Código de Error': response.status_code})
    except Exception as e:
        print(f"Error descargando {url}: {e}")
        errores_extremos.append({'Clave': clave, 'URL': url, 'Código de Error': str(e)})

# Ruta del archivo
file_path = 'Output_point_layer1.csv'  # Cambia por el archivo .csv o .xlsx

# Leer el archivo según su extensión
if file_path.endswith('.csv'):
    df = pd.read_csv(file_path)
elif file_path.endswith('.xlsx'):
    df = pd.read_excel(file_path)
else:
    raise ValueError("El archivo debe ser un .csv o .xlsx")

# Descargar solo archivos EXTREMOS
for index, row in df.iterrows():
    clave = row.get('name') or row.get('CLAVE')
    download_extremo(row.get('EXTREMOS'), clave)

# Guardar el reporte de errores en un archivo Excel
if errores_extremos:
    errores_df = pd.DataFrame(errores_extremos)
    errores_df.to_excel('errores_extremos.xlsx', index=False)
    print("\nReporte de errores guardado en 'errores_extremos.xlsx'")
else:
    print("\nTodos los archivos EXTREMOS fueron descargados exitosamente.")

print("\nDescarga de EXTREMOS completada.")

Error descargando https://smn.conagua.gob.mx/tools/RESOURCES/Normales_Climatologicas/Med-Extr/ags/medex01008.txt: HTTPSConnectionPool(host='smn.conagua.gob.mx', port=443): Max retries exceeded with url: /tools/RESOURCES/Normales_Climatologicas/Med-Extr/ags/medex01008.txt (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)')))
Error descargando https://smn.conagua.gob.mx/tools/RESOURCES/Normales_Climatologicas/Med-Extr/ags/medex01010.txt: HTTPSConnectionPool(host='smn.conagua.gob.mx', port=443): Max retries exceeded with url: /tools/RESOURCES/Normales_Climatologicas/Med-Extr/ags/medex01010.txt (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)')))
Error descargando https://smn.conagua.gob.mx/tools/RESOURCES/Normales_Climatologicas/Med-Extr/ags/medex01011.txt: HTTPSConne

In [3]:
import os
import pandas as pd
import requests  # librería para descargar archivos de internet

# Automatiza la descarga SOLO de los archivos EXTREMOS
def download_extremo(url):
    try:  # Aunque una descarga falle, el programa sigue
        if pd.notna(url):  # Verifica que no sea NaN
            # Crear la carpeta EXTREMOS si no existe
            os.makedirs('EXTREMOS', exist_ok=True)

            # Obtener el nombre del archivo desde la URL
            filename = url.split('/')[-1]
            filepath = os.path.join('EXTREMOS', filename)
            # Ejemplo:
            # filename = "archivo2025.csv"
            # filepath = "EXTREMOS/archivo2025.csv"
            headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)'}
            #pusimos verify=false porque nos estaba dando error, ya que es un dominio de gobierno
            response = requests.get(url, headers=headers, verify=False)

            if response.status_code == 200:  # descarga exitosa
                with open(filepath, 'wb') as file:
                    # w = write, b = binary
                    # Guarda exactamente lo que llega del servidor, byte por byte
                    file.write(response.content)
                print(f"Descargado: {filename}")
            else:
                print(f"No se pudo descargar {filename}, Código de estado: {response.status_code}")
    except Exception as e:
        print(f"Error descargando {url}: {e}")


# Cargar el archivo CSV
file_path = 'Output_point_layer1.csv'  # Cambia por tu archivo real
df = pd.read_csv(file_path)

# Descargar únicamente los archivos de la columna EXTREMOS
for index, row in df.iterrows():  # para cada fila del CSV
    download_extremo(row.get('EXTREMOS'))
    # aquí row funciona como:
    # row = {
    #   "DIARIOS": "url1",
    #   "EXTREMOS": "url2",
    #   "MENSUALES": "url3"
    # }
    # Entonces row.get('EXTREMOS') obtiene solo el link de EXTREMOS de esa fila

print("\nDescarga de EXTREMOS completada.")




Descargado: medex01008.txt




Descargado: medex01010.txt




Descargado: medex01011.txt




Descargado: medex01012.txt




Descargado: medex01013.txt




Descargado: medex01015.txt




Descargado: medex01017.txt




Descargado: medex01020.txt




Descargado: medex01023.txt




Descargado: medex01026.txt




Descargado: medex01028.txt




Descargado: medex01029.txt




Descargado: medex01031.txt




Descargado: medex01032.txt




Descargado: medex01033.txt




Descargado: medex01045.txt




Descargado: medex01046.txt




Descargado: medex01078.txt




Descargado: medex01081.txt




Descargado: medex01084.txt




Descargado: medex01088.txt




Descargado: medex01091.txt




Descargado: medex01095.txt




Descargado: medex01103.txt




Descargado: medex05004.txt




Descargado: medex05175.txt




Descargado: medex10047.txt




Descargado: medex10057.txt




Descargado: medex10081.txt




Descargado: medex10088.txt




Descargado: medex10099.txt




Descargado: medex10135.txt




Descargado: medex10172.txt




Descargado: medex11045.txt




Descargado: medex14026.txt




Descargado: medex14032.txt




Descargado: medex14037.txt




Descargado: medex14038.txt




Descargado: medex14053.txt




Descargado: medex14071.txt
Descargado: medex14100.txt




Descargado: medex14101.txt




Descargado: medex14144.txt




Descargado: medex14145.txt




Descargado: medex14156.txt
Descargado: medex14165.txt




Descargado: medex14167.txt




Descargado: medex14179.txt




Descargado: medex14306.txt




Descargado: medex14324.txt




Descargado: medex14326.txt




Descargado: medex14331.txt




Descargado: medex14346.txt




Descargado: medex18031.txt




Descargado: medex24055.txt




Descargado: medex24059.txt




Descargado: medex24074.txt




Descargado: medex24077.txt




Descargado: medex24100.txt




Descargado: medex24144.txt




Descargado: medex24146.txt




Descargado: medex24148.txt




Descargado: medex24150.txt




Descargado: medex24151.txt




Descargado: medex24152.txt




Descargado: medex24175.txt




Descargado: medex24191.txt




Descargado: medex32001.txt




Descargado: medex32002.txt




Descargado: medex32003.txt




Descargado: medex32004.txt




Descargado: medex32005.txt




Descargado: medex32006.txt




Descargado: medex32007.txt




Descargado: medex32010.txt




Descargado: medex32011.txt




Descargado: medex32013.txt
Descargado: medex32015.txt




Descargado: medex32016.txt




Descargado: medex32018.txt




Descargado: medex32019.txt




Descargado: medex32020.txt




Descargado: medex32021.txt




Descargado: medex32022.txt




Descargado: medex32024.txt




Descargado: medex32025.txt




Descargado: medex32026.txt




Descargado: medex32027.txt




Descargado: medex32028.txt




Descargado: medex32029.txt




Descargado: medex32030.txt




Descargado: medex32031.txt




Descargado: medex32032.txt




Descargado: medex32033.txt




Descargado: medex32034.txt




Descargado: medex32036.txt




Descargado: medex32037.txt




Descargado: medex32038.txt




Descargado: medex32039.txt




Descargado: medex32040.txt




Descargado: medex32041.txt




Descargado: medex32042.txt




Descargado: medex32045.txt




Descargado: medex32046.txt




Descargado: medex32047.txt




Descargado: medex32048.txt




Descargado: medex32049.txt




Descargado: medex32050.txt




Descargado: medex32051.txt




Descargado: medex32052.txt




Descargado: medex32053.txt




Descargado: medex32054.txt




Descargado: medex32055.txt




Descargado: medex32057.txt




Descargado: medex32058.txt




Descargado: medex32059.txt




Descargado: medex32061.txt




Descargado: medex32065.txt




Descargado: medex32068.txt




Descargado: medex32069.txt




Descargado: medex32070.txt




Descargado: medex32072.txt




Descargado: medex32073.txt




Descargado: medex32076.txt




Descargado: medex32078.txt




Descargado: medex32084.txt
Descargado: medex32085.txt




Descargado: medex32086.txt




Descargado: medex32087.txt




Descargado: medex32091.txt




Descargado: medex32093.txt




Descargado: medex32095.txt




Descargado: medex32097.txt




Descargado: medex32098.txt




Descargado: medex32099.txt




Descargado: medex32100.txt




Descargado: medex32101.txt




Descargado: medex32103.txt




Descargado: medex32105.txt




Descargado: medex32106.txt




Descargado: medex32107.txt
Descargado: medex32108.txt




Descargado: medex32109.txt




Descargado: medex32111.txt




Descargado: medex32112.txt




Descargado: medex32113.txt




Descargado: medex32114.txt
Descargado: medex32115.txt




Descargado: medex32116.txt
Descargado: medex32117.txt




Descargado: medex32118.txt
Descargado: medex32119.txt








Descargado: medex32120.txt




Descargado: medex32121.txt




Descargado: medex32122.txt




Descargado: medex32123.txt




Descargado: medex32124.txt




Descargado: medex32125.txt




Descargado: medex32126.txt




Descargado: medex32127.txt




Descargado: medex32129.txt




Descargado: medex32130.txt




Descargado: medex32131.txt




Descargado: medex32132.txt




Descargado: medex32133.txt




Descargado: medex32134.txt




Descargado: medex32135.txt




Descargado: medex32137.txt




Descargado: medex32139.txt




Descargado: medex32140.txt




Descargado: medex32142.txt




Descargado: medex32143.txt




Descargado: medex32148.txt




Descargado: medex32150.txt




Descargado: medex32151.txt
Descargado: medex32171.txt




Descargado: medex32172.txt




Descargado: medex32173.txt




Descargado: medex32174.txt
Descargado: medex32176.txt




Descargado: medex32177.txt




Descargado: medex32179.txt




Descargado: medex32180.txt
Descargado: medex32184.txt
Descargado: medex32186.txt




Descargado: medex32187.txt
Descargado: medex32188.txt




Descargado: medex32189.txt




Descargado: medex32191.txt
Descargado: medex01003.txt




Descargado: medex01006.txt
Descargado: medex01009.txt




Descargado: medex10015.txt
Descargado: medex10032.txt




Descargado: medex10034.txt
Descargado: medex10059.txt




Descargado: medex10067.txt
Descargado: medex10070.txt




Descargado: medex10074.txt




Descargado: medex10151.txt




Descargado: medex14025.txt




Descargado: medex14069.txt




Descargado: medex14098.txt




Descargado: medex14103.txt




Descargado: medex14108.txt




Descargado: medex14134.txt




Descargado: medex14135.txt




Descargado: medex14153.txt




Descargado: medex14161.txt




Descargado: medex14175.txt




Descargado: medex14176.txt




Descargado: medex14186.txt




Descargado: medex14192.txt




Descargado: medex14196.txt




Descargado: medex14319.txt




Descargado: medex14345.txt




Descargado: medex14347.txt




Descargado: medex14363.txt




Descargado: medex19129.txt




Descargado: medex24127.txt




Descargado: medex24147.txt




Descargado: medex24166.txt




Descargado: medex24194.txt




Descargado: medex24196.txt




Descargado: medex32009.txt




Descargado: medex32012.txt




Descargado: medex32014.txt




Descargado: medex32017.txt




Descargado: medex32023.txt




Descargado: medex32043.txt




Descargado: medex32056.txt




Descargado: medex32060.txt




Descargado: medex32062.txt




Descargado: medex32063.txt




Descargado: medex32067.txt
Descargado: medex32071.txt




Descargado: medex32074.txt




Descargado: medex32077.txt




Descargado: medex32080.txt




Descargado: medex32088.txt




Descargado: medex32089.txt




Descargado: medex32090.txt
Descargado: medex32092.txt




Descargado: medex32096.txt




Descargado: medex32102.txt




Descargado: medex32104.txt




Descargado: medex32110.txt




Descargado: medex32136.txt




Descargado: medex32138.txt




Descargado: medex32141.txt
Descargado: medex32144.txt

Descarga de EXTREMOS completada.




## Vamos a convertir los archivos en excel de manera automática

In [4]:
import pandas as pd
import os

# Definir carpetas
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS"
carpeta_excel = os.path.join(carpeta_txt, "DIARIOS_excel")

# Crear la carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Función para leer y procesar un archivo TXT
def procesar_archivo_txt(ruta_archivo):
    try:
        with open(ruta_archivo, "r", encoding="latin1") as file: #r=read y encoding latin1 para interpretar acentos, ñ, etc.
            lines = file.readlines() #guardar cada linea en una lista
#pasa de: 
            # Juan,25,Zacatecas
            # Ana,30,Guadalajara
            # Luis,22,Monterrey
#a:
#             [
#   "Juan,25,Zacatecas\n",
#   "Ana,30,Guadalajara\n",
#   "Luis,22,Monterrey\n"
# ]


        # Encontrar la línea donde comienzan los datos (evitar encabezados)
        inicio_datos = 0
        for i, line in enumerate(lines): #i es el número de línea, line es el contenido de esa linea
            if "FECHA" in line and "PRECIP" in line:  # Detectar encabezado de la tabla
                inicio_datos = i
                break

        # Leer los datos desde la línea detectada
        df = pd.read_csv(ruta_archivo, skiprows=inicio_datos, delim_whitespace=True)#el delim_whitespace lo utilizamos porque están separados por espacios

        # Eliminar la primera fila que contiene las unidades de medida
        df = df.iloc[1:].copy()

        # Convertir columnas numéricas al tipo adecuado
        columnas_numericas = ["PRECIP", "EVAP", "TMAX", "TMIN"]
        df[columnas_numericas] = df[columnas_numericas].apply(pd.to_numeric, errors='coerce')#convertir texto a número

        return df
    except Exception as e:
        print(f"Error al procesar {ruta_archivo}: {e}")
        return None

# Procesar todos los archivos en la carpeta de TXT
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo)

        # Procesar el archivo y obtener el DataFrame
        df_datos = procesar_archivo_txt(ruta_txt)

        if df_datos is not None:
            # Definir la ruta de salida en la carpeta DIARIOS_excel
            nombre_salida = os.path.splitext(archivo)[0] + ".xlsm"
            ruta_excel = os.path.join(carpeta_excel, nombre_salida)

            # Guardar el DataFrame en un archivo Excel
            df_datos.to_excel(ruta_excel, index=False, engine='openpyxl')

            print(f"Archivo guardado: {ruta_excel}")

print("Proceso completado. Todos los archivos han sido convertidos a Excel.")



Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01003.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01006.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01008.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01009.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01010.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01011.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01012.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01013.xlsm
Archivo guardado: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia010

KeyboardInterrupt: 

In [5]:
import pandas as pd
import os
import xlwings as xw

# Definir carpetas
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS"
carpeta_excel = os.path.join(carpeta_txt, "DIARIOS_excel")

# Crear la carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Función para leer y procesar un archivo TXT
def procesar_archivo_txt(ruta_archivo):
    try:
        with open(ruta_archivo, "r", encoding="latin1") as file:
            lines = file.readlines()

        # Encontrar la línea donde comienzan los datos (evitar encabezados)
        inicio_datos = 0
        for i, line in enumerate(lines):
            if "FECHA" in line and "PRECIP" in line:  # Detectar encabezado de la tabla
                inicio_datos = i
                break

        # Leer los datos desde la línea detectada
        df = pd.read_csv(ruta_archivo, skiprows=inicio_datos, delim_whitespace=True)

        # Eliminar la primera fila que contiene las unidades de medida
        df = df.iloc[1:].copy()

        # Convertir columnas numéricas al tipo adecuado
        columnas_numericas = ["PRECIP", "EVAP", "TMAX", "TMIN"]
        df[columnas_numericas] = df[columnas_numericas].apply(pd.to_numeric, errors='coerce')

        return df
    except Exception as e:
        print(f"Error al procesar {ruta_archivo}: {e}")
        return None

# Procesar todos los archivos en la carpeta de TXT
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo)

        # Procesar el archivo y obtener el DataFrame
        df_datos = procesar_archivo_txt(ruta_txt)

        if df_datos is not None:
            # Definir la ruta de salida en la carpeta DIARIOS_excel
            nombre_salida = os.path.splitext(archivo)[0] + ".xlsm"
            ruta_excel = os.path.join(carpeta_excel, nombre_salida)

            # Guardar en un archivo temporal de Excel
            ruta_temporal = ruta_excel.replace(".xlsm", ".xlsx")
            df_datos.to_excel(ruta_temporal, index=False, engine='openpyxl')

            # Convertir el archivo a .xlsm con xlwings
            app = xw.App(visible=False)
            wb = app.books.open(ruta_temporal)
            wb.save(ruta_excel)
            wb.close()
            app.quit()

            # Eliminar el archivo temporal .xlsx
            os.remove(ruta_temporal)

            print(f"Archivo guardado correctamente: {ruta_excel}")

print("Proceso completado. Todos los archivos han sido convertidos a Excel .xlsm correctamente.")


Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01003.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01006.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01008.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01009.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01010.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01011.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia01012.xlsm
Archivo guardado correctamente: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\DIARIOS\DIARIOS_excel\dia010

com_error: (-2147352567, 'Ocurrió una excepción.', (0, 'Microsoft Excel', 'No se puede obtener acceso a "dia01023.xlsm".', 'xlmain11.chm', 0, -2146827284), None)

# Opción 1 mensuales


In [13]:
import os
import pandas as pd
import xlwings as xw

# Definir carpetas
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel = os.path.join(carpeta_txt, "MENSUALES_excel1")

# Crear la carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Nombres de las tablas identificadas
nombres_tablas = [
    "LLUVIA MÁXIMA 24 H.",
    "LLUVIA TOTAL MENSUAL",
    "EVAPORACIÓN MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO",
    "TEMPERATURA MÁXIMA EXTREMA",
    "TEMPERATURA MÍNIMA PROMEDIO",
    "TEMPERATURA MÍNIMA EXTREMA",
    "TEMPERATURA MEDIA MENSUAL"
]

# Procesar archivos TXT
for archivo_txt in os.listdir(carpeta_txt):
    if archivo_txt.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo_txt)
        with open(ruta_txt, "r", encoding="utf-8") as file:
            lineas = file.readlines()
        
        tablas = {}
        tabla_actual = None
        datos_actuales = []
        
        for linea in lineas:
            linea = linea.strip()
            if linea in nombres_tablas:
                if tabla_actual and datos_actuales:
                    tablas[tabla_actual] = pd.DataFrame(datos_actuales)
                tabla_actual = linea
                datos_actuales = []
            elif tabla_actual and linea:
                datos_actuales.append(linea.split())
        
        if tabla_actual and datos_actuales:
            tablas[tabla_actual] = pd.DataFrame(datos_actuales)

        # Crear archivo XLSM temporal
        nombre_excel = archivo_txt.replace(".txt", ".xlsm")
        ruta_excel = os.path.join(carpeta_excel, nombre_excel)
        
        with pd.ExcelWriter(ruta_excel, engine='openpyxl') as writer:
            for nombre_tabla, df in tablas.items():
                df.to_excel(writer, sheet_name=nombre_tabla[:31], index=False, header=False)

        # Convertir a XLSM con xlwings
        app = xw.App(visible=False)
        wb = app.books.open(ruta_excel)
        wb.save()
        wb.close()
        app.quit()



com_error: (-2147352567, 'Ocurrió una excepción.', (0, 'Microsoft Excel', "Excel no puede abrir el archivo 'mes01003.xlsm' porque el formato o la extensión no son válidos. Compruebe que el archivo no se ha dañado y que la extensión y el formato del archivo coinciden.", 'xlmain11.chm', 0, -2146827284), None)

In [11]:
import pandas as pd
import os

# Ruta de la carpeta donde se guardará el archivo
ruta_carpeta = "MENSUALES_excel2"
os.makedirs(ruta_carpeta, exist_ok=True)

# Ruta del archivo de salida
ruta_excel = os.path.join(ruta_carpeta, "datos_mensuales.xlsx")

# Definir nombres de las tablas
nombres_tablas = [
    "LLUVIA MÁXIMA 24 H.",
    "LLUVIA TOTAL MENSUAL",
    "EVAPORACIÓN MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO",
    "TEMPERATURA MÁXIMA EXTREMA",
    "TEMPERATURA MÍNIMA PROMEDIO",
    "TEMPERATURA MÍNIMA EXTREMA",
    "TEMPERATURA MEDIA MENSUAL"
]

# Simulación de lectura y procesamiento de datos (ajustar con los datos reales)
datos_tablas = []
for nombre in nombres_tablas:
    # Generar datos de ejemplo (Reemplazar con los datos reales extraídos)
    df = pd.DataFrame({
        "AÑO": list(range(2000, 2010)),
        "ENE": [round(i * 1.1, 1) for i in range(10)],
        "FEB": [round(i * 1.2, 1) for i in range(10)],
        "MAR": [round(i * 1.3, 1) for i in range(10)],
        "ABR": [round(i * 1.4, 1) for i in range(10)],
        "MAY": [round(i * 1.5, 1) for i in range(10)],
        "JUN": [round(i * 1.6, 1) for i in range(10)],
        "JUL": [round(i * 1.7, 1) for i in range(10)],
        "AGO": [round(i * 1.8, 1) for i in range(10)],
        "SEP": [round(i * 1.9, 1) for i in range(10)],
        "OCT": [round(i * 2.0, 1) for i in range(10)],
        "NOV": [round(i * 2.1, 1) for i in range(10)],
        "DIC": [round(i * 2.2, 1) for i in range(10)],
        "ACUM": [round(i * 2.3, 1) for i in range(10)],
        "PROM": [round(i * 2.4, 1) for i in range(10)],
        "MESES": [12] * 10
    })
    
    # Agregar columna con el nombre de la tabla
    df["TIPO DE DATO"] = nombre
    datos_tablas.append(df)

# Concatenar todas las tablas en una sola
df_final = pd.concat(datos_tablas, ignore_index=True)

# Guardar en Excel en una sola hoja
df_final.to_excel(ruta_excel, sheet_name="Datos_Mensuales", index=False)

print(f"Archivo guardado en: {ruta_excel}")


Archivo guardado en: MENSUALES_excel2\datos_mensuales.xlsx


In [16]:
import os
import pandas as pd
import xlwings as xw
import numpy as np

# Definir rutas de entrada y salida
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel1 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1"
carpeta_excel2 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel2"

# Crear carpetas de salida si no existen
os.makedirs(carpeta_excel1, exist_ok=True)
os.makedirs(carpeta_excel2, exist_ok=True)

# Definir las secciones de tablas
secciones = [
    "LLUVIA MÁXIMA 24 H.", "LLUVIA TOTAL MENSUAL", "EVAPORACIÓN MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO", "TEMPERATURA MÁXIMA EXTREMA", 
    "TEMPERATURA MÍNIMA PROMEDIO", "TEMPERATURA MÍNIMA EXTREMA", "TEMPERATURA MEDIA MENSUAL"
]

def leer_archivo_txt(ruta):
    """Leer un archivo de texto y extraer su contenido"""
    with open(ruta, 'r', encoding='utf-8') as file:
        lineas = file.readlines()
    return lineas

def extraer_tablas(lineas):
    """Extraer datos de tablas basadas en las secciones identificadas"""
    tablas = {}
    nombre_tabla = None
    datos = []
    columnas = []
    
    for linea in lineas:
        linea = linea.strip()
        if linea in secciones:
            if nombre_tabla and datos:
                df = pd.DataFrame(datos, columns=columnas).replace('', np.nan)
                tablas[nombre_tabla] = df
            nombre_tabla = linea
            datos = []
            columnas = []
        elif nombre_tabla and linea:
            valores = linea.split()
            if not columnas:
                columnas = valores  # Asignar la primera fila como nombres de columnas
            else:
                while len(valores) < len(columnas):
                    valores.append(np.nan)  # Rellenar con NaN para mantener la alineación
                datos.append(valores)
    
    if nombre_tabla and datos:
        df = pd.DataFrame(datos, columns=columnas).replace('', np.nan)
        tablas[nombre_tabla] = df
    
    return tablas

def opcion_1(txt_files):
    """Cada tabla en una hoja separada"""
    for archivo in txt_files:
        ruta_txt = os.path.join(carpeta_txt, archivo)
        lineas = leer_archivo_txt(ruta_txt)
        tablas = extraer_tablas(lineas)
        
        if tablas:
            ruta_excel = os.path.join(carpeta_excel1, archivo.replace('.txt', '.xlsm'))
            wb = xw.Book()
            for nombre, df in tablas.items():
                sheet = wb.sheets.add(name=nombre[:31])
                sheet.range("A1").value = [df.columns.tolist()] + df.fillna('').values.tolist()
            wb.save(ruta_excel)
            wb.close()

def opcion_2(txt_files):
    """Todas las tablas en una sola hoja con columna de tipo de dato"""
    for archivo in txt_files:
        ruta_txt = os.path.join(carpeta_txt, archivo)
        lineas = leer_archivo_txt(ruta_txt)
        tablas = extraer_tablas(lineas)
        
        if tablas:
            ruta_excel = os.path.join(carpeta_excel2, archivo.replace('.txt', '.xlsm'))
            wb = xw.Book()
            sheet = wb.sheets.add(name="Datos Combinados")
            df_final = pd.DataFrame()
            
            for nombre, df in tablas.items():
                df.insert(0, "Tipo de Dato", nombre)
                while df.shape[1] < len(df.columns):
                    df[df.columns[df.shape[1]]] = np.nan  # Asegurar alineación con NaN
                df_final = pd.concat([df_final, df], ignore_index=True)
            
            sheet.range("A1").value = [df_final.columns.tolist()] + df_final.fillna('').values.tolist()
            wb.save(ruta_excel)
            wb.close()

# Obtener archivos de la carpeta de textos
txt_files = [f for f in os.listdir(carpeta_txt) if f.endswith('.txt')]

# Ejecutar ambas opciones
opcion_1(txt_files)
opcion_2(txt_files)

print("Conversión completada.")


com_error: (-2147352567, 'Ocurrió una excepción.', (0, 'Microsoft Excel', 'Error en el método Add de la clase Workbooks.', 'xlmain11.chm', 0, -2146827284), None)

In [25]:
import os
import pandas as pd
import xlwings as xw

# Definir rutas de entrada y salida
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel1 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1"
carpeta_excel2 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel2"

# Crear carpetas de salida si no existen
os.makedirs(carpeta_excel1, exist_ok=True)
os.makedirs(carpeta_excel2, exist_ok=True)

# Definir las secciones de tablas
secciones = [
    "LLUVIA MÁXIMA 24 H.", "LLUVIA TOTAL MENSUAL", "EVAPORACIÓN MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO", "TEMPERATURA MÁXIMA EXTREMA", 
    "TEMPERATURA MÍNIMA PROMEDIO", "TEMPERATURA MÍNIMA EXTREMA", "TEMPERATURA MEDIA MENSUAL"
]

def txt_a_xlsx(ruta_txt, ruta_xlsx):
    """Convierte un archivo TXT a XLSX sin modificar su estructura."""
    with open(ruta_txt, 'r', encoding='utf-8') as file:
        lineas = file.readlines()
    
    df = pd.DataFrame([line.strip().split() for line in lineas])
    df.to_excel(ruta_xlsx, index=False, header=False)

def identificar_tablas(ruta_xlsx):
    """Identifica las tablas dentro del archivo XLSX y las separa correctamente."""
    df = pd.read_excel(ruta_xlsx, header=None)
    tablas = {}
    nombre_tabla = None
    datos = []
    
    for _, row in df.iterrows():
        row_data = row.dropna().astype(str).tolist()
        if not row_data:
            continue
        if row_data[0] in secciones:
            if nombre_tabla and datos:
                tablas[nombre_tabla] = pd.DataFrame(datos)
            nombre_tabla = row_data[0]
            datos = []
        else:
            datos.append(row_data)
    
    if nombre_tabla and datos:
        tablas[nombre_tabla] = pd.DataFrame(datos)
    
    if not tablas:
        print(f"No se encontraron tablas en {ruta_xlsx}. Verifica si los datos están correctamente estructurados.")
    
    return tablas

def guardar_xlsx(tablas, ruta_xlsx, opcion):
    """Guarda los datos en XLSX, opción 1 en hojas separadas, opción 2 en una sola hoja."""
    with pd.ExcelWriter(ruta_xlsx, engine='xlsxwriter') as writer:
        if opcion == 1:
            for nombre, df in tablas.items():
                if not df.empty:
                    df.to_excel(writer, sheet_name=nombre[:31], index=False, header=False)
        else:
            if not tablas:
                print(f"No hay datos para guardar en {ruta_xlsx}")
                return
            df_lista = [df.assign(Tipo=nombre) for nombre, df in tablas.items() if not df.empty]
            if df_lista:
                df_final = pd.concat(df_lista, ignore_index=True)
                df_final.to_excel(writer, sheet_name="Datos Combinados", index=False, header=False)
            else:
                print(f"No hay datos válidos para concatenar en {ruta_xlsx}")

def convertir_xlsx_a_xlsm(ruta_xlsx, ruta_xlsm):
    """Convierte un archivo XLSX a XLSM usando xlwings."""
    app = xw.App(visible=False)
    wb = app.books.open(ruta_xlsx)
    wb.save(ruta_xlsm)
    wb.close()
    app.quit()

# Procesar los archivos TXT y generar XLSX
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith('.txt'):
        ruta_txt = os.path.join(carpeta_txt, archivo)
        ruta_xlsx = os.path.join(carpeta_excel1, archivo.replace('.txt', '.xlsx'))
        txt_a_xlsx(ruta_txt, ruta_xlsx)
        
        tablas = identificar_tablas(ruta_xlsx)
        
        if not tablas:
            print(f"No se procesaron tablas en {ruta_xlsx}. Verifica el contenido del archivo.")
            continue
        
        ruta_xlsx_opcion1 = os.path.join(carpeta_excel1, archivo.replace('.txt', '_opcion1.xlsx'))
        ruta_xlsx_opcion2 = os.path.join(carpeta_excel2, archivo.replace('.txt', '_opcion2.xlsx'))
        
        guardar_xlsx(tablas, ruta_xlsx_opcion1, opcion=1)
        guardar_xlsx(tablas, ruta_xlsx_opcion2, opcion=2)
        
        # Convertir XLSX a XLSM si los archivos existen
        if os.path.exists(ruta_xlsx_opcion1):
            convertir_xlsx_a_xlsm(ruta_xlsx_opcion1, ruta_xlsx_opcion1.replace('.xlsx', '.xlsm'))
        if os.path.exists(ruta_xlsx_opcion2):
            convertir_xlsx_a_xlsm(ruta_xlsx_opcion2, ruta_xlsx_opcion2.replace('.xlsx', '.xlsm'))

print("Conversión completada.")



No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01003.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01003.xlsx. Verifica el contenido del archivo.
No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01006.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01006.xlsx. Verifica el contenido del archivo.
No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01008.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01008.xlsx. Verifica el contenido del archivo.
No se encontraron t

KeyboardInterrupt: 

In [26]:
import os
import pandas as pd
import xlwings as xw
import re

# Definir rutas de entrada y salida
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel1 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1"
carpeta_excel2 = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel2"

# Crear carpetas de salida si no existen
os.makedirs(carpeta_excel1, exist_ok=True)
os.makedirs(carpeta_excel2, exist_ok=True)

# Definir las secciones de tablas
secciones = [
    "LLUVIA MÁXIMA 24 H.", "LLUVIA TOTAL MENSUAL", "EVAPORACIÓN MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO", "TEMPERATURA MÁXIMA EXTREMA", 
    "TEMPERATURA MÍNIMA PROMEDIO", "TEMPERATURA MÍNIMA EXTREMA", "TEMPERATURA MEDIA MENSUAL"
]

def limpiar_linea(linea):
    """Limpia una línea del archivo TXT asegurando que los espacios sean consistentes."""
    linea = re.sub(r'\s+', ' ', linea.strip())  # Reemplaza múltiples espacios con uno solo
    return linea.split(' ')

def txt_a_xlsx(ruta_txt, ruta_xlsx):
    """Convierte un archivo TXT a XLSX sin modificar su estructura pero asegurando buena alineación."""
    with open(ruta_txt, 'r', encoding='utf-8') as file:
        lineas = file.readlines()
    
    df = pd.DataFrame([limpiar_linea(line) for line in lineas])
    df.to_excel(ruta_xlsx, index=False, header=False)

def identificar_tablas(ruta_xlsx):
    """Identifica las tablas dentro del archivo XLSX asegurando una alineación adecuada."""
    df = pd.read_excel(ruta_xlsx, header=None, dtype=str)
    df.fillna('', inplace=True)
    tablas = {}
    nombre_tabla = None
    datos = []
    
    for _, row in df.iterrows():
        row_data = row.tolist()
        row_data = [str(x).strip() for x in row_data if x.strip() != '']  # Eliminar espacios innecesarios
        
        if not row_data:
            continue
        
        if row_data[0] in secciones:
            if nombre_tabla and datos:
                tablas[nombre_tabla] = pd.DataFrame(datos)
            nombre_tabla = row_data[0]
            datos = []
        else:
            datos.append(row_data)
    
    if nombre_tabla and datos:
        tablas[nombre_tabla] = pd.DataFrame(datos)
    
    if not tablas:
        print(f"No se encontraron tablas en {ruta_xlsx}. Verifica si los datos están correctamente estructurados.")
    
    return tablas

def guardar_xlsx(tablas, ruta_xlsx, opcion):
    """Guarda los datos en XLSX, opción 1 en hojas separadas, opción 2 en una sola hoja."""
    with pd.ExcelWriter(ruta_xlsx, engine='xlsxwriter') as writer:
        if opcion == 1:
            for nombre, df in tablas.items():
                if not df.empty:
                    df.to_excel(writer, sheet_name=nombre[:31], index=False, header=False)
        else:
            if not tablas:
                print(f"No hay datos para guardar en {ruta_xlsx}")
                return
            df_lista = [df.assign(Tipo=nombre) for nombre, df in tablas.items() if not df.empty]
            if df_lista:
                df_final = pd.concat(df_lista, ignore_index=True)
                df_final.to_excel(writer, sheet_name="Datos Combinados", index=False, header=False)
            else:
                print(f"No hay datos válidos para concatenar en {ruta_xlsx}")

def convertir_xlsx_a_xlsm(ruta_xlsx, ruta_xlsm):
    """Convierte un archivo XLSX a XLSM usando xlwings."""
    app = xw.App(visible=False)
    wb = app.books.open(ruta_xlsx)
    wb.save(ruta_xlsm)
    wb.close()
    app.quit()

# Procesar los archivos TXT y generar XLSX
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith('.txt'):
        ruta_txt = os.path.join(carpeta_txt, archivo)
        ruta_xlsx = os.path.join(carpeta_excel1, archivo.replace('.txt', '.xlsx'))
        txt_a_xlsx(ruta_txt, ruta_xlsx)
        
        tablas = identificar_tablas(ruta_xlsx)
        
        if not tablas:
            print(f"No se procesaron tablas en {ruta_xlsx}. Verifica el contenido del archivo.")
            continue
        
        ruta_xlsx_opcion1 = os.path.join(carpeta_excel1, archivo.replace('.txt', '_opcion1.xlsx'))
        ruta_xlsx_opcion2 = os.path.join(carpeta_excel2, archivo.replace('.txt', '_opcion2.xlsx'))
        
        guardar_xlsx(tablas, ruta_xlsx_opcion1, opcion=1)
        guardar_xlsx(tablas, ruta_xlsx_opcion2, opcion=2)
        
        # Convertir XLSX a XLSM si los archivos existen
        if os.path.exists(ruta_xlsx_opcion1):
            convertir_xlsx_a_xlsm(ruta_xlsx_opcion1, ruta_xlsx_opcion1.replace('.xlsx', '.xlsm'))
        if os.path.exists(ruta_xlsx_opcion2):
            convertir_xlsx_a_xlsm(ruta_xlsx_opcion2, ruta_xlsx_opcion2.replace('.xlsx', '.xlsm'))

print("Conversión completada.")


No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01003.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01003.xlsx. Verifica el contenido del archivo.
No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01006.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01006.xlsx. Verifica el contenido del archivo.
No se encontraron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01008.xlsx. Verifica si los datos están correctamente estructurados.
No se procesaron tablas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel1\mes01008.xlsx. Verifica el contenido del archivo.
No se encontraron t

In [27]:
import pandas as pd
import os

# Definir carpetas
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel = os.path.join(carpeta_txt, "MENSUALES_excel")

# Crear la carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Función para leer y procesar un archivo TXT
def procesar_archivo_txt(ruta_archivo):
    try:
        with open(ruta_archivo, "r", encoding="latin1") as file:
            lines = file.readlines()

        # Encontrar la línea donde comienzan los datos (evitar encabezados)
        inicio_datos = 0
        for i, line in enumerate(lines):
            if "AÑO" in line and "ENE" in line:  # Detectar encabezado de la tabla
                inicio_datos = i
                break

        # Leer los datos desde la línea detectada
        df = pd.read_csv(ruta_archivo, skiprows=inicio_datos, delim_whitespace=True)

        # Eliminar la primera fila que contiene las unidades de medida
        df = df.iloc[1:].copy()

        # Convertir columnas numéricas al tipo adecuado
        columnas_numericas = ["AÑO", "ENE", "FEB", "MAR", "ABR", "MAY", "JUN", "JUL", "AGO", "SEP", "OCT", "NOV", "DIC"]
        df[columnas_numericas] = df[columnas_numericas].apply(pd.to_numeric, errors='coerce')

        return df
    except Exception as e:
        print(f"Error al procesar {ruta_archivo}: {e}")
        return None

# Procesar todos los archivos en la carpeta de TXT
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo)

        # Procesar el archivo y obtener el DataFrame
        df_datos = procesar_archivo_txt(ruta_txt)

        if df_datos is not None:
            # Definir la ruta de salida en la carpeta MENSUALES_excel
            nombre_salida = os.path.splitext(archivo)[0] + ".xlsm"
            ruta_excel = os.path.join(carpeta_excel, nombre_salida)

            # Guardar el DataFrame en un archivo Excel
            df_datos.to_excel(ruta_excel, index=False, engine='openpyxl')

            print(f"Archivo guardado: {ruta_excel}")

print("Proceso completado. Todos los archivos han sido convertidos a Excel.")

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01003.txt: Error tokenizing data. C error: Expected 6 fields in line 8, saw 11

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01006.txt: Error tokenizing data. C error: Expected 6 fields in line 8, saw 11

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01008.txt: Error tokenizing data. C error: Expected 6 fields in line 8, saw 11

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01009.txt: Error tokenizing data. C error: Expected 6 fields in line 8, saw 11

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01010.txt: Error tokenizing data. C error: Expected 6 fields in line 8, saw 11

Error al procesar C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01011.txt: Error tokenizing data. C error: Expected 6 fields in li

In [34]:
import pandas as pd
import os
import re

# Definir carpetas
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel = os.path.join(carpeta_txt, "MENSUALES_excel")

# Crear la carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Función para leer y procesar un archivo TXT
def procesar_archivo_txt(ruta_archivo):
    try:
        with open(ruta_archivo, "r", encoding="latin1") as file:
            lines = file.readlines()

        # Encontrar la línea donde comienzan los datos (evitar encabezados)
        inicio_datos = 0
        for i, line in enumerate(lines):
            if "FEB" in line and "ENE" in line:  # Detectar encabezado de la tabla
                inicio_datos = i
                
                break

        # Procesar las líneas asegurando alineación correcta
        datos_procesados = []
        for line in lines[inicio_datos:]:
            line = re.sub(r'\s+', ' ', line.strip())  # Reemplazar múltiples espacios con un solo espacio
            datos_procesados.append(line.split(' '))

        # Crear el DataFrame
        df = pd.DataFrame(datos_procesados)

        # Validar que la primera fila tiene los nombres correctos de las columnas
        if not set(["AÑO", "ENE", "FEB", "MAR", "ABR", "MAY", "JUN", "JUL", "AGO", "SEP", "OCT", "NOV", "DIC"]).issubset(set(df.iloc[0])):
            print(f"Advertencia: No se encontraron todas las columnas esperadas en {ruta_archivo}. Revisar formato.")
            return None

        # Asignar nombres de columnas basados en la primera fila
        df.columns = df.iloc[0]
        df = df[1:].reset_index(drop=True)

        # Convertir columnas numéricas al tipo adecuado
        columnas_numericas = ["AÑO", "ENE", "FEB", "MAR", "ABR", "MAY", "JUN", "JUL", "AGO", "SEP", "OCT", "NOV", "DIC"]
        df[columnas_numericas] = df[columnas_numericas].apply(pd.to_numeric, errors='coerce')

        return df
    except Exception as e:
        print(f"Error al procesar {ruta_archivo}: {e}")
        return None

# Procesar todos los archivos en la carpeta de TXT
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo)

        # Procesar el archivo y obtener el DataFrame
        df_datos = procesar_archivo_txt(ruta_txt)

        if df_datos is not None:
            # Definir la ruta de salida en la carpeta MENSUALES_excel
            nombre_salida = os.path.splitext(archivo)[0] + ".xlsm"
            ruta_excel = os.path.join(carpeta_excel, nombre_salida)

            # Guardar el DataFrame en un archivo Excel
            df_datos.to_excel(ruta_excel, index=False, engine='openpyxl')

            print(f"Archivo guardado: {ruta_excel}")
        else:
            print(f"No se pudo procesar el archivo: {ruta_txt}")

print("Proceso completado. Todos los archivos han sido convertidos a Excel.")


Advertencia: No se encontraron todas las columnas esperadas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01003.txt. Revisar formato.
No se pudo procesar el archivo: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01003.txt
Advertencia: No se encontraron todas las columnas esperadas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01006.txt. Revisar formato.
No se pudo procesar el archivo: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01006.txt
Advertencia: No se encontraron todas las columnas esperadas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01008.txt. Revisar formato.
No se pudo procesar el archivo: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01008.txt
Advertencia: No se encontraron todas las columnas esperadas en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01009.txt. Revisar formato.
No se pudo pr

In [44]:
import os
import pandas as pd

# Ruta de la carpeta donde están los archivos TXT
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel = os.path.join(carpeta_txt, "MENSUALES_excel")

# Crear carpeta de salida si no existe
if not os.path.exists(carpeta_excel):
    os.makedirs(carpeta_excel)

# Función para procesar un archivo TXT
def procesar_archivo_txt(ruta_txt):
    with open(ruta_txt, "r", encoding="latin-1") as archivo:
        lineas = archivo.readlines()
    
    tablas = []
    tabla_actual = []
    nombre_tabla = None

    for linea in lineas:
        # Buscar encabezados de tabla (AÑO, ENE, FEB...)
        if "AÑO" in linea:
            if tabla_actual:  # Si hay una tabla en curso, guardarla
                tablas.append((nombre_tabla, tabla_actual))
                tabla_actual = []

            nombre_tabla = lineas[lineas.index(linea) - 1].strip()  # Nombre de la tabla anterior
            tabla_actual.append(linea.strip())

        elif tabla_actual:
            # Seguir agregando líneas hasta encontrar otra tabla o el final del archivo
            if linea.strip():
                tabla_actual.append(linea.strip())
    
    # Guardar última tabla si existe
    if tabla_actual:
        tablas.append((nombre_tabla, tabla_actual))

    if not tablas:
        print(f"No se encontró ninguna tabla en {ruta_txt}")
        return
    
    # Crear archivo Excel con todas las tablas en hojas separadas
    nombre_excel = os.path.join(carpeta_excel, os.path.basename(ruta_txt).replace(".txt", ".xlsx"))
    with pd.ExcelWriter(nombre_excel) as writer:
        for nombre_tabla, datos_tabla in tablas:
            try:
                df = pd.DataFrame([fila.split() for fila in datos_tabla[1:]], columns=datos_tabla[0].split())
                df.to_excel(writer, sheet_name=nombre_tabla[:31], index=False)  # Hoja máx 31 caracteres
            except Exception as e:
                print(f"Error al procesar tabla '{nombre_tabla}' en {ruta_txt}: {e}")

    print(f"Archivo procesado: {nombre_excel}")

# Procesar todos los archivos TXT en la carpeta
archivos_txt = [f for f in os.listdir(carpeta_txt) if f.endswith(".txt")]

for archivo in archivos_txt:
    procesar_archivo_txt(os.path.join(carpeta_txt, archivo))

print("✅ Proceso completado. Todos los archivos han sido convertidos a Excel.")



No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01003.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01006.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01008.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01009.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01010.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01011.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01012.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES\mes01013.txt
No se encontró ninguna tabla en C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUA

In [45]:
# import pandas as pd

# # Ruta del archivo de texto
# file_path = "/mnt/data/mes01003.txt"

# # Leer el archivo de texto línea por línea con la codificación adecuada
# with open(file_path, "r", encoding="latin-1") as file:
#     lines = file.readlines()

# # Diccionario de nombres corregidos de las tablas en el archivo
# table_names_extended = {
#     "LLUVIA MÁXIMA 24 H.": "LLUVIA MÃ\x81XIMA 24 H.",
#     "LLUVIA TOTAL MENSUAL": "LLUVIA TOTAL MENSUAL",
#     "EVAPORACIÓN MENSUAL": "EVAPORACIÃ\x93N MENSUAL",
#     "TEMPERATURA MÁXIMA PROMEDIO": "TEMPERATURA MÃ\x81XIMA PROMEDIO",
#     "TEMPERATURA MÁXIMA EXTREMA": "TEMPERATURA MÃ\x81XIMA EXTREMA",
#     "TEMPERATURA MÍNIMA PROMEDIO": "TEMPERATURA MÃ\x8dNIMA PROMEDIO",
#     "TEMPERATURA MÍNIMA EXTREMA": "TEMPERATURA MÃ\x8dNIMA EXTREMA",
#     "TEMPERATURA MEDIA MENSUAL": "TEMPERATURA MEDIA MENSUAL",
# }

# # Almacenar las tablas encontradas
# tables = {}
# current_table = None
# current_data = []

# # Procesar línea por línea
# for line in lines:
#     line = line.strip()
#     if line in table_names_extended.values():  # Nueva tabla encontrada
#         if current_table and current_data:
#             tables[current_table] = pd.DataFrame(current_data)
#         # Obtener el nombre real de la tabla
#         current_table = [key for key, value in table_names_extended.items() if value == line][0]
#         current_data = []
#     elif current_table:
#         # Agregar datos a la tabla actual
#         columns = line.split("\t")
#         current_data.append(columns)

# # Guardar última tabla
# if current_table and current_data:
#     tables[current_table] = pd.DataFrame(current_data)

# # Crear un archivo Excel con todas las tablas en hojas separadas
# excel_path = "/mnt/data/datos_climatologicos_completo.xlsx"
# with pd.ExcelWriter(excel_path) as writer:
#     for table_name, df in tables.items():
#         # Asignar la primera fila como encabezados
#         df.columns = df.iloc[0]
#         df = df[1:].reset_index(drop=True)
#         df.to_excel(writer, sheet_name=table_name[:31], index=False)

# # Mostrar el archivo generado
# excel_path


In [None]:
# import pandas as pd
# import re

# # Ruta del archivo de texto
# file_path = "/mnt/data/mes01003.txt"

# # Leer el archivo de texto con codificación adecuada
# with open(file_path, "r", encoding="latin-1") as file:
#     lines = file.readlines()

# # Diccionario de nombres corregidos de las tablas en el archivo
# table_names_extended = {
#     "LLUVIA MÁXIMA 24 H.": "LLUVIA MÃ\x81XIMA 24 H.",
#     "LLUVIA TOTAL MENSUAL": "LLUVIA TOTAL MENSUAL",
#     "EVAPORACIÓN MENSUAL": "EVAPORACIÃ\x93N MENSUAL",
#     "TEMPERATURA MÁXIMA PROMEDIO": "TEMPERATURA MÃ\x81XIMA PROMEDIO",
#     "TEMPERATURA MÁXIMA EXTREMA": "TEMPERATURA MÃ\x81XIMA EXTREMA",
#     "TEMPERATURA MÍNIMA PROMEDIO": "TEMPERATURA MÃ\x8dNIMA PROMEDIO",
#     "TEMPERATURA MÍNIMA EXTREMA": "TEMPERATURA MÃ\x8dNIMA EXTREMA",
#     "TEMPERATURA MEDIA MENSUAL": "TEMPERATURA MEDIA MENSUAL",
# }

# # Almacenar las tablas encontradas
# tables = {}
# current_table = None
# current_data = []

# # Procesar línea por línea
# for line in lines:
#     line = line.strip()
#     if line in table_names_extended.values():  # Nueva tabla encontrada
#         if current_table and current_data:
#             tables[current_table] = pd.DataFrame(current_data)
#         # Obtener el nombre real de la tabla
#         current_table = [key for key, value in table_names_extended.items() if value == line][0]
#         current_data = []
#     elif current_table:
#         # Agregar datos a la tabla actual
#         columns = line.split("\t")
#         current_data.append(columns)

# # Guardar última tabla
# if current_table and current_data:
#     tables[current_table] = pd.DataFrame(current_data)

# # Función para limpiar nombres de columnas y valores de filas
# def clean_column_names(name):
#     replacements = {
#         "AÃ\x91O": "ANIO",
#         "MÃ\x8dNIMA": "MINIMA",
#         "MÃ\x81XIMA": "MAXIMA",
#     }
#     for old, new in replacements.items():
#         name = name.replace(old, new)
#     return name

# # Crear un archivo Excel con todas las tablas en hojas separadas
# excel_path = "/mnt/data/datos_climatologicos_final.xlsx"
# with pd.ExcelWriter(excel_path) as writer:
#     for table_name, df in tables.items():
#         # Limpiar encabezados
#         df.columns = df.iloc[0].apply(clean_column_names)
#         df = df[1:].reset_index(drop=True)

#         # Limpiar valores dentro de la tabla
#         df = df.applymap(lambda x: clean_column_names(str(x)))

#         # Guardar en Excel
#         df.to_excel(writer, sheet_name=table_name[:31], index=False)

# # Mostrar el archivo generado
# excel_path

In [48]:
import os
import pandas as pd
import xlwings as xw

# Carpetas de entrada y salida
carpeta_txt = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
carpeta_excel = os.path.join(carpeta_txt, "MENSUALES_excel")

# Crear la carpeta de salida si no existe
os.makedirs(carpeta_excel, exist_ok=True)

# Diccionario de nombres corregidos de las tablas (NO modificar)
table_names_extended = {
    "LLUVIA MÁXIMA 24 H.": "LLUVIA MÃ\x81XIMA 24 H.",
    "LLUVIA TOTAL MENSUAL": "LLUVIA TOTAL MENSUAL",
    "EVAPORACIÓN MENSUAL": "EVAPORACIÃ\x93N MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO": "TEMPERATURA MÃ\x81XIMA PROMEDIO",
    "TEMPERATURA MÁXIMA EXTREMA": "TEMPERATURA MÃ\x81XIMA EXTREMA",
    "TEMPERATURA MÍNIMA PROMEDIO": "TEMPERATURA MÃ\x8dNIMA PROMEDIO",
    "TEMPERATURA MÍNIMA EXTREMA": "TEMPERATURA MÃ\x8dNIMA EXTREMA",
    "TEMPERATURA MEDIA MENSUAL": "TEMPERATURA MEDIA MENSUAL",
}

# Función para limpiar nombres de columnas y valores de filas
def clean_column_names(name):
    replacements = {
        "AÃ\x91O": "ANIO",
        "MÃ\x8dNIMA": "MINIMA",
        "MÃ\x81XIMA": "MAXIMA",
    }
    for old, new in replacements.items():
        name = name.replace(old, new)
    return name

# Función para procesar un archivo TXT y convertirlo a XLSM
def procesar_txt_a_xlsm(file_path, output_path):
    with open(file_path, "r", encoding="latin-1") as file:
        lines = file.readlines()

    tables = {}
    current_table = None
    current_data = []

    for line in lines:
        line = line.strip()
        if line in table_names_extended.values():
            if current_table and current_data:
                tables[current_table] = pd.DataFrame(current_data)
            current_table = [key for key, value in table_names_extended.items() if value == line][0]
            current_data = []
        elif current_table:
            columns = line.split("\t")
            current_data.append(columns)

    if current_table and current_data:
        tables[current_table] = pd.DataFrame(current_data)

    # Eliminar la última fila de cada tabla si contiene valores None o está vacía
    for table_name in list(tables.keys()):  # Convertimos a lista para evitar errores al modificar el diccionario
        if not tables[table_name].empty:
            while tables[table_name].iloc[-1].isnull().all() or tables[table_name].iloc[-1].eq('').all():
                tables[table_name] = tables[table_name].iloc[:-1]

    # Crear archivo XLSM con xlwings
    app = xw.App(visible=False)
    wb = app.books.add()

    for table_name, df in tables.items():
        if not df.empty:
            sheet_name = table_name[:31]  # Máximo 31 caracteres en nombres de hojas
            sht = wb.sheets.add(sheet_name)
            
            # Verificar si el DataFrame tiene encabezados
            if len(df) > 1:
                # Limpiar encabezados correctamente
                df.columns = df.iloc[0].apply(clean_column_names)  # Aplica limpieza a los encabezados
                df = df[1:].reset_index(drop=True)  # Elimina la fila duplicada de encabezado
            else:
                df.columns = [clean_column_names(col) for col in df.columns]  # Limpia si hay solo una fila
            
            # Limpiar valores dentro de la tabla
            df = df.applymap(lambda x: clean_column_names(str(x)))

            # Escribir los encabezados en Excel
            sht.range("A1").value = df.columns.tolist()

            # Escribir los datos en Excel debajo de los encabezados
            if not df.empty:
                sht.range("A2").value = df.values

    # Guardar como XLSM
    wb.sheets[0].delete()  # Eliminar hoja en blanco creada por defecto
    wb.save(output_path)
    wb.close()
    app.quit()

# Procesar todos los archivos TXT en la carpeta
for archivo in os.listdir(carpeta_txt):
    if archivo.endswith(".txt"):
        ruta_txt = os.path.join(carpeta_txt, archivo)
        nombre_salida = os.path.splitext(archivo)[0] + ".xlsm"
        ruta_xlsm = os.path.join(carpeta_excel, nombre_salida)
        
        print(f"Procesando {archivo} → {nombre_salida}...")
        procesar_txt_a_xlsm(ruta_txt, ruta_xlsm)

print("✅ Conversión completa. Archivos guardados en:", carpeta_excel)



Procesando mes01003.txt → mes01003.xlsm...
Procesando mes01006.txt → mes01006.xlsm...
Procesando mes01008.txt → mes01008.xlsm...
Procesando mes01009.txt → mes01009.xlsm...
Procesando mes01010.txt → mes01010.xlsm...


KeyboardInterrupt: 

In [55]:
import os
import pandas as pd
import xlwings as xw

# Directorios
input_folder = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES"
output_folder = r"C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel"

# Crear la carpeta de salida si no existe
os.makedirs(output_folder, exist_ok=True)

# Diccionario de nombres corregidos de las tablas en el archivo
table_names_extended = {
    "LLUVIA MÁXIMA 24 H.": "LLUVIA MÃ\x81XIMA 24 H.",
    "LLUVIA TOTAL MENSUAL": "LLUVIA TOTAL MENSUAL",
    "EVAPORACIÓN MENSUAL": "EVAPORACIÃ\x93N MENSUAL",
    "TEMPERATURA MÁXIMA PROMEDIO": "TEMPERATURA MÃ\x81XIMA PROMEDIO",
    "TEMPERATURA MÁXIMA EXTREMA": "TEMPERATURA MÃ\x81XIMA EXTREMA",
    "TEMPERATURA MÍNIMA PROMEDIO": "TEMPERATURA MÃ\x8dNIMA PROMEDIO",
    "TEMPERATURA MÍNIMA EXTREMA": "TEMPERATURA MÃ\x8dNIMA EXTREMA",
    "TEMPERATURA MEDIA MENSUAL": "TEMPERATURA MEDIA MENSUAL",
}

# Función para limpiar nombres de columnas y valores de filas
def clean_column_names(name):
    replacements = {
        "AÃ\x91O": "ANIO",
        "MÃ\x8dNIMA": "MINIMA",
        "MÃ\x81XIMA": "MAXIMA",
    }
    for old, new in replacements.items():
        name = name.replace(old, new)
    return name

# Procesar todos los archivos .txt en la carpeta de entrada
for filename in os.listdir(input_folder):
    if filename.endswith(".txt"):
        file_path = os.path.join(input_folder, filename)
        with open(file_path, "r", encoding="latin-1") as file:
            lines = file.readlines()

        # Almacenar las tablas encontradas
        tables = {}
        current_table = None
        current_data = []

        for line in lines:
            line = line.strip()
            if line in table_names_extended.values():  # Nueva tabla encontrada
                if current_table and current_data:
                    tables[current_table] = pd.DataFrame(current_data)
                current_table = [key for key, value in table_names_extended.items() if value == line][0]
                current_data = []
            elif current_table:
                columns = line.split("\t")
                current_data.append(columns)

        # Guardar última tabla
        if current_table and current_data:
            tables[current_table] = pd.DataFrame(current_data)

        # Eliminar la última fila de cada tabla si está vacía
        for table_name in tables:
            if tables[table_name].iloc[-1].isnull().all() or tables[table_name].iloc[-1].eq('').all():
                tables[table_name] = tables[table_name].iloc[:-1]

        # Crear un archivo Excel con todas las tablas en hojas separadas
        output_file = os.path.join(output_folder, f"{os.path.splitext(filename)[0]}.xlsm")
        
        app = xw.App(visible=False)  # Inicia Excel en segundo plano
        wb = app.books.add()  # Crea un nuevo libro de Excel

        for table_name, df in tables.items():
            df.columns = df.iloc[0].apply(clean_column_names)
            df = df[1:].reset_index(drop=True)
            df = df.applymap(lambda x: clean_column_names(str(x)))

            # Agregar hoja y escribir datos
            sheet = wb.sheets.add(name=table_name[:31])
            sheet.range("A1").value = df

        wb.save(output_file)
        wb.close()
        app.quit()

print("Conversión completada. Archivos guardados en:", output_folder)


Conversión completada. Archivos guardados en: C:\Users\ALEN\Documents\trabajo doc bautista\climatologia\MENSUALES_excel
