In [1]:
import os
import pandas as pd

# Ruta al directorio local
local_directory = r"/content/"


# Verificar si el directorio existe
if not os.path.isdir(local_directory):
    print(f"El directorio '{local_directory}' no existe o no es accesible. Verifica la ruta.")
    exit()

# Listar archivos en el directorio
xlsx_files = [file for file in os.listdir(local_directory) if file.endswith('.xlsx')]

# Diagnóstico: Mostrar archivos encontrados
if not xlsx_files:
    print("No se encontraron archivos .xlsx en el directorio.")
    exit()
else:
    print(f"Archivos .xlsx encontrados: {xlsx_files}")

# DataFrame para consolidar los datos
all_data = pd.DataFrame()

# Procesar cada archivo .xlsx
for file_name in xlsx_files:
    file_path = os.path.join(local_directory, file_name)
    print(f"Procesando archivo: {file_name}...")

    try:
        # Leer todas las hojas del archivo Excel
        df = pd.read_excel(file_path, engine='openpyxl', sheet_name=None)
        print(f"Hojas en {file_name}: {list(df.keys())}")

        # Procesar cada hoja
        for sheet_name, sheet_data in df.items():
            if not sheet_data.empty:
                try:
                    print(f"Procesando hoja '{sheet_name}' de {file_name} con {sheet_data.shape[0]} filas.")
                    # Agregar metadatos del archivo
                    sheet_data['Nombre de archivo'] = file_name
                    sheet_data['Nombre de hoja'] = sheet_name
                    # Concatenar al DataFrame principal
                    all_data = pd.concat([all_data, sheet_data], ignore_index=True)
                except Exception as e:
                    print(f"Error procesando hoja '{sheet_name}' en archivo '{file_name}': {e}")
            else:
                print(f"La hoja '{sheet_name}' de {file_name} está vacía.")
    except Exception as e:
        print(f"Error procesando archivo {file_name}: {e}")
        continue

# Verificar y exportar datos
if not all_data.empty:
    output_file = os.path.join(local_directory, 'datos_combinados_DLP_Noviembre.csv')
    try:
        all_data.to_csv(output_file, index=False, sep=';', encoding='utf-8')
        print(f"Datos exportados a {output_file} con separador ';'.")
    except Exception as e:
        print(f"Error al exportar datos: {e}")
else:
    print("No se encontraron datos para exportar.")


Archivos .xlsx encontrados: ['DLP2-NOVIEMBRE - 4 of 11.xlsx', 'DLP2-NOVIEMBRE - 10 of 11.xlsx', 'DLP2-NOVIEMBRE - 7 of 11.xlsx', 'DLP2-NOVIEMBRE - 1 of 11.xlsx', 'DLP2-NOVIEMBRE - 8 of 11.xlsx', 'DLP2-NOVIEMBRE - 2 of 11.xlsx', 'DLP2-NOVIEMBRE - 3 of 11.xlsx', 'DLP2-NOVIEMBRE - 5 of 11.xlsx', 'DLP2-NOVIEMBRE - 6 of 11.xlsx', 'DLP2-NOVIEMBRE - 11 of 11.xlsx', 'DLP2-NOVIEMBRE - 9 of 11.xlsx']
Procesando archivo: DLP2-NOVIEMBRE - 4 of 11.xlsx...
Hojas en DLP2-NOVIEMBRE - 4 of 11.xlsx: ['Hoja 1']
Procesando hoja 'Hoja 1' de DLP2-NOVIEMBRE - 4 of 11.xlsx con 116922 filas.
Procesando archivo: DLP2-NOVIEMBRE - 10 of 11.xlsx...
Hojas en DLP2-NOVIEMBRE - 10 of 11.xlsx: ['Hoja 1']
Procesando hoja 'Hoja 1' de DLP2-NOVIEMBRE - 10 of 11.xlsx con 116922 filas.
Procesando archivo: DLP2-NOVIEMBRE - 7 of 11.xlsx...
Hojas en DLP2-NOVIEMBRE - 7 of 11.xlsx: ['Hoja 1']
Procesando hoja 'Hoja 1' de DLP2-NOVIEMBRE - 7 of 11.xlsx con 116922 filas.
Procesando archivo: DLP2-NOVIEMBRE - 1 of 11.xlsx...
Hojas en D

In [2]:
#Descargar archivo DLP Noviembre al PC
from google.colab import files
files.download('datos_combinados_DLP_Noviembre.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>