Descompresion de datos

In [1]:
import zipfile
import os

def descomprimir_zips_en_datos():
    """
    Descomprime todos los archivos ZIP encontrados en el directorio actual
    dentro de una subcarpeta llamada 'datos'.
    """
    carpeta_destino = "datos"

    # Crear la carpeta 'datos' si no existe
    if not os.path.exists(carpeta_destino):
        os.makedirs(carpeta_destino)
        print(f"Carpeta '{carpeta_destino}' creada.")

    # Obtener una lista de todos los archivos en el directorio actual
    archivos_en_directorio = os.listdir('.')

    # Filtrar solo los archivos .zip
    archivos_zip = [f for f in archivos_en_directorio if f.endswith('.zip')]

    if not archivos_zip:
        print("No se encontraron archivos ZIP en el directorio actual.")
        return

    print(f"Archivos ZIP encontrados: {archivos_zip}")

    for archivo_zip in archivos_zip:
        ruta_completa_zip = os.path.join('.', archivo_zip)
        try:
            with zipfile.ZipFile(ruta_completa_zip, 'r') as zip_ref:
                zip_ref.extractall(os.path.join('.', carpeta_destino))
            print(f"'{archivo_zip}' descomprimido exitosamente en '{carpeta_destino}'.")
        except zipfile.BadZipFile:
            print(f"Error: '{archivo_zip}' no es un archivo ZIP válido o está corrupto.")
        except Exception as e:
            print(f"Ocurrió un error al descomprimir '{archivo_zip}': {e}")

descomprimir_zips_en_datos()

Carpeta 'datos' creada.
Archivos ZIP encontrados: ['estadisticas_normales_9120.zip', 'Registro_temperaturas-05072025.zip']
'estadisticas_normales_9120.zip' descomprimido exitosamente en 'datos'.
'Registro_temperaturas-05072025.zip' descomprimido exitosamente en 'datos'.


In [None]:
import pandas as pd
import os

def cargar_excel_desde_datos(nombre_archivo):
    """
    Carga un archivo Excel desde la subcarpeta 'datos'.

    Args:
        nombre_archivo (str): El nombre completo del archivo Excel a cargar.

    Returns:
        pd.DataFrame: El DataFrame de pandas con los datos del Excel, o None si hay un error.
    """
    ruta_completa = os.path.join('datos', nombre_archivo)

    if not os.path.exists(ruta_completa):
        print(f"Error: El archivo '{ruta_completa}' no se encontró.")
        return None

    try:
        df = pd.read_excel(ruta_completa, header=4)
        print(f"Archivo '{nombre_archivo}' cargado exitosamente desde 'datos/'.")
        print("Primeras 5 filas del DataFrame:")
        print(df.head())
        return df
    except Exception as e:
        print(f"Ocurrió un error al cargar el archivo Excel: {e}")
        return None
    
nombre_excel = "Estadísticas normales Datos abiertos 1991-2020.xlsx"
df = cargar_excel_desde_datos(nombre_excel)

if df is not None:
    print("\nInformación del DataFrame:")
    df.info()
    df.head()


Archivo 'Estadísticas normales Datos abiertos 1991-2020.xlsx' cargado exitosamente desde 'datos/'.
Primeras 5 filas del DataFrame:
                 Estación                           Valor Medio de   Ene  \
0  LA QUIACA OBSERVATORIO                         Temperatura (°C)  13.2   
1  LA QUIACA OBSERVATORIO                  Temperatura máxima (°C)  20.6   
2  LA QUIACA OBSERVATORIO                  Temperatura mínima (°C)   7.7   
3  LA QUIACA OBSERVATORIO                     Humedad relativa (%)  62.6   
4  LA QUIACA OBSERVATORIO  Velocidad del Viento (km/h) (2011-2020)   6.5   

    Feb   Mar   Abr   May   Jun   Jul   Ago   Sep   Oct   Nov   Dic  
0    13  12.8  11.3   7.3   4.8   4.5     7    10  12.4  13.4  13.9  
1  20.4  20.6  20.3  17.8  16.3  16.1    18    20  21.7  22.5  22.2  
2   7.6   6.6   3.1  -2.5  -5.7  -6.2    -4  -0.4   3.3   5.5   7.3  
3  63.2  60.3    46  32.6  27.4  25.7  26.7  32.1  42.4  48.6  55.8  
4   6.8   6.7   5.5   4.8   5.5   5.9   6.7   7.9   7.9   7.7 

In [7]:
df.describe()
df.columns

Index(['Estación', 'Valor Medio de', 'Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun',
       'Jul', 'Ago', 'Sep', 'Oct', 'Nov', 'Dic'],
      dtype='object')