In [16]:
# --- IMPORTACIONES ---

import pandas as pd
import glob
import os

In [17]:
# --- CONFIGURACIONES ---

# RUTA A LOS DATOS
# Busca todos los archivos que terminen en '*_cleaned.csv' en la carpeta 
# especificada y los almacena en una lista
data_path = '../../data/processed/cleaned/'
data_files = glob.glob(os.path.join(data_path, '*_cleaned.csv'))

# Imprime los archivos encontrados
print(f'Archivos con datos encontrados: {len(data_files)}')
print(data_files)

Archivos con datos encontrados: 8
['../../data/processed/cleaned\\piezo_SDH1PS01_cleaned.csv', '../../data/processed/cleaned\\piezo_SDH1PS02_cleaned.csv', '../../data/processed/cleaned\\piezo_SDH2PP01_cleaned.csv', '../../data/processed/cleaned\\piezo_SDH2PS01_cleaned.csv', '../../data/processed/cleaned\\piezo_SDH2PS02_cleaned.csv', '../../data/processed/cleaned\\piezo_SDH2PS03_cleaned.csv', '../../data/processed/cleaned\\soil_SDH1_cleaned.csv', '../../data/processed/cleaned\\soil_SDH2_cleaned.csv']


In [18]:
# --- DEFINICION DE FUNCIONES ---

# 1. PROMEDIAR A ESCALA DIARIA LOS DATOS SUBHORARIOS

def aggregate_to_daily_mean(file_path):
    """
    Lee un archivo CSV con datos de series de tiempo, lo agrega a una
    escala diaria y calcula el valor promedio para cada día
    """
    # Lee el CSV e identifica el indice como datetime
    df = pd.read_csv(file_path, parse_dates=['Timestamps'], index_col='Timestamps')
    
    # Resamplea el df a escala diaria usando el promedio
    daily_df = df.resample('D').mean()

    return daily_df

In [19]:
# --- BUCLE DE PROCESAMIENTO ---

# Define una carpeta de salida para los datos limpios y la crea si no existe
output_path = '../../data/processed/daily/'
os.makedirs(output_path, exist_ok=True)

# Itera sobre cada archivo
for file_path in data_files:

    # Define el nombre de cada df usando el nombre de archivo
    base_name = os.path.basename(file_path)
    df_name = '_'.join(base_name.split('_')[:2])

    # Imprime el nombre del df en procesamiento
    print(f'\nProcesando el archivo {df_name}...')

    # Llama a la funcion de agregacion diaria
    daily_dataframe = aggregate_to_daily_mean(file_path)

    # Genera un nombre de archivo y asigna ubicacion al df diario
    output_filename = os.path.join(output_path, f'{df_name}_daily.csv')
    
    # Exporta el df procesado como csv
    daily_dataframe.to_csv(output_filename)
    
    # Imprime informacion sobre el nombre del output
    print(f"Datos diarios para {df_name} guardados en: {output_filename}")



Procesando el archivo piezo_SDH1PS01...
Datos diarios para piezo_SDH1PS01 guardados en: ../../data/processed/daily/piezo_SDH1PS01_daily.csv

Procesando el archivo piezo_SDH1PS02...
Datos diarios para piezo_SDH1PS02 guardados en: ../../data/processed/daily/piezo_SDH1PS02_daily.csv

Procesando el archivo piezo_SDH2PP01...
Datos diarios para piezo_SDH2PP01 guardados en: ../../data/processed/daily/piezo_SDH2PP01_daily.csv

Procesando el archivo piezo_SDH2PS01...
Datos diarios para piezo_SDH2PS01 guardados en: ../../data/processed/daily/piezo_SDH2PS01_daily.csv

Procesando el archivo piezo_SDH2PS02...
Datos diarios para piezo_SDH2PS02 guardados en: ../../data/processed/daily/piezo_SDH2PS02_daily.csv

Procesando el archivo piezo_SDH2PS03...
Datos diarios para piezo_SDH2PS03 guardados en: ../../data/processed/daily/piezo_SDH2PS03_daily.csv

Procesando el archivo soil_SDH1...
Datos diarios para soil_SDH1 guardados en: ../../data/processed/daily/soil_SDH1_daily.csv

Procesando el archivo soil_