# Ordenamiento de datos

In [7]:
import sys
import os
from functools import reduce

project_path = os.path.abspath('..')
sys.path.insert(1, project_path)

import pandas as pd
import numpy as np

from src.utils import get_project_root 

Variables presentes en ambas estaciones
- SO2
- NO2
- NO
- NOX
- O3
- CO
- Dirección del viento
- Velocidad del viento

In [8]:
def adjust_index(minma_df):
    """Combina los indices fecha y hora de un df con datos de MINMA
    y los transforma en un DatetimeIndex.
    
    Parameters
    ----------
    minma_df : pd.DataFrame
        pd.DataFrame con datos de MINMA a modificar.
    """    
    padding = '0'
    date_len = 6
    time_len = 4 
    minma_df.index = minma_df.index.set_levels([s.rjust(date_len,padding) for s in minma_df.index.levels[0].astype(str)], level=0)
    minma_df.index = minma_df.index.set_levels([s.rjust(time_len,padding) for s in minma_df.index.levels[1].astype(str)], level=1)
    minma_df.index = minma_df.index.map(' '.join)
    minma_df.index = minma_df.index.map(lambda x: '20'+x if (x[0] != '9') else '19'+x) 
    minma_df.index = pd.to_datetime(minma_df.index)

In [9]:
def get_minma_data(param_list, station, from_last=None, to_date=-1, n_cols=5):
    """Recibe una lista de parámetros para una estación y entrega
    un DataFrame con datos dentro de algún período.

    Parameters
    ----------
    param_list : list[str]
        list con parámetros monitoreados a utilizar.
    station : str
        str con nombre de la estación de interés.
    from_last : str
        str indicando el tiempo hacia atrás a considerar.
    to_date : str
        str indicando la fecha hacia el presente a considerar.

    Returns
    -------
    pd.DataFrame
        pd.DataFrame con datos de cada parámetro para alguna estación.       
    """        
    param_df_list = []
    for param in param_list:
        path = get_project_root() / 'data' / 'raw' / station / f'{station}_{param}.csv'
        param_df = pd.read_csv(path,
                                sep=';',
                                usecols=range(len(param_list)),
                                index_col=[0,1]
                                ).add_suffix(f'_{param}')
        param_df_list.append(param_df)
    station_df = reduce(lambda  left,right: pd.merge(left,right,on=['FECHA (YYMMDD)', 'HORA (HHMM)']), param_df_list)
    adjust_index(station_df)
    if to_date == -1:
        to_date = station_df.index[-1]
    from_date = None
    if from_last != None:
        from_date = to_date - pd.Timedelta(from_last)
    return station_df.loc[from_date:to_date]

## Los Maitenes

In [4]:
get_minma_data(['SO2','NO2','NO','NOX','O3','CO'], 'maitenes')

  if (await self.run_code(code, result,  async_=asy)):


Unnamed: 0,Registros validados_SO2,Registros preliminares_SO2,Registros no validados_SO2,Registros validados_NO2,Registros preliminares_NO2,Registros no validados_NO2,Registros validados_NO,Registros preliminares_NO,Registros no validados_NO,Registros validados_NOX,Registros preliminares_NOX,Registros no validados_NOX,Registros validados_O3,Registros preliminares_O3,Registros no validados_O3,Registros validados_CO,Registros preliminares_CO,Registros no validados_CO
2009-09-01 01:00:00,,19084,,,82,,,3,,,112,,,26,,,049,
2009-09-01 02:00:00,,114504,,,809998,,,31,,,112,,,24,,,05,
2009-09-01 03:00:00,,0381679,,,76,,,32,,,109,,,24,,,05,
2009-09-01 04:00:00,,0381679,,,73,,,32,,,105,,,25,,,048,
2009-09-01 05:00:00,,0381679,,,73,,,29,,,102,,,31,,,046,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2022-09-06 19:00:00,,,172,,,445,,,263838,,,708718,,,29,,,025
2022-09-06 20:00:00,,,173,,,4,,,23956,,,63959,,,25,,,024
2022-09-06 21:00:00,,,176,,,371,,,262483,,,633514,,,28,,,023
2022-09-06 22:00:00,,,173,,,426,,,249475,,,675858,,,28,,,02


## Quintero

In [5]:
get_minma_data(['SO2','NO2','NO','NOX','O3','CO'], 'quintero')

Unnamed: 0,Registros validados_SO2,Registros preliminares_SO2,Registros no validados_SO2,Registros validados_NO2,Registros preliminares_NO2,Registros no validados_NO2,Registros validados_NO,Registros preliminares_NO,Registros no validados_NO,Registros validados_NOX,Registros preliminares_NOX,Registros no validados_NOX,Registros validados_O3,Registros preliminares_O3,Registros no validados_O3,Registros validados_CO,Registros preliminares_CO,Registros no validados_CO
2016-02-01 01:00:00,,175957,,,,271378,,,10277,,,368271,,,562378,,,00976166
2016-02-01 02:00:00,,181287,,,,379096,,,119868,,,491127,,,345831,,,0130333
2016-02-01 03:00:00,,24793,,,,385914,,,11349,,,49156,,,285624,,,00951166
2016-02-01 04:00:00,,421441,,,,435712,,,12977,,,556602,,,231188,,,00856999
2016-02-01 05:00:00,,343705,,,,425243,,,165403,,,581372,,,291755,,,00700998
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2022-09-06 19:00:00,,,221,,,698,,,135353,,,833331,,,36,,,035
2022-09-06 20:00:00,,,225,,,55,,,130148,,,680131,,,39,,,031
2022-09-06 21:00:00,,,227,,,448,,,119537,,,567241,,,39,,,032
2022-09-06 22:00:00,,,23,,,392,,,109673,,,501439,,,39,,,027
