In [None]:
# default_exp preprocessing

# Preprocessing

> Este modulo es el encargado de la carga, preprocesamiento y preparacion de los datos.

In [None]:
#hide
from nbdev.showdoc import *
import numpy as np
import re
import unittest

## Clase TimeSerie

In [None]:
#export
class TimeSerie:
    "Estructura de datos que almacena las mediciones en una estacion."
    
    @staticmethod
    def __process_time(time):
        match = re.match(r"(?P<val>\d+)(?P<smh>[smh]*)$", time, re.I)
        assert match, "Formato incorrecto de tamaño de ventana o paso."
        
        result = int(match.group("val"))
        if match.group("smh").lower() == "m":
            result *= 60
        elif match.group("smh").lower() == "h":
            result *= 60*60
        return result
        
        
    def __init__(self, window_size:str="2m", step:str="30s", freq:int=50):
        "El formato de `window_size` y `step` es \d+[smh]"
        "`window_size` representa el tamaño de tiempo en que sera cortada la serie de tiempo"
        "`step` representa el tamaño de paso que se utiliza al cortar la serie de tiempo"
        "`freq` es la frecuencia en Hz que tienen las mediciones"
        
        self.window_size = self.__process_time(window_size)
        self.step = self.__process_time(step)
        
        assert type(freq) is int, "La frecuencia debe ser un entero."
        assert freq > 0 and freq <= 500, "La frecuencia debe definirse entre 1 y 500 Hz"
        self.freq = freq
    
    def __repr__(self):
        return f"window_size {self.window_size}\nstep {self.step}\nfreq {self.freq}"
    
    def __str__(self):
        return f"window_size {self.window_size}\nstep {self.step}\nfreq {self.freq}"

### Ejemplos:

Serie de tiempo con ventana de 2 minutos y paso de 30 segundos, el muestreo fue hecho a 50 Hz.

In [None]:
TimeSerie("2m","30s",50)

window_size 120
step 30
freq 50

In [None]:
TimeSerie("4s","2s",40)

window_size 4
step 2
freq 40

In [None]:
TimeSerie("1h","30m",10)

window_size 3600
step 1800
freq 10

In [None]:
TimeSerie("10","5",15)

window_size 10
step 5
freq 15

In [None]:
TimeSerie("2m","30",30)

window_size 120
step 30
freq 30

In [None]:
#hide

#Test definition

class TestTimeSerie(unittest.TestCase):
    
    def __check_params(self, ts, window_size, step, freq):
        self.assertEqual(ts.window_size, window_size)
        self.assertEqual(ts.step, step)
        self.assertEqual(ts.freq, freq)
    
    def test_params(self):
        ts = TimeSerie("2m","30s",50)
        self.__check_params(ts, 120, 30, 50)
        
        ts = TimeSerie("4s","2s",40)
        self.__check_params(ts, 4, 2, 40)
        
        ts = TimeSerie("1h","30m",10)
        self.__check_params(ts, 60*60, 30*60, 10)
        
        ts = TimeSerie("10","5",15)
        self.__check_params(ts, 10, 5, 15)
        
        ts = TimeSerie("2m","30",30)
        self.__check_params(ts, 2*60, 30, 30)

In [None]:
#hide

#Test run
unittest.main(argv=[''], verbosity=2, exit=False)

test_params (__main__.TestTimeSerie) ... ok

----------------------------------------------------------------------
Ran 1 test in 0.002s

OK


<unittest.main.TestProgram at 0x181d4c6aac8>