# Series de Tiempo

## Librerias

**Scipy Stack**

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels

In [47]:
import plotly.express as px
import plotly.graph_objects as go

**Scikit Learn**

In [5]:
import sklearn

## Pronostico de Series de Tiempo

Una serie de tiempo es un grupo de observaciones que tienen secuencia en el tiempo.

**Notación**
- **t - n**: Un momento anterior (t-1 para el periodo anterior)
- **t**: El momento actual o punto de referencia
- **t + n**: Un momento posterior (t+1 para el periodo siguiente)

Tenemos dos opciones cuando trabajamos con series de tiempo:
<ol>
    <li>
        <strong>Análisis de series de tiempo.</strong>
        <p>
            En este caso, una serie de tiempo es modelada para determinar sus componentes en terminos de patrones de 
            estacionalidad, tendencias, relación con factores externos, etc.
        </p>
    </li>
    <li>
        <strong>Pronostico de series de tiempo.</strong>
        <p>
        En este caso, se usa la información de la serie de tiempo para predecir futuros valores de la misma.
        </p>
    </li>
</ol>


### Componentes de una serie de tiempo

<ul>
    <li>
        <strong>Nivel.</strong> Es el valor base de la serie de tiempo 
    </li>
    <li>
        <strong>Tendencia.</strong> Es el comportamiento creciente o decreciente de la serie a lo largo del tiempo.
    </li>
    <li>
        <strong>Estacionalidad.</strong> Son los patrones de comportamiento repetidos a lo largo de la serie temporal.
    </li>
    <li>
        <strong>Ruido.</strong> Es la variabilidad que no puede ser explicada en el modelo
    </li>
</ul>



### Series de Tiempo como Aprendizaje Supervisado

### Ventana Deslizante

<p style="text-align:justify">
    Es un metodo que nos permite reestructurar nuestra serie de tiempo en un problema de aprendizaje supervisado. La ventana 
    deslizante nos permite utilizar el valor de un periodo anterior para predecir el valor del siguiente periodo.    
</p>

<p style="text-align:justify">
    Al utilizar la ventana deslizante, el valor o los valores de los periodos anteriores se convierten en nuestras variables 
    explicaticas y el valor del siguiente periodo se conviert en la variable que queremos explicar. Debemos ser consientes de 
    que algunos valores iniciales y finales se perderan dependiendo de la longitud de la ventana. 
</p>


El modelo de ventana deslizante puede clasificarse de diversas formas:

**Dependiendo de la cantidad de varibles explicativas**

- Series temporales univariadas
- Series temporales multicariadas

**Dependiendo de la cantidad de rezagos**

- Pronostico con un rezago
- Pronostico con multiples rezagos

### Trabajando con Series de Tiempo

**Nacimientos femeninos**

In [37]:
df = pd.read_csv('../Data/daily-total-female-births.csv', index_col=0, squeeze=True, parse_dates=True)

In [29]:
type(df)

pandas.core.series.Series

In [33]:
df.head()

date
1959-01-01    35
1959-01-02    32
1959-01-03    30
1959-01-04    31
1959-01-05    44
Name: births, dtype: int64

In [44]:
pd.DataFrame(df.describe())

Unnamed: 0,births
count,365.0
mean,41.980822
std,7.348257
min,23.0
25%,37.0
50%,42.0
75%,46.0
max,73.0


In [62]:
fig = px.histogram(df, x='births', nbins=20, marginal='box')
fig.update_layout(
    title='Distribución de frecuencia de nacimientos femeninos'
)
fig.show()

Si nuestros datos tienen un indice temporal, podemos llamar las observaciones de un mes determinado

In [41]:
# Llamando los datos de mayo
df['1959-05']

date
1959-05-01    32
1959-05-02    35
1959-05-03    38
1959-05-04    33
1959-05-05    39
1959-05-06    47
1959-05-07    38
1959-05-08    52
1959-05-09    30
1959-05-10    34
1959-05-11    40
1959-05-12    35
1959-05-13    42
1959-05-14    41
1959-05-15    42
1959-05-16    38
1959-05-17    24
1959-05-18    34
1959-05-19    43
1959-05-20    36
1959-05-21    55
1959-05-22    41
1959-05-23    45
1959-05-24    41
1959-05-25    37
1959-05-26    43
1959-05-27    39
1959-05-28    33
1959-05-29    43
1959-05-30    40
1959-05-31    38
Name: births, dtype: int64

In [96]:
temperature = pd.read_csv('../Data/daily-minimum-temperatures-in-me.csv', nrows=3650, index_col=0, parse_dates=True, squeeze=True)
# df.rename(columns={'Daily minimum temperatures in Melbourne, Australia, 1981-1990':'Temperature'})

In [113]:
df_temp = pd.DataFrame()

In [116]:
df_temp['year'] = [temperature.index[i].year for i in range(len(temperature))]
df_temp['month'] = [temperature.index[i].month for i in range(len(temperature))]
df_temp['day'] = [temperature.index[i].day for i in range(len(temperature))]
df_temp['temperature'] = [temperature.values[i] for i in range(len(temperature))]

In [117]:
df_temp

Unnamed: 0,year,month,day,temperature
0,1981,1,1,20.7
1,1981,1,2,17.9
2,1981,1,3,18.8
3,1981,1,4,14.6
4,1981,1,5,15.8
...,...,...,...,...
3645,1990,12,27,14.0
3646,1990,12,28,13.6
3647,1990,12,29,13.5
3648,1990,12,30,15.7


pp 41