<!--Información del curso-->
<img align="left" style="padding-right:10px;" src="figuras/logo_ciencia_datos.png">

<center><h1 style="font-size:2em;color:#2467C0"> Pandas - Parte 8  </h1></center>

<center><h2 style="font-size:2em;color:#840700">   Manipulación básica de series temporales </h4></center>

<br>
<table>
<col width="550">
<col width="450">
<tr>
<td><img src="figuras/pandas_presentacion.png" align="left" style="width:400px"/></td>
<td>

* **Wes McKinney**, empezó a desarrollar Pandas en el año 2008 mientras trabajaba en *AQR Capital* [https://www.aqr.com/] por la necesidad que tenía de una herramienta flexible de alto rendimiento para realizar análisis cuantitativos en datos financieros. 
* Antes de dejar AQR convenció a la administración de la empresa de distribuir esta biblioteca bajo licencia de código abierto.
* **Pandas** es un acrónimo de **PANel DAta analysiS**
   
    
<br>
</td>
</tr>
</table>

# Librerías

Cargando las bibliotecas que necesitamos 


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Trabajar con el tiempo

Pandas se desarrolló en el contexto del modelado financiero, por lo que, como era de esperar, contiene un conjunto bastante extenso de herramientas para trabajar con fechas, horas y datos indexados por tiempo.
Los datos de fecha y hora vienen en distintasmaneras, que discutiremos aquí:

- *Marcas de tiempo* o *Time stamps*: hacen referencia a momentos particulares en el tiempo (por ejemplo, 19 de Noviembre de 2020 a las 10:00 a.m.).
- *Intervalos de tiempo* hacen referencia a un período de tiempo entre un punto inicial y final en particular; por ejemplo, el año 2020. Los períodos generalmente hacen referencia a un caso especial de intervalos de tiempo en los que cada intervalo tiene una duración uniforme y no se superpone (por ejemplo, períodos de 24 horas que comprenden días).
- *Los  delta de tiempo* o *duraciones* hacen referencia a un período de tiempo exacto (por ejemplo, una duración de 22 segundos).

En esta lección, presentaremos cómo trabajar con cada uno de estos tipos de datos de fecha/hora en Pandas. Comenzaremos con una breve discusión de las herramientas para trabajar con fechas y horas en Python, antes de pasar más específicamente a una discusión de las herramientas proporcionadas por Pandas.

## Fechas y horas en Python


El mundo de Python tiene varias representaciones disponibles de fechas, horas, deltas e intervalos de tiempo.
Si bien las herramientas de series de tiempo proporcionadas por Pandas tienden a ser las más útiles para las aplicaciones de ciencia de datos, es útil ver su relación con otros paquetes utilizados en Python.


### Fechas y horas de Python nativo: ``datetime`` 

Los objetos básicos de Python para trabajar con fechas y horas residen en el módulo integrado ``datetime`` y puede usarlo para realizar rápidamente una serie de funcionalidades útiles en fechas y horas.
Por ejemplo, puede crear manualmente una fecha usando el tipo ``datetime``:


In [None]:
from datetime import datetime
fecha = datetime(year=2020, month=11, day=19)

Una vez que tenga un objeto ``datetime``, puede hacer cosas como imprimir el día de la semana de varias maneras:

In [None]:
fecha.strftime('%A')

In [None]:
print(fecha.strftime("%d %B %Y"))

En estas últimas líneas, usamos códigos de formato de cadena estándar para imprimir fechas, sobre el cual puede leer en la [strftime section](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior) de la documentación de Python [datetime documentation](https://docs.python.org/3/library/datetime.html).

El poder de datetime radica en su flexibilidad y sintaxis sencilla: puede usar estos objetos y sus métodos integrados para realizar fácilmente casi cualquier operación que le pueda interesar. El problema es que no esta optimizado para trabajar con  grandes cantidades de fechas y horas: así como las listas de variables numéricas de Python no son optimas en comparación con los arreglos numéricos de NumPy.

### Arreglos de tiempo de Numpy:  ``datetime64``

Las debilidades del formato de fecha y hora de Python inspiraron al equipo de NumPy a agregar un conjunto de tipos de datos de series de tiempo nativos a NumPy. El tipo ``datetime64`` codifica las fechas como enteros de 64 bits y, por lo tanto, permite que los arreglos de fechas se representen de forma muy compacta.
El ``datetime64`` requiere un formato de entrada muy específico:


In [None]:
import numpy as np
fecha = np.array('2020-11-19', dtype=np.datetime64)  #año - mes - día
fecha

Una vez que tengamos esta fecha, podemos realizar rápidamente operaciones vectorizadas en ella:

In [None]:
#Mostrar los siguientes 20 días
fecha + np.arange(20)

Si bien el tipo de datos ``datetime64`` aborda algunas de las deficiencias del tipo ``datetime`` incorporado de Python, carece de muchos de los métodos y funciones convenientes que han sido incluidas en Pandas.

### Fechas y horas en pandas

Pandas se basa en los conceptos de tiempo de Python y Numpy que acabamos de comentar para proporcionar un objeto de ``Marca de Tiempo`` o ``Timestamp``, que combina la facilidad de uso de ``datetime``  con el almacenamiento eficiente y la interfaz vectorizada de ``numpy.datetime64``.
A partir de un grupo de estos objetos ``Timestamp``, Pandas puede construir un ``DatetimeIndex`` que se puede usar para indexar datos en una ``Serie`` o ``DataFrame``; veremos muchos ejemplos de esto en esta lección.

Por ejemplo, podemos usar las herramientas de Pandas para repetir la demostración de arriba.
Podemos analizar una fecha de cadena con formato flexible y usar códigos de formato para generar días de la semana:


In [None]:
import pandas as pd
fecha = pd.to_datetime("19th of November, 2020")
fecha

In [None]:
fecha.strftime('%A')

In [None]:
fecha.strftime("%d %B %Y")

Además, podemos hacer operaciones vectorizadas al estilo NumPy directamente en este mismo objeto:

In [None]:
fecha + pd.to_timedelta(np.arange(20), 'D')

En la siguiente sección, veremos más de cerca la manipulación de datos de series de tiempo con las herramientas proporcionadas por Pandas.

## Fecha y hora en pandas

### Objetos tipo ``Timestamp`` 

Pandas tiene sus propios objetos de fecha y hora, que son compatibles con los objetos estándar `datetime`, pero proporcionan algunas funcionalidades más para trabajar.

El objeto `Timestamp` también se puede construir a partir de una cadena:

In [None]:
ts = pd.Timestamp('00:00:00')
ts

Al igual que con los objetos `datetime.datetime`, hay varios atributos útiles disponibles en `Timestamp`. Por ejemplo, podemos obtener el mes:

In [None]:
ts.month

También hay un tipo `Timedelta`, que puede ser usado para agregar intervalos de tiempo:

In [None]:
ts + pd.Timedelta('5 days')

## Analizando cadenas de fecha y hora


<img align="left" width="400"  float= "none" align="middle" src="figuras/iso_8601.png">

Desafortunadamente, cuando se trabaja con datos del mundo real, se pueden encontrar muchos formatos diferentes para `fecha y hora`. Para trabajar con esos datos en Pandas, primero es necesario cambiar las cadenas de teimpo a objetos reales de `Timestamp`.

**Para convertir fechas con formato de cadena en objetos de marca de tiempo: use la función `pandas.to_datetime`**. Aquí se muestran algunos ejemplos


In [None]:
pd.to_datetime("2-13-20")

In [None]:
pd.to_datetime("02/13/20")

In [None]:
pd.to_datetime("13/2/2020", dayfirst=True)

In [None]:
pd.to_datetime("13/02/2020", format="%d/%m/%Y")

In [None]:
pd.to_datetime("02-13-2020")

In [None]:
pd.to_datetime("02-13-2020")

Una descripción detallada de cómo especificar la cadena `format`, vea la tabla en la documentación de python: https://docs.python.org/3.5/library/datetime.html#strftime-and-strptime-behavior

## `Timestamp`  en una Serie o DataFrame

In [None]:
serie = pd.Series(['2020-2-13 10:00:00', '2020-2-13 11:00:00', '2020-2-13 12:00:00'])

In [None]:
serie

La función `to_datetime`  también se puede utilizar para convertir una serie:

In [None]:
temp_serie = pd.to_datetime(serie)

In [None]:
temp_serie

Observe que el tipo de datos de esta serie ha cambiado ahora es del tipo `datetime64 [ns]`. Esto indica que tenemos una serie de valores de fecha y hora reales.

Los mismos atributos que en un `Timestamp` también están disponibles en una Serie con datos de fecha y hora, utilizando el descriptor de acceso **`.dt` **:

In [None]:
temp_serie.dt.hour

In [None]:
temp_serie.dt.weekday

Para construir rápidamente algunos datos regulares temporales, la función [`` pd.date_range``] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.date_range.html) es útil:

In [None]:
date_rng = pd.date_range(start="2020-10-25", periods=30, freq='12H')
date_rng

A partir del rango de fechas se puede crear una DataFrame con valores. Para esto se puede utilizar la función ``randint``  con la que se pueden conseguir número aleatorios en un rango. A continuación, se muestra un código con un ejemplo y los cinco primeros registros obtenidos.

In [None]:
df_temp = pd.DataFrame(date_rng, columns=['fecha'])
df_temp['valor'] = np.random.randint(0,100,size=(len(date_rng)))
df_temp.head(5)

Si se desea realizar la manipulación de una serie temporal se ha de utilizar la fecha como índice del *DataFrame*. Modificar el índice del *DataFrame* es realmente sencillo, para lo que se puede utilizar el siguiente código:

In [None]:
df_temp = df_temp.set_index('fecha')
df_temp.head(5)

## Funciones  para la manipulación básica de series temporales con pandas

Una de las primeras operaciones que se puede realizar con la serie temporal el seleccionar un periodo de tiempo. En caso de que se necesiten los registros de un día simplemente se ha de indicar la fecha y, en el ejemplo, se obtendrá los 15 registros. Por ejemplo, los datos del día 1 noviembre de 2020 se obtendrían con la línea:

In [None]:
#Utilizando el separador "-"
df_temp['2020-11-1']

Para seleccionar todos los datos de noviembre

In [None]:
df_temp['2020-11']

Para conseguir un periodo de tiempo simplemente se ha de indicar la fecha inicial y final separada por dos puntos. Por ejemplo, los dato entre el 30 de octubre y el 2 de noviembre de 2020 se pueden obtener mediante el código:

In [None]:
df_temp['2020-10-30':'2020-11-2']

Tambien se puede incluir un horario en particular, por ejemplo los datos entre las 3:00:00 del 30 de octubre    y  las 18:00:00 el 2 de noviembre de 2020  se pueden obtener mediante el código:

In [None]:
df_temp['2020-10-30 3:00:00 ':'2020-11-2 18:00:00']

Seleccionar los datos a partir de una fecha, por ejemplo todos los datos despues del 2 de noviembre

In [None]:
df_temp['2020-11-2':]

## Remuestreo de las series temporales


Los datos que se han utilizado hasta ahora tienen una frecuencia horaria. En el caso de que se desee los datos con otra frecuencia estos se pueden remuestrear. Esto se consigue con la función ``resample``, al que se le ha de indicar el periodo y a su resultado se le puede aplicar una operación. Por ejemplo, la media semanal se puede obtener mediante el código:

In [None]:
#Semanal
df_temp.resample('W').mean()

In [None]:
#Mensual
df_temp.resample('M').mean()

In [None]:
#Mensual (muestra desde el inicio de mes)
df_temp.resample('MS').mean()

In [None]:
#Por día el valor maximo
df_temp.resample('D').max()

In [None]:
#Cada 3 días  el valor maximo
df_temp.resample('3D').max()

Fundamental para estas herramientas de series de tiempo de Pandas es el concepto de una frecuencia o desplazamiento de fecha. Así como vimos los códigos  ``W``(semana)  y  ``M``(mes), podemos usar dichos códigos para especificar cualquier espaciado de frecuencia deseado. La siguiente tabla resume los principales códigos disponibles:


| Code   | Description         | Code   | Description          |
|--------|---------------------|--------|----------------------|
| ``D``  | Calendar day        | ``B``  | Business day         |
| ``W``  | Weekly              |        |                      |
| ``M``  | Month end           | ``BM`` | Business month end   |
| ``Q``  | Quarter end         | ``BQ`` | Business quarter end |
| ``A``  | Year end            | ``BA`` | Business year end    |
| ``H``  | Hours               | ``BH`` | Business hours       |
| ``T``  | Minutes             |        |                      |
| ``S``  | Seconds             |        |                      |
| ``L``  | Milliseonds         |        |                      |
| ``U``  | Microseconds        |        |                      |
| ``N``  | nanoseconds         |        |                      |

Las frecuencias mensuales, trimestrales y anuales se marcan todas al final del período especificado.
Al agregar un sufijo ``S``  a cualquiera de estos, se marcarán al principio:

| Code    | Description            || Code    | Description            |
|---------|------------------------||---------|------------------------|
| ``MS``  | Month start            ||``BMS``  | Business month start   |
| ``QS``  | Quarter start          ||``BQS``  | Business quarter start |
| ``AS``  | Year start             ||``BAS``  | Business year start    |

# Ejemplo 1:  Datos de estaciones de medición en rios

Para la siguiente demostración de la funcionalidad de series de tiempo, utilizamos una muestra de datos de descarga la zona de Maarkebeek (Belgica) con valores promediados de 3 horas, derivados del (https://www.waterinfo.be/).

![Maarke.png](attachment:Maarke.png)

Exportar los datos del archivo datos/vmm_flowdata.csv a un DataFrame llamado data

In [None]:
data = pd.read_csv("datos/vmm_flowdata.csv")
data

Ya sabemos cómo analizar una columna de fecha con Pandas:

In [None]:
#Convertir la columna 'Time' a tiempo
data['Time'] = pd.to_datetime(data['Time'])

Con `set_index ('datetime')`, configuramos la columna con los valores de fecha y hora como índice de fila

In [None]:
data = data.set_index("Time")

In [None]:
data

Los pasos anteriores se proporcionan como funcionalidad integrada de `read_csv`:

In [None]:
# Usar index_col=0, parse_dates=True para hacer la configuración de la columna de tiempo desde el inicio
data = pd.read_csv("datos/vmm_flowdata.csv", index_col=0, parse_dates=True)
data

RECUERDE: **`pd.read_csv` proporciona una gran cantidad de funciones integradas** 

Si queremos ver todos los indices de las filas

In [None]:
data.index

Hay algunos atributos de los valores del `timestamp` disponibles:

In [None]:
data.index.day

In [None]:
data.index.year

La función `plot` también adaptará sus ejes siguiendo los índices de tiempo: 

In [None]:
# %matplotlib notebook
data.plot()

Seleccionemos los datos del año 2013

In [None]:
data['2013']

Normalmente esperaría que esto acceda a una columna llamada '2013', pero cuando se tiene la configuración de `DatetimeIndex`, Pandas también intenta  interpretarlo como las filas de fecha y hora.

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>seleccione todos los datos a partir de 2012</li>
</ul>
</div>

In [None]:
data['2012':]

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>seleccione todos los datos en enero para todos los años diferentes</li>
</ul>
</div>

In [None]:
data[data.index.month == 1]

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>Seleccione todos los datos en abril, mayo y junio para todos los años diferentes</li>
</ul>
</div>

In [None]:
#Utilizaremos la función isin para filtrar sólo los valores de los meses que nos interesan
data[data.index.month.isin([4, 5, 6])]  

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>Seleccione todos los datos 'diurnos' (entre 8h y 20h) para todos los días</li>
</ul>
</div>

In [None]:
data[(data.index.hour > 8) & (data.index.hour < 20)]

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li> Hacer la grafica del promedio de los datos con una frecuencia semanal</li>
</ul>
</div>

In [None]:
data.resample('M').mean().plot() 

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li> Hacer la grafica del promedio de los datos pero ahora con una frecuencia de cada 10 días </li>
</ul>
</div>

In [None]:
data.resample('10D').mean().plot() 

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>Graficar la desviación estándar mensual </li>
</ul>
</div>

In [None]:
data.resample('M').std().plot()

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>Graficar la media y mediana mensual para los años 2011 al 2012 para la calumna 'L06_347'<br><br></li>
</ul>
    
</div>

In [None]:
subset = data['2011':'2012']['L06_347']
subset.resample('M').agg(['mean', 'median']).plot()

<div class="alert alert-info">

<b>EJERCICIO</b>:

 <ul>
  <li>Encontrar el valor promedio diario de la columna 'LS06_348', con estos valores graficar el mínimo y máximo mensual </li>
</ul>
</div>

In [None]:
daily = data['LS06_348'].resample('D').mean() 

In [None]:
daily.resample('M').agg(['min', 'max']).plot()

<div class="alert alert-info">
<b>EJERCICIO</b>:

 <ul>
  <li>Hacer una grafica de la media por semana de las tres estaciones en el año 2012</li>
</ul>

</div>

In [None]:
data['2012'].resample('M').mean().plot()

<div class="alert alert-info">
<b>EJERCICIO</b>:

<ul>
  <li>Muestre la comparación del promedio mensual y semanal para la estación L06_347 de Enero de 2010 a Junio de 2011  </li>
</ul>

</div>

In [None]:
from matplotlib import dates
# Start and end of the date range to extract
start, end = '2010-01', '2011-06'
# Plot daily and weekly resampled time series together
fig, ax = plt.subplots()
ax.plot(data.loc[start:end, 'L06_347'].resample('W').mean(),
marker='.', linestyle='-', linewidth=0.5, label='Semanal')
ax.plot(data.loc[start:end, 'L06_347'].resample('M').mean(),
marker='o', markersize=8, linestyle='-', label='Mensual')
ax.set_ylabel('Nivel del agua en (cm)')
fig.autofmt_xdate()
ax.fmt_xdata = dates.DateFormatter('%Y-%m-%d')
ax.set_title('Comparación semanal y mensual')
ax.legend();

## Ejemplo 2: Visualización de recuentos de bicicletas en Seattle

Como un ejemplo más complicado de trabajar con algunos datos de series de tiempo,
echemos un vistazo a los recuentos de bicicletas  de Seattle  en el [Puente Fremont](https://data.seattle.gov/api/views/65db-xm6k/rows.csv?accessType=DOWNLOAD).
Estos datos provienen de un contador de bicicletas automatizado, instalado a fines de 2012, que tiene sensores inductivos en las aceras este y oeste del puente. Los recuentos de bicicletas por hora se pueden descargar de http://data.seattle.gov/.


<img align="left" width="400"  float= "none" align="middle" src="figuras/seatle.jpg">

In [None]:
#Especificaremos que queremos la Fecha como índice:
data = pd.read_csv('datos/Fremont_Bridge_Bicycle_Counter.csv', index_col='Date', parse_dates=True)
data.head()

Para mayor comodidad, reasignameremos los nombres de las columnas y agregaremos una columna "Total":

In [None]:
data.columns = ['Total','East', 'West']

Ahora echemos un vistazo a las estadísticas resumidas de estos datos:

In [None]:
data.describe()

#### a )  Visualizando los datos

Podemos obtener información sobre el conjunto de datos visualizándolo. Comencemos graficando los datos sin procesar:

In [None]:
#Opcional: Instalar seaborn con "pip install seaborn"
#En caso de no instalarlo, simplemente comentar la siguiente línea de codigo 
import seaborn; seaborn.set()

In [None]:
data.plot()
plt.ylabel('Hourly Bicycle Count');

Las ~137 mil muestras por hora son demasiado densas para que podamos entenderlas. Podemos obtener más información volviendo a muestrear los datos por semana:

In [None]:
weekly = data.resample('W').sum()
weekly.plot(style=[':', '--', '-'],figsize=(15,5))
plt.ylabel('Weekly bicycle count')

Esto nos muestra algunas tendencias estacionales interesantes: como era de esperar, la gente anda en bicicleta más en verano que en invierno, e incluso dentro de una temporada en particular, el uso de la bicicleta varía de una semana a otra (probablemente dependiendo del clima). *Incluso se puede notar el efecto del confinamiento debido a la pandemia Covid-19 durante este 2020*

Otra forma que resulta útil para agregar los datos es usar una media móvil, utilizando la función ``rolling()``, el cual funciona como una especie de filtro. Aquí haremos una media móvil de 30 días de nuestros datos:

In [None]:
daily = data.resample('D').sum()
daily.rolling(30, center=True).sum().plot(style=[':', '--', '-'],figsize=(15,5))
plt.ylabel('mean hourly count');

Nota: La función pandas ``rolling()``  proporciona la función de cálculos de ventana móvil. El concepto de cálculo de la ventana móvil se utiliza principalmente en el procesamiento de señales y datos de series de tiempo. En pocas palabras, tomamos un tamaño de ventana de *k* a la vez y realizamos alguna operación matemática deseada en él. Una ventana de tamaño *k* significa *k* valores consecutivos a la vez. En un caso muy simple, todos los valores de "k" están igualmente ponderados.

La irregularidad del resultado se debe al corte brusco de la ventana móvil. Podemos obtener una versión más suave de una media móvil usando una función de ventana, por ejemplo, una ventana gaussiana. El siguiente código especifica tanto el ancho de la ventana (elegimos 60 días) como el ancho de Gauss dentro de la ventana (elegimos 10 días como el ancho o desviación estandar):

In [None]:
daily.rolling(60, center=True,
              win_type='gaussian').sum(std=10).plot(style=[':', '--', '-'],figsize=(15,5));

#### b) Profundizando en los datos

Si bien estas vistas de datos suavizadas son útiles para tener una idea de la tendencia general de los datos, ocultan gran parte de la estructura interesante.
Por ejemplo, podríamos querer ver el tráfico promedio en función de la hora del día.

In [None]:
by_time = data.groupby(data.index.time).mean()
by_time.plot(style=[':', '--', '-'],figsize=(15,5));

El tráfico horario tiene una distribución fuertemente bimodal, con picos alrededor de las 8:00 de la mañana y las 5:00 de la tarde.
Probablemente esto sea evidencia de un fuerte componente de tráfico de pasajeros que cruza el puente.
Esto se evidencia aún más por las diferencias entre la acera occidental (generalmente se usa yendo hacia el centro de Seattle), que alcanza su punto máximo por la mañana, y la acera este (generalmente se usa alejándose del centro de Seattle), que alcanza su punto máximo por la noche.

También podríamos sentir curiosidad por saber cómo cambian las cosas según el día de la semana. Nuevamente, podemos hacer esto con un simple groupby:


In [None]:
by_weekday = data.groupby(data.index.dayofweek).mean()
by_weekday.index = ['Mon', 'Tues', 'Wed', 'Thurs', 'Fri', 'Sat', 'Sun']
by_weekday.plot(style=[':', '--', '-'],figsize=(10,5));

Esto muestra una fuerte distinción entre los totales de los días laborables y los fines de semana, con aproximadamente el doble de ciclistas promedio que cruzan el puente de lunes a viernes que los sábados y domingos.

Con esto en mente, hagamos un GroupBy compuesto y observemos la tendencia horaria entre semana frente a fines de semana. Comenzaremos agrupando por una bandera que marca el fin de semana y la hora del día:

In [None]:
weekend = np.where(data.index.weekday < 5, 'Weekday', 'Weekend')
by_time = data.groupby([weekend, data.index.time]).mean()

Haciendo la grafica separada de lunes a viernes y para  los sábados y domingos.

In [None]:
import matplotlib.pyplot as plt
hourly_ticks = 4 * 60 * 60 * np.arange(6)

fig, ax = plt.subplots(1, 2, figsize=(14, 5))
by_time.loc['Weekday'].plot(ax=ax[0], title='Weekdays',
                           xticks=hourly_ticks, style=[':', '--', '-'])
by_time.loc['Weekend'].plot(ax=ax[1], title='Weekends',
                           xticks=hourly_ticks, style=[':', '--', '-']);



El resultado es muy interesante: vemos un patrón de viaje bimodal durante la semana laboral y un patrón recreativo unimodal durante los fines de semana.
Sería interesante analizar estos datos con más detalle y examinar el efecto del clima, la temperatura, la época del año y otros factores en los patrones de desplazamiento de las personas.

NOTA: Los temas discutidos en esta lección son los más importantes y los que más suelen utilizarse, se deja al lector el siguiente link para abundar en este tema

https://www.dataquest.io/blog/tutorial-time-series-analysis-with-pandas/
