# Matplotlib 2 - Tendencias

---

Trabajaremos con un dataset obtenido de Google Trends,
una aplicación web en la que se pueden buscar términos y ver su evolución en el tiempo en función de sus consultas en el buscador.

### https://trends.google.es
- - -

## Visualización de series de tiempo

### Importamos librerías

In [None]:
import pandas as pd

In [None]:
import matplotlib.pyplot as plt

### Cargamos dataset

In [None]:
df = pd.read_csv("https://raw.githubusercontent.com/4data-lab/datasets/master/timeline.csv")

In [None]:
df.head()

- - -

In [None]:
df.dtypes

- - -

Pandas ofrece inferencia de tipos, pero es recomendable revisar los los tipos asignados por si hay que realizar alguna corrección.

| Dtypes  |  Uso asociado |
|---|---|
| object | Texto o numeración mixta y valores no numericos |
| int64 | Números enteros |
| float64 | Números de punto flotante |
| bool | Valores True y False |
| datetime64 | Valores de Fecha y Hora |
| timedelta[ns] | Deferencia entre dos datatimes |

- - -

In [None]:
df["fecha"] = df["fecha"].astype("datetime64")

In [None]:
df.dtypes

In [None]:
df.set_index("fecha", inplace=True)

In [None]:
df.head()

- - -
Los números representan el interés de búsqueda en relación con el punto más alto en el gráfico y el tiempo.

Un valor de 100 es la popularidad máxima para el término.
Un valor de 50 significa que el término es la mitad de popular.
- - -

- - -
#### Mismo código:

- - -

In [None]:
df[["dieta"]].plot(figsize=(16,8), color="royalblue", lw=2)

- - -
Lo primero que podemos ver es que esta serie de tiempo cuenta con Estacionalidad.

Recordar que estacionalidad es la variación periódica y predecible de una serie de tiempo.

Ahora intentemos con los datos de Gimnasio y finanzas...
- - -

In [None]:
df[["gimnasio"]].plot(figsize=(16,8), color="darkorange", lw=2);

- - -
Gimnasio si bien presenta una estacionalidad también dispone de una tendecia ascendente.

Tened en cuenta que la tendencia consiste en la evolución a largo plazo de la serie de tiempo y que es usual encontrarse con series temporales que presentan un movimiento sostenido en la misma dirección durante un amplio período de tiempo, con independencia de pequeñas oscilaciones.
- - -

In [None]:
df[["finanzas"]].plot(figsize=(16,8), color="green", lw=2);

\- - -
En los datos de Finanzas destaca que tenemos una componente cíclica, estas componentes están formadas por fluctuaciones alrededor de la tendencia que se repiten de forma más o menos periódica y de amplitud superior al año.
- - -

### Rolling

En algunos casos, no es evidente identificar la tendencia y/o la componente cíclica, es por ello que haremos uso del método de Rolling.

Así pues, para cada punto de tiempo, se tomara el promedio de los puntos de cada lado.

Vamos a definir la cantidad de puntos a promediar como **ventana**.


In [None]:
df["dieta"].rolling(12).mean().plot(figsize=(16,8), color="royalblue", lw=2);

Como se aprecia, podemos eliminar parte de la Estacionalidad y de esa manera poder visualizar la Tendencia.

In [None]:
df["gimnasio"].rolling(12).mean().plot(figsize=(16,8), color="darkorange", lw=2);

In [None]:
df["finanzas"].rolling(12).mean().plot(figsize=(16,8), color="green", lw=2);

In [None]:
df["dieta"].rolling(12).mean().plot(figsize=(16,8), color="royalblue", lw=2)
df["gimnasio"].rolling(12).mean().plot(figsize=(16,8), color="darkorange", lw=2)
df["finanzas"].rolling(12).mean().plot(figsize=(16,8), color="green", lw=2);

- - -
Ahora tened en cuenta que queremos analizar mejor la estacionalidad, y no queremos vernos afectados por la tendencia.
Para ello disponemos de la función diff.
La tecnica se conoce como diferenciación, donde se observa la diferencia entre puntos de datos sucesivos, porque solo se observa la diferencia entre un punto de datos y el anterior.

In [None]:
df["dieta"].diff().plot(figsize=(16,8), color="royalblue", lw=2);

In [None]:
df["gimnasio"].diff().plot(figsize=(16,8), color="darkorange", lw=2);

In [None]:
df["dieta"].diff().plot(figsize=(16,8), color="royalblue", lw=2)
df["gimnasio"].diff().plot(figsize=(16,8), color="darkorange", lw=2);

In [None]:
df.diff().plot(figsize=(16,8), lw=2);

- - -