# **Working with Dates and Time Series Data**

En el mundo del análisis de datos, el tiempo desempeña un papel crucial. Las fechas y las secuencias temporales son elementos esenciales para comprender patrones, tendencias y relaciones en una amplia variedad de conjuntos de datos. Para gestionar y analizar eficazmente los datos relacionados con el tiempo, se utilizan conceptos como "datetimes" (fechas y horas) y "time series" (series temporales). Estas herramientas permiten a los analistas extraer información valiosa y tomar decisiones informadas en diversos campos, desde finanzas hasta ciencias sociales y más allá.



## **Datetimes:**

Los "datetimes" son combinaciones de fechas y horas que se utilizan para representar momentos específicos en el tiempo. Estas combinaciones son más que simples números; incorporan contextos temporales que son cruciales para el análisis. Las necesidades de utilizar "datetimes" en el análisis de datos incluyen:

1. Secuenciación temporal: Almacenar y organizar datos en función de sus marcas de tiempo permite capturar la secuencia en la que ocurrieron los eventos. Esto es esencial para comprender el orden y la relación temporal entre diferentes observaciones.

2. Análisis temporal: Las tendencias, patrones y estacionalidades en los datos a menudo son más claros cuando se analizan en función del tiempo. Las "datetimes" permiten visualizar y analizar cómo evolucionan los datos a lo largo del tiempo.

3. Segmentación y agrupación: Las "datetimes" permiten agrupar datos en intervalos específicos, como días, semanas o meses. Esto facilita la agregación y el análisis de tendencias en diferentes escalas temporales.



##**Time Series:**

Una "time series" es una secuencia ordenada de datos observados en diferentes momentos a lo largo del tiempo. Estos datos pueden representar una variedad de fenómenos, como ventas diarias, precios de acciones, temperaturas, tasas de inflación y más. Las necesidades de utilizar "time series" en el análisis de datos incluyen:

1. Predicción y pronóstico: Las "time series" históricas pueden usarse para predecir valores futuros. Modelos estadísticos y de aprendizaje automático pueden aprovechar patrones pasados para pronosticar tendencias y comportamientos futuros.

2. Detección de anomalías: Identificar puntos atípicos en una serie temporal puede ser crucial para la detección temprana de problemas o oportunidades. Las anomalías pueden indicar cambios significativos en el comportamiento normal de los datos.

3. Análisis de tendencias y estacionalidad: Las "time series" a menudo exhiben patrones estacionales y tendencias a lo largo del tiempo. Estos patrones pueden proporcionar información valiosa sobre ciclos económicos, cambios estacionales y otros fenómenos recurrentes.

4. Optimización temporal: Al analizar series temporales, es posible identificar los momentos más óptimos para tomar decisiones, como cuándo invertir, comprar o vender.

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/tomasate/Datos_Clases/main/Datos_1/ETH_1h.csv')

Si intentamos usar un método de los datetimes veremos que son apenas str

El método `.to_datetime` puede ser aplicado para redefinir una columna de valores de tipo objeto.
Sin embargo en este caso obtendremos un error de formato
```
df['Date'] = pd.to_datetime(df['Date'])
```

Para solucionarlo, podemos dirigirnos a la documentación y ver cómo debemos formatear [Python doc](https://docs.python.org/3.6/library/datetime.html#strftime-and-strptime-behavior).


Puede convertir una columna a una serie de tiempo al cargar la data

In [None]:
import datetime as dt
d_parser = lambda x: dt.datetime.strptime(x, '%Y-%m-%d %I-%p')
df = pd.read_csv('https://raw.githubusercontent.com/tomasate/Datos_Clases/main/Datos_1/ETH_1h.csv', parse_dates=['Date'], date_parser=d_parser)

Hagamos la serie de tiempos el índice


Este cambio se hace permanente en:


Ahora, extraemos la data requerida con un indexador:

Extraemos la data de una forma más compleja:

Extraemos solo una columna

El promedio de esa columna

24 horas de data

Los valores de High para un día

El más alto valor de High de un día

Podemos hacer un remuestreo de la data.

API de Python para objetos [date_offset](https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects).

Veamos cuánto es el mayor valor del primero de enero

To show graphs inline, use "magic" command %matplotlib (matplotlib should already be installed):

Plot highs as defined above: