#Preámbulo

Este cuaderno se encarga de explicar las bases para manipular fechas usando Python. 

Aunque parece algo redundante, uno de los problemas más comunes en Python cuando se trabaja con datos que están fechados es la dificultad para adaptar las fechas de una manera legible para el programa.

#1.Introducción

Las fechas en Python tienen un formato propio llamado datetime64. Cuando trabajamos con tiempo es conveniente pasar las fechas a este formato ya que de otra forma existe la posibilidad de que el código te empiece a dar errores. 

Por ejemplo, si intentamos hacer un gráfico con fechas que están en formato número (string) y no en datetime, lo más normal es que el eje tiempo te salga con décimales del tipo "año 2002.5". 

Este formato tiene sus propias peculiaridades y vamos a desgranarlos todos a lo largo de este caso de uso.

In [None]:
import pandas as pd

#2.Cómo convertir unos datos al formato fecha

Para comprobarlo vamos a crear una serie con fechas en un formato diferente al datetime64. 

In [None]:
#Vamos a empezar creando una serie de fechas en formato número
FechasN=pd.Series([1-1-2020,1-1-2021,1-1-2022])
FechasN

0   -2020
1   -2021
2   -2022
dtype: int64

Nos devuelve el año en negativo y no la fecha. Vamos a hacerlo como si las fechas fueran palabras (strings)

In [None]:
FechasP=pd.Series(['1-1-2020','1-1-2021','1-1-2022'])
FechasP

0    1-1-2020
1    1-1-2021
2    1-1-2022
dtype: object

Aquí ya nos devuelve las fechas que queremos pero como si fueran palabras. Esto puede llegar a darnos problemas para algunas operaciones así que lo convertimos a formato fecha

In [None]:
Fechas1=pd.to_datetime(FechasP)
Fechas1

0   2020-01-01
1   2021-01-01
2   2022-01-01
dtype: datetime64[ns]

Ya lo tenemos en formato fecha. Pero, ¿y que pasaría si solo tuvieramos los años? Es decir, los datos que tenemos están en frecuancia anual sin tener meses o días.

In [None]:
FechasA=pd.Series(['2020','2021','2022'])
FechasA

0    2020
1    2021
2    2022
dtype: object

In [None]:
Fechas2=pd.to_datetime(FechasA)
Fechas2

0   2020-01-01
1   2021-01-01
2   2022-01-01
dtype: datetime64[ns]

Como podemos ver, el formate fecha (datetime64) siempre necesita de mes y día. Si no lo tiene simplemente asume que es 1 de enero (1-1-...)

#3.Como modificar los períodos (si va por mes, año...)



Período es el intervalo de tiempo que comprende cada fecha.

Cuando se trabaja con fechas es muy importante conocer el intervalo en el que nos estamos manejando. Esto es, si cada período es una semana, un mes, un año...

Para ello usamos una una función de pandas donde tenemos que dar tres argumentos; fecha de inicio, número de períodos y tipo de intervalo donde tipo de intervalo es:

1-'D' es día

2-'W' es semana

3-'M' es mes

4-'Q' es trimestre

5-'Y' es año

In [None]:
Período=pd.date_range('1-1-2019',periods=12,freq='D')
Período

DatetimeIndex(['2019-01-01', '2019-01-02', '2019-01-03', '2019-01-04',
               '2019-01-05', '2019-01-06', '2019-01-07', '2019-01-08',
               '2019-01-09', '2019-01-10', '2019-01-11', '2019-01-12'],
              dtype='datetime64[ns]', freq='D')

Como vemos, hemos creado una serie de 12 fechas que van día a día empezando el 1 de enero de 2019.

Vamos a ver como se hace con otro tipo de períodos.

In [None]:
PeríodoQ=pd.date_range('1-1-2019',periods=4,freq='Q')
PeríodoQ

DatetimeIndex(['2019-03-31', '2019-06-30', '2019-09-30', '2019-12-31'], dtype='datetime64[ns]', freq='Q-DEC')

En este caso hemos creado una serie de fechas que son los cuatro trimestres de 2019 contandolos desde el final de estos trimestres.

#4.Cómo tomar lags y leads en Python

Estos términos son importantes si estás trabajando en ciencia de datos. 

Lags significa que tomas el período anterior de toda la serie de fechas. Esto es, si tu serie está en $x_t$ tomar un lag significa tomar esa misma variable en $x_{t-1}$

Un lead es lo mismo pero al revés, si tu variable está en $x_t$ tomar un lead es pasarlo a $x_{t+1}$. Es decir, pasarlo todo un período hacia delante.

Veamoslo con un ejemplo para que quede más claro

In [None]:
Período

DatetimeIndex(['2019-01-01', '2019-01-02', '2019-01-03', '2019-01-04',
               '2019-01-05', '2019-01-06', '2019-01-07', '2019-01-08',
               '2019-01-09', '2019-01-10', '2019-01-11', '2019-01-12'],
              dtype='datetime64[ns]', freq='D')

La serie "período" empieza el 1 de enero de 2019 y acaba el 12 de enero de 2019. Así que si tomamos el lag de esta serie:

In [None]:
lag=Período.shift(-1)
lag

DatetimeIndex(['2018-12-31', '2019-01-01', '2019-01-02', '2019-01-03',
               '2019-01-04', '2019-01-05', '2019-01-06', '2019-01-07',
               '2019-01-08', '2019-01-09', '2019-01-10', '2019-01-11'],
              dtype='datetime64[ns]', freq='D')

Nos devuelve una serie que empieza el 31 de diciembre de 2018 y acaba el 11 de enero de 2019. Para ello tienes que usar .shift() y poner dentro del paréntesis el número de períodos que quieres retrasar la serie (el número de lags). Para los lags siempre se ponen los números en negativo. 

Para los leads es lo mismo pero al revés.

In [None]:
Lead=Período.shift(1)
Lead

DatetimeIndex(['2019-01-02', '2019-01-03', '2019-01-04', '2019-01-05',
               '2019-01-06', '2019-01-07', '2019-01-08', '2019-01-09',
               '2019-01-10', '2019-01-11', '2019-01-12', '2019-01-13'],
              dtype='datetime64[ns]', freq='D')

El lead de "período" nos devuelve una serie que empieza el 2 de enero de 2019 y acaba el 13 de enero de 2019.

#5.Como hacer cálculos con fechas

En Python puedes hacer cálculos con fechas usando timedelta. Esto es, puedes sumar o restar días, horas, semanas y demás y luego puedes convertirlo a segundos o a días.

In [None]:
#Empezaremos estbleciendo un período de tiempo y calculando cuantos segundos tiene
from datetime import timedelta

#Definimos el intervalo de tiempo
delta=timedelta(days=50)
#Calculamos cuantos segundos tiene
delta.total_seconds()


4320000.0

Ahora vamos a sumarle a estos 50 días 2 semanas extras y vamos a comprobar cuantos días y segundos tiene el intervalo

In [None]:
delta1=timedelta(weeks=2)
delta2=delta+delta1


print('Total días:',delta2.days,
      'Total segundos:',delta2.total_seconds())

Total días: 64 Total segundos: 5529600.0


#6.Como calcular la fecha actual



Usando Python puedes calcular la fecha actaul y jugar con ella. Para saber la fecha actual (te devuelve año, mes y día) se usa .today()

In [None]:
from datetime import date
Hoy=date.today()
Hoy

datetime.date(2022, 5, 31)

Ahora vamos a crear un objeto que sea la fecha de mi cumpleaños este año (se pone primero año, luego mes y luego día). Después vamos a restar ese día a la fecha actual para saber cuantos días quedan para mi cumpleaños contando desde hoy.

In [None]:
micumpleaños=date(2022,11,23)

t=micumpleaños-Hoy

print('Días hasta mi cumpleaños:',t.days)


Días hasta mi cumpleaños: 176


También podemos saber cuantos segundos tiene este intervalo de tiempo contando desde el minuto 1 del 31 de mayo.

In [None]:
print('Segundos hasta mi cumpleaños:',t.total_seconds())

Segundos hasta mi cumpleaños: 15206400.0


#7.Como cambiar el formato de fecha

Python te devuelve por defecto el formato de fecha americana que consiste en decir primero el año, luego el mes y luego el día. Si quieres pasarlo al formato de España puedes hacerlo de la siguiente manera:

In [None]:
Hoy.strftime('%d/%m/%y')

'31/05/22'

Si quieres también incluir el día de la semana y que el mes sea el nombre y no el número se hace así

In [None]:
Hoy.strftime('%A %d %B %y')

'Tuesday 31 May 22'