In [0]:
SANDBOX_NAME = # Sandbox Name
DATA_PATH = "/data/sandboxes/"+SANDBOX_NAME+"/data/"



# Introducción

Python permite trabajar con fechas de una forma fácil utilizando el módulo `datetime` y los objetos especiales de tipo `date`. Gracias a ello, nos podemos olvidar de las particularidades que tienen ciertos cálculos cuando se trabaja con fechas, como pueda ser la duración de los meses, la aparición de años bisiestos o la numeración de las semanas, por citar algunos ejemplos.

Nuestro punto de partida será la función `date`.

In [0]:
from datetime import date
from datetime import datetime



Obtenemos la fecha actual:

In [0]:
today=date.today()

In [3]:
type(today)

datetime.date

In [4]:
print(today)

2019-04-10


In [5]:
print("The current date is {}".format(today))

The current date is 2019-04-10




Podemos cambiar el formato de la fecha, por ejemplo sustituyendo los guiones por barras usando el método strftime

In [6]:
today.strftime("%Y/%m/%d")

'2019/04/10'



Cada elemento de la fecha está representado por la combinación del símbolo de porcentaje `"%"` y una letra. En nuestro caso:
- `%d` representa el día del mes.
- `%m` representa el mes.
- `%Y` representa el año.



Por ejemplo, podríamos también pasar de formato de año largo a uno corto cambiando `"%Y"` por `"%y"`

In [7]:
today.strftime("%y/%m/%d")

'19/04/10'



O incluso podemos cambiar el número del mes por su nombre en inglés utilizando `"%B"`

In [8]:
today.strftime("%Y/%B/%d")

'2019/April/10'



Por supuesto, podremos cambiar el orden de cada elemento según nuestras preferencias:

In [9]:
today.strftime("%d/%m/%Y")

'10/04/2019'



También podemos trabajar con la fecha y la hora

In [10]:
now = datetime.now()
print(now)

2019-04-10 12:49:36.126953




De forma similar a la fecha, los elementos referidos a la fecha vienen representados por el mismo conjunto de letras, mientras que los de la hora lo hacen por defecto por el siguiente conjunto:

- `%H` representa la hora.
- `%M` representa los minutos.
- `%S` representa los segundos.
- `%f` representa los microsegundos.

In [0]:
now.strftime("%d/%m/%Y %H:%M:%S.%f")



No es obligatorio declarar todos los elementos que componen el objeto `datetime` cuando cambiamos el formato, pero obviamente los que no se declaren no aparecerán. Así, si no queremos que en nuestra variable aparezcan los milisegundos, es tan fácil eliminar esa parte cuando creamos el formato.

In [0]:
now.strftime("%d/%m/%Y %H:%M:%S")



# Componentes objeto datetime



Si en vez de imprimir por pantalla la variable `hoy` mostramos el objeto en sí, lo que obtenemos es una tupla:

In [11]:
today

datetime.date(2019, 4, 10)



Esto nos va a permitir acceder fácilmente a cada elemento de la fecha y a poder trabajar cómodamente con cada uno de sus componentes.

In [12]:
today.year

2019

In [13]:
today.month

4

In [14]:
today.day

10

In [15]:
now

datetime.datetime(2019, 4, 10, 12, 49, 36, 126953)

In [0]:
now.hour

In [0]:
now.minute

In [0]:
now.second



Se puede también obtener información más compleja del objeto `datetime` que no aparece en la tupla que vemos por pantalla como puede ser el día de la semana.

In [0]:
now.weekday()



El primer día de la semana será en nuestro caso el lunes y, como siempre en Python, se empieza a contar desde cero.



Es especialmente útil el método `isocalendar()` cuando se trabaja con semanas, puesto que el cálculo de la semana en curso no es tan trivial como pueda parecer.

In [0]:
now.isocalendar()



El primer elemento de la tupla es el año ISO, el segundo es la semana ISO y el tercer elemento es el día ISO.

In [0]:
print('The current ISO week is {}'.format(now.isocalendar()[1]))



# Operaciones sencillas con fechas



Python nos permite (entre otras operaciones) añadir y sustraer fácilmente periodos temporales a cualquier fecha usando la función `timedelta`.

In [0]:
from datetime import timedelta

tomorrow_1 = now + timedelta(hours=24)

In [0]:
print(tomorrow_1)

In [0]:
tomorrow_2 = now + timedelta(days=1)
print(tomorrow_2)



Lo realmente interesante de los objetos de tipo `datetime` es que poseen la lógica de las operaciones con fechas, por lo que no nos tenemos que preocupar de los días que tiene un mes o de los años bisiestos, puesto que será el propio Python quien se encargue de estas consideraciones:

In [0]:
print(now+timedelta(days=31))



Se puede ver que al añadir 31 días a nuestra fecha actual, Python se encarga él sólo de determinar si el mes posee 30 o 31 días y sumará tantas unidades al mes como sea necesario.



Sin embargo, no podremos añadir meses completos usando el argumento months.

In [0]:
print(now+timedelta(months=1))



Para ello podemos recurrir al objeto `relativedelta`

In [0]:
from dateutil.relativedelta import relativedelta

In [0]:
print(now+relativedelta(months=2))



También podemos obtener la diferencia (en segundos o en días) entre dos fechas 

In [0]:
other_date = now + timedelta(days=15,hours=3,seconds=7)

In [0]:
difference=(other_date-now)

In [0]:
difference.seconds



# Cómo convertir texto a fecha



Casi siempre nos vamos a encontrar con la necesidad de querer convertir una cadena de caracteres a un objeto `datetime`.

In [0]:
string_date = '12/09/2018'



En este caso podemos hacer uso del método `strptime` contenido en la clase `datetime`.

In [17]:
datetime.strptime(string_date,"%d/%m/%Y")

datetime.datetime(2018, 9, 12, 0, 0)



Aquí lo que estamos pasando como argumento es el formato de fecha que tiene nuestra cadena de caracteres, para que Python pueda identificar qué es cada elemento y pueda así crear el objeto `datetime` correctamente.



Por defecto, Python nos añade la hora 00:00 si no declaramos la parte horaria. Para evitar si nos interesa trabajar únicamente con la fecha, podemos usar el método `date`.

In [18]:
datetime.strptime(string_date,"%d/%m/%Y").date()



datetime.date(2018, 9, 12)

In [0]:
hour = '12-09-18 15:23:11'
datetime.strptime(hour,"%d-%m-%y %H:%M:%S")



# Pandas 

In [0]:
import pandas as pd



Pandas incorpora sus propios métodos para tratar con columnas de tipo fecha o para cambiar una columna de tipo *string* a otra de tipo *datetime64*. 

In [0]:
df = pd.DataFrame({'index':[0,1],'date':['12-09-18 15:23:11','23-09-18 17:21:45']})

In [41]:
df.dtypes

date     object
index     int64
dtype: object



`fecha` es en este caso un objeto de tipo *string*. Si queremos convertirlo a otro de tipo 'fecha' podemos hacerlo con el método `to_datetime`.

In [42]:
df['date'] = pd.to_datetime(df['date'])
df.dtypes

date     datetime64[ns]
index             int64
dtype: object

In [43]:
df

Unnamed: 0,date,index
0,2018-12-09 15:23:11,0
1,2018-09-23 17:21:45,1


In [44]:
df.dtypes

date     datetime64[ns]
index             int64
dtype: object



Podemos ver que cambia a *datetime64[ns]*.

In [0]:
df = pd.DataFrame({'index':[0,1],'date':['18/09/19 15:23:11','18/09/23 17:21:45']})

In [0]:
df.date = pd.to_datetime(df.date,format='%y/%m/%d %H:%M:%S')

In [47]:
df

Unnamed: 0,date,index
0,2018-09-19 15:23:11,0
1,2018-09-23 17:21:45,1




Pandas siempre representa las fechas de la forma `%Y-%m-%d` por lo que si queremos que utilice otro formato, hay que cambiarlo tras convertir la columna de *string* a *datimetime64*.

In [48]:
df.date = df.date.dt.strftime('%d %B %Y')
df

Unnamed: 0,date,index
0,19 September 2018,0
1,23 September 2018,1


In [49]:
df.dtypes

date     object
index     int64
dtype: object



Pero en este caso la columna vuelve a convertirse en string, por lo que perderemos los métodos propios de las fechas.

In [0]:
df = pd.DataFrame({'index':[0,1],'date':['18/09/19 15:23:11','18/09/23 17:21:45']})
df.date = pd.to_datetime(df.date,format='%y/%m/%d %H:%M:%S')



Si necesitamos añadir o sustraer un periodo de tiempo a nuestra fecha, `timedelta` es totalmente compatible con pandas (no así `relativedelta`).

In [0]:
df['date_3'] = df['date'] + timedelta(days=3)



Para extraer cada parte que compone la fecha, pandas implementa sus propios métodos a partir del objeto `dt`.

In [0]:
df.date.dt.year

In [0]:
df.date.dt.day



# Ejercicio 1



A partir de la siguiente lista de fechas, crea un data frame donde aparezca la fecha original, el año, el día de la semana (Lunes, Martes, etc.) y el día de la semana que tendría esa fecha pero un año después. No utilices por ahora ningún método de pandas para trabajar con fechas.

In [0]:
dates = ['19/09/1977','03/10/1980','21/11/1983','20/08/1999','17/05/2002','19/05/2005','18/12/2015','14/12/2017']

In [0]:
from datetime import datetime
from dateutil.relativedelta import relativedelta
import pandas as pd

In [0]:
# Respuesta aqui



Utilizando el data frame resultante, añade el mes y el día del mes usando métodos de pandas y calcula también (usando el método que prefieras) el número de días y el de años que han transcurrido desde entonces hasta hoy. 

In [0]:
# Respuesta aqui



Añade las dos siguientes columnas al data frame y anterior y reordénalas para que aparezca la fecha, el título, la puntuación, el año de estreno y los años que han transcurrido

In [0]:
star_wars = pd.DataFrame({'title':['A New Hope','The Empire Strikes Back','Return of the Jedi',
                                    'The Phantom Menace','Attack of the Clones','Revenge of the Sith',
                                    'The Force Awakens','The Last Jedi'],
                         'note':[8.6,8.8,8.3,6.5,6.6,7.6,8,7.3]})

In [0]:
# Respuesta aqui