# Datas e Horários

## Datas

- objeto python date:

In [18]:
from datetime import date, datetime, timedelta, timezone

In [11]:
# criando objeto python date:
a_day = date(2012,6,21) # input: YYYY,mm,dd
print(a_day) # formato ISO 8601: YYYY-mm-dd com 0 a esquerda quando necessário

# atributos:
print(a_day.year)
print(a_day.month)
print(a_day.day)

# métodos:
print(a_day.weekday()) # 0 = segunda; 1 = terça;...; 6 = domingo. Código terrível

2012-06-21
2012
6
21
3


In [7]:
# operações com datas:
delta = date(2017,6,21) - date(2016,6,21)
print(-delta.days)

-365


In [6]:
# Criando o delta:
from datetime import timedelta
td = timedelta(days=365)

print(date(2016,6,21) + td)

2017-06-21


In [21]:
# convert to string:
a_day = date(2012,6,21) 
print(type(a_day))
print(a_day)
print()
print(type(a_day.isoformat()))
print(a_day.isoformat())

# apenas no formato iso, strings podem ser ordenadas em ordem cronológica (através da "alfabética")

<class 'datetime.date'>
2012-06-21

<class 'str'>
2012-06-21


In [25]:
# selecionando o dado e o formato de data:
print(type(a_day.strftime('%Y'))) # string 
print(a_day.strftime('%Y')) # ano da data armazenada na variável
print()
print(a_day.strftime("%d/%m/%Y"))    # o '%' marca que o próximo caractere é um chamado de informação
print(a_day.strftime("%Y-%m-%d")) 
print(a_day.strftime('O ano é %Y, repetindo: %Y')) # string de formato são flexiveis


<class 'str'>
2012

21/06/2012
2012-06-21
O ano é 2012, repetindo: 2012


In [23]:
# outras strings de formato:
format_strings = {'year': '%Y',
                  'month': '%m',
                  'day': '%d',
                  'full name month': '%B',
                  'day of the year': '%j'}

## Horas

In [4]:
from datetime import datetime

In [34]:
dt = datetime(2017,10,1,15,23,25) # input: YYYY,mm,dd, hh (formato 24h), mm, ss
    # precisam ser inteiros. 
dt = datetime(2017,10,1,15,23,25,500000)
print(dt)
print(print(dt.isoformat()))

    # Se quiser fracionar segundo na metade, tem que informar microssegundos (10^-6 segundo)
    # Se precisar fracionar mais, pode-se incluir nanossegundos (mais a frente)

# usando inputs mais explicitos:
datetime(year=2017,month=10,day=1,hour=15,minute=23,second=25,microsecond=500000)

2017-10-01 15:23:25.500000
2017-10-01T15:23:25.500000
None


datetime.datetime(2017, 10, 1, 15, 23, 25, 500000)

In [32]:
# editando um datetime: replace method
dt_edited = dt.replace(hour=0,minute=0,second=0,microsecond=0)
print(dt_edited)

2017-10-01 00:00:00


In [36]:
# datetime para string:
print(dt.strftime("%Y-%m-%d")) # get the date
print(dt.strftime("%Y-%m-%d %H:%M:%S")) 


2017-10-01
2017-10-01 15:23:25


In [None]:
# updated strings de formato:
format_strings = {'year': '%Y',
                  'month': '%m',
                  'day': '%d',
                  'full name month': '%B',
                  'day of the year': '%j',

                  'hour': '%H',
                  'minute': '%M',
                  'second': '%S'
                  }

In [37]:
# parsing (análise): recebe string, converte pra datetime (inverso do método .strftime())
dt = datetime.strptime("12/30/2017 15:19:13", "%m/%d/%Y %H:%M:%S")  
    # string parse time: é um 'P' e nao um 'F' como no método anterior strftime
    # forneça a string e depois a formatação dela. Incompatibilidade entre os dois gerará ValueError
print(type(dt))
print(dt)

<class 'datetime.datetime'>
2017-12-30 15:19:13


In [38]:
# formato de hora: Unix timestamp -> número de segundos desde 1o de janeiro de 1970, zero hora
ts = 1514665153.0
# converter pra datetime:
print(datetime.fromtimestamp(ts))

2017-12-30 17:19:13


# Duração

In [5]:
# Create example datetimes
start = datetime(2017, 10, 8, 23, 46, 47)
end = datetime(2017, 10, 9, 0, 10, 57)
# Subtract datetimes to create a timedelta object
duration = end - start
print(duration) # print the object
print(duration.total_seconds()) # method to return timedelta in seconds (integer)
display(duration) # display the object 
print(type(duration)) # object type

0:24:10
1450.0


datetime.timedelta(seconds=1450)

<class 'datetime.timedelta'>


In [17]:
# create timedelta by hand:
delta = timedelta(seconds=1, days=1)
print(delta)
print()
# adding timedelta to a date:
print(start)
print(start + delta)
print(start - delta) # subtract
print()
# timedelta can be negative:
delta2 = timedelta(weeks=-1)
print(delta2)

1 day, 0:00:01

2017-10-08 23:46:47
2017-10-09 23:46:48
2017-10-07 23:46:46

-7 days, 0:00:00


### UTC
- Até então usamos timestamps 'naive', que não leva em consideração a geolocalização (fuso / timezone).
- Podemos ter datetime 'aware', que leva a informação da timezone
- O padrão para isso é o UTC (padrão ingles)
- à direita (leste) os horários são adiantados em relação ao Reino Unido (UTC+X)
- à esquerda (oeste) os horários são atrasados em relação ao Reino Unido (UTC-X)


In [19]:
from datetime import timezone

In [26]:
# timezone object
ET = timezone(timedelta(hours=-5)) # estern timezone (UTC-5), um de EUA

# create datetime UTC-3:
dt = datetime(2017, 12, 30, 15, 9, 3, tzinfo=ET)
print(dt) # datetime agoa inclui a última info, chamada de UTC offset (deslocamento UTC)

2017-12-30 15:09:03-05:00
2017-12-31 01:39:03+05:30


In [33]:
# ajustar o mesmo momento para horário em outra timezone: "trocar o fuso"
IST = timezone(timedelta(hours=5, minutes=30)) # fuso da Índia

print(dt)
print(dt.astimezone(IST)) # Que horas são na Índia neste momento?
print(dt)
print()

# ajustar != trocar a timezone

# Trocar a timezone -> mantém o relógio e troca o fuso (e o momento)
print(dt)
print(dt.replace(tzinfo=IST))
print(dt)
print()

# Trocar o momento e a zona:
print(dt.astimezone(timezone.utc)) # timezone.utc é o UTC

2017-12-30 15:09:03-05:00
2017-12-31 01:39:03+05:30
2017-12-30 15:09:03-05:00

2017-12-30 15:09:03-05:00
2017-12-30 15:09:03+05:30
2017-12-30 15:09:03-05:00

2017-12-30 20:09:03+00:00


##### Database de Fusos

In [34]:
from dateutil import tz # base de dados 

In [37]:
# Request de uma timezone específica:
et = tz.gettz('America/New_York') # Eastern time; 
            # Primeiro o Continente, depois a cidade grande mais próxima
print(et)

# esse objeto pode ser usado como input de tzinfo:
horario = datetime(2017, 12, 30, 15, 9, 3, tzinfo=et)
print(horario)
# outro exemplo: df['hour'].replace(tzinfo=et)
# outro exemplo: f['hour'].astimezone(et)

# considera o horario de verão no timedelta da zona:
verao = datetime(2017, 10, 1, 15, 23, 25, tzinfo=et)
print(verao)

tzfile('US/Eastern')
2017-12-30 15:09:03-05:00
2017-10-01 15:23:25-04:00


#### Horário de Verão

- o deslocamento UTC (UTC offset) do objeto muda ao entrar no horário de verão: 

In [40]:
# Vamos observar o horário naive primeiro 
spring_ahead_159am = datetime(2017, 3, 12, 1, 59, 59) 
# o relógio adianta 1h às 2h deste dia (um segundo depois desse horário)
spring_ahead_159am.isoformat() # lembrando: .isoformat() ou .strftime() converte datetime em string

'2017-03-12T01:59:59'

In [41]:
spring_ahead_3am = datetime(2017, 3, 12, 3, 0, 0)
spring_ahead_3am.isoformat() # print

'2017-03-12T03:00:00'

In [42]:
(spring_ahead_3am - spring_ahead_159am).total_seconds() 
# 3601 segundos = uma hora e um segundo, já que nao temos geolocalização (naive)

3601.0

In [49]:
# aqui esse horário de verão acontece
EST = timezone(timedelta(hours=-5))
EDT = timezone(timedelta(hours=-4)) # Eastern Daylight time


spring_ahead_159am = spring_ahead_159am.replace(tzinfo=EST)
print(spring_ahead_159am)
spring_ahead_3am = spring_ahead_3am.replace(tzinfo=EDT) # teve que ser definido delta diferente pra ser horario de verao
print(spring_ahead_3am)


2017-03-12 01:59:59-05:00
2017-03-12 03:00:00-04:00


In [50]:
(spring_ahead_3am - spring_ahead_159am).total_seconds() 
# agora apenas um segundo. O horário de verão teve que ser definido, nada vai acontecer automáticamente

1.0

In [61]:
# como saber os horários de verão: dateutil de novo

eastern = tz.gettz('America/New_York') # aqui ele ja puxa horario de verão se a data estiver neste intervalo

spring_ahead_159am = datetime(2017, 3, 12, 1, 59, 59, tzinfo = eastern) 
spring_ahead_3am = datetime(2017, 3, 12, 3, 0, 0, tzinfo = tz.gettz('America/New_York')) # s´po pra mostrar que dá pra chamar direto no argumento
(spring_ahead_3am - spring_ahead_159am).total_seconds() # DEU ERRADO

3601.0

In [58]:
# fim do horario de verão: hora repete
eastern = tz.gettz('US/Eastern')
# 2017-11-05 01:00:00
first_1am = datetime(2017, 11, 5, 1, 0, 0,  tzinfo = eastern)

In [59]:
# checando se a hora é ambigua (como ocorre em fim de horario de verão)
tz.datetime_ambiguous(first_1am)

True

In [None]:
# 2017-11-05 01:00:00 again
second_1am = datetime(2017, 11, 5, 1, 0, 0,tzinfo = eastern)
second_1am = tz.enfold(second_1am) # enfold: define em caso de hora ambigua que essa é a repetição da hora

(first_1am - second_1am).total_seconds() # enfold não altera o horário, é apenas um placeholder é necessário...

In [56]:
# ... converter pra UTC
first_1am = first_1am.astimezone(tz.UTC)
second_1am = second_1am.astimezone(tz.UTC)
(second_1am - first_1am).total_seconds()

3600.0

# Pandas

In [60]:
import pandas as pd

In [None]:
df = pd.read_csv('arquivo.csv')
df['Dates'] # tipo dos valores da coluna pode ser object ou string

# definir tipo como datetime no carregamento do arquivo:
df = pd.read_csv('arquivo.csv', parse_dates = ['Dates', 'Another_dates'])

# converter pra datetime com dataframe já carregado:
df['Dates'] = pd.to_datetime(df['Dates'], format="%m/%d/%Y %H:%M:%S")

# type(df['Dates'].iloc[2]) # o tipo é timestamp e nao datetime, mas funciona parecido

In [None]:
df['Deltas'] = df['Dates'] - df['Another_dates'] # timedeltas

df['Deltas'].dt.total_seconds().head(4) # chaining methods (encadeando métodos):
df['Deltas']\
    .dt.total_seconds()\ 
        .head(4)
# pra usar método de datetime em timestamp precisa por esse accessor ".dt" antes
df['Deltas'].iloc[2].year # não precisa de ".dt" em caso de ser um único elemento

In [None]:
# Sumarizando dados de uma coluna de timestamp (versões anteriores a 0.23 de Pandas podem quebrar)
df['Dates'].mean()
df['Dates'].median()
df['Dates'].sum()   
df['Dates'].sum() / timedelta(days=91) # matemática

## Timezones e pandas

In [None]:
# atribuir timezone: mantendo a data e hora 
df['Dates'].dt.tz_localize('America/New_york')
    # Pode ocorrer o Ambiguous timezone, correspondente a horários ambiguos (de verão)

df['Dates'].dt.tz_localize('America/New_york', ambiguous='Nat')
    # Transforma o horário ambiguo em uma espécie de 'Na' "not a time"

In [None]:
# converter timezone: troca a data e horário pra adequar
df['Dates'] = df['Dates'].dt.tz_convert('Europe/London')

In [None]:
# shift: defesa uma linha ao comparar duas colunas
df['Time since'] = df['Start date'] - (df['End date'].shift(1)) # shift 1 pega uma linha acima

In [None]:
# agrupar:

# duração média por mês:
df_resampled = df.resample('M', on = 'Start date')
df_resampled['Duration seconds'].mean()
    # agrupa linhas na base de uma coluna de datetime, por ano, mês, dia e por ai vai.
