## Series Temporais

O Pandas possui 3 tipos de objetos para lidar com séries temporias:
* **Timestamp** - Para marcação de data, hora, minuto, etc. A estrutura de índice associada é ``DatetimeIndex``.
* **Period** - Para período de tempos.  A estrutura de índice associada é ``PeriodIndex``.
* **Timedelta** - Para duração de tempo. A estrutura de índice associada é ``TimedeltaIndex``.

Os exemplos a seguir serão apenas uma breve introdução. Para uma ir mais a fundo, a documentação sobre timeseries do Pnadas encontra-se no link a seguir: http://pandas.pydata.org/pandas-docs/stable/timeseries.html

In [1]:
import numpy as np
import pandas as pd

In [2]:
# Criando um objeto
date = pd.to_datetime("16/11/1982")
date

Timestamp('1982-11-16 00:00:00')

In [3]:
# Mostrando o dia da semana
date.strftime('%A')

'Tuesday'

**Indexação por tempo**  
Quando temos um conjunto de dados indexado por data, podemos executar algumas operações de maneira mais rápida, como por exemplo filtrar intervalos

In [4]:
# Criando uma série indexada por data
indice = pd.DatetimeIndex(['2014-07-04', '2014-08-04',
                           '2015-07-04', '2015-08-04'])

dados = pd.Series([0, 1, 2, 3], index=indice)

dados

2014-07-04    0
2014-08-04    1
2015-07-04    2
2015-08-04    3
dtype: int64

In [5]:
# Filtrando por ano
dados['2014']

2014-07-04    0
2014-08-04    1
dtype: int64

In [6]:
# Filtrando um intervalo
dados['2014-07-04':'2015-07-04']

2014-07-04    0
2014-08-04    1
2015-07-04    2
dtype: int64

**Série de datas**  
Assim como podemos criar uma série de dados utilizando o ``range()`` para o Python e o ``np.arange()`` para o NumPy, podemos criar também uma sequência de datas com a função ``pd.date_range()``.

In [7]:
# Criando através da definição das datas de início e fim
pd.date_range('2018-03-15', '2018-03-20')

DatetimeIndex(['2018-03-15', '2018-03-16', '2018-03-17', '2018-03-18',
               '2018-03-19', '2018-03-20'],
              dtype='datetime64[ns]', freq='D')

In [8]:
# Criando através de uma sequenca de dias
pd.date_range('2018-03-15', periods=6)

DatetimeIndex(['2018-03-15', '2018-03-16', '2018-03-17', '2018-03-18',
               '2018-03-19', '2018-03-20'],
              dtype='datetime64[ns]', freq='D')

In [9]:
# Podemos também modificar a sequência, modificando o parâmetro seq de dias para anos, mês, horas, minutos, segundos, etc.
pd.date_range('2018-03-15', periods=6, freq='H')

DatetimeIndex(['2018-03-15 00:00:00', '2018-03-15 01:00:00',
               '2018-03-15 02:00:00', '2018-03-15 03:00:00',
               '2018-03-15 04:00:00', '2018-03-15 05:00:00'],
              dtype='datetime64[ns]', freq='H')

In [10]:
# A função aceita inclusive combinação de frequências, como horas e minutos. Abaixo exemplo com intervalo de 2 horas e meia.
pd.timedelta_range(0, periods=9, freq="2H30T")

TimedeltaIndex(['00:00:00', '02:30:00', '05:00:00', '07:30:00', '10:00:00',
                '12:30:00', '15:00:00', '17:30:00', '20:00:00'],
               dtype='timedelta64[ns]', freq='150T')

**resample**  
A partir da indexação por data, podemos manipular os dados a partir delas. Uma função interessante é a ``resample()`` que nos permite agregar os valores por média, soma, máximo, etc; e pelo período que desejarmos tais como dia, semana, mês, etc.

In [11]:
# Gerando dados
data = pd.date_range('2018-07-02', periods=14, freq='D')  # 2 semanas de index
dados = np.array(range(len(data)))  # array com 14 elementos

data_dados = pd.Series(dados, index=data)  # juntando os dois dados
data_dados

2018-07-02     0
2018-07-03     1
2018-07-04     2
2018-07-05     3
2018-07-06     4
2018-07-07     5
2018-07-08     6
2018-07-09     7
2018-07-10     8
2018-07-11     9
2018-07-12    10
2018-07-13    11
2018-07-14    12
2018-07-15    13
Freq: D, dtype: int32

In [12]:
# Agregando de dias para semanas e calculando a média dos valores
data_dados.resample('W').mean()

2018-07-08     3
2018-07-15    10
Freq: W-SUN, dtype: int32