Pandas contiene amplias capacidades y funciones para trabajar con datos de series temporales para todos los dominios. Utilizando los **tipos de datos NumPy datetime64 y timedelta64**, pandas ha consolidado una gran cantidad de funciones de otras bibliotecas de Python como scikits.timeseries y ha creado una gran cantidad de nuevas funciones para manipular datos de series temporales.

In [3]:
import pandas as pd
import numpy as np
import datetime

In [4]:
dti = pd.to_datetime(
    ["1/1/2018", np.datetime64("2018-01-01"), datetime.datetime(2018, 1, 1)]
)

In [5]:
dti

DatetimeIndex(['2018-01-01', '2018-01-01', '2018-01-01'], dtype='datetime64[ns]', freq=None)

In [6]:
# Genere secuencias de fechas de frecuencia fija y lapsos de tiempo
dti = pd.date_range("2018-01-01", periods=3, freq="H")

In [7]:
dti

DatetimeIndex(['2018-01-01 00:00:00', '2018-01-01 01:00:00',
               '2018-01-01 02:00:00'],
              dtype='datetime64[ns]', freq='H')

In [8]:
# Manipulación y conversión de fechas y horas con información de zona horaria
dti = dti.tz_localize("UTC")

In [9]:
dti

DatetimeIndex(['2018-01-01 00:00:00+00:00', '2018-01-01 01:00:00+00:00',
               '2018-01-01 02:00:00+00:00'],
              dtype='datetime64[ns, UTC]', freq='H')

In [10]:
dti.tz_convert("US/Pacific")

DatetimeIndex(['2017-12-31 16:00:00-08:00', '2017-12-31 17:00:00-08:00',
               '2017-12-31 18:00:00-08:00'],
              dtype='datetime64[ns, US/Pacific]', freq='H')

In [11]:
# Remuestreo o conversión de una serie de tiempo a una frecuencia particular
idx = pd.date_range("2018-01-01", periods=5, freq="H")

In [12]:
ts = pd.Series(range(len(idx)), index=idx)

In [13]:
ts

2018-01-01 00:00:00    0
2018-01-01 01:00:00    1
2018-01-01 02:00:00    2
2018-01-01 03:00:00    3
2018-01-01 04:00:00    4
Freq: H, dtype: int64

In [14]:
ts.resample("2H").mean()

2018-01-01 00:00:00    0.5
2018-01-01 02:00:00    2.5
2018-01-01 04:00:00    4.0
Freq: 2H, dtype: float64

In [15]:
# Realización de aritmética de fecha y hora con incrementos de tiempo absolutos o relativos
friday = pd.Timestamp("2018-01-05")

In [16]:
friday.day_name()

'Friday'

In [17]:
# Add 1 day
saturday = friday + pd.Timedelta("1 day")

In [18]:
saturday.day_name()

'Saturday'

In [19]:
# Add 1 business day (Friday --> Monday)
monday = friday + pd.offsets.BDay()

In [20]:
monday.day_name()

'Monday'

## Visión general

### pandas captura 4 conceptos generales relacionados con el tiempo:

    1.**Horas de fecha**: una fecha y hora específicas con soporte de zona horaria. Similar a datetime.datetime de la biblioteca estándar.

    2. **Deltas de tiempo**: una duración de tiempo absoluta. Similar a datetime.timedelta de la biblioteca estándar.

    3. **Lapsos de tiempo**: Un lapso de tiempo definido por un punto en el tiempo y su frecuencia asociada.

    4. **Compensaciones de fecha**: una duración de tiempo relativa que respeta la aritmética del calendario. Similar a dateutil.relativedelta.relativedelta del paquete dateutil.

In [21]:
# Para los datos de series de tiempo, es convencional representar el componente de tiempo en el índice 
# de una Serie o Data Frame que se puedan realizar manipulaciones con respecto al elemento de tiempo.
pd.Series(range(3), index=pd.date_range("2000", freq="D", periods=3))

2000-01-01    0
2000-01-02    1
2000-01-03    2
Freq: D, dtype: int64

In [22]:
# Sin embargo, Series y DataFrame también pueden admitir directamente el componente de tiempo como datos en sí mismos.
pd.Series(pd.date_range("2000", freq="D", periods=3))

0   2000-01-01
1   2000-01-02
2   2000-01-03
dtype: datetime64[ns]

In [23]:
# Series y DataFrame tienen soporte y funcionalidad de tipo de datos extendidos para datos de fecha y hora, 
# timedelta y Period cuando se pasan a esos constructores. Sin embargo, los datos de DateOffset 
# se almacenarán como datos de objeto.
pd.Series(pd.period_range("1/1/2011", freq="M", periods=3))

0    2011-01
1    2011-02
2    2011-03
dtype: period[M]

In [24]:
pd.Series([pd.DateOffset(1), pd.DateOffset(2)])

0         <DateOffset>
1    <2 * DateOffsets>
dtype: object

In [25]:
pd.Series(pd.date_range("1/1/2011", freq="M", periods=3))

0   2011-01-31
1   2011-02-28
2   2011-03-31
dtype: datetime64[ns]

In [26]:
# Por último, pandas representa fechas y horas nulas, deltas de tiempo y lapsos de tiempo como NaT, 
# que es útil para representar valores de fecha faltante o nula y se comporta de manera similar 
# a como lo hace np.nan para datos flotantes.
pd.Timestamp(pd.NaT)

NaT

In [27]:
pd.Timedelta(pd.NaT)

NaT

In [28]:
pd.Period(pd.NaT)

NaT

In [29]:
# Equality acts as np.nan would
pd.NaT == pd.NaT

False