# Tipos de datos de fecha

En Pandas, las fechas y horas se manejan principalmente utilizando los tipos de datos ``datetime64`` y ``Timedelta``. Estos tipos de datos permiten realizar operaciones avanzadas de manipulación y análisis de datos temporales. A continuación, se describen en detalle estos tipos de datos y cómo se utilizan en Pandas.

Pandas utiliza el tipo de datos datetime64[ns] para representar **fechas** y **horas** con precisión de nanosegundos. Este tipo de datos es fundamental para realizar operaciones de análisis temporal de manera eficiente. 



Para convertir una columna de un DataFrame a tipo datetime, se utiliza la función ``pd.to_datetime()``. Por ejemplo:

In [5]:
import pandas as pd

# Crear un DataFrame con datos de ejemplo
data = {'fecha': ['2023-01-01', '2023-02-01', '2023-03-01']}
df = pd.DataFrame(data)

# Convertir la columna 'fecha' a tipo datetime
df['fecha'] = pd.to_datetime(df['fecha'])
print(df.dtypes)

fecha    datetime64[ns]
dtype: object


El tipo de datos **Timedelta** se utiliza para representar diferencias de tiempo entre dos fechas. Este tipo de datos es útil para calcular duraciones, intervalos y realizar operaciones aritméticas con fechas. Para crear una columna de tipo Timedelta, se puede utilizar la función ``pd.to_timedelta()``. Por ejemplo:

In [10]:
import pandas as pd

# Crear un DataFrame con datos de ejemplo
data = {'inicio': ['2023-01-01', '2023-02-01'], 'fin': ['2023-01-10', '2023-02-10']}
df = pd.DataFrame(data)

# Convertir las columnas 'inicio' y 'fin' a tipo datetime
df['inicio'] = pd.to_datetime(df['inicio'])
df['fin'] = pd.to_datetime(df['fin'])

# Calcular la diferencia entre las fechas
df['duracion'] = df['fin'] - df['inicio']
print(df)

      inicio        fin duracion
0 2023-01-01 2023-01-10   9 days
1 2023-02-01 2023-02-10   9 days


En el ejemplo anterior no se utiliza ``.to_timedelta()`` porque la diferencia entre dos columnas de tipo datetime (como df['fin'] - df['inicio']) automáticamente genera un objeto de tipo Timedelta.



Cuando se resta una fecha de otra en Pandas, el resultado es directamente una duración o intervalo de tiempo representado como Timedelta. Por tanto, en este caso no es necesario usar explícitamente ``pd.to_timedelta()``.
``pd.to_timedelta()`` se utiliza principalmente cuando se quiere crear o convertir directamente a un tipo ``Timedelta`` a partir de otros tipos de datos como cadenas o números. Por ejemplo, cuando se desea convertir un número a una duración específica (días, horas, minutos) a partir de una columna que no está en formato de fecha.

Además de ``datetime64`` y ``Timedelta``, Pandas también soporta el tipo de datos Period para trabajar con periodos de tiempo. Un Period representa una unidad de tiempo específica, como un mes o un año. Para crear una columna de tipo Period, se puede utilizar la función ``pd.period_range()``. Por ejemplo:

In [17]:
import pandas as pd

# Crear un rango de periodos mensuales
periodos = pd.period_range(start='2023-01', end='2023-06', freq='M')
print(periodos)

PeriodIndex(['2023-01', '2023-02', '2023-03', '2023-04', '2023-05', '2023-06'], dtype='period[M]')


Es importante tener en cuenta que las operaciones con tipos de datos de fecha pueden ser sensibles al formato y la zona horaria. Pandas maneja las zonas horarias mediante el uso de la librería pytz o la funcionalidad de zona horaria de datetime. Para ajustar la zona horaria de una serie de fechas, se puede utilizar el método ``.tz_localize()`` y ``.tz_convert()``. Por ejemplo:



In [20]:
import pandas as pd

# Crear una serie de fechas
fechas = pd.date_range(start='2023-01-01', periods=3, freq='D', tz='UTC')

# Convertir la zona horaria de UTC a US/Eastern
fechas = fechas.tz_convert('US/Eastern')
print(fechas)

DatetimeIndex(['2022-12-31 19:00:00-05:00', '2023-01-01 19:00:00-05:00',
               '2023-01-02 19:00:00-05:00'],
              dtype='datetime64[ns, US/Eastern]', freq='D')


En resumen, el manejo de tipos de datos de fecha en Pandas es fundamental para realizar análisis temporales precisos y eficientes. La conversión y manipulación de fechas utilizando **datetime64, Timedelta y Period** permite realizar operaciones avanzadas y obtener insights valiosos de los datos temporales.