 # **<font color="DarkBlue">Series de tiempo 🐼 </font>**

<p align="center">
<img src="https://pandas.pydata.org/static/img/pandas_mark.svg" width="50">
</p>


https://pandas.pydata.org/

 # **<font color="DarkBlue">Fundamentos de series temporales</font>**

<p align="justify">
En Pandas, un tipo fundamental de objeto de serie temporal es una <b>Serie temporal</b>, que se caracteriza por estar indexada mediante <b>marcas de tiempo</b>. Este tipo de objeto es utilizado frecuentemente para trabajar con datos que varían con el tiempo, como series de ventas, precios de acciones, temperaturas, entre otros.
<br><br>
Las marcas de tiempo pueden ser representadas en otros formatos fuera de Pandas, como cadenas de texto o objetos <code>datetime</code> de Python.
<br><br>
Sin embargo, al ser convertidas a una Serie temporal en Pandas, las marcas de tiempo se indexan de manera eficiente, lo que permite realizar operaciones de análisis temporal de forma rápida y precisa.
<br><br>
Las Series temporales en Pandas son muy útiles para tareas como el análisis de tendencias, descomposición de series temporales, resampling (cambio de frecuencia de las muestras), y la predicción a futuro.
<br><br>
 Además, el uso de marcas de tiempo como índice mejora la eficiencia en el acceso y la manipulación de los datos a lo largo del tiempo.
</p>


In [None]:
import pandas as pd
import plotly.express as px
from datetime import datetime

Ejemplo:

<p align="justify">
<b>DatetimeIndex</b> es un tipo especial de índice que se utiliza para representar datos de tiempo en una serie o DataFrame. Este índice permite realizar un análisis eficiente y operaciones de manipulación temporal, como la reindexación de datos, el agrupamiento por frecuencia y la conversión de datos a diferentes intervalos de tiempo.
<br><br>
 Al crear un objeto <code>DatetimeIndex</code>, Pandas utiliza marcas de tiempo (fechas y horas) para indexar las filas, lo que facilita las operaciones basadas en tiempo.
 <br><br>
 Es comúnmente utilizado para trabajar con datos de series temporales, como las fechas de eventos o registros en un conjunto de datos.
</p>


In [None]:
# Crear un rango de fechas

fechas = pd.date_range("2024-11-01", periods=5, freq="D")
fechas

DatetimeIndex(['2024-11-01', '2024-11-02', '2024-11-03', '2024-11-04',
               '2024-11-05'],
              dtype='datetime64[ns]', freq='D')

In [None]:
# Crear una Serie con un DatetimeIndex

datos = [10, 20, 30, 40, 50]
serie_temporal = pd.Series(datos, index=fechas)
serie_temporal.name = "Datos"


In [None]:
serie_temporal

Unnamed: 0,Datos
2024-11-01,10
2024-11-02,20
2024-11-03,30
2024-11-04,40
2024-11-05,50


<p align="justify">
Este ejemplo crea un objeto <code>DatetimeIndex</code> utilizando <code>pd.date_range()</code>, que genera un rango de fechas con una frecuencia diaria.
<br><br>
 Luego, se crea una <code>Serie</code> con estos índices de fecha, y cada valor de la serie está asociado a una fecha específica. El índice de la serie es un <code>DatetimeIndex</code>, lo que permite realizar fácilmente manipulaciones y análisis basados en fechas.








 # **<font color="DarkBlue">Indexación, selección y subconjuntos</font>**

<p align="justify">
En Pandas, la indexación, selección y creación de subconjuntos de series de tiempo son operaciones fundamentales para trabajar con datos temporales. Al utilizar un objeto de tipo <code>DatetimeIndex</code> como índice de una serie o un DataFrame, Pandas permite realizar diversas operaciones de selección y filtrado de manera eficiente.
<br><br>
Estas operaciones incluyen el acceso a datos en fechas específicas, la selección de un rango de fechas, el filtrado por una frecuencia específica y la segmentación por una condición temporal.
<br><br>
Existen varias maneras de realizar la indexación y selección de datos en series de tiempo. Por ejemplo, se puede acceder a los datos de una fecha específica utilizando una notación similar a la de los índices tradicionales en Pandas. También es posible seleccionar subconjuntos de datos basados en intervalos de tiempo, como días, meses o años, y realizar operaciones basadas en estas divisiones.
<br><br>
Además, la indexación por fecha permite realizar tareas como la reindexación (ajustar el índice para coincidir con una nueva frecuencia), el resampling (cambio de frecuencia de las muestras), y la selección de un subconjunto de datos en un periodo de tiempo determinado.


 ## **<font color="DarkBlue">Selección por fecha</font>**

In [None]:
# Crear un rango de fechas y datos

fechas = pd.date_range("2024-11-01", periods=5, freq="D")
ventas = [100, 200, 150, 175, 210]


In [None]:
# Crear una serie temporal

serie_ventas = pd.Series(ventas, index=fechas)
serie_ventas.name = "Ventas"
serie_ventas


Unnamed: 0,Ventas
2024-11-01,100
2024-11-02,200
2024-11-03,150
2024-11-04,175
2024-11-05,210


In [None]:
# Seleccionar ventas de una fecha específica

ventas_especificas = serie_ventas["2024-11-03"]
ventas_especificas

150

 ## **<font color="DarkBlue">Selección por rango de fechas</font>**

In [None]:
# Seleccionar un rango de fechas

rango_ventas = serie_ventas["2024-11-02":"2024-11-04"]
rango_ventas

Unnamed: 0,Ventas
2024-11-02,200
2024-11-03,150
2024-11-04,175


 ## **<font color="DarkBlue">Resampling y agregación por mes</font>**

In [None]:
# Resampling para obtener ventas mensuales (aunque el conjunto de datos es diario)

ventas_mensuales = serie_ventas.resample('ME').sum()
ventas_mensuales

Unnamed: 0,Ventas
2024-11-30,835


 # **<font color="DarkBlue">Generando un rango de fechas</font>**

<p align="justify">
La función <code>pd.date_range()</code> de Pandas se utiliza para generar un rango de fechas con una frecuencia específica.
<br><br>
En el ejemplo <code>index = pd.date_range("2012-04-01", "2012-06-01")</code>, se crea un rango de fechas desde el 1 de abril de 2012 hasta el 1 de junio de 2012.
<br><br>
Esta función devuelve un objeto <code>DatetimeIndex</code> que incluye todas las fechas dentro de ese rango, con una frecuencia predeterminada de un día.  Al utilizar <code>date_range()</code>, es posible especificar el intervalo entre las fechas, lo que permite ajustar el análisis de acuerdo con las necesidades específicas del problema.
</p>


In [None]:
# Generar un rango de fechas entre el 1 de abril y el 2 de mayo de 2012

index = pd.date_range("2012-04-01", "2012-05-02")
index

DatetimeIndex(['2012-04-01', '2012-04-02', '2012-04-03', '2012-04-04',
               '2012-04-05', '2012-04-06', '2012-04-07', '2012-04-08',
               '2012-04-09', '2012-04-10', '2012-04-11', '2012-04-12',
               '2012-04-13', '2012-04-14', '2012-04-15', '2012-04-16',
               '2012-04-17', '2012-04-18', '2012-04-19', '2012-04-20',
               '2012-04-21', '2012-04-22', '2012-04-23', '2012-04-24',
               '2012-04-25', '2012-04-26', '2012-04-27', '2012-04-28',
               '2012-04-29', '2012-04-30', '2012-05-01', '2012-05-02'],
              dtype='datetime64[ns]', freq='D')

In [None]:
# Crear una serie de ventas con el rango de fechas generado

ventas = [120, 150, 200, 175, 190, 210, 250, 230, 180, 160, 170, 195, 210, 220, 240, 230, 250, 265, 280, 300, 310, 325, 350, 375, 400, 420, 440, 460, 480, 500, 520, 540]


In [None]:
len(ventas)

32

In [None]:
# Crear la serie temporal de ventas

serie_ventas = pd.Series(ventas, index=index)
serie_ventas.name = "Ventas"
serie_ventas

Unnamed: 0,Ventas
2012-04-01,120
2012-04-02,150
2012-04-03,200
2012-04-04,175
2012-04-05,190
2012-04-06,210
2012-04-07,250
2012-04-08,230
2012-04-09,180
2012-04-10,160


In [None]:
pd.date_range(start="2024-01-01", periods=20)

DatetimeIndex(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04',
               '2024-01-05', '2024-01-06', '2024-01-07', '2024-01-08',
               '2024-01-09', '2024-01-10', '2024-01-11', '2024-01-12',
               '2024-01-13', '2024-01-14', '2024-01-15', '2024-01-16',
               '2024-01-17', '2024-01-18', '2024-01-19', '2024-01-20'],
              dtype='datetime64[ns]', freq='D')

In [None]:
pd.date_range(end="2024-11-04", periods=20)

DatetimeIndex(['2024-10-16', '2024-10-17', '2024-10-18', '2024-10-19',
               '2024-10-20', '2024-10-21', '2024-10-22', '2024-10-23',
               '2024-10-24', '2024-10-25', '2024-10-26', '2024-10-27',
               '2024-10-28', '2024-10-29', '2024-10-30', '2024-10-31',
               '2024-11-01', '2024-11-02', '2024-11-03', '2024-11-04'],
              dtype='datetime64[ns]', freq='D')

<p align="justify">
Las fechas de inicio y de finalización definen límites estrictos para el índice de fechas generado.
<br><br>
A continuación, las opciones que se pueden utilizar...


<table border="1">
  <thead>
    <tr>
      <td><b>Alias</td>
      <td><b>Tipo de desplazamiento</td>
      <td><b>Descripción</td>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>D</td>
      <td>Day</td>
      <td>Calendario diario</td>
    </tr>
    <tr>
      <td>B</td>
      <td>BusinessDay</td>
      <td>Diario de negocios</td>
    </tr>
    <tr>
      <td>H</td>
      <td>Hour</td>
      <td>Cada hora</td>
    </tr>
    <tr>
      <td>Tomin</td>
      <td>Minute</td>
      <td>Una vez por minuto</td>
    </tr>
    <tr>
      <td>S</td>
      <td>Second</td>
      <td>Una vez por segundo</td>
    </tr>
    <tr>
      <td>Loms</td>
      <td>Milli</td>
      <td>Milisegundo (1/1.000 de 1 segundo)</td>
    </tr>
    <tr>
      <td>U</td>
      <td>Micro</td>
      <td>Microsegundo (1/1.000.000 de 1 segundo)</td>
    </tr>
    <tr>
      <td>M</td>
      <td>MonthEnd</td>
      <td>Último día del calendario del mes</td>
    </tr>
    <tr>
      <td>BM</td>
      <td>BusinessMonthEnd</td>
      <td>Último día hábil (día laborable) del mes</td>
    </tr>
    <tr>
      <td>MS</td>
      <td>MonthBegin</td>
      <td>Primer día del calendario del mes</td>
    </tr>
    <tr>
      <td>BMS</td>
      <td>BusinessMonthBegin</td>
      <td>Primer día laborable del mes</td>
    </tr>
    <tr>
      <td>W-MON, W-TUE, ...</td>
      <td>Week</td>
      <td>Semanalmente en un día determinado de la semana (LUN, MAR, MIÉRCOLES, JUEVES, VIERNES, SÁBADOS o DOMINGOS)</td>
    </tr>
    <tr>
      <td>WOM-1MON, WOM-2MON, ...</td>
      <td>WeekOfMonth</td>
      <td>Generar fechas semanales en la primera, segunda, tercera o cuarta semana del mes (por ejemplo, WOM-3FRI para el tercer viernes de cada mes)</td>
    </tr>
    <tr>
      <td>Q-JAN, Q-FEB, ...</td>
      <td>QuarterEnd</td>
      <td>Fechas trimestrales ancladas en el último día calendario de cada mes, para el año que termina en el mes indicado (ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV o DIC)</td>
    </tr>
    <tr>
      <td>BQ-JAN, BQ-FEB, ...</td>
      <td>BusinessQuarterEnd</td>
      <td>Fechas trimestrales ancladas en el último día laborable de cada mes, para el año que termina en el mes indicado</td>
    </tr>
    <tr>
      <td>QS-JAN, QS-FEB, ...</td>
      <td>QuarterBegin</td>
      <td>Fechas trimestrales ancladas en el primer día calendario de cada mes, para el año que termina en el mes indicado</td>
    </tr>
    <tr>
      <td>BQS-JAN, BQS-FEB, ...</td>
      <td>BusinessQuarterBegin</td>
      <td>Fechas trimestrales ancladas en el primer día laborable de cada mes, para el año que termina en el mes indicado</td>
    </tr>
    <tr>
      <td>A-JAN, A-FEB, ...</td>
      <td>YearEnd</td>
      <td>Fechas anuales ancladas en el último día del calendario del mes determinado (ENE, FEB, MAR, ABR, MAY, JUN, JUL, AGO, SEP, OCT, NOV o DIC)</td>
    </tr>
    <tr>
      <td>BA-JAN, BA-FEB, ...</td>
      <td>BusinessYearEnd</td>
      <td>Fechas anuales ancladas en el último día laborable del mes determinado</td>
    </tr>
    <tr>
      <td>AS-JAN, AS-FEB, ...</td>
      <td>YearBegin</td>
      <td>Fechas anuales ancladas en el primer día del mes determinado</td>
    </tr>
    <tr>
      <td>BAS-JAN, BAS-FEB, ...</td>
      <td>BusinessYearBegin</td>
      <td>Fechas anuales ancladas en el primer día laborable del mes determinado</td>
    </tr>
  </tbody>
</table>


 # **<font color="DarkBlue">Frecuencias y desplazamientos de fecha</font>**

<p align="justify">
  En pandas, las frecuencias de tiempo son representadas por una frecuencia base y un multiplicador. La frecuencia base indica el intervalo de tiempo en el cual se realiza el desplazamiento, mientras que el multiplicador determina cuántas veces se aplica esa frecuencia base. Por ejemplo, un alias como "ME" representa una frecuencia mensual, mientras que "h" denota una frecuencia horaria.
  <br><br>
  Las frecuencias base suelen ser abreviaciones de cadenas que indican unidades de tiempo comunes, como "D" para días, "B" para días hábiles, "h" para horas, "T" para minutos, "S" para segundos, entre otros. Los multiplicadores permiten trabajar con múltiplos de esas frecuencias, como "2D" para cada dos días o "3H" para cada tres horas.
</p>


 ## **<font color="DarkBlue">Frecuencia Mensual</font>**

In [None]:
# Crear un rango de fechas con frecuencia mensual

rango_mensual = pd.date_range("2024-01-01", "2024-12-31", freq="ME")
rango_mensual

DatetimeIndex(['2024-01-31', '2024-02-29', '2024-03-31', '2024-04-30',
               '2024-05-31', '2024-06-30', '2024-07-31', '2024-08-31',
               '2024-09-30', '2024-10-31', '2024-11-30', '2024-12-31'],
              dtype='datetime64[ns]', freq='ME')

 ## **<font color="DarkBlue">Frecuencia Horaria</font>**

In [None]:
# Crear un rango de fechas con frecuencia horaria

rango_horario = pd.date_range("2024-01-01", "2024-01-02", freq="h")
rango_horario


DatetimeIndex(['2024-01-01 00:00:00', '2024-01-01 01:00:00',
               '2024-01-01 02:00:00', '2024-01-01 03:00:00',
               '2024-01-01 04:00:00', '2024-01-01 05:00:00',
               '2024-01-01 06:00:00', '2024-01-01 07:00:00',
               '2024-01-01 08:00:00', '2024-01-01 09:00:00',
               '2024-01-01 10:00:00', '2024-01-01 11:00:00',
               '2024-01-01 12:00:00', '2024-01-01 13:00:00',
               '2024-01-01 14:00:00', '2024-01-01 15:00:00',
               '2024-01-01 16:00:00', '2024-01-01 17:00:00',
               '2024-01-01 18:00:00', '2024-01-01 19:00:00',
               '2024-01-01 20:00:00', '2024-01-01 21:00:00',
               '2024-01-01 22:00:00', '2024-01-01 23:00:00',
               '2024-01-02 00:00:00'],
              dtype='datetime64[ns]', freq='h')

 ## **<font color="DarkBlue">Frecuencia de 2 días</font>**

In [None]:
# Crear un rango de fechas con frecuencia cada dos días

rango_dos_dias = pd.date_range("2024-01-01", "2024-01-10", freq="2D")
rango_dos_dias


DatetimeIndex(['2024-01-01', '2024-01-03', '2024-01-05', '2024-01-07',
               '2024-01-09'],
              dtype='datetime64[ns]', freq='2D')

 # **<font color="DarkBlue">Timpestamp</font>**

<p align="justify">
  En pandas, <code>Timestamp</code> es un objeto que representa un único punto en el tiempo, similar al <code>datetime</code> de Python pero con mayor funcionalidad para trabajar con datos en series temporales.
  <br><br>
  Es el equivalente a una fila en una columna temporal de un DataFrame o Series, y se utiliza como la unidad básica para manejar marcas de tiempo en pandas.
  <br><br>
  Los objetos <code>Timestamp</code> permiten realizar operaciones como comparación, aritmética de tiempo, conversión a diferentes formatos de cadenas, y más. Además, pueden ser creados directamente a partir de cadenas, objetos <code>datetime</code> de Python o enteros que representan segundos desde la época Unix.
  <br><br>
  Por ejemplo, se puede convertir una cadena en un objeto <code>Timestamp</code> utilizando la función <code>pd.Timestamp</code>. Este tipo de dato es fundamental para indexar, analizar y procesar series temporales, ya que permite gestionar eficientemente marcas de tiempo con granularidades que van desde microsegundos hasta años.
</p>


In [None]:
# Crear un objeto Timestamp desde una cadena

stamp = pd.Timestamp("2024-11-04 10:00")
stamp

Timestamp('2024-11-04 10:00:00')

In [None]:
# Realizar operaciones

stamp_1d = stamp + pd.Timedelta("1 day")
stamp_1d

Timestamp('2024-11-05 10:00:00')

 # **<font color="DarkBlue">Period</font>**

<p align="justify">
  En pandas, el objeto <code>Period</code> representa un intervalo de tiempo fijo, como un mes, un día o un trimestre, en lugar de un punto específico en el tiempo como lo hace <code>Timestamp</code>.
  <br><br>
  Es especialmente útil para trabajar con datos agrupados o agregados en intervalos temporales regulares.
  <br><br>
  Un objeto <code>Period</code> se define mediante un punto de referencia en el tiempo (como una fecha) y una frecuencia (como "M" para mensual o "Q" para trimestral). Los periodos pueden ser utilizados como índices en series temporales y son compatibles con operaciones aritméticas, como sumar o restar intervalos de tiempo.
  <br><br>
  Los <code>Period</code> permiten una representación precisa y eficiente de intervalos de tiempo y son comunes en aplicaciones como análisis financiero, donde es importante trabajar con datos agregados por trimestres o años.
</p>


In [None]:
# Crear un objeto Period para representar un año

periodo_anual = pd.Period("2024", freq="Y-DEC")
periodo_anual

Period('2024', 'Y-DEC')

In [None]:
periodo_anual - 4

Period('2020', 'Y-DEC')

In [None]:
# Crear un objeto Period para representar un mes

periodo_mensual = pd.Period("2024-11", freq="M")
periodo_mensual

Period('2024-11', 'M')

In [None]:
periodo_mensual + 4

Period('2025-03', 'M')

In [None]:
# Crear un objeto Period para representar un trimestre

periodo_trimestral = pd.Period("2024Q4", freq="Q")
periodo_trimestral

Period('2024Q4', 'Q-DEC')

In [None]:
periodo_trimestral - 2

Period('2024Q2', 'Q-DEC')

In [None]:
# Crear un rango de Periods

rango_periodos = pd.period_range("2024-01", "2024-12", freq="M")
rango_periodos

PeriodIndex(['2024-01', '2024-02', '2024-03', '2024-04', '2024-05', '2024-06',
             '2024-07', '2024-08', '2024-09', '2024-10', '2024-11', '2024-12'],
            dtype='period[M]')

<br>
<br>
<p align="center"><b>
💗
<font color="DarkBlue">
Hemos llegado al final de nuestro colab de Pandas, a seguir codeando...
</font>
</p>