# Trabajando con datetime en Pandas DataFrame

In [None]:
# Importamos las librerías necesarias para trabajar con DataFrames y arrays
import pandas as pd
import numpy as np

### 1. Fechas y Horas en Python
Los objetos básicos de Python para trabajar con fechas y horas residen en el módulo incorporado ``datetime``.
Junto con el módulo de terceros ``dateutil``, puedes usarlo para realizar rápidamente una gran cantidad de funcionalidades útiles sobre fechas y horas.
Por ejemplo, puedes construir manualmente una fecha usando el tipo ``datetime``:

In [None]:
# Creamos un objeto datetime especificando año, mes y día
from datetime import datetime
datetime(year = 2015, month = 7, day = 4)

O, usando el módulo ``dateutil``, puedes analizar fechas desde una variedad de formatos de cadena de texto:

In [None]:
# https://dateutil.readthedocs.io/en/stable/parser.html#functions
# Parseamos fechas desde diferentes formatos de texto
from dateutil import parser
print(parser.parse("4th of July, 2015"))  # Formato en inglés natural
print(parser.parse("07/04/2015"))  # Formato MM/DD/YYYY (por defecto americano)
print(parser.parse("07/04/2015", dayfirst=True))  # Formato DD/MM/YYYY (europeo)

In [None]:
# Más ejemplos de parseo de fechas en diferentes formatos
print(parser.parse("7/4/2015"))  # Formato M/D/YYYY
print(parser.parse("07-04-2015"))  # Formato MM-DD-YYYY
print(parser.parse("2015-07-04"))  # Formato ISO 8601 (YYYY-MM-DD)

Una vez que tienes un objeto ``datetime``, puedes hacer cosas como imprimir el día de la semana:

In [None]:
# https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior
# Usamos strftime con el código %A para obtener el nombre completo del día de la semana
datetime(year = 2025, month = 4, day = 2).strftime('%A')

### 2. Fechas y Horas en numpy

In [None]:
# Creamos un array numpy con tipo datetime64
# El formato debe ser YYYY-MM-DD para que numpy lo reconozca correctamente
import numpy as np
date = np.array('2015-07-04', dtype = np.datetime64)
date

In [None]:
# Este formato (MM-DD-YYYY) no es reconocido por numpy datetime64 y genera un error
# numpy requiere el formato ISO 8601 (YYYY-MM-DD)
#np.array('07-04-2015', dtype = np.datetime64)

Una vez que tenemos esta fecha formateada, sin embargo, podemos realizar rápidamente operaciones vectorizadas sobre ella:

In [None]:
# Mostramos la fecha creada anteriormente
date

In [None]:
# Creamos un array de números del 0 al 13
np.arange(14)

In [None]:
# Sumamos días a una fecha de forma vectorizada
# Esto crea un array de 12 fechas consecutivas empezando desde '2015-07-04'
dates = date + np.arange(12)
dates

In [None]:
# Accedemos al primer elemento del array de fechas
dates[0]

Aquí hay un datetime basado en minutos:

In [None]:
# Creamos un datetime con precisión de segundos
# numpy automáticamente detecta la unidad basándose en el formato proporcionado
np.datetime64('2015-07-04 12:00:30')

Nota que la zona horaria se establece automáticamente según la hora local del ordenador que ejecuta el código.
Puedes forzar cualquier unidad fundamental deseada usando uno de los muchos códigos de formato; por ejemplo, aquí forzaremos un tiempo basado en nanosegundos.

La siguiente tabla, extraída de la [documentación de NumPy datetime64](http://docs.scipy.org/doc/numpy/reference/arrays.datetime.html), lista los códigos de formato disponibles junto con los intervalos de tiempo relativos y absolutos que pueden codificar:

|Código  | Significado     | Intervalo temporal (relativo) | Intervalo temporal (absoluto)   |
|--------|-----------------|-------------------------------|----------------------------------|
| ``Y``  | Año             | ± 9.2e18 años                 | [9.2e18 AC, 9.2e18 DC]          |
| ``M``  | Mes             | ± 7.6e17 años                 | [7.6e17 AC, 7.6e17 DC]          |
| ``W``  | Semana          | ± 1.7e17 años                 | [1.7e17 AC, 1.7e17 DC]          |
| ``D``  | Día             | ± 2.5e16 años                 | [2.5e16 AC, 2.5e16 DC]          |
| ``h``  | Hora            | ± 1.0e15 años                 | [1.0e15 AC, 1.0e15 DC]          |
| ``m``  | Minuto          | ± 1.7e13 años                 | [1.7e13 AC, 1.7e13 DC]          |
| ``s``  | Segundo         | ± 2.9e12 años                 | [ 2.9e9 AC, 2.9e9 DC]           |
| ``ms`` | Milisegundo     | ± 2.9e9 años                  | [ 2.9e6 AC, 2.9e6 DC]           |
| ``us`` | Microsegundo    | ± 2.9e6 años                  | [290301 AC, 294241 DC]          |
| ``ns`` | Nanosegundo     | ± 292 años                    | [ 1678 DC, 2262 DC]             |
| ``ps`` | Picosegundo     | ± 106 días                    | [ 1969 DC, 1970 DC]             |
| ``fs`` | Femtosegundo    | ± 2.6 horas                   | [ 1969 DC, 1970 DC]             |
| ``as`` | Attosegundo     | ± 9.2 segundos                | [ 1969 DC, 1970 DC]             |

### 3. Fechas y Horas en Pandas

#### Argumentos por defecto

In [None]:
# Importamos pandas para trabajar con DataFrames
import pandas as pd

In [None]:
# Creamos un DataFrame con fechas en formato texto
# Por defecto, pandas las trata como objetos (strings), no como fechas
df = pd.DataFrame({'date': ['3/10/2000', '3/11/2000', '3/12/2000'],
                   'value': [2, 3, 4]})
df

In [None]:
# Verificamos los tipos de datos de cada columna
# La columna 'date' es de tipo 'object' (texto), no datetime
df.dtypes

In [None]:
# Convertimos la columna 'date' de texto a tipo datetime
# Por defecto, dayfirst=False, por lo que interpreta el formato como MM/DD/YYYY (americano)
df['date'] = pd.to_datetime(df['date']) # dayfirst = False
df

In [None]:
# Ahora verificamos que la columna 'date' es de tipo datetime64[ns]
df.dtypes

#### Formato día primero

In [None]:
# Creamos el mismo DataFrame pero ahora usamos dayfirst=True
# Esto interpreta las fechas en formato DD/MM/YYYY (europeo)
df = pd.DataFrame({'date': ['3/10/2000', '3/11/2000', '3/12/2000'],
                   'value': [2, 3, 4]})

df['date'] = pd.to_datetime(df['date'], dayfirst=True)
df

#### Formato personalizado

In [None]:
# Usamos el parámetro 'format' para especificar exactamente el formato de entrada
# Esto es útil cuando tienes formatos complejos o para mejorar el rendimiento
df = pd.DataFrame({'date': ['2016-6-10 20:30:0', 
                            '2016-7-1 19:45:30', 
                            '2013-10-12 4:5:1'],
                   'value': [2, 3, 4]})

df['date'] = pd.to_datetime(df['date'], format="%Y-%m-%d %H:%M:%S")
df

#### Manejar errores de parseo

In [None]:
# Este código genera un error porque 'a/11/2000' no es una fecha válida
# Por defecto, pandas lanza una excepción cuando encuentra un valor que no puede parsear
df = pd.DataFrame({'date': ['3/10/2000', 'a/11/2000', '3/12/2000'],
                   'value': [2, 3, 4]})

df['date'] = pd.to_datetime(df['date'])

In [None]:
# Con errors='ignore', pandas deja la columna sin modificar si encuentra errores
# La columna sigue siendo de tipo 'object' en lugar de datetime
df = pd.DataFrame({'date': ['3/10/2000', 'a/11/2000', '3/12/2000'],
                   'value': [2, 3, 4]})

df['date'] = pd.to_datetime(df['date'], errors = 'ignore')
df.dtypes

In [None]:
# Con errors='coerce', pandas convierte valores inválidos en NaT (Not a Time)
# Esto permite convertir la columna a datetime manteniendo las filas con errores como valores nulos
df = pd.DataFrame({'date': ['3/10/2000', 'a/11/2000', '3/12/2000'],
                   'value': [2, 3, 4]})

df['date'] = pd.to_datetime(df['date'], errors = 'coerce')
df

In [None]:
# Filtramos las filas donde la fecha es nula (NaT)
# Esto nos permite identificar qué registros tuvieron errores de parseo
df[df['date'].isnull()]

In [None]:
# Verificamos que ahora la columna 'date' es de tipo datetime64[ns]
# A pesar de tener un valor NaT, el tipo de la columna es datetime
df.dtypes

In [None]:
# Mostramos el valor de fechas válidas e inválidas
# NaT (Not a Time) es el equivalente de NaN para fechas
print(df.at[0, 'date'])
print(df.at[1, 'date'])

### 4. Ensamblar un datetime desde múltiples columnas

In [None]:
# Creamos un DataFrame con columnas separadas para año, mes y día
df = pd.DataFrame({'year': [2015, 2016],
                   'month': [2, 3],
                   'day': [4, 5]})

df

In [None]:
# Verificamos que todas las columnas son de tipo entero
df.dtypes

In [None]:
# pd.to_datetime puede combinar automáticamente columnas 'year', 'month' y 'day'
# en una sola columna datetime
df['date'] = pd.to_datetime(df)

In [None]:
# Mostramos el DataFrame con la nueva columna 'date' creada
df

In [None]:
# Verificamos que la nueva columna 'date' es de tipo datetime64[ns]
df.dtypes

### 5. Obtener año, mes y día

In [None]:
# Creamos un DataFrame con nombres y fechas de nacimiento
df = pd.DataFrame({'name': ['Tom', 'Andy', 'Lucas'],
                 'DoB': ['08-05-1997', '04-28-1996', '12-16-1995']})

# Convertimos las fechas de nacimiento a formato datetime
df['DoB'] = pd.to_datetime(df['DoB'])
df

In [None]:
# Extraemos componentes individuales de la fecha usando el accessor .dt
# .dt.year extrae el año, .dt.month el mes, y .dt.day el día
df['year'] = df['DoB'].dt.year
df['month'] = df['DoB'].dt.month
df['day'] = df['DoB'].dt.day
df

In [None]:
# Verificamos los tipos de datos de las columnas
# Las columnas year, month y day son enteros (int64)
df.dtypes

### 6. Obtener la semana del año, el día de la semana y año bisiesto

In [None]:
# Extraemos información adicional sobre las fechas
# .isocalendar().week obtiene el número de semana del año según ISO 8601
# .dayofweek devuelve el día de la semana (0=Lunes, 6=Domingo)
# .is_leap_year indica si el año es bisiesto
df['week_of_year'] = df['DoB'].dt.isocalendar().week
df['day_of_week'] = df['DoB'].dt.dayofweek
df['is_leap_year'] = df['DoB'].dt.is_leap_year
df

In [None]:
# Creamos un diccionario para mapear números de día a nombres en español
# Usamos .map() para convertir los números del día de la semana en nombres legibles
dw_mapping={
    0: 'Monday', 
    1: 'Tuesday', 
    2: 'Wednesday', 
    3: 'Thursday', 
    4: 'Friday',
    5: 'Saturday', 
    6: 'Sunday'
} 
df['day_of_week_name']=df['DoB'].dt.weekday.map(dw_mapping)
df

### 7. Obtener la edad a partir de la fecha de nacimiento

In [None]:
# Obtenemos la fecha y hora actual usando pd.to_datetime('today')
pd.to_datetime('today')

In [None]:
# Alternativa usando datetime.today() del módulo datetime
datetime.today()

In [None]:
# Celda vacía (puede usarse para notas o código adicional)

In [None]:
# Calculamos la edad restando la fecha de nacimiento de la fecha actual
# Convertimos el resultado a días con .dt.days y dividimos por 365.25 para obtener años
# (365.25 tiene en cuenta los años bisiestos)
today = pd.to_datetime('today')
df['age'] = (today - df['DoB']).dt.days//365.25

df

### 8. Mejorar el rendimiento estableciendo la columna de fecha como índice

In [None]:
# Leemos un archivo CSV y parseamos la columna 'date' directamente como datetime
# Esto es más eficiente que leer y luego convertir
df = pd.read_csv('data/city_sales.csv', parse_dates = ['date'])
df

In [None]:

import pandas as pd
print(pd.__version__)

In [None]:
# Mostramos estadísticas descriptivas de todas las columnas
# datetime_is_numeric=True trata las fechas como números para calcular estadísticas


#df.describe(include='all', datetime_is_numeric=True) --asi se deberia escribir pero da errores
#manera alternativa: 

try:
    display(df.describe(include='all', datetime_is_numeric=True))
except TypeError:
    display(df.describe(include='all'))

In [None]:
# Verificamos que hay 4 ciudades con 448786 registros cada una
# 4 * 448786 = 1795144 (total de filas)
4*448786

In [None]:
# Verificamos que 'date' es de tipo datetime64[ns]
df.dtypes

In [None]:
# Leemos el CSV y establecemos 'date' como índice en dos pasos
# Primero parseamos la fecha, luego la establecemos como índice con set_index
df = pd.read_csv('data/city_sales.csv', parse_dates = ['date'])
df.set_index(['date'], inplace=True)
df.head()

In [None]:
# Forma más eficiente: usamos index_col='date' para establecer el índice al leer
# Esto es más rápido y consume menos memoria que hacerlo en dos pasos
df = pd.read_csv('data/city_sales.csv', parse_dates = ['date'], index_col = 'date')
df.head()

In [None]:
# Verificamos que ahora tenemos un DateTimeIndex
# Esto nos permite usar funcionalidades avanzadas de selección por fechas
df.index

In [None]:
# Creamos un DatetimeIndex desde diferentes formatos de entrada
# pandas es muy flexible y puede interpretar varios formatos
from datetime import datetime
dates = pd.to_datetime([datetime(2015, 7, 3), '4th of July, 2015',
                       '2015-Jul-6', '07-07-2015', '20150708'])
dates

### 9. Seleccionar datos con un año específico y realizar agregaciones

In [None]:
# Con un DateTimeIndex, podemos seleccionar datos por año usando solo el año
# Esto devuelve todos los registros del año 2018
df.loc['2018']

In [None]:
# Podemos combinar la selección por año con la selección de columna específica
# Esto devuelve solo la columna 'num' para el año 2018
df.loc['2018', 'num'].head()

In [None]:
# Seleccionamos datos de 2018, agrupamos por ciudad y sumamos
# Esto nos muestra el total de ventas por ciudad en 2018
df.loc['2018'].groupby('city').sum()

### 10. Seleccionar datos con un mes específico o un día específico del mes

In [None]:
# Seleccionamos todos los datos de mayo de 2018 usando el formato 'YYYY-M'
df.loc['2018-5'].head()

In [None]:
# Seleccionamos datos de un día específico: 1 de mayo de 2018
df.loc['2018-5-1'].head()

In [None]:
# Forma alternativa: filtramos usando una condición booleana
# Seleccionamos todas las filas donde el mes es febrero (cualquier año)
cond = df.index.month == 2
df[cond].head()

### 11. Seleccionar datos entre dos fechas (obsoleto)

In [None]:
# Seleccionamos datos entre dos años usando slicing
# ADVERTENCIA: Este método genera un FutureWarning y puede ser obsoleto en futuras versiones
df.loc['2016':'2018']

In [None]:
# between_time selecciona todas las filas dentro de un rango horario específico
# Esto selecciona todos los registros entre 10:30 y 10:45 de TODOS los días
df.between_time('10:30','10:45')

In [None]:
# Verificamos las dimensiones del DataFrame completo
# 1795144 filas y 2 columnas
df.shape

### 12. Operaciones con fechas

In [None]:
# Recreamos el DataFrame con fechas de nacimiento
df = pd.DataFrame({'name': ['Tom', 'Andy', 'Lucas'],
                 'DoB': ['08-05-1997', '04-28-1996', '12-16-1995']})

df['DoB'] = pd.to_datetime(df['DoB'])
df

In [None]:
# Usamos DateOffset para sumar o restar períodos de tiempo a las fechas
# DateOffset permite operaciones con días, meses, años, etc.
from pandas.tseries.offsets import DateOffset, BDay

print(df['DoB'] + DateOffset(days = 5))  # Suma 5 días
print(df['DoB'] + DateOffset(days = -5))  # Resta 5 días
print(df['DoB'] + DateOffset(months = 5))  # Suma 5 meses

In [None]:
# BDay representa "Business Days" (días laborables)
# Esto crea un objeto que representa 10 días laborables
BDay(10)

In [None]:
# Sumamos 10 días laborables a las fechas de nacimiento
# Nota: BDay excluye sábados y domingos automáticamente
print(df['DoB'])
print(df['DoB'] + BDay(10))

In [None]:
# Creamos una nueva columna con la fecha de nacimiento + 10 días laborables
df['DoB+10BD'] = df['DoB'] + BDay(10)
df

In [None]:
# Calculamos la diferencia en días calendario entre las dos fechas
# Nota: aunque sumamos 10 días laborables, la diferencia en días calendario puede variar
# dependiendo de cuántos fines de semana caen en ese período
df['date_diff'] = (df['DoB+10BD'] - df['DoB']).dt.days
df

In [None]:
# Verificamos los tipos de datos del DataFrame
# date_diff es int64 porque representa días como número entero
df.dtypes

### 13. Secuencias regulares: ``pd.date_range()``

Para hacer más conveniente la creación de secuencias de **fechas regulares**, Pandas ofrece algunas funciones para este propósito: ``pd.date_range()`` para timestamps, ``pd.period_range()`` para períodos, y ``pd.timedelta_range()`` para deltas de tiempo.
Hemos visto que **``range()`` de Python y ``np.arange()`` de NumPy** convierten un punto de inicio, punto final y un tamaño de paso opcional en una secuencia.
De manera similar, ``pd.date_range()`` acepta una fecha de inicio, una fecha final y un código de frecuencia opcional para crear una secuencia regular de fechas.
Por defecto, la frecuencia es un día:

In [None]:
# Creamos un rango de fechas desde el 3 al 10 de julio de 2015
# Por defecto, la frecuencia es diaria (freq='D')
pd.date_range('2015-07-03', '2015-07-10')

Alternativamente, el rango de fechas puede especificarse no con una fecha de inicio y final, sino con una fecha de inicio y un número de períodos:

In [None]:
# Creamos 8 fechas consecutivas empezando desde el 3 de julio de 2015
# Esto es equivalente al ejemplo anterior
pd.date_range('2015-07-03', periods = 8)

El espaciado puede modificarse alterando el argumento ``freq``, que por defecto es ``D``.
Por ejemplo, aquí construiremos un rango de timestamps con frecuencia mensual (inicio de mes):

In [None]:
# Creamos 12 fechas con frecuencia mensual (MS = Month Start)
# Esto genera el primer día de cada mes en 2015
pd.date_range('2015-01-01', periods = 12, freq='MS')

### 14. Manejar valores faltantes

In [None]:
# Leemos el archivo de ventas por ciudad con fecha como índice
df = pd.read_csv('data/city_sales.csv', parse_dates=['date'], index_col='date')
df

In [None]:
# Creamos una ventana rodante (rolling window) de 3 períodos y calculamos la media
# Las primeras 2 filas serán NaN porque no hay suficientes valores previos
df['rolling_sum'] = df['num'].rolling(3).mean()
df.head()

In [None]:
# Rellenamos los valores NaN usando backfill (relleno hacia atrás)
# Los valores NaN se rellenan con el siguiente valor válido
df['rolling_sum_back'] = df['rolling_sum'].fillna(method = 'backfill')
df.head()

In [None]:
# Creamos un DataFrame con valores faltantes (None y NaN)
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
                   "B":[None, 2, 54, 3, None],
                   "C":[20, 16, None, 3, 8],
                   "D":[14, 3, None, None, 6]})
  
# Mostramos el DataFrame
df

In [None]:
# Interpolamos los valores faltantes usando interpolación lineal
# Esto estima los valores faltantes basándose en los valores adyacentes
df.interpolate(method = 'linear')

### 15. Remuestreo, Ventanas y Desplazamiento

In [None]:
# Leemos datos históricos de acciones de Google
# Parseamos la columna 'Date' y la establecemos como índice
goog = pd.read_csv('data/GOOG.csv')
goog['Date'] =  pd.to_datetime(goog['Date'])
goog.set_index('Date', inplace=True)
goog


In [None]:
# Mostramos las primeras 10 filas del DataFrame de Google
goog.head(10)

In [None]:
# Mostramos información general del DataFrame
# Vemos que hay 2518 registros con 6 columnas numéricas
goog.info()

In [None]:
# Rellenamos valores faltantes usando forward fill (relleno hacia adelante)
# Esto propaga el último valor válido hacia adelante
goog = goog.fillna(method='ffill')
goog

In [None]:

# Graficamos el precio de cierre de Google a lo largo del tiempo
goog['Close'].plot();

In [None]:
# Remuestreamos los datos a frecuencia anual de negocios (BA = Business Year) y calculamos la media
# Esto nos da el precio promedio por año (considerando solo días laborables)
goog.resample('BA').mean()

In [None]:
# asfreq devuelve el valor en las fechas especificadas sin agregar
# Esto es diferente a resample que agrega (promedia, suma, etc.)
goog.asfreq('BA')

In [None]:
# Mostramos el valor específico del 31 de diciembre de 2012
goog.loc['2012-12-31']

In [None]:
# Comparamos visualmente tres métodos de trabajar con series temporales:
# - input: datos originales (semi-transparente)
# - resample: promedio anual (línea punteada)
# - asfreq: valor específico al final de cada año (línea discontinua)
import matplotlib.pyplot as plt
plt.figure(figsize=(10,10))
goog['Close'].plot(alpha=0.5, style='-')
goog['Close'].resample('BA').mean().plot(style=':')
goog['Close'].asfreq('BA').plot(style='--');

plt.legend(['input', 'resample', 'asfreq'],
           loc='upper left');

In [None]:
# Mostramos nuevamente el resultado de asfreq para el año de negocios
goog.asfreq('BA')

| Código | Descripción             | Código | Descripción                      |
|--------|-------------------------|--------|----------------------------------|
| ``D``  | Día de calendario       | ``B``  | Día laborable                    |
| ``W``  | Semanal                 |        |                                  |
| ``M``  | Fin de mes              | ``BM`` | Fin de mes laborable             |
| ``Q``  | Fin de trimestre        | ``BQ`` | Fin de trimestre laborable       |
| ``A``  | Fin de año              | ``BA`` | Fin de año laborable             |
| ``H``  | Horas                   | ``BH`` | Horas laborables                 |
| ``T``  | Minutos                 |        |                                  |
| ``S``  | Segundos                |        |                                  |
| ``L``  | Milisegundos            |        |                                  |
| ``U``  | Microsegundos           |        |                                  |
| ``N``  | Nanosegundos            |        |                                  |

In [None]:
# Extraemos solo la columna 'Close' para simplificar los análisis siguientes
goog = goog['Close']

In [None]:
# Creamos un DataFrame para analizar cambios semanales
# shift(7) desplaza los datos 7 días hacia adelante
# Calculamos la diferencia y el porcentaje de crecimiento semanal
pd.DataFrame({'Data': goog,
             'Data-7': goog.shift(7),
             'Diff': goog - goog.shift(7),
             '%Crec': round(((goog - goog.shift(7))/goog)*100,2)})

In [None]:
# Calculamos y graficamos el ROI (Return on Investment) anual
# shift(261) desplaza aproximadamente un año (261 días laborables)
# El ROI muestra el porcentaje de retorno comparado con hace un año
ROI = 100 * (goog - goog.shift(261)) / goog.shift(261)
ROI.plot()
plt.ylabel('% Return on Investment');

### 16. Ventana rodante (Rolling window)

In [None]:
# Creamos un objeto de ventana rodante de 261 días (aproximadamente un año de trading)
# center=True centra la ventana en lugar de alinearla al final
rolling = goog.rolling(261, center=True) # 365 - fines de semana (aprox(52*2))

In [None]:
# Graficamos los datos originales junto con la media y desviación estándar rodantes
# La media rodante suaviza las fluctuaciones y muestra la tendencia
# La desviación estándar rodante muestra la volatilidad a lo largo del tiempo
rolling = goog.rolling(261, center=True)

data = pd.DataFrame({'input': goog,
                     'one-year rolling_mean': rolling.mean(),
                     'one-year rolling_std': rolling.std()})

ax = data.plot(style=['-', '--', ':'])
ax.lines[0].set_alpha(0.3)

In [None]:
# Verificamos cuántos días han pasado desde el inicio de los datos
# Esto nos ayuda a entender el contexto para calcular medias rodantes
today = datetime(year=2010, month=1, day=8)
min_date = goog.index.min()
print(today)
print(min_date)
print((today- min_date).days)

In [None]:
# Calculamos la media rodante de 4 días para una fecha específica
# Esto promedia los valores de los 4 días previos (incluyendo el día actual)
goog.rolling(4).mean().loc[today]

In [None]:
# Contamos cuántos días de trading tenemos en el dataset
# 2518 días de trading (excluyendo fines de semana y festivos)
len(goog.index)

In [None]:
# Contamos cuántos días de calendario hay entre la primera y última fecha
# 3652 días de calendario (incluyendo todos los días)
len(pd.date_range(goog.index.min(), goog.index.max()))

In [None]:
# Calculamos cuántos años de datos tenemos
# Aproximadamente 10 años
(goog.index.max() - goog.index.min()).days/365

In [None]:
# Estimamos cuántos fines de semana hay en 10 años
# 10 años * 52 semanas/año * 2 días/fin de semana = 1040 días
10*52*2

In [None]:
# Calculamos la diferencia entre días de calendario y días de trading
# 3652 - 2518 = 1134 días no laborables (fines de semana + festivos)
3652 - 2518