<a href="https://colab.research.google.com/github/Kevin2558/Data_Science/blob/main/02_Preprocesamiento/Datos_Temporales.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Preprocesamiento Datos temporales**

Extraer información útil desde una variable de tipo fecha/hora, como:

- Día del mes
- Mes
- Año
- Día de la semana
- ¿Es fin de semana?
- ¿Es feriado? (opcional)
- Hora del día (si tiene timestamp)

In [1]:
import pandas as pd

# Crear un DataFrame con fechas
data = {
    'fecha': pd.date_range(start='2023-01-01', periods=10, freq='D'),
    'ventas': [100, 120, 90, 95, 110, 130, 80, 140, 150, 160]
}
df = pd.DataFrame(data)

# Asegurar que sea datetime
df['fecha'] = pd.to_datetime(df['fecha'])

# Crear nuevas variables temporales
df['año'] = df['fecha'].dt.year
df['mes'] = df['fecha'].dt.month
df['día'] = df['fecha'].dt.day
df['día_semana'] = df['fecha'].dt.dayofweek  # Lunes=0, Domingo=6
df['es_fin_semana'] = df['día_semana'].isin([5, 6]).astype(int)

print(df)

       fecha  ventas   año  mes  día  día_semana  es_fin_semana
0 2023-01-01     100  2023    1    1           6              1
1 2023-01-02     120  2023    1    2           0              0
2 2023-01-03      90  2023    1    3           1              0
3 2023-01-04      95  2023    1    4           2              0
4 2023-01-05     110  2023    1    5           3              0
5 2023-01-06     130  2023    1    6           4              0
6 2023-01-07      80  2023    1    7           5              1
7 2023-01-08     140  2023    1    8           6              1
8 2023-01-09     150  2023    1    9           0              0
9 2023-01-10     160  2023    1   10           1              0


**¿Y si quiero saber si es feriado en Chile?**

Puedes usar la librería holidays:

In [2]:
!pip install holidays



In [3]:
import holidays

# Feriados en Chile
cl_holidays = holidays.Chile()

# Columna booleana si es feriado
df['es_feriado'] = df['fecha'].isin(cl_holidays).astype(int)

print(df[['fecha', 'es_feriado']])

       fecha  es_feriado
0 2023-01-01           0
1 2023-01-02           0
2 2023-01-03           0
3 2023-01-04           0
4 2023-01-05           0
5 2023-01-06           0
6 2023-01-07           0
7 2023-01-08           0
8 2023-01-09           0
9 2023-01-10           0


**¿Y si tuviera horas?**

Si tuvieras timestamps (e.g., 2023-01-01 13:45:00), podrías extraer:

In [17]:
# h horas, t minutos, s segundos
fechas = pd.date_range(start='2023-01-01 08:00:00', periods=10, freq='4h23t5s')
ventas = [100, 130, 90, 110, 150, 120, 80, 170, 160, 140]

df = pd.DataFrame({
    'fecha_hora': fechas,
    'ventas': ventas
})

print(df)

           fecha_hora  ventas
0 2023-01-01 08:00:00     100
1 2023-01-01 12:23:05     130
2 2023-01-01 16:46:10      90
3 2023-01-01 21:09:15     110
4 2023-01-02 01:32:20     150
5 2023-01-02 05:55:25     120
6 2023-01-02 10:18:30      80
7 2023-01-02 14:41:35     170
8 2023-01-02 19:04:40     160
9 2023-01-02 23:27:45     140


  fechas = pd.date_range(start='2023-01-01 08:00:00', periods=10, freq='4h23t5s')


In [18]:
df['año'] = df['fecha_hora'].dt.year
df['mes'] = df['fecha_hora'].dt.month
df['día'] = df['fecha_hora'].dt.day
df['día_semana'] = df['fecha_hora'].dt.dayofweek  # Lunes=0, Domingo=6
df['es_fin_semana'] = df['día_semana'].isin([5, 6]).astype(int)
df['hora'] = df['fecha_hora'].dt.hour
df['minuto'] = df['fecha_hora'].dt.minute
df['franja_horaria'] = pd.cut(df['hora'], bins=[0,6,12,18,24],
                               labels=['madrugada', 'mañana', 'tarde', 'noche'],
                               right=False)
print(df)

           fecha_hora  ventas   año  mes  día  día_semana  es_fin_semana  \
0 2023-01-01 08:00:00     100  2023    1    1           6              1   
1 2023-01-01 12:23:05     130  2023    1    1           6              1   
2 2023-01-01 16:46:10      90  2023    1    1           6              1   
3 2023-01-01 21:09:15     110  2023    1    1           6              1   
4 2023-01-02 01:32:20     150  2023    1    2           0              0   
5 2023-01-02 05:55:25     120  2023    1    2           0              0   
6 2023-01-02 10:18:30      80  2023    1    2           0              0   
7 2023-01-02 14:41:35     170  2023    1    2           0              0   
8 2023-01-02 19:04:40     160  2023    1    2           0              0   
9 2023-01-02 23:27:45     140  2023    1    2           0              0   

   hora  minuto franja_horaria  
0     8       0         mañana  
1    12      23          tarde  
2    16      46          tarde  
3    21       9          noche 