<a href="https://colab.research.google.com/github/ledyquesada/Ejercicios/blob/main/Semana5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Continuando con manipulación avanzada de datos con Python**
# Trabajo con fechas y series temporales

**Datetime**

In [None]:
from datetime import datetime

# Obtener la fecha y hora actual
fecha_actual = datetime.now()

# Crear una fecha específica
fecha_personalizada = datetime(2022, 10, 1, 12, 30, 0)


**Timestamp- DatetimeIndex**

In [None]:
import pandas as pd

# Crear una serie temporal con fechas
fechas = pd.date_range(start='2022-01-01', end='2022-01-10', freq='D')

# Crear una serie temporal con índice de fechas
datos = [10, 20, 15, 25, 30, 22, 18, 27, 29, 35]
serie_temporal = pd.Series(datos, index=fechas)

# Acceder a datos utilizando fechas
dato_1 = serie_temporal['2022-01-05']
rango_fechas = serie_temporal['2022-01-03':'2022-01-08']

# Resampling y frecuencias temporales
resample_semanal = serie_temporal.resample('W').mean()

# Operaciones con fechas
dias_transcurridos = serie_temporal.index.max() - serie_temporal.index.min()


**Zonas horarias**

In [None]:
import pandas as pd
from datetime import datetime
import pytz

# Crear una serie temporal con zona horaria
fechas = pd.date_range(start='2022-01-01', end='2022-01-10', freq='D', tz='UTC')
serie_temporal = pd.Series(range(len(fechas)), index=fechas)

# Convertir a otra zona horaria
serie_temporal_nueva_zona = serie_temporal.tz_convert('America/New_York')


**Periodos y duraciones**

In [None]:
# Crear un rango de periodos mensuales
periodos_mensuales = pd.period_range(start='2022-01', end='2022-12', freq='M')

# Operaciones con periodos
periodo_actualizado = periodos_mensuales + 1

# Crear una duración de tiempo
duracion = pd.Timedelta(days=5, hours=3)

#FILTRADO Y SUBCONJUNTOS BASADOS EN FECHAS

# Filtrar datos para un mes específico
datos_mes = serie_temporal['2022-03']

# Filtrar datos para un rango de fechas
datos_rango = serie_temporal['2022-02-15':'2022-03-15']

#COMPARACION DE PERIODOS

# Comparar si las fechas están en el mismo año
mismo_anio = serie_temporal.index.to_period('Y') == pd.Period('2022', freq='Y')

#MANEJO DE DIAS HÁBILES
# Crear un rango de fechas hábiles
fechas_habiles = pd.date_range(start='2022-01-01', end='2022-01-10', freq='B')




**Resampling**

In [None]:
# Resamplear datos a frecuencia mensual
datos_mensuales = serie_temporal.resample('M').sum()

# Calcular la media móvil con una ventana de 3 días
media_movil = serie_temporal.rolling(window=3).mean()


# Frecuencias Temporales

In [None]:
import pandas as pd

# Crear un rango de fechas diarias
fechas_diarias = pd.date_range(start='2022-01-01', end='2022-01-10', freq='D')


# Crear un rango de fechas mensuales
fechas_mensuales = pd.date_range(start='2022-01-01', end='2022-12-31', freq='M')


# Crear un rango de fechas con frecuencia de 4 horas
fechas_cada_4_horas = pd.date_range(start='2022-01-01', end='2022-01-10', freq='4H')


# Crear un rango de fechas cada 2 semanas
fechas_cada_2_semanas = pd.date_range(start='2022-01-01', end='2022-12-31', freq='2W')


# Desplazar las fechas 3 días hacia adelante
fechas_desplazadas = fechas_diarias + pd.DateOffset(days=3)

# Crear un rango de fechas con frecuencia mensual, pero solo los primeros lunes de cada mes
fechas_primeros_lunes = pd.date_range(start='2022-01-01', end='2022-12-31', freq='WOM-1MON')


# Crear un rango de fechas con frecuencia personalizada
fechas_irregulares = pd.date_range(start='2022-01-01', end='2022-01-10', freq=['2D', '3D', '5D'])



# COMBINACIÓN Y FUSIÓN DE CONJUNTOS DE DATOS

In [None]:
# Concatenar a lo largo de las filas (por defecto)
df_concat_filas = pd.concat([df1, df2])

# Concatenar a lo largo de las columnas
df_concat_columnas = pd.concat([df1, df2], axis=1)


# Merging basado en la columna 'Key'
df_merge = pd.merge(df3, df4, on='Key')


# Merging externo con sufijos
df_merge_outer = pd.merge(df3, df4, on='Key', how='outer', suffixes=('_df3', '_df4'))


# Joining basado en los índices
df_join = df5.join(df6)


# Fusionar DataFrames basándose en múltiples columnas
df_merge_multi = pd.merge(df3, df4, on=['Key'], how='inner')

# Unir DataFrames basándose en múltiples índices
df_join_multi = df5.join(df6, how='inner')


# Merging interno (por defecto)
df_merge_inner = pd.merge(df3, df4, on='Key', how='inner')

# Merging externo (incluye todos los registros)
df_merge_outer = pd.merge(df3, df4, on='Key', how='outer')


serie1 = pd.Series(['S0', 'S1', 'S2'], name='Serie1')
serie2 = pd.Series(['S3', 'S4', 'S5'], name='Serie2')

# Concatenar Series a lo largo de las filas
serie_concat_filas = pd.concat([serie1, serie2], axis=1)


# Ejemplo práctico
Supongamos que tenemos datos de ventas diarias de dos productos diferentes en dos ubicaciones diferentes. Queremos analizar y combinar estos conjuntos de datos para obtener una visión más completa.

In [None]:
import numpy as np
import pandas as pd

# Crear datos de ventas diarias para dos productos en dos ubicaciones
fechas = pd.date_range(start='2022-01-01', end='2022-01-10', freq='D')
ubicacion1_ventas = np.random.randint(50, 100, size=len(fechas))
ubicacion2_ventas = np.random.randint(30, 80, size=len(fechas))

# Crear DataFrames para cada ubicación
df_ubicacion1 = pd.DataFrame({'Fecha': fechas, 'Producto_A': ubicacion1_ventas})
df_ubicacion2 = pd.DataFrame({'Fecha': fechas, 'Producto_B': ubicacion2_ventas})

# Manipulación avanzada de datos con Pandas
# Calcular la venta total diaria y agregar una columna de día de la semana
df_ubicacion1['Venta_Total'] = df_ubicacion1['Producto_A']
df_ubicacion2['Venta_Total'] = df_ubicacion2['Producto_B']
df_ubicacion1['Dia_Semana'] = df_ubicacion1['Fecha'].dt.day_name()

# Trabajo con Fechas y Series Temporales en Pandas
# Filtrar datos para el primer lunes de cada mes
df_ubicacion1_lunes = df_ubicacion1[df_ubicacion1['Fecha'].dt.is_month_start & (df_ubicacion1['Fecha'].dt.day_name() == 'Monday')]

# Combinación y Fusión de Conjuntos de Datos
# Concatenar DataFrames a lo largo de las filas
df_concatenado = pd.concat([df_ubicacion1, df_ubicacion2], ignore_index=True)

# Fusionar DataFrames basándose en la columna 'Fecha'
df_fusionado = pd.merge(df_concatenado, df_ubicacion1_lunes[['Fecha', 'Dia_Semana']], on='Fecha', how='left')

print("DataFrame de Ubicación 1:")
print(df_ubicacion1)
print("\nDataFrame de Ubicación 2:")
print(df_ubicacion2)
print("\nDataFrame Concatenado:")
print(df_concatenado)
print("\nDataFrame Fusionado:")
print(df_fusionado)
