In [11]:
import pandas as pd
import random

# Duplicar los datos y generar nuevas fechas para múltiples años con variaciones
def duplicar_datos_con_nuevos_años_y_variaciones(df, años):
    df_final = df.copy()

    for nuevo_año in años:
        df_duplicado = df.copy()

        # Cambiar el año en las fechas duplicadas
        def cambiar_año(fecha):
            try:
                return fecha.replace(year=nuevo_año) if pd.notnull(fecha) else fecha
            except ValueError:
                return fecha - pd.Timedelta(days=1)

        df_duplicado['Fecha'] = pd.to_datetime(df_duplicado['Fecha'])
        df_duplicado['Fecha'] = df_duplicado['Fecha'].apply(cambiar_año)
        df_duplicado['Año'] = nuevo_año

        # Agregar variaciones a las columnas numéricas
        if 'Accesos' in df_duplicado.columns:
            df_duplicado['Accesos'] = df_duplicado['Accesos'].apply(lambda x: max(0, x + random.randint(10, 200)))
        if 'Pregrado' in df_duplicado.columns:
            df_duplicado['Pregrado'] = df_duplicado['Pregrado'].apply(lambda x: max(0, x + random.randint(0, 20)))
        if 'Postgrado' in df_duplicado.columns:
            df_duplicado['Postgrado'] = df_duplicado['Postgrado'].apply(lambda x: max(0, x + random.randint(0,20)))

        df_final = pd.concat([df_duplicado, df_final], ignore_index=True)

    return df_final

# Cargar el archivo original
df = pd.read_excel("Datasets/daily_counts_full.xlsx")
df['Fecha'] = pd.to_datetime(df['Fecha'])

# Duplicar los datos para los años 2023 y 2022 con variaciones
años_a_duplicar = [2023, 2022]
df_final = duplicar_datos_con_nuevos_años_y_variaciones(df, años=años_a_duplicar)

# Ordenar por fecha de más antiguo a más reciente
df_final = df_final.sort_values('Fecha').reset_index(drop=True)
# Exportar el archivo duplicado ordenado
df_final = df_final.drop_duplicates(subset=['Fecha'], keep='first').reset_index(drop=True)
archivo_salida = "Datasets/accesos_duplicados1.xlsx"
df_final.to_excel(archivo_salida, index=False)

print(f"Archivo duplicado con variaciones guardado como {archivo_salida}")

Archivo duplicado con variaciones guardado como Datasets/accesos_duplicados1.xlsx
