In [None]:
# import libraries

import schedule
import time
from datetime import datetime
import pandas as pd

def run_job():
    print(f"Job started at {datetime.now()}")

    def main():
            # identificar los nombres de los archivos en nuestro dorectorio
            file_names = ["ventas_francia.xlsx", "ventas_españa.xlsx", "datos extra.xlsx"]
            venta_historica = "venta_historica.csv" # df inicialmente vacio para adjuntar datos

            # crear una lista de nuestros archivos
            excels = [pd.read_excel(file, ) for file in file_names]

            # guardar individualmente cada archivo
            francia, españa, extra = excels[0].iloc[1:,:], excels[1].iloc[1:,:], excels[2]
            columns = ["Articulo", "Descripcion", "Unidades Vendidas","PVP"] # definir nombres de columnas

            francia.columns = columns # usar nombres correctos de columnas
            españa.columns = columns[:3]

            # crear columna de control para diferenciar datos despues de unirlos
            francia["Pais"], españa["Pais"] = "FR", "ES"

            # unir verticalmente los archivos de francia y españa, y despues unirlos con datos extra
            ventas = pd.concat([francia, españa]).merge(extra, left_on= "Articulo", right_on="ARTICULO")

            # Unir los datos por familia y sumar las unidades vendidas
            ventas_x_familia = ventas.groupby(["Articulo", "Descripcion", "Pais"])["Unidades Vendidas"].sum().reset_index()

            tabla_dinamica = pd.pivot_table(
                                        ventas_x_familia, 
                                        values="Unidades Vendidas", 
                                        index="Descripcion", 
                                        columns="Pais", 
                                        aggfunc="sum"
                                       )

            # Guardar la tabla con fecha de hoy
            fecha_hoy = datetime.now().strftime("%Y-%m-%d")
            tabla_dinamica["Fecha"] = fecha_hoy
            output_file = f"Unidades Vendidas{fecha_hoy}.csv"
            tabla_dinamica.to_csv(output_file)

            # adjuntar datos al historico
            with open(venta_historica, "a") as venta_historica:
                if venta_historica.tell() == 0:
                    venta_historica.write(",".join(tabla_dinamica.reset_index().columns) + "\n")  # crear columnas
                tabla_dinamica.to_csv(venta_historica, header=False, mode="a")

               
    main()

# definir horario para ejecutar script a las 9:00 PM
schedule.every().day.at("21:00").do(run_job)


while True:
    schedule.run_pending()
    time.sleep(1)