# Test de Generador de Reportes

In [2]:
# Downoloading libraries.
import pandas as pd
import numpy as np

## Loading file to process

In [3]:
# Loading CSV file with updated status. It is important to note that the best way to produce reports for each month is to create a new jupyter notebook with the updated CSV file. 
# In that sense, keeping backups of past CSV will be important to keep a registry of all passed months.
data = pd.read_csv("./Status Sofía 2025 - TEST1.csv")
data

Unnamed: 0,Fecha de Solicitud,Fecha de Entrega,Solicitud,Linea de Productos,Tipo,Piezas,Estado,Responsable,Solicitante,Trabajo,...,Unnamed: 20,Unnamed: 21,Unnamed: 22,Unnamed: 23,Unnamed: 24,Unnamed: 25,Unnamed: 26,Unnamed: 27,Unnamed: 28,Unnamed: 29
0,29/5/2024,,87-24/ Sofía/ Campaña Consumo de Cerdo,Cerdo,Campaña,1.0,Entregado,Sergio,Maria Isabel Anglarill,Creatvidad + Diseño,...,,,,,,,,,,
1,13/1/2025,19/2/2025,Sofía/ Campaña Consumo de Cerdo/ TVC 30'' y 15'',Cerdo,Comercial,2.0,Entregado,Sergio,Maria Isabel Anglarill,Creatividad,...,,,,,,,,,,
2,13/1/2025,19/2/2025,Sofía/ Campaña Consumo de Cerdo/ Jingle,Cerdo,Cuña,1.0,Entregado,Sergio,Maria Isabel Anglarill,Creatividad + Redacción,...,,,,,,,,,,
3,13/1/2025,13/2/2025,Sofía/ Campaña Consumo de Cerdo/ KV 1 Medallon...,Cerdo,KV,1.0,Entregado,René,Maria Isabel Anglarill,Diseño,...,,,,,,,,,,
4,13/1/2025,13/2/2025,Sofía/ Campaña Consumo de Cerdo/ KV 2 Carne Mo...,Cerdo,KV,1.0,Entregado,René,Maria Isabel Anglarill,Diseño,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
945,,,841-25/Sofía/Institucional/Brief 50 Años Sofía,,,,,,,,...,,,,,,,,,,
946,,,842-25/Sofía/BRIEF | CARNAVAL 2026,,,,,,,,...,,,,,,,,,,
947,,,844-25/Sofía/Procesados/Diseño bolsa procesado...,,,,,,,,...,,,,,,,,,,
948,,,843-25/Sofia/Digital/Nada es lo que parece 3,,,,,,,,...,,,,,,,,,,


## Pre-processing data

In [4]:
#Removing all columns with nan values
df_cleaned = data.dropna(axis=1, how='all')

In [5]:
#Removing column 29 with nan values
df_cleaned = df_cleaned.drop(["Unnamed: 29"], axis = 1)

In [6]:
#Printing dataframe to check if the nan columns have been removed
df_cleaned

Unnamed: 0,Fecha de Solicitud,Fecha de Entrega,Solicitud,Linea de Productos,Tipo,Piezas,Estado,Responsable,Solicitante,Trabajo
0,29/5/2024,,87-24/ Sofía/ Campaña Consumo de Cerdo,Cerdo,Campaña,1.0,Entregado,Sergio,Maria Isabel Anglarill,Creatvidad + Diseño
1,13/1/2025,19/2/2025,Sofía/ Campaña Consumo de Cerdo/ TVC 30'' y 15'',Cerdo,Comercial,2.0,Entregado,Sergio,Maria Isabel Anglarill,Creatividad
2,13/1/2025,19/2/2025,Sofía/ Campaña Consumo de Cerdo/ Jingle,Cerdo,Cuña,1.0,Entregado,Sergio,Maria Isabel Anglarill,Creatividad + Redacción
3,13/1/2025,13/2/2025,Sofía/ Campaña Consumo de Cerdo/ KV 1 Medallon...,Cerdo,KV,1.0,Entregado,René,Maria Isabel Anglarill,Diseño
4,13/1/2025,13/2/2025,Sofía/ Campaña Consumo de Cerdo/ KV 2 Carne Mo...,Cerdo,KV,1.0,Entregado,René,Maria Isabel Anglarill,Diseño
...,...,...,...,...,...,...,...,...,...,...
945,,,841-25/Sofía/Institucional/Brief 50 Años Sofía,,,,,,,
946,,,842-25/Sofía/BRIEF | CARNAVAL 2026,,,,,,,
947,,,844-25/Sofía/Procesados/Diseño bolsa procesado...,,,,,,,
948,,,843-25/Sofia/Digital/Nada es lo que parece 3,,,,,,,


## Assigning datatypes to columns in the dataframe

In [7]:
# Changing data types from columns
df_cleaned.columns = df_cleaned.columns.str.strip()

# Date format
df_cleaned['Fecha de Solicitud'] = pd.to_datetime(df_cleaned['Fecha de Solicitud'], format='%d/%m/%Y', errors='coerce')
df_cleaned['Fecha de Entrega'] = pd.to_datetime(df_cleaned['Fecha de Entrega'], format='%d/%m/%Y', errors='coerce')

# String
cols_to_convert = ['Solicitud', 'Linea de Productos', 'Tipo', 'Estado', 'Responsable', 'Solicitante', 'Trabajo']
df_cleaned[cols_to_convert] = df_cleaned[cols_to_convert].astype('string')

# Ints
df_cleaned['Piezas'] = pd.to_numeric(df_cleaned['Piezas'], errors='coerce').astype('Int64')

## Function to assign a week number to each entry

In [8]:
# Creating a new column to assign a week of the month given the date.
df_cleaned["Semana"] = df_cleaned["Fecha de Solicitud"].apply(lambda d: (d.day - 1) // 7 + 1).astype("Int64")

In [9]:
# Checking if datatypes have been correctly assigned
df_cleaned.dtypes

Fecha de Solicitud    datetime64[ns]
Fecha de Entrega      datetime64[ns]
Solicitud             string[python]
Linea de Productos    string[python]
Tipo                  string[python]
Piezas                         Int64
Estado                string[python]
Responsable           string[python]
Solicitante           string[python]
Trabajo               string[python]
Semana                         Int64
dtype: object

In [10]:
#Printing dataframe for debugging
df_cleaned

Unnamed: 0,Fecha de Solicitud,Fecha de Entrega,Solicitud,Linea de Productos,Tipo,Piezas,Estado,Responsable,Solicitante,Trabajo,Semana
0,2024-05-29,NaT,87-24/ Sofía/ Campaña Consumo de Cerdo,Cerdo,Campaña,1,Entregado,Sergio,Maria Isabel Anglarill,Creatvidad + Diseño,5
1,2025-01-13,2025-02-19,Sofía/ Campaña Consumo de Cerdo/ TVC 30'' y 15'',Cerdo,Comercial,2,Entregado,Sergio,Maria Isabel Anglarill,Creatividad,2
2,2025-01-13,2025-02-19,Sofía/ Campaña Consumo de Cerdo/ Jingle,Cerdo,Cuña,1,Entregado,Sergio,Maria Isabel Anglarill,Creatividad + Redacción,2
3,2025-01-13,2025-02-13,Sofía/ Campaña Consumo de Cerdo/ KV 1 Medallon...,Cerdo,KV,1,Entregado,René,Maria Isabel Anglarill,Diseño,2
4,2025-01-13,2025-02-13,Sofía/ Campaña Consumo de Cerdo/ KV 2 Carne Mo...,Cerdo,KV,1,Entregado,René,Maria Isabel Anglarill,Diseño,2
...,...,...,...,...,...,...,...,...,...,...,...
945,NaT,NaT,841-25/Sofía/Institucional/Brief 50 Años Sofía,,,,,,,,
946,NaT,NaT,842-25/Sofía/BRIEF | CARNAVAL 2026,,,,,,,,
947,NaT,NaT,844-25/Sofía/Procesados/Diseño bolsa procesado...,,,,,,,,
948,NaT,NaT,843-25/Sofia/Digital/Nada es lo que parece 3,,,,,,,,


## Applying data filtering

In [102]:
# Filtering by date
df_enero_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-01-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-01-31")] 
df_febrero_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-02-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-02-28")] 
df_marzo_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-03-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-03-31")] 
df_abril_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-04-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-04-30")] 
df_mayo_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-05-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-05-31")] 
df_junio_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-06-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-06-30")] 
df_julio_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-07-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-07-31")] 
# df_agosto_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-08-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-08-31")] 
# df_septiembre_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-09-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-09-30")] 
# df_octubre_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-10-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-10-31")] 
# df_noviembre_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-11-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-11-30")] 
# df_diciembre_2025 = df_cleaned[(df_cleaned["Fecha de Solicitud"] >= "2025-12-01") & (df_cleaned["Fecha de Solicitud"] <= "2025-12-31")]


In [103]:
df_enero_2025

Unnamed: 0,Fecha de Solicitud,Fecha de Entrega,Solicitud,Linea de Productos,Tipo,Piezas,Estado,Responsable,Solicitante,Trabajo,Semana
1,2025-01-13,2025-02-19,Sofía/ Campaña Consumo de Cerdo/ TVC 30'' y 15'',Cerdo,Comercial,2,Entregado,Sergio,Maria Isabel Anglarill,Creatividad,2
2,2025-01-13,2025-02-19,Sofía/ Campaña Consumo de Cerdo/ Jingle,Cerdo,Cuña,1,Entregado,Sergio,Maria Isabel Anglarill,Creatividad + Redacción,2
3,2025-01-13,2025-02-13,Sofía/ Campaña Consumo de Cerdo/ KV 1 Medallon...,Cerdo,KV,1,Entregado,René,Maria Isabel Anglarill,Diseño,2
4,2025-01-13,2025-02-13,Sofía/ Campaña Consumo de Cerdo/ KV 2 Carne Mo...,Cerdo,KV,1,Entregado,René,Maria Isabel Anglarill,Diseño,2
5,2025-01-13,2025-02-13,Sofía/ Campaña Consumo de Cerdo/ KV 3 Chuleta ...,Cerdo,KV,1,Entregado,René,Maria Isabel Anglarill,Diseño,2
...,...,...,...,...,...,...,...,...,...,...,...
453,2025-01-28,2025-02-04,332-25/ Sofía/ Hamburguesa/ Polera,Hamburguesas,Uniforme,2,Entregado,Luján,Gabriela,Diseño + Arte Finalista,4
455,2025-01-28,2025-02-04,333-25/ Sofía/ Hamburguesa/ Ploteo Carritos,Hamburguesas,Arte,1,Entregado,Mariano,Carlos Gordillo,Diseño + Arte Finalista,4
456,2025-01-28,2025-03-17,334-25/ Sofía/ Disfraz Chorizo y Huevo,Sofía,Uniforme,2,Entregado,Mariano,Carlos Gordillo,Diseño + Arte Finalista,4
457,2025-01-29,2025-02-05,335-25/ Sofía/ Arte para Caja de Luz,Sofía,Arte,1,Entregado,René,Nathaly Tardío,Diseño + Arte Finalista,5


In [105]:
#Saving dataframe cleaned and filtered exported to csv to processing.
df_enero_2025.to_csv("./FILTERED_STATUS/Sofia_ENE_2025.csv", index=False)
df_febrero_2025.to_csv("./FILTERED_STATUS/Sofia_FEB_2025.csv", index=False)
df_marzo_2025.to_csv("./FILTERED_STATUS/Sofia_MAR_2025.csv", index=False)
df_abril_2025.to_csv("./FILTERED_STATUS/Sofia_ABR_2025.csv", index=False)
df_mayo_2025.to_csv("./FILTERED_STATUS/Sofia_MAY_2025.csv", index=False)
df_julio_2025.to_csv("./FILTERED_STATUS/Sofia_JUN_2025.csv", index=False)
df_junio_2025.to_csv("./FILTERED_STATUS/Sofia_JUL_2025.csv", index=False)


# CREATING Aggregated Dataframe

In [106]:
data = {
    "Solicitudes_recibidas" : np.nan,
    "Piezas_solicitadas"    : np.nan,
    "Piezas_entregadas"     : np.nan,
    "Piezas_canceladas"     : np.nan,
    "Semana1_solicitadas"   : np.nan,
    "Semana1_entregadas"    : np.nan,
    "Semana2_solicitadas"   : np.nan,
    "Semana2_entregadas"    : np.nan,
    "Semana3_solicitadas"   : np.nan,
    "Semana3_entregadas"    : np.nan,
    "Semana4_solicitadas"   : np.nan,
    "Semana4_entregadas"    : np.nan
}

indices = ["ENE", "FEB", "MAR", "ABR", "MAY", "JUN", "JUL", "AGO", "SEP", "OCT", "NOV", "DIC"]
df_aggregated = pd.DataFrame(data, indices)
df_aggregated



Unnamed: 0,Solicitudes_recibidas,Piezas_solicitadas,Piezas_entregadas,Piezas_canceladas,Semana1_solicitadas,Semana1_entregadas,Semana2_solicitadas,Semana2_entregadas,Semana3_solicitadas,Semana3_entregadas,Semana4_solicitadas,Semana4_entregadas
ENE,,,,,,,,,,,,
FEB,,,,,,,,,,,,
MAR,,,,,,,,,,,,
ABR,,,,,,,,,,,,
MAY,,,,,,,,,,,,
JUN,,,,,,,,,,,,
JUL,,,,,,,,,,,,
AGO,,,,,,,,,,,,
SEP,,,,,,,,,,,,
OCT,,,,,,,,,,,,


## FUNCTION: EXTRACT PIEZAS SOLICITADAS v. ENTREGADAS

In [109]:
def to_aggregated(file):
    splitting = file.split("_") #Splitting filename
    month = splitting[2] #getting month

    working_df = pd.read_csv(file) #loading the monthly csv

    df_aggregated.loc[month, "Solicitudes_recibidas"] = working_df["Solicitud"].count().astype(int)

    #Getting the total number of Piezas_solicitadas
    df_aggregated.loc[month, "Piezas_solicitadas"] = working_df["Piezas"].sum().astype(int)
    
    #DF with the count of all Piezas_solicitadas and their status
    #0: Entregado, 1: Cancelado, 2:En cliente, 3:Stand by
    piezas_por_estado = working_df["Estado"].value_counts()

    #Adding data to Piezas_entregadas and Piezas_canceladas columns in aggregated dataframe
    df_aggregated.loc[month, "Piezas_entregadas"] = piezas_por_estado.iloc[0]
    df_aggregated.loc[month, "Piezas_canceladas"] = piezas_por_estado.iloc[1]    
    
to_aggregated("./FILTERED_STATUS/Sofia_ENE_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_FEB_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_MAR_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_ABR_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_MAY_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_JUN_2025.csv")
to_aggregated("./FILTERED_STATUS/Sofia_JUL_2025.csv")

df_aggregated



Unnamed: 0,Solicitudes_recibidas,Piezas_solicitadas,Piezas_entregadas,Piezas_canceladas,Semana1_solicitadas,Semana1_entregadas,Semana2_solicitadas,Semana2_entregadas,Semana3_solicitadas,Semana3_entregadas,Semana4_solicitadas,Semana4_entregadas
ENE,227.0,327.0,202.0,19.0,,,,,,,,
FEB,94.0,146.0,81.0,5.0,,,,,,,,
MAR,116.0,139.0,89.0,14.0,,,,,,,,
ABR,75.0,97.0,67.0,3.0,,,,,,,,
MAY,147.0,328.0,108.0,25.0,,,,,,,,
JUN,40.0,118.0,33.0,3.0,,,,,,,,
JUL,50.0,120.0,44.0,2.0,,,,,,,,
AGO,,,,,,,,,,,,
SEP,,,,,,,,,,,,
OCT,,,,,,,,,,,,
