# Consumo Calculado y Predicho

## A considerar:
Interpretación de los Resultados:

- Valores Positivos: Indican que se espera tener un inventario positivo de ese insumo al final del mes. Por ejemplo, para mayo de 2024, se espera tener un inventario de aproximadamente 19,384 unidades.
- Valores Negativos: Indican que se espera un inventario negativo, lo que implica una posible escasez o déficit del insumo. Por ejemplo, para septiembre de 2024, se predice un déficit de aproximadamente 28,569 unidades.
  
Identificación de la Fecha y Cantidad Óptima para Pedido:

- Dado que la fecha óptima para hacer un pedido es aquella en la que el inventario proyectado es mínimo (especialmente si es negativo), puedes tomar la fecha con el inventario más negativo como la señal para realizar un pedido.

**La cantidad a pedir debe cubrir el déficit y adicionalmente asegurar un inventario suficiente para el próximo periodo.**

## Data

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose
from statsmodels.tsa.statespace.sarimax import SARIMAX
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_percentage_error
import joblib  # Importar joblib para la serialización del modelo
import warnings
import json

# Definir las rutas de los archivos Excel
file_paths = [
    'datasets_xlsx/2022/cuadro-insumos-medico-quirurgico-enero-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-insumos-medico-quirurgico-febrero-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-insumo-medico-quirurgico-marzo-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-medicamentos-abril-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-insumo-medico-quirurgico-de-mayo-2022.xlsx',
    'datasets_xlsx/2022/inventario-insumos-medico-quirurgico-junio-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-medico-quirurgico-julio-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-insumos-medico-quirurgico-agosto-2022.xlsx',
    'datasets_xlsx/2022/inventario-de-insumos-medico-quirurgico-septiembre-2022.xlsx',
    'datasets_xlsx/2022/inventario-insumos-medico-quirurgico-octubre-2022.xlsx',
    'datasets_xlsx/2022/inventario-medico-quirurgico-nov.-2022.xlsx',
    'datasets_xlsx/2022/inventario-medico-quirugico-dic.-2022.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-insumos-medico-quirurgico-enero-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-insumos-medico-quirurgico-febrero-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-insumos-medico-quirurgico-marzo-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-insumos-medico-quirurgico-abril-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-de-medico-quirurgico-de-mayo-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-de-medico-quirurgico-de-junio-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-de-medico-quirurgico-de-julio-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-medico-quirurgico-agosto-2023.xlsx',
    'datasets_xlsx/2023/inventario-mq-a-septiembre-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-medico-quirurgico-octubre-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-medico-quirurgico-nov.-2023.xlsx',
    'datasets_xlsx/2023/cuadro-de-inventario-medico-quirurgico-dic.-2023.xlsx',
    'datasets_xlsx/2024/cuadro-de-inventario-insumos-medico-quirurgico-enero-2024.xlsx',
    'datasets_xlsx/2024/cuadro-de-inventario-de-insumos-medicos-quirurgico-feb.-2024.xlsx',
    'datasets_xlsx/2024/inventario-insumos-medico-quirurgico-marzo-2024.xlsx',
    'datasets_xlsx/2024/cuadro-de-inventario-mq-abril-2024.xlsx'
]

months = [
    '2022-01-01', '2022-02-01', '2022-03-01', '2022-04-01', '2022-05-01', '2022-06-01', 
    '2022-07-01', '2022-08-01', '2022-09-01', '2022-10-01', '2022-11-01', '2022-12-01',
    '2023-01-01', '2023-02-01', '2023-03-01', '2023-04-01', '2023-05-01', '2023-06-01', 
    '2023-07-01', '2023-08-01', '2023-09-01', '2023-10-01', '2023-11-01', '2023-12-01',
    '2024-01-01', '2024-02-01', '2024-03-01', '2024-04-01'
]

# Leer los archivos Excel en DataFrames y añadir una columna para el mes correspondiente
dfs = []

for file_path, month in zip(file_paths, months):
    df = pd.read_excel(file_path)
    df = df.iloc[:, [0, 1, -2]]  # Seleccionar las columnas por índice
    df['Fecha'] = month  # Añadir la columna de la fecha
    df = df.rename(columns={df.columns[2]: 'Inventario'})  # Renombrar la columna -2
    dfs.append(df)

# Concatenar todos los DataFrames
df_combined = pd.concat(dfs, ignore_index=True)

# Renombrar las columnas
df_combined.columns = ['Codigo', 'Insumo', 'Inventario', 'Fecha']

# Eliminar filas con NaN en la columna 'Codigo'
df_combined = df_combined.dropna(subset=['Codigo', 'Insumo'])
df_combined['Codigo'] = df_combined['Codigo'].apply(lambda x: str(x).replace('.0', '') if isinstance(x, (int, float)) else x)

In [2]:
df_combined

Unnamed: 0,Codigo,Insumo,Inventario,Fecha
1,100036614,GALON GEL ALCOHOLADO AL 70% ALC,0.0,2022-01-01
2,209003502,CONECTOR PARA BOMBA DE INFUSION CON FILTRO DE ...,144980.0,2022-01-01
3,209003700,AGUJA PARA NEUMOPERITONEO (TIPO VERESS) PARA ...,175.0,2022-01-01
4,209007502,DETERGENTE ANIONICO EN POLVO PRESENTACION: PAQ...,2534.0,2022-01-01
5,209008100,"AGUJA HIPODÉRMICA, (SE SOLICITA CALIBRE 18G X...",316800.0,2022-01-01
...,...,...,...,...
14466,210226501,DELANTAL PROTECTOR DE FLUIDOS POTENCIALMENTE P...,0.0,2024-04-01
14467,210235801,FORRO DE COLCHON Para proteger el colchon del ...,0.0,2024-04-01
14468,210248401,ENVASE PARA DESECHOS PUNZOCORTANTE( SE SOLICIT...,0.0,2024-04-01
14469,210248501,ENVASE PARA DESECHOS PUNZOCORTANTE (SE SOLICIT...,0.0,2024-04-01


In [3]:
# Filtrar las filas con valores numéricos en 'Codigo'
df_insumos = df_combined[['Codigo', 'Insumo']]
df_insumos = df_insumos.dropna(subset=['Codigo'])
df_insumos['Codigo'] = df_insumos['Codigo'].apply(lambda x: ''.join(filter(str.isdigit, str(x))) if not str(x).isdigit() else x)

# Crear diccionario de código y nombre de producto
codigo_nombre_dict = df_insumos.set_index('Codigo')['Insumo'].to_dict()

# Exportar el diccionario a JSON
with open('json_files/codigo_nombre_productos.json', 'w') as json_file:
    json.dump(codigo_nombre_dict, json_file, indent=4)

In [4]:
# Reordenar las columnas
df_combined = df_combined[['Fecha', 'Codigo', 'Insumo', 'Inventario']]

# Contar el número de ceros por cada 'Insumo'
def count_zeros(df):
    return (df['Inventario'] == 0).sum()

# Filtrar los insumos con al menos 2 ceros
filtered_insumos = df_combined.groupby('Insumo').filter(lambda x: count_zeros(x) <= 2)

# Crear una tabla pivote
pivot_table = filtered_insumos.pivot_table(
    index='Insumo',         # Las filas serán los insumos
    columns='Fecha',        # Las columnas serán las fechas
    values='Inventario',    # Los valores serán los inventarios
    aggfunc='sum'           # La función de agregación será la suma
).fillna(0)

# Contar los ceros en cada fila
zero_counts = (pivot_table == 0).sum(axis=1)

# Filtrar las filas que tienen a lo sumo 2 ceros
filtered_pivot_table = pivot_table[zero_counts <= 2]

# Calcular el consumo (diferencia de inventarios entre meses consecutivos)
consumption = filtered_pivot_table.diff(axis=1).fillna(0)

In [5]:
df_insumos.info()

<class 'pandas.core.frame.DataFrame'>
Index: 14432 entries, 1 to 14470
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Codigo  14432 non-null  object
 1   Insumo  14432 non-null  object
dtypes: object(2)
memory usage: 338.2+ KB


In [6]:
df_insumos

Unnamed: 0,Codigo,Insumo
1,100036614,GALON GEL ALCOHOLADO AL 70% ALC
2,209003502,CONECTOR PARA BOMBA DE INFUSION CON FILTRO DE ...
3,209003700,AGUJA PARA NEUMOPERITONEO (TIPO VERESS) PARA ...
4,209007502,DETERGENTE ANIONICO EN POLVO PRESENTACION: PAQ...
5,209008100,"AGUJA HIPODÉRMICA, (SE SOLICITA CALIBRE 18G X..."
...,...,...
14466,210226501,DELANTAL PROTECTOR DE FLUIDOS POTENCIALMENTE P...
14467,210235801,FORRO DE COLCHON Para proteger el colchon del ...
14468,210248401,ENVASE PARA DESECHOS PUNZOCORTANTE( SE SOLICIT...
14469,210248501,ENVASE PARA DESECHOS PUNZOCORTANTE (SE SOLICIT...


In [7]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose
from statsmodels.tsa.statespace.sarimax import SARIMAX
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_percentage_error
import joblib  # Importar joblib para la serialización del modelo
import json
import os
import warnings
# Entrenar y guardar los modelos SARIMAX
modelos = {}
predecibles = []
cantidad_adicional = 100
avisos = []

output_dir = "modelos_sarimax"
os.makedirs(output_dir, exist_ok=True)

# Entrenar y guardar los modelos SARIMAX (continuación)
for insumo in consumption.index:
    try:
        df_insumo = consumption.loc[insumo].dropna()

        if len(df_insumo) < 24:
            continue

        train_end = '2024-01-31'
        train_data = df_insumo[:train_end]
        test_data = df_insumo[train_end:]

        model = SARIMAX(train_data, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12))
        results = model.fit(disp=False)

        codigo_producto = int(df_insumos[df_insumos['Insumo'] == insumo]['Codigo'].values[0])
        joblib.dump(results, f"{output_dir}/modelo_{codigo_producto}.pkl")

        predecibles.append({
            "Codigo": int(codigo_producto),  # Convertir a entero
            "Nombre": insumo,
            "ultimos_valores": [int(x) for x in df_insumo.tail(6)]  # Convertir a enteros
        })

        pred = results.get_forecast(steps=12)
        predicted_values = pred.predicted_mean

        for fecha, inventario in predicted_values.items():
            if inventario < 0:
                # Calcular el último día del mes anterior
                mes_anterior = (pd.to_datetime(fecha) - pd.DateOffset(months=1)).strftime('%Y-%m-%d')
                mes_anterior = pd.to_datetime(mes_anterior) + pd.offsets.MonthEnd(0)
                
                cantidad_a_pedir = int(abs(inventario) + cantidad_adicional)  # Convertir a entero

                # Calcular el último día del mes actual
                fecha_deficit = pd.to_datetime(fecha) + pd.offsets.MonthEnd(0)
                
                avisos.append({
                    "codigo": int(codigo_producto),
                    "insumo": insumo,
                    "fecha_pedir_insumos": mes_anterior.strftime('%Y-%m-%d'),
                    "cantidad_a_pedir": cantidad_a_pedir,
                    "mes_a_cubrir": fecha_deficit.strftime('%Y-%m-%d')
                })
    except Exception as e:
        print(f"Error al procesar el insumo {insumo}: {e}")

  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._ini

Error al procesar el insumo CANULA NASOFARINGEA  DE 20 FR A  26 FR.  (SE SOLOCITA TAMAÑ0 26FR) : LU decomposition error.


  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to estimate starting parameters%s.'
  self._init_dates(dates, freq)
  self._init_dates(dates, freq)
  warn('Too few observations to e

In [8]:
# Guardar los JSON
with open('json_files/predecibles.json', 'w') as predecibles_file:
    json.dump(predecibles, predecibles_file, indent=4)

with open('json_files/requerimientos.json', 'w') as avisos_file:
    json.dump(avisos, avisos_file, indent=4)

print("Modelos SARIMAX guardados y archivos JSON generados con éxito.")

Modelos SARIMAX guardados y archivos JSON generados con éxito.
