# 1. Control inventario de materias primas con apoyo de la ciencia de datos
La empresa X, desde hace 10 años, se dedica a la fabricación de productos para la construcción como: resinas acrílicas, pinturas industriales, recubrimientos para madera, entre otros; y lo hacen procesando las siguientes materias primas: Soda, Xilol, Toluol, 2EHA, Vam, Butil, Ethil, Metil y Estireno. Para la empresa la precisión en el control de inventarios sobre estos insumos es esencial, ya que las materias primas son costosas y altamente sensibles a las condiciones de almacenamiento. La empresa ha experimentado inconsistencias en estos inventarios, afectando la eficiencia de la producción y su estado financiero.

Este proyecto se enfocará en el diseño e implementación de un sistema de control de inventarios que permita la planificación eficiente de las materias primas. Para ello, se cuenta con una base de datos en tiempo real, con información de recetas y adiciones manuales que realizan los operarios en modo semiautomático para la producción.
El objetivo del proyecto será analizar estos datos para encontrar:
Patrones de consumo para encontrar inconsistencias.
Identificar las causas de las variaciones que hay en los inventarios y los reportes de producción.
Desarrollar un modelo predictivo para optimizar la gestión de inventarios, alineando el inventario disponible del almacén con la demanda real de la producción.
Causas y efectos
Las causas del problema incluyen la falta de un sistema de monitoreo continuo, prácticas de compra sin planeación y una previsión de demanda insuficiente. Los efectos de estos problemas se manifiestan en mayores costos, tiempos de producción detenidos y afectación de la rentabilidad de la empresa.

Se deben analizar las variables numericas:
 - Set Point(Solicitudes de materias primas en kg, se abrevia generalmente como SP)
 - Consumo (La metrica del consumo de los sensores de flujo másico, se abrevia como PV)

Se deben analizar variables categoricas como:
 - Solicitudes, partidas o lotes
 - Equipos(los cuales hacen referencia a reactores, tanques o diluidores)
 - Tipo de Solicitud(Receta o semiautomatico)

Se analizan en tiempo ya que son variables que se almacenan en funcion del tiempo
 - TimeStamp

# 2. Cargando Librerias y el conjunto de datos

In [None]:
import pandas as pd
archivo_excel = 'Data.xlsx'
hojas = pd.ExcelFile(archivo_excel).sheet_names


def DataMp(materiaPrima):
    sample_df = pd.read_excel(archivo_excel, sheet_name=materiaPrima,decimal='.', header=0, usecols="C:AO", skiprows=2)

    sample_df['TimeStamp'] = pd.to_datetime(sample_df['TimeStamp'])
    sample_df.set_index('TimeStamp', inplace=True)
    return sample_df


FileNotFoundError: [Errno 2] No such file or directory: 'MP Consumos Barbosa.xlsx'

In [None]:
def identificar_sp_activo(row, equipo):
    if 'Activo_Receta' + equipo in row:
        if row['Activo_Receta' + equipo]:
            return 'SP Receta ' + equipo
        elif row['Activo_Semi' + equipo]:
            return 'SP Semi ' + equipo
        else:
            return 'Ninguno'
    elif 'Activo_Semi' + equipo in row:
        if row['Activo_Semi' + equipo]:
            return 'SP Semi ' + equipo
    return 'Ninguno'




In [None]:
# Identificar si el bombeo está activo
def CalculoMP(equipo):
    sample_dfSoda['Activo_Semi' + equipo] = sample_dfSoda['Estado Bombeo Semi '+ equipo] == 'Active'

    if 'Estado Bombeo Receta ' + equipo in sample_dfSoda.columns:
        sample_dfSoda['Activo_Receta' + equipo] = sample_dfSoda['Estado Bombeo Receta '+ equipo] == 'Active'


    # Crear una columna que identifique el nuevo SP activo
    # Aplicar la función para identificar el SP activo en cada momento
    # sample_dfSoda['SP_Activo' + equipo] = sample_dfSoda.apply(identificar_sp_activo, axis=1)
    sample_dfSoda['SP_Activo' + equipo] = sample_dfSoda.apply(identificar_sp_activo, axis=1, args=(equipo,))


    # Crear una columna con el valor del SP activo en cada momento
    sample_dfSoda['Valor_SP_Activo'] = sample_dfSoda.apply(
        lambda row: row['SP Receta ' + equipo] if row['SP_Activo' + equipo] == 'SP Receta ' + equipo
        else (row['SP Semi ' + equipo] if row['SP_Activo' + equipo] == 'SP Semi ' + equipo else 0),
        axis=1
    )

    # Identificar cambios en el SP activo (cada vez que se activa uno nuevo)
    sample_dfSoda['Cambio_SP_Activo'] = sample_dfSoda['SP_Activo' + equipo].shift(1) != sample_dfSoda['SP_Activo' + equipo]
    sample_dfSoda['Consumo R131_1'] = sample_dfSoda['Consumo ' + equipo].shift(-1)

    # Crear un número de solicitud único para cada nuevo SP activo
    sample_dfSoda['Solicitud'] = sample_dfSoda['Cambio_SP_Activo'].cumsum()

    # Agrupar los sample_dfSoda por solicitud y obtener los valores finales de SP y PV
    resultadoR131 = sample_dfSoda[sample_dfSoda['SP_Activo' + equipo] != 'Ninguno'].groupby('Solicitud').agg(
        SP_Activo_Final=('SP_Activo' + equipo, 'last'),
        Valor_SP_Final=('Valor_SP_Activo', 'max'),  # Tomar el máximo de los valores de SP para cada carga
        PV_Final=('Consumo R131_1', 'last')  # Tomar el último PV del grupo
    ).reset_index()
    resultadoR131["Equipo"]=equipo
    return resultadoR131
    # # Sumar todos los valores para cada carga y agregar un total
    # suma_filas = resultadoR131[['Valor_SP_Final', 'PV_Final']].sum().to_frame().T
    # suma_filas['SP_Activo_Final'] = 'Total ' + equipo
    # suma_filas['Solicitud'] = ' '

    # # Concatenar la fila de suma al DataFrame original
    # resultado_con_sumaR131Soda = pd.concat([resultadoR131, suma_filas], ignore_index=True)
    # # resultado_con_sumaR131Soda=resultado

    # # Ordenar el resultado final para que sea más legible
    # resultado_con_sumaR131Soda = resultado_con_sumaR131Soda[['Solicitud', 'SP_Activo_Final', 'Valor_SP_Final', 'PV_Final']]
    # resultado_con_sumaR131Soda["Equipo"]="R131"
    # # Verificar el resultado
    # return resultado_con_sumaR131Soda


In [None]:
resultadoR131=CalculoMP("R131")
resultadoTK131=CalculoMP("TK131")
resultadoR141=CalculoMP("TK141")
resultadoV142=CalculoMP("V142")
resultadoTk141=CalculoMP("TK141")
resultadoR221=CalculoMP("R221")
resultadoTK221=CalculoMP("TK221")

resultados=pd.concat([resultadoR131,
                      resultadoTK131,
                      resultadoR141,
                      resultadoV142,
                      resultadoTk141,
                      resultadoR221,
                      resultadoTK221])
resultados

Unnamed: 0,Solicitud,SP_Activo_Final,Valor_SP_Final,PV_Final,Equipo
0,2,SP Receta R131,1086.92981,1287.476318,R131
1,4,SP Receta R131,1070.75061,1287.889404,R131
2,6,SP Receta R131,1022.079712,1287.872681,R131
3,8,SP Receta R131,1005.200073,1287.883179,R131
4,10,SP Receta R131,988.587219,1287.870483,R131
5,12,SP Receta R131,970.806824,1287.890991,R131
6,14,SP Receta R131,810.816711,1287.893677,R131
7,16,SP Receta R131,793.0,793.01593,R131
8,18,SP Receta R131,793.0,793.013672,R131
0,1,SP Semi TK131,638.44989,2500.017334,TK131


In [None]:
# prompt: pivot_table = resultados.pivot_table(values=['Valor_SP_Final', 'PV_Final'], index=['Equipo','Solicitud','SP_Activo_Final'], aggfunc='sum', margins=True, margins_name='Total')
# prefero algo asi pero que subtotalice cada grupo

pivot_table = pd.pivot_table(resultados, values=['Valor_SP_Final', 'PV_Final'], index=['Equipo', 'Solicitud', 'SP_Activo_Final'], aggfunc='sum', margins=True, margins_name='Total')

# Subtotalizar por cada grupo (Equipo)
pivot_table_with_subtotals = pivot_table.groupby(level=0).sum().add_prefix('Subtotal_')

# Concatenar las tablas para obtener el resultado deseado
result = pd.concat([pivot_table, pivot_table_with_subtotals])

result

NameError: name 'resultados' is not defined