#**Problema:**
Una extrusora de la empresa XXXXX produce varias referencias de producto y se desea obtener un modelo de producto extruido y se dese a obtener un modelo confiable de variación del consumo de energía en la extrusora con la producción realizada. Los datos obtenidos de consumo de energía eléctrica y la producción realizada para las diferentes referencias son las siguientes:

#**Objetivo del negocio:**
Una empresa productora de piezas plásticas inyectadas posee veinte maquinas y debido a los incrementos que se están dando en la dinámica energética mundial tiene demasiados costos en consumo de energía eléctrica, lo que impacta drásticamente en las finanzas del negocio.

#**Objetivo del proyecto:**
Por medio del modelamiento de datos de consumo energético de una inyectora se desea encontrar un modelo que facilite tomar decisiones prácticas para reducir el consumo de energía sin desmejorar la producción.

#**Planeación del proyecto:** 
Con los datos que se tienen de producción de una inyectora durante cierta cantidad de sesiones de fabricación se va a encontrar una línea base de consumo energético y aplicando los métodos estadísticos apropiados se obtendrá una línea meta con los datos mas favorables que permitan hacer los cambios operativos necesarios para disminuir el consumo de energía.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns

In [2]:
from scipy import stats
import scipy
import statsmodels.api as sm
import statsmodels.formula.api as smf

In [3]:
data = pd.read_excel('BasePrincipal.xlsx')
data.isnull
data.dropna #elimina valores nulos
data.drop_duplicates #eliminar datos duplicados

FileNotFoundError: ignored

In [None]:
sns.get_dataset_names()
sns.set(rc = {'figure.figsize' :( 7, 7 ),  
               'axes.labelsize' : 12 })

In [None]:
data.head(200)

Se obtiene el número de datos que existen en la información tales como el tipo de referencia y la cantidad de datos que existen de la misma

In [None]:
data['Referencia'].value_counts()

# **Análisis de los datos**
# **Separación de los datos según su referencia:** 
Se separan en tres grupos y se debe analizar de manera diferente, ya que son tres productos diferentes y el consumo de energía es diferente. En este caso se llamarán data1, data2, y data3, que se asociaran respectivamente a los datos que se evidencian en la línea anterior.

# **Datos de la referencia "OC125" (data1)**


In [None]:
data1 = data.copy()
data1 = data1.drop(data1[data1['Referencia']!='OC125'].index) 
data1.head()

In [None]:
data1['Referencia'].value_counts()

In [None]:
data1['Consumo (KWh/Día)'].std()

In [None]:
data1['Consumo (KWh/Día)'].mean() 

In [None]:
pend1, interc1, corr1, p_valor1, error_std1 = stats.linregress(data1['Producción (Ton/Día)'], data1['Consumo (KWh/Día)'])

print(f"pend1 = {pend1:10f}")
print(f"interc1 = {interc1:10f}")
print(f"corr1 = {corr1:10f}")
print(f"p_valor1 = {p_valor1:10f}")
print(f"error_std1 = {error_std1:10f}")

In [None]:
CorrPearson1 = data1['Consumo (KWh/Día)'].corr(data1['Producción (Ton/Día)'], method='pearson')
CorrPearson1

In [None]:
Norm1 = (data1['Consumo (KWh/Día)'] - data1['Consumo (KWh/Día)'].mean())/data1['Consumo (KWh/Día)'].std()

In [None]:
data1['Normalización 1'] = Norm1
data1.head(200)

In [None]:
sns.scatterplot(data=data1, x = "Producción (Ton/Día)", y = "Normalización 1")

In [None]:
data1 = data1.drop(data1[data1['Normalización 1'] <= -1.8].index)
data1 = data1.drop(data1[data1['Producción (Ton/Día)'] >= 18].index)
data1.head(115)

In [None]:

sns.scatterplot(data=data1, x = "Producción (Ton/Día)", y = "Normalización 1")

In [None]:
sns.lmplot( x = "Producción (Ton/Día)", y = "Normalización 1", data=data1, palette='viridis');

# **Datos de la Referencia "OC1C27NT" (data2)**

In [None]:
data2 = data.copy()
data2 = data2.drop(data2[data2['Referencia']!='OC1C27NT'].index)
data2.head()

In [None]:
data2['Referencia'].value_counts()

In [None]:
data2['Consumo (KWh/Día)'].mean() 

In [None]:
data2['Consumo (KWh/Día)'].std()

In [None]:
CorrPearson2 = data2['Consumo (KWh/Día)'].corr(data2['Producción (Ton/Día)'], method='pearson')
CorrPearson2

In [None]:
pend2, interc2, corr2, p_valor2, error_std2 = stats.linregress(data2['Producción (Ton/Día)'], data2['Consumo (KWh/Día)'])

print(f"pend2 = {pend2:10f}")
print(f"interc2 = {interc2:10f}")
print(f"corr2 = {corr2:10f}")
print(f"p_valor2 = {p_valor2:10f}")
print(f"error_std2 = {error_std2:10f}")

In [None]:
Norm2 = (data2['Consumo (KWh/Día)'] - data2['Consumo (KWh/Día)'].mean())/data2['Consumo (KWh/Día)'].std()

In [None]:
data2['Normalización 2'] = Norm2

In [None]:
data2 = data2.drop(data2[data2['Normalización 2'] <= -1.8].index)
data2 = data2.drop(data2[data2['Producción (Ton/Día)'] <= 10.6].index)

In [None]:
sns.lmplot( x = "Producción (Ton/Día)", y = "Normalización 2", data=data2, palette='viridis');

# **Datos de referencia "OC125A" (data3)**

In [None]:
data3 = data.copy()
data3 = data3.drop(data3[data3['Referencia']!='OC125A'].index)
data3.head()

In [None]:
data3['Referencia'].value_counts()

Datos de estadistica descriptiva para la tabla 1 que contiene los datos de la referencia 'OC125'

In [None]:
data3['Consumo (KWh/Día)'].mean()

In [None]:
data3['Consumo (KWh/Día)'].std()

In [None]:
CorrPearson3 = data3['Consumo (KWh/Día)'].corr(data3['Producción (Ton/Día)'], method='pearson')
CorrPearson3

In [None]:
pend3, interc3, corr3, p_valor3, error_std3 = stats.linregress(data3['Producción (Ton/Día)'], data3['Consumo (KWh/Día)'])

print(f"pend3 = {pend3:10f}")
print(f"interc3 = {interc3:10f}")
print(f"corr3 = {corr3:10f}")
print(f"p_valor3 = {p_valor3:10f}")
print(f"error_std3 = {error_std3:10f}")

In [None]:
Norm3 = (data3['Consumo (KWh/Día)'] - data3['Consumo (KWh/Día)'].mean())/data3['Consumo (KWh/Día)'].std()

In [None]:
data3['Normalización 3'] = Norm3

In [None]:
sns.scatterplot(data=data3, x = "Producción (Ton/Día)", y = "Normalización 3")

In [None]:
data3 = data3.drop(data3[data3['Normalización 3'] <= -1.8].index)
data3 = data3.drop(data3[data3['Producción (Ton/Día)'] >= 18].index)

In [None]:
sns.lmplot( x = "Producción (Ton/Día)", y = "Normalización 3", data=data3);

# **Agrupamiento de datos modificados**
Se agrupan los datos analizados por separados en una nueva tabla, el propósito de esta es lograr generar un modelo que unifique los tres productos y poder tener una línea base común.

In [None]:
dataFinal = pd.concat([data1, data2, data3], axis=0)
dataFinal

Una vez analizados los datos por separado y concatenados en una nueva tabla, se compara la data original contra la nueva data analizada y modificada, esto con el propósito de mostrar la diferencia cuando se depura la información de datos que podría alterar el resultado que se busca.

In [None]:
dataFinal = dataFinal.drop(['Normalización 1','Normalización 2', 'Normalización 3'], axis = 'columns')
dataFinal

In [None]:
sns.lmplot(x='Producción (Ton/Día)', y='Consumo (KWh/Día)', data=data, hue='Referencia');

In [None]:
sns.lmplot(x='Producción (Ton/Día)', y='Consumo (KWh/Día)', data=dataFinal, hue='Referencia');

# **Ecuaciones matemáticas**

Se toma la ecuación de la recta para poder unificar la información y estandarizarla a un solo producto, y se realiza con el producto que más consumo tenia.

*   $$y_1 = m_1x + b_1$$
*   $$y_2 = m_2x + b_2$$
*   $$y_3 = m_3x + b_3$$


$$x_{1A} = (m_2x_2 + b_2 - b_1)/m_1$$
$$x_{1B} = (m_3x_3 + b_3 - b_1)/m_1$$

La aplicación de esta se aplica en las siguientes filas tanto para el producto dos como el producto tres.










In [None]:
data2["Producción (Ton/Día)"] = ((pend2 * data2['Producción (Ton/Día)'])+(interc2-interc1))/pend1
data2.head()

Se realiza la depuración de la información que no se necesita y que podria entorpecer y confundir el proceso

In [None]:
data2 = data2.drop(['Normalización 2'], axis = 'columns')
data2.head()

In [None]:
dataFinal = dataFinal.drop(dataFinal[dataFinal['Referencia'] == "OC1C27NT"].index)
dataFinal.head(200)

In [None]:
dataFinal = pd.concat([dataFinal, data2], axis=0)
dataFinal.head(200)

In [None]:
data3["Producción (Ton/Día)"] = ((pend3 * data3['Producción (Ton/Día)'])+(interc3-interc1))/pend1
data3.head()

In [None]:
data3 = data3.drop(['Normalización 3'], axis = 'columns')
data3.head()

In [None]:
dataFinal = dataFinal.drop(dataFinal[dataFinal['Referencia'] == "OC125A"].index)
dataFinal.head(200)

In [None]:
dataFinal = pd.concat([dataFinal, data3], axis=0)
dataFinal.head(200)

In [None]:
dataFinal["Referencia Estandarizada"] = "Produccion Estandarizada"
dataFinal.head()

In [None]:
sns.lmplot(x='Producción (Ton/Día)', y='Consumo (KWh/Día)', data=dataFinal, hue='Referencia Estandarizada');

In [None]:
pendFinBase, intercFinBase, corrFinBase, p_valorFinBase, error_stdFinBase = stats.linregress(dataFinal['Producción (Ton/Día)'], dataFinal['Consumo (KWh/Día)'])

print(f"pendFinalBase = {pendFinBase:10f}")
print(f"intercFinalBase = {intercFinBase:10f}")
print(f"corrFinalBase = {corrFinBase:10f}")
print(f"p_valorFinalBase = {p_valorFinBase:10f}")
print(f"error_stdFinalBase = {error_stdFinBase:10f}")

In [None]:
dataFinal["Consumo Base"] = pendFinBase * dataFinal['Producción (Ton/Día)'] + intercFinBase
dataFinal

In [None]:
dataFinal = dataFinal.drop(dataFinal[dataFinal['Consumo (KWh/Día)'] > dataFinal['Consumo Base']].index)

In [None]:
sns.lmplot(x='Producción (Ton/Día)', y='Consumo (KWh/Día)', data=dataFinal, hue='Referencia Estandarizada');

In [None]:
pendFinMeta, intercFinMeta, corrFinMeta, p_valorFinMeta, error_stdFinMeta = stats.linregress(dataFinal['Producción (Ton/Día)'], dataFinal['Consumo (KWh/Día)'])

print(f"pendFinal = {pendFinMeta:10f}")
print(f"intercFinal = {intercFinMeta:10f}")
print(f"corrFinal = {corrFinMeta:10f}")
print(f"p_valorFinal = {p_valorFinMeta:10f}")
print(f"error_stdFinal = {error_stdFinMeta:10f}")

In [None]:
dataFinal['Variacion Consumo Energia'] = dataFinal['Consumo Base'] - dataFinal['Consumo (KWh/Día)']
dataFinal


Se busca el mayor máximo entre la línea base y entre los puntos de consumo optimo con el propósito de encontrar una línea meta promedio que permita optimizar y reprogramar la producción para obtener ahorros de energía.


In [None]:
maximo = dataFinal['Variacion Consumo Energia'].max()
print("Valor máximo:",maximo)
ahorroPot = maximo/2
print("Ahorro Potencia:",ahorroPot)

# **Conclusión**

1.   El Ahorro potencial promedio es 88.6 KWh por serie de producción, ese ahorro se puede dar por buenas practicas de manufactura o optimización en la ejecución del mantenimiento. 

2.   El ahorro maximo que se podria conseguir por serie de produccion es 177.215 KWh (Serie de producción: Fabricación de un pedido completo de piezas inyectadas)

