In [1]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
%matplotlib notebook

# Analisis replicas generadas en la simulación

## Primero cargamos las replicas en DataFrames distintos y miramos cuantas replicas tenemos para análisis

In [2]:
replicas = []
numero_replicas = 10
for i in range(numero_replicas):
    replicas.append(pd.read_excel("Replica_cliente_{}.xlsx".format(i), sheet_name="Replica"))
print("número de replicas: ",len(replicas))

número de replicas:  10


## Primer acercamiento a los datos (se hará con una sola replica ya que en estructura todas son iguales, EJEMPLO REPLICA 0)

In [3]:
replicas[0].head(10)

Unnamed: 0.1,Unnamed: 0,clas_oper1,clas_oper2,costo_operacion1,costo_operacion2,costo_total_produccion,llega,conformidad,prVuelva,vuelve,prReclamo,Reclama,costo_cliente,costo_proceso,ganancia_proceso
0,0,Reproceso,,517.5633,875.249012,1392.812312,True,PNC,0.656139,True,0.12391,True,60000,61392.812312,-58592.812312
1,1,,,450.910514,839.705466,1290.61598,True,PC,0.391866,False,0.103156,False,0,1290.61598,1509.38402
2,2,,,456.691944,840.612444,1297.304388,True,PC,0.025489,False,0.329937,False,0,1297.304388,1502.695612
3,3,,,500.756092,995.495088,1496.25118,True,PC,0.558848,False,0.209164,False,0,1496.25118,1303.74882
4,4,,,380.044994,872.845665,1252.890659,True,PC,0.143654,False,0.230651,False,0,1252.890659,1547.109341
5,5,,,386.15244,945.732978,1331.885418,True,PC,0.936456,False,0.716533,False,0,1331.885418,1468.114582
6,6,,Reparacion,474.4108,826.07833,1300.48913,True,PNC,0.828189,False,0.436078,False,170000,171300.48913,-168500.48913
7,7,,,499.260811,757.477897,1256.738708,True,PC,0.068613,False,0.700843,False,0,1256.738708,1543.261292
8,8,,,548.617856,760.025794,1308.64365,True,PC,0.587069,False,0.414324,False,0,1308.64365,1491.35635
9,9,,,417.65122,967.366895,1385.018115,True,PC,0.844808,False,0.281033,False,0,1385.018115,1414.981885


### Eliminaremos la columna de indices del archivo para dejar unicamente la del editor y reemplazamos los datos "NaN" o nulos por vacios debido a que son más faciles de trabajar

In [4]:
for i in range(len(replicas)):
    replicas[i] = replicas[i].drop(replicas[i].columns[[0]], axis="columns").fillna("")

#### Así quedan las replicas después de haber hecho este proceso (EJEMPLO REPLICA 1)

In [5]:
replicas[1][-10:]

Unnamed: 0,clas_oper1,clas_oper2,costo_operacion1,costo_operacion2,costo_total_produccion,llega,conformidad,prVuelva,vuelve,prReclamo,Reclama,costo_cliente,costo_proceso,ganancia_proceso
973,,Reparacion,461.564073,803.486634,1265.050707,True,PNC,0.506606,True,0.242235,True,60000,61265.050707,-58465.050707
974,,,477.296679,844.105224,1321.401904,True,PC,0.543973,False,0.366075,False,0,1321.401904,1478.598096
975,,,350.528882,851.182712,1201.711595,True,PC,0.39863,False,0.705895,False,0,1201.711595,1598.288405
976,Reproceso,,955.510523,925.301581,1880.812105,True,PC,0.505258,False,0.312967,False,0,1880.812105,919.187895
977,,,524.347885,811.172194,1335.520078,True,PC,0.473084,False,0.679591,False,0,1335.520078,1464.479922
978,,,510.083954,937.865311,1447.949264,True,PC,0.967354,False,0.02858,False,0,1447.949264,1352.050736
979,,,407.080816,871.779335,1278.860151,True,PC,0.014879,False,0.590209,False,0,1278.860151,1521.139849
980,,,378.296935,894.006776,1272.303711,True,PC,0.394262,False,0.335028,False,0,1272.303711,1527.696289
981,,,396.574577,875.853282,1272.427859,True,PC,0.347236,False,0.155026,False,0,1272.427859,1527.572141
982,Reproceso,,416.720781,937.971305,1354.692086,True,PNC,0.032869,True,0.096926,True,60000,61354.692086,-58554.692086


## Explicación de cada una de las columnas DataFrame final
<ul> 
    <li>clas_oper1: Está columna tiene 3 posibles valores. "Reproceso", "Desecho" y "". Donde si el producto fue muestreado se realizaran los debidos procedimientos a este y se le sumaran los respectivos costos de muestreo.</li>
    <li>clas_oper2: Está columna tiene 5 posibles valores. "Desecho", "Reproceso", "Reparacion", "Reclasificación" y "". Donde de acuerdo al muestreo realizado en cada operación se le realizaran los respectivos procesos y se le sumaran los respectivos costos a la operación.</li>
    <li>costo_operacion1: Está columna tiene la información sobre los costos de la operación 1 sumados a los del muestreo 1.</li>
    <li>costo_operacion2: Está columna tiene la información sobre los costos de la operación 2 sumados a los del muestreo 2.
    <li>costo_total_produccion: Está columna tiene la suma de los costos de la operación 1 y la operación 2.</li>
    <li>llega: Dado que en la operación 2 existen productos a los que se les realiza preventa estos productos no llegan a un cliente final por tanto está columna se crea buscando filtrar aquellos productos que se les realizo esta preventa y no llegan al cliente final.</li>
    <li>conformidad: Está columna tiene información sobre que producto llega al cliente como un producto conforme y cual llega como un producto no conforme. (Se considera un producto como no conforme si no cumple con los parametros de alguna de las dos operaciones, por tanto si, por ejemplo, un producto requiere de un reproceso pero este no es muestreado el producto será catalogado como no conforme, por el contrario si el producto requiere de un reproceso pero este es muestreado el producto sera catalogado como producto conforme)</li>
    <li>prVuelva: Está columna tiene los valores aleatorios requeridos para determinar si un cliente vuelve o no vuelve a la tienda al recibir un producto no conforme.</li>
    <li>vuelve: Esta columna tiene 2 posibles valores. "True" o "False". Donde si un cliente recibe un producto conforme este automaticamente tomara el valor de "False", pero si recibe un producto no conforme se le clasificara de acuerdo al valor generado en la columna anterior.</li>
    <li>prReclamo: Está columna tiene los aleatorios requeridos para determinar si un cliente que vuelve a la tienda reclama o no.</li>
    <li>Reclama: Está columna tiene dos posibles valores. "True" o "False". Donde la columna tomara "True" si el cliente vuelve a la tienda y si supera la probabilidad establecida para que este reclame.</li>
    <li>costo_cliente: Está columna tiene tres posibles valores "60000" que se asignara si el cliente recibe un producto no conforme y reclama, "170000" que se asignara si el cliente recibe un producto no conforme y no vuelve a la tienda y "0" en cualquier otro caso</li>
    <li>costo_proceso: Está columna tiene la suma del costo generado por un cliente y el costo generado por el proceso de fabricación del producto "costo_total_produccion + costo_cliente"</li>
    <li>ganancia_proceso: Está columna tiene la resta del costo de venta del producto y el costo del proceso de fabricación de un producto "2800 - costo_proceso"</li>
</ul>

#### Para empezar analizaremos los costos individuales de cada operación con su respectivo muestreo y los costos totales de estas dos operaciones juntas, así como también los costos por clientes que recibieron productos no conformes y los costos promedios de todo el procedimiento  (Haremos este procedimiento para todas las replicas en conjunto)

In [6]:
promedio_costos_operacion1 = []
promedio_costos_operacion2 = []
promedio_costos_operaciones = []
PromedioCostos_clientes_inconformes = []
promedioCostos_clientes = []
costos_proceso = []
ganancias_promedio = []
for i in range(len(replicas)):
    promedio_costos_operacion1.append(replicas[i].costo_operacion1.mean())
    promedio_costos_operacion2.append(replicas[i].costo_operacion2.mean())
    promedio_costos_operaciones.append(replicas[i].costo_total_produccion.mean())
    PromedioCostos_clientes_inconformes.append(replicas[i].costo_cliente[(replicas[i].conformidad == "PNC") & 
                                                                   (replicas[i].llega == True)].mean())
    promedioCostos_clientes.append(replicas[i].costo_cliente[replicas[i].llega == True].mean())
    costos_proceso.append(replicas[i].costo_proceso.mean())
    ganancias_promedio.append(replicas[i].ganancia_proceso.mean())

In [7]:
print("Promedio costos operación 1:", sum(promedio_costos_operacion1)/numero_replicas)
print("Promedio costos operación 2:", sum(promedio_costos_operacion2)/numero_replicas)
print("Promedio costos operaciones:", sum(promedio_costos_operaciones)/numero_replicas)
print("Promedio costos por cliente:", sum(promedioCostos_clientes)/numero_replicas)
print("Promedio costos clientes inconformes:", sum(PromedioCostos_clientes_inconformes)/numero_replicas)
print("Promedio de costos de todo el procedimiento:", sum(costos_proceso)/numero_replicas)
print("Promedio ganancias de todo el proceso:", sum(ganancias_promedio)/numero_replicas)

Promedio costos operación 1: 486.51271882192896
Promedio costos operación 2: 890.4557383166855
Promedio costos operaciones: 1376.9684571386147
Promedio costos por cliente: 9518.524780573638
Promedio costos clientes inconformes: 83647.7399955027
Promedio de costos de todo el procedimiento: 10871.407022825997
Promedio ganancias de todo el proceso: -8071.407022825995


### Análisis

<font color="red">
Con base a los datos encontrados anteriormente se evidencia que el costo no está siendo cubierto por el precio de venta. Como se puede notar los costos promedio por cliente que recibe un producto no conforme son muy elevados e incluso si tenemos en cuenta los clientes que recibieron un producto conforme estos costos siguen estando muy por encima del precio de venta de un producto.</font>

In [8]:
numero_productos_no_conformes = []
numero_productos_conformes = []
for i in range(len(replicas)):
    print("Replica {}".format(i))
    print(replicas[i].conformidad.value_counts())
    print()

Replica 0
PC     873
PNC    112
Name: conformidad, dtype: int64

Replica 1
PC     864
PNC    119
Name: conformidad, dtype: int64

Replica 2
PC     876
PNC    108
Name: conformidad, dtype: int64

Replica 3
PC     863
PNC    122
Name: conformidad, dtype: int64

Replica 4
PC     874
PNC    109
Name: conformidad, dtype: int64

Replica 5
PC     866
PNC    115
Name: conformidad, dtype: int64

Replica 6
PC     871
PNC    113
Name: conformidad, dtype: int64

Replica 7
PC     883
PNC    105
Name: conformidad, dtype: int64

Replica 8
PC     887
PNC    104
Name: conformidad, dtype: int64

Replica 9
PC     877
PNC    111
Name: conformidad, dtype: int64



### Análisis
<font color="red">En todas las replicas se observa que más de 100 productos son productos no conformes, dado que la forma que existe de evitar que un producto pase como no conforme y llegue al cliente es mediante el muestreo una posible solución a este problema puede ser aumentar los cantidad de productos a los que se les realiza muestreo para así lograr disminuir la cantidad de productos no conformes que llegan al cliente y consecuentemento reducir los costos por cliente</font>

Para mostrar este punto calculemos la ganancia obtenida promedio al tener en cuenta unicamente los productos conformes

In [9]:
ganancia_promedio_pc = []
for i in range(len(replicas)):
    ganancia_promedio_pc.append(replicas[i].ganancia_proceso[replicas[i].conformidad == "PC"].mean())
contador = 0
for valor in ganancia_promedio_pc:    
    print("Ganancia promedio replica {}:".format(contador),valor)
    contador += 1

Ganancia promedio replica 0: 1409.838220094952
Ganancia promedio replica 1: 1402.703779794416
Ganancia promedio replica 2: 1416.9907102165128
Ganancia promedio replica 3: 1416.2054748392957
Ganancia promedio replica 4: 1419.4252867285009
Ganancia promedio replica 5: 1408.4271654656575
Ganancia promedio replica 6: 1430.2964440487283
Ganancia promedio replica 7: 1419.8860701017024
Ganancia promedio replica 8: 1427.3831868825998
Ganancia promedio replica 9: 1421.9208326893577


In [10]:
print("Ganancia Promedio PC:",np.mean(ganancia_promedio_pc))
print("Desviacion estandar Ganancia PC:",np.std(ganancia_promedio_pc))

Ganancia Promedio PC: 1417.307717086172
Desviacion estandar Ganancia PC: 8.073926918742494


In [11]:
perdida_promedio_pnc = []
for i in range(len(replicas)):
    perdida_promedio_pnc.append(replicas[i].ganancia_proceso[(replicas[i].llega == True) & 
                                                          (replicas[i].conformidad == "PNC")].mean())
contador = 0
for valor in perdida_promedio_pnc:    
    print("Perdida promedio replica {}:".format(contador),valor)
    contador += 1

Perdida promedio replica 0: -87032.58833048318
Perdida promedio replica 1: -86790.04260102879
Perdida promedio replica 2: -77989.30964975957
Perdida promedio replica 3: -80845.7781501437
Perdida promedio replica 4: -80447.94471557457
Perdida promedio replica 5: -76723.82078787971
Perdida promedio replica 6: -91187.04919348084
Perdida promedio replica 7: -78995.41341926741
Perdida promedio replica 8: -80917.07946286007
Perdida promedio replica 9: -80867.70363543108


In [12]:
print("Perdida Promedio:",np.mean(perdida_promedio_pnc))
print("Desviacion estandar Perdida:",np.std(perdida_promedio_pnc))

Perdida Promedio: -82179.6729945909
Desviacion estandar Perdida: 4376.044592711378


### Análisis
<font color="red">Como se puede apreciar, la pérdida obtenida con los productos no conformes es muy superior con respecto a la ganancia obtenida por los productos conformes. Si, al realizar el muestreo se evidencia que el producto requiere un proceso adicional para no clasificar como un producto no conforme, necesariamente el costo de producción de ese producto puntual va a ser superior con respecto al producto que no requiere este proceso adicional. Pero si en concordancia, se compara este costo de producción más alto en el proceso adicional con respecto a las pérdidas obtenidas por un producto no conforme se puede evidenciar que aún con el aumento de dicho costo, se obtendrán menos pérdidas que al permitir que el cliente obtenga un producto no conforme. Evidencia de ello al verificar dentro de la replica número 1 el producto 976 al que se le realizo un reproceso tiene un costo de operación (1880.812105) mucho más elevado que el promedio obtenido anteriormente (1376.9684571386147) este es un costo que continua generando ganancias, a diferencia de si el producto fuera no conforme que generaria un costo por cliente muy elevado.</font>

vamos a calcular los costos promedio para cada replica de producir un producto conforme y también los costos promedio para cada replica de producir un producto no conforme, posteriormente se realizaran un par de gráficas que permitan hacer una comparación entre las ganancias y las perdidas

In [13]:
costo_promedio_pc = []
costo_promedio_pnc = []
for i in range(len(replicas)):
    costo_promedio_pc.append(replicas[i].costo_proceso[replicas[i].conformidad == "PC"].mean())
    costo_promedio_pnc.append(replicas[i].costo_proceso[replicas[i].conformidad == "PNC"].mean())

In [17]:
plt.title("Ganancias v Costos")
plt.xlabel("Ganancias")
plt.ylabel("Costos")
plt.scatter(ganancia_promedio_pc,costo_promedio_pc,label="PC")
plt.scatter(perdida_promedio_pnc,costo_promedio_pnc,label="PNC")
plt.legend()

<IPython.core.display.Javascript object>

<matplotlib.legend.Legend at 0x7f49a1e88e90>