# Materia prima, costos y ventas

Crearemos un dataframe que sea de utilidad para hacer un analisis enfocado en analizar el detalle de todos los productos vendidos. El dataframe madre contiene todos los registros y columnas obtenidas por cada articulo incluido en una orden de compra.

In [285]:
import pandas as pd
import numpy as np

In [286]:
# Importamos el dataframe generado desde el kernel ubicado en '/..pymongo/raw'. El kernel inserta el csv directamente aqui.

df = pd.read_csv('operaciones.csv').reset_index(drop=True)

# Para añadir la columna de precios de fabrica, añadimos tambien la tabla de precios vigentes que asigna un precio a partir del calibre, la estructura
# y el tipo de cara Exterior

prc = pd.read_csv('../recursos/listaPrecios2020.csv', sep=';' ).reset_index(drop=True)

Usamos el metodo **_.merge()_** para unir el dataframe original con la tabla de precios de lista **_'../recursos/listaPrecios2020.csv'_**

In [287]:
precios = df.merge(prc, how='left', left_on=['Especificaciones.calibreECT', 'Especificaciones.caraExterior', 'Especificaciones.estructura'], right_on=['precios.calibreECT', 'precios.caraExterior', 'precios.estructura'])

#Verificamos la relación en algunos valores al azar

precios.loc[154]

Unnamed: 0                                                               154
_id                                                 5fcb95d34124c8597eb6c8c5
idUsuario                                           5fba998a345a4bb6ed3446c8
tipo                                                         ordenProduccion
estado                                                               abierta
foliointerno                                                           24152
fechaEmision                                                      2020-09-11
fechaCierre                                                       2020-10-30
priceKey                                                      29regularkraft
Productos.idProducto                                5fc9d875450966d58fee1ef4
Productos.idLocal                                                       CJ61
Productos.unidades                                                  millares
Productos.precioUnitario                                                5512

In [288]:
# Creamos una lista con las columnas que vamos a necesitar

material = ['foliointerno',
            '_id',
'Usuario.razonSocial', 
'Productos.idLocal',
'Productos.unidades',
'Productos.cantidad',
'Productos.importe',
'Especificaciones.estructura',
'Especificaciones.tipo',
'Especificaciones.calibreECT',
'Especificaciones.caraExterior',
'Especificaciones.largo',
'Especificaciones.ancho',
'Especificaciones.alto',
'Especificaciones.tipoUnion',
'Especificaciones.suaje',
'Productos.precioUnitario',
            'precios.precioGeneralm2',
            'fechaEmision'
           ]

# Introducimos el diccionario como filtro para ordenar

material = precios[material]
material

Unnamed: 0,foliointerno,_id,Usuario.razonSocial,Productos.idLocal,Productos.unidades,Productos.cantidad,Productos.importe,Especificaciones.estructura,Especificaciones.tipo,Especificaciones.calibreECT,Especificaciones.caraExterior,Especificaciones.largo,Especificaciones.ancho,Especificaciones.alto,Especificaciones.tipoUnion,Especificaciones.suaje,Productos.precioUnitario,precios.precioGeneralm2,fechaEmision
0,24156,5fc3da6c62f23e3d63860a22,LOQUAY. S.A.,CJ246,millares,2.0,21200.0,caja regular,regular,32,kraft,32.3,24.5,30.3,CIG,0,10600.0,14.12,2020-09-11
1,24157,5fc3db5f62f23e3d63860a24,LOQUAY. S.A.,CJ245,millares,2.5,8840.0,caja regular,regular,29,kraft,19.6,15.0,17.5,CIP,0,3536.0,13.25,2020-09-11
2,24374,5fc3de2962f23e3d63860a26,LOQUAY. S.A.,CJ247,millares,2.0,27664.0,caja en dos piezas,dosPiezas,32,kraft,44.3,32.0,14.5,CIP,0,13832.0,18.30,2020-11-06
3,24375,5fc3dfbc62f23e3d63860a27,LOQUAY. S.A.,CJ65,millares,3.0,8268.0,caja regular,regular,29,kraft,20.0,10.4,18.5,CIP,0,2756.0,13.25,2020-11-06
4,24377,5fc3e09a62f23e3d63860a28,LOQUAY. S.A.,CJ67,millares,2.0,8382.0,caja regular,dosPiezas,29,kraft,26.3,17.8,13.2,CIP,0,4191.0,13.25,2020-11-06
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
230,23197,5fcbf2174124c8597eb6c90c,LOQUAY. S.A.,CJ90,millares,2.0,5512.0,caja regular,regular,29,kraft,20.0,10.4,18.5,CIP,0,2756.0,13.25,2020-01-28
231,23198,5fcbf24f4124c8597eb6c90d,LOQUAY. S.A.,CJ67,millares,5.0,20955.0,caja regular,dosPiezas,29,kraft,26.3,17.8,13.2,CIP,0,4191.0,13.25,2020-01-28
232,23200,5fcbf28a4124c8597eb6c90e,LOQUAY. S.A.,CJ249,millares,2.0,20176.0,caja regular,regular,36,kraft,32.8,25.0,25.3,CIG,0,10088.0,14.64,2020-01-28
233,23201,5fcbf2e24124c8597eb6c90f,LOQUAY. S.A.,CJ85,millares,5.0,18720.0,caja regular,regular,29,kraft,19.6,15.0,20.0,CIP,0,3744.0,13.25,2020-01-28


El corrugado se construye a partir de m2 de lamina producida de un mismo calibre por lo que añadiremos las columnas necesarias para calcular el area de la lamina en m2, segun la siguiente formula:

               L(lamina) = ((2*L) * (2*W)) + desarrollo
               W(lamina) = (L*W) + desarrollo
               Área en m2 = L(lamina) * W(lamina)
                    
La variable de desarrollo se asigna dependiendo del tipo de corrugado de acuerdo a la siguiente tabla:

                    {'regular': 5.5,
                    'dosPiezas': 1.5,
                    'N/A': 0}
              

In [289]:
# Creamos el diccionario para sustituir la llave del tipo con el desarrollo de tolerancia.

desarrollo = {'regular': [5.5, 1.5],
                    'dosPiezas': [7, 2.7],
                    np.nan: [0, 0]}

# Sustituyendo y aplicando el diccionario en la columna

material["Especificaciones.tipo"] = material["Especificaciones.tipo"].map(desarrollo)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  material["Especificaciones.tipo"] = material["Especificaciones.tipo"].map(desarrollo)


In [290]:
# Crear funciones para calcular la longitud y ancho totales de la lamina

def largoLaminaM2(largo, ancho, desarrollo):
    longitudLamina = ((2*largo) + (2*ancho)) + desarrollo
    return longitudLamina / 100

def anchoLaminaM2(ancho, alto, desarrollo):
    anchoLamina = (ancho + alto + desarrollo)
    return anchoLamina / 100

### Creamos las columnas nuevas aplicando las funciones

In [291]:
# Largo de lamina

material["Especificaciones.longitudLamina"] = largoLaminaM2(material["Especificaciones.largo"], material["Especificaciones.ancho"], material["Especificaciones.tipo"].str[0])

# Ancho de lamina

material["Especificaciones.anchoLamina"] = anchoLaminaM2(material["Especificaciones.ancho"], material["Especificaciones.alto"], material["Especificaciones.tipo"].str[1])

# Calculamos el área total en metros cuadrados por cada producto vendido.

material["areaM2"] = material["Especificaciones.anchoLamina"] * material["Especificaciones.longitudLamina"]
material["precioListaMillares"] = (material["areaM2"] * material["precios.precioGeneralm2"])*1000

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  material["Especificaciones.longitudLamina"] = largoLaminaM2(material["Especificaciones.largo"], material["Especificaciones.ancho"], material["Especificaciones.tipo"].str[0])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  material["Especificaciones.anchoLamina"] = anchoLaminaM2(material["Especificaciones.ancho"], material["Especificaciones.alto"], material["Especificaciones.tipo"].str[1])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

Se

In [293]:
material.describe()

Unnamed: 0,Productos.cantidad,Productos.importe,Especificaciones.calibreECT,Especificaciones.largo,Especificaciones.ancho,Especificaciones.alto,Especificaciones.suaje,Productos.precioUnitario,precios.precioGeneralm2,Especificaciones.longitudLamina,Especificaciones.anchoLamina,areaM2,precioListaMillares
count,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0,235.0
mean,3.617979,42776.140426,30.093617,67.884681,37.010213,18.679149,0.225532,18838.851064,10.489872,2.137877,0.568268,1.407369,14601.042294
std,1.729977,40372.938732,3.084245,56.177055,18.063378,32.95193,0.418824,26048.850446,3.699597,1.446636,0.38867,1.361098,16020.506817
min,0.1,5512.0,23.0,19.0,10.4,0.0,0.0,2720.0,5.8,0.663,0.29,0.201552,1951.12
25%,2.0,13600.0,27.5,29.0,24.0,0.0,0.0,2756.0,7.5,1.126,0.304,0.3364,2670.564
50%,4.0,21000.0,32.0,32.3,29.0,13.3,0.0,10088.0,13.25,1.211,0.495,0.637185,9183.64272
75%,5.0,78800.0,32.0,104.0,59.1,20.0,0.0,21685.0,14.12,2.786,0.627,2.867271,21504.5325
max,7.0,189000.0,38.0,164.7,95.7,200.0,1.0,123000.0,18.3,4.573,2.63,7.47183,105502.2396


Exportamos este dataframe unificado para utilizarlo como fuente base de información.

In [271]:
material.to_csv('material.csv')