#### Importaciones

In [18]:
from db_class import DB
import pandas as pd

#### Instanciamos un objeto de la clase DB pasando como parámetro el nombre del fichero

In [19]:
base_datos = DB("ventas.db")

Connection is established to ventas.db


#### Cargamos en un dataframe los datos de la tabla de ventas utilizando la conexión de la base de datos

In [20]:
df_ventas = pd.read_sql_query("SELECT * from ventas", base_datos.conn)

#### Mostramos las primeras filas de la tabla

In [21]:
df_ventas.head()

Unnamed: 0,id,producto,cantidad,importe,ciudad,anyo,mes
0,1,1,100,,Sevilla,2019,1
1,2,1,50,,Madrid,2019,1
2,3,1,75,,Sevilla,2019,2
3,4,1,25,,Madrid,2019,3
4,5,2,40,,Madrid,2019,2


#### Cargamos en un dataframe los datos de la tabla de productos utilizando la conexión de la base de datos

In [22]:
df_productos = pd.read_sql_query("SELECT * FROM productos", base_datos.conn)

In [23]:
df_productos.head()

Unnamed: 0,id,nombre,precio_unitario,coste_produccion
0,1,Barrita-NGA,5.5,3.2
1,2,Barrita-NGB,6.2,2.5
2,3,Barrita-NGC,7.5,4.5
3,4,Barrita-NGD,8.15,4.0


#### Hacemos un merge indicando las columnas que se igualan con left_on y right_on

In [24]:
df_mix = pd.merge(df_ventas,df_productos,how='inner',left_on='producto',right_on='id')

In [25]:
df_mix.head()

Unnamed: 0,id_x,producto,cantidad,importe,ciudad,anyo,mes,id_y,nombre,precio_unitario,coste_produccion
0,1,1,100,,Sevilla,2019,1,1,Barrita-NGA,5.5,3.2
1,2,1,50,,Madrid,2019,1,1,Barrita-NGA,5.5,3.2
2,3,1,75,,Sevilla,2019,2,1,Barrita-NGA,5.5,3.2
3,4,1,25,,Madrid,2019,3,1,Barrita-NGA,5.5,3.2
4,14,1,40,,Madrid,2019,6,1,Barrita-NGA,5.5,3.2


#### Renombramos columnas para evitar confusiones

In [26]:
df_mix_renamed = df_mix.rename(columns={'id_x' : 'id_venta', 'id_y' : 'id_producto'})

In [27]:
df_mix_renamed.head()

Unnamed: 0,id_venta,producto,cantidad,importe,ciudad,anyo,mes,id_producto,nombre,precio_unitario,coste_produccion
0,1,1,100,,Sevilla,2019,1,1,Barrita-NGA,5.5,3.2
1,2,1,50,,Madrid,2019,1,1,Barrita-NGA,5.5,3.2
2,3,1,75,,Sevilla,2019,2,1,Barrita-NGA,5.5,3.2
3,4,1,25,,Madrid,2019,3,1,Barrita-NGA,5.5,3.2
4,14,1,40,,Madrid,2019,6,1,Barrita-NGA,5.5,3.2


#### Agrupamos por producto y ciudad, después sumamos (se suman el resto de campos)

In [28]:
df_resultado = df_mix_renamed.groupby(by=["nombre","ciudad"]).sum(numeric_only=True)

In [29]:
df_resultado

Unnamed: 0_level_0,Unnamed: 1_level_0,id_venta,producto,cantidad,anyo,mes,id_producto,precio_unitario,coste_produccion
nombre,ciudad,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
Barrita-NGA,Madrid,20,3,115,6057,10,3,16.5,9.6
Barrita-NGA,Sevilla,4,2,175,4038,3,2,11.0,6.4
Barrita-NGB,Lugo,21,4,460,4038,11,4,12.4,5.0
Barrita-NGB,Madrid,12,4,120,4038,6,4,12.4,5.0
Barrita-NGC,Lugo,10,3,200,2019,5,3,7.5,4.5
Barrita-NGC,Madrid,9,3,140,2019,5,3,7.5,4.5
Barrita-NGC,Sevilla,8,3,25,2019,4,3,7.5,4.5
Barrita-NGD,Madrid,24,8,275,4038,13,8,16.3,8.0
Barrita-NGD,Sevilla,12,4,130,2019,7,4,8.15,4.0


#### Filtramos para dejar las columnas que nos interesan: producto, ciudad y cantidad

In [30]:
df_resultado = df_mix_renamed[['nombre','ciudad','cantidad']].groupby(by=["nombre","ciudad"]).sum() 

In [31]:
df_resultado

Unnamed: 0_level_0,Unnamed: 1_level_0,cantidad
nombre,ciudad,Unnamed: 2_level_1
Barrita-NGA,Madrid,115
Barrita-NGA,Sevilla,175
Barrita-NGB,Lugo,460
Barrita-NGB,Madrid,120
Barrita-NGC,Lugo,200
Barrita-NGC,Madrid,140
Barrita-NGC,Sevilla,25
Barrita-NGD,Madrid,275
Barrita-NGD,Sevilla,130
