<a href="https://colab.research.google.com/github/JuanCruzBeltramo/Proyecto_AMACOR/blob/main/Python_Enunciado_Proyecto_Amacor2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img width=600 src="https://impelia.org/wp-content/uploads/2022/08/impelia_logo-cabecera_-02.png">

Hecho por: [Kenny Garcés](https://www.linkedin.com/in/kennygarces/) y [Remei Toda](https://www.linkedin.com/in/remei-toda-ribes-185879119/)

# Análisis de datos supermercados <strong style= 'color: red'>A</strong><strong style= 'color: green'>M</strong><strong style= 'color: orange'>A</strong><strong style= 'color: blue'>C</strong><strong style= 'color: brown'>O</strong><strong style= 'color: purple'>R</strong>


Amacor, un renombrado supermercado con una presencia sólida en la región donde el dueño es José Pérez. Se encuentra en una fase estratégica de mejora continua para fortalecer la eficiencia de sus operaciones. Ya que actualmente se encuentran con ciertos conflictos económicos en la empresa y quieren aumentar su facturación y así evitar posibles depidos. Como parte de este proceso, el equipo de marketing de Amacor ha llevado a cabo una iniciativa ambiciosa para recopilar y analizar datos detallados sobre su inventario de productos. El objetivo es optimizar la gestión del inventario, mejorar la toma de decisiones y garantizar una experiencia de compra excepcional para sus clientes.

El dataset recopilado contiene información crucial, como nombres de productos, categorías, precios, ofertas, cantidades en stock y fechas de exportación del dato. Sin embargo, durante el proceso de revisión, el equipo de marketing ha identificado desafíos sustanciales que requieren atención inmediata. Estos desafíos incluyen la ausencia de valores en ciertas columnas, la existencia de productos duplicados y la posibilidad de inconsistencias en la calidad de los datos.

Esta situación ha llevado al equipo de marketing a pedir ayuda a los data scientist de Impelia. Con el fin, de poder obtener información precisa y confiable, lo que es esencial para la toma de decisiones de manera eficiente y estratégica.

## Metología a seguir

**Análisis Inicial**: Evaluar el impacto de los valores nulos y productos duplicados en el conjunto de datos.
Identificar las columnas clave que serán fundamentales en el proceso de limpieza y análisis.

**Limpieza de Datos**: Desarrollar estrategias para abordar los valores nulos, ya sea mediante la eliminación de registros o la imputación de valores basada en el contexto.
Implementar un procedimiento para eliminar productos duplicados, conservando solo la primera ocurrencia.

**Análisis de Columnas**: Realizar un análisis exhaustivo de cada columna para comprender la naturaleza de los datos y detectar posibles anomalías.
Proponer soluciones para corregir cualquier error o inconsistencia identificada.

**Resumen Estadístico**: Generar un resumen estadístico detallado para las columnas numéricas, aprovechando gráficos y visualizaciones para destacar patrones y tendencias.

**Presentación de Resultados**: Elaborar un informe completo que documente las acciones tomadas en la limpieza de datos y el análisis de los mismos.
El informe deberá responder como mínimo a las siguientes cuestiones:
1. ¿Cúal es el número total de productos?

2. ¿Cuantos productos tienen oferta aplicada?

3. ¿Cuál es el producto más caro?

4. ¿A cuantos productos no les queda Stock?

5. ¿Cuál es el producto más barato?

6. ¿Cuál es el producto con más Stock? ¿Se le está aplicando oferta a este producto?

7. A los producos que se les aplica la oferta, ¿Cuánto dinero se está ahorrando el cliente?

8. ¿Cuál es el producto más barato por pasillos?

9. ¿Cuál es el producto más caro por pasillos?

10. ¿Cuál es el producto con más Stock por pasillos?

11. ¿Qué ocurre con el producto "**<strong style= 'color: red'>Mostaza regular doypack 1000 g</strong>**"? ¿Hay algún otro producto que le ocurra lo mismo?

12. ¿Cuál es la marca con más productos?

13. ¿Cuántos productos hay en cada pasillo?

14. Cambiar los nombres de los productos a en formato mayúsculas y cambiando los espacios por "_".

15. ¿Cuántas variedades de vinos venden? ¿Y cuál es el más caro?

16. ¿Qué pasillo tiene más productos sin ofertas aplicadas?

17. ¿Cuántos productos se venden a granel y cuántos por unidad?

18. ¿Cuántos productos de los que hay en stock se les está aplicando oferta?

19. ¿Qué está ocurriendo con el Producto "**<strong style= 'color: red'>Aceite de Oliva extra virgen 250 ml</strong>**" en temas de oferta y demanda?

20. Ofrece recomendaciones específicas para mejorar la calidad de los datos y sugerir acciones futuras para la gestión del inventario.

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

# ¿Cúal es el número total de productos?

In [None]:
dates = pd.read_csv('Data_Amacor.csv', sep=',')
dates

Unnamed: 0,title,brand,normal_price,low_price,high_price,oferta,categoria1,categoria2,datetime,Atributos,sin_stock,Num_Stock,page
0,Pasta dental Ultra Blanco 3 un. 90 g c/u,Colgate,0.0,2590.0,3249.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
1,Pasta dental triple 3 un. 90 g,Pepsodent,0.0,2790.0,2979.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,25,1
2,Jabón líquido Dermo Care avena doypack 750 ml,Simond'S,1549.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,20,1
3,Jabón líquido original 700 ml,Dove,0.0,2659.0,3549.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
4,Pasta dental Xtra Whitening 3 un. 90 g,Pepsodent,0.0,2135.0,2979.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,14,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4463,Camarones enteros 400 g,Cuisine & Co,5890.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,10,1
4464,Carpaccio de vacuno congelado 320 g,Cuisine & Co,7639.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,41,1
4465,Croqueta salmón 80 g,Aqua,790.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,34,1
4466,Camarones cocidos y pelados 500 g,Cuisine & Co,6560.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,35,2


In [None]:
# Hay 4468 productos

In [None]:
dates.isnull().sum()

title           0
brand           0
normal_price    0
low_price       0
high_price      0
oferta          0
categoria1      0
categoria2      0
datetime        0
Atributos       0
sin_stock       0
Num_Stock       0
page            0
dtype: int64

In [None]:
dates.duplicated('title').sum()

1741

In [None]:
dates.duplicated().sum()

0

In [None]:
dates[dates.duplicated(['title', 'brand'])]

Unnamed: 0,title,brand,normal_price,low_price,high_price,oferta,categoria1,categoria2,datetime,Atributos,sin_stock,Num_Stock,page
130,Desodorante Protection 5 spray 150 ml,BiO,0.0,1949.0,2599.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,10,4
452,Vino Trío Ensamblaje 750 cc,Concha Y Toro,6130.0,0.0,0.0,0,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,36,6
529,Nuggets de pollo congelado bolsa 400 g,Super Pollo,0.0,0.0,0.0,0,supermercados,congelados,2022-07-16 22:11:26.364649,1 un,0,0,2
803,Avena instantánea 750 g,Quaker,1829.0,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,48,3
1210,Yoghurt batido frutilla 1 kg,Soprole,2069.0,0.0,0.0,0,lacteos,lacteos,2022-07-16 22:11:26.364649,1 un,1,41,7
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4463,Camarones enteros 400 g,Cuisine & Co,5890.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,10,1
4464,Carpaccio de vacuno congelado 320 g,Cuisine & Co,7639.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,41,1
4465,Croqueta salmón 80 g,Aqua,790.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,34,1
4466,Camarones cocidos y pelados 500 g,Cuisine & Co,6560.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,35,2


In [None]:
nombres_nuevos = ['Nombre_productos', 'Marca', 'Precio_sin_oferta', 'Precio_oferta_min', 'Precio_oferta_max', 'Oferta', 'Zona_supermecado', 'Tipo_producto', 'Fecha', 'Atributo', 'Stock', 'Cantidad_Stock', 'Pagina']
dates.columns = nombres_nuevos
dates

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
0,Pasta dental Ultra Blanco 3 un. 90 g c/u,Colgate,0.0,2590.0,3249.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
1,Pasta dental triple 3 un. 90 g,Pepsodent,0.0,2790.0,2979.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,25,1
2,Jabón líquido Dermo Care avena doypack 750 ml,Simond'S,1549.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,20,1
3,Jabón líquido original 700 ml,Dove,0.0,2659.0,3549.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
4,Pasta dental Xtra Whitening 3 un. 90 g,Pepsodent,0.0,2135.0,2979.0,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,14,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4463,Camarones enteros 400 g,Cuisine & Co,5890.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,10,1
4464,Carpaccio de vacuno congelado 320 g,Cuisine & Co,7639.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,41,1
4465,Croqueta salmón 80 g,Aqua,790.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,34,1
4466,Camarones cocidos y pelados 500 g,Cuisine & Co,6560.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,35,2


In [None]:
# Cambiamos de peso chileno a Euros para poder dimencionar los valores en mercado europeo

exchange =0.0011

def convertir_a_euro(valor):
    return valor * exchange

dates['Precio_sin_oferta'] = dates['Precio_sin_oferta'].apply(convertir_a_euro)
dates['Precio_oferta_min'] = dates['Precio_oferta_min'].apply(convertir_a_euro)
dates['Precio_oferta_max'] = dates['Precio_oferta_max'].apply(convertir_a_euro)
dates

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
0,Pasta dental Ultra Blanco 3 un. 90 g c/u,Colgate,0.0000,2.8490,3.5739,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
1,Pasta dental triple 3 un. 90 g,Pepsodent,0.0000,3.0690,3.2769,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,25,1
2,Jabón líquido Dermo Care avena doypack 750 ml,Simond'S,1.7039,0.0000,0.0000,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,20,1
3,Jabón líquido original 700 ml,Dove,0.0000,2.9249,3.9039,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
4,Pasta dental Xtra Whitening 3 un. 90 g,Pepsodent,0.0000,2.3485,3.2769,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,14,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4463,Camarones enteros 400 g,Cuisine & Co,6.4790,0.0000,0.0000,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,10,1
4464,Carpaccio de vacuno congelado 320 g,Cuisine & Co,8.4029,0.0000,0.0000,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,41,1
4465,Croqueta salmón 80 g,Aqua,0.8690,0.0000,0.0000,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,34,1
4466,Camarones cocidos y pelados 500 g,Cuisine & Co,7.2160,0.0000,0.0000,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,35,2


# ¿Cuantos productos tienen oferta aplicada?

In [None]:
 # ¿Cuantos productos tienen oferta aplicada?
a = dates[dates['Oferta'] > 0]
pd.DataFrame(a)

# Los siguientes 857 productos tienen oferta aplicada

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
0,Pasta dental Ultra Blanco 3 un. 90 g c/u,Colgate,0.0,2.8490,3.5739,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
1,Pasta dental triple 3 un. 90 g,Pepsodent,0.0,3.0690,3.2769,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,25,1
3,Jabón líquido original 700 ml,Dove,0.0,2.9249,3.9039,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
4,Pasta dental Xtra Whitening 3 un. 90 g,Pepsodent,0.0,2.3485,3.2769,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,14,1
6,Jabón barra original 3 un. de 90 g,Dove,0.0,2.9249,4.0249,1,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,10,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4396,Camarones cocidos apanados mariposa 500 g,Cuisine & Co,0.0,6.0390,6.8090,1,supermercados,pescaderia,2022-07-16 21:25:28.860226,1 un,1,30,1
4398,Camarones cocidos y pelados 250 g,Cuisine & Co,0.0,3.7290,4.1690,1,supermercados,pescaderia,2022-07-16 21:25:28.860226,1 un,1,14,1
4433,Surtido de mariscos 500 g,Cuisine & Co,0.0,3.8390,4.3450,1,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,28,1
4438,Camarones cocidos apanados mariposa 500 g,Cuisine & Co,0.0,6.0390,6.8090,1,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,1,1,1


# ¿Cuál es el producto más caro?

In [None]:
# ¿Cuál es el producto más caro?

# Ordenar el DataFrame por la columna 'high_price' de forma descendente
dates_sorted = dates.sort_values(by='Precio_oferta_max', ascending=False)

# Seleccionar los primeros 5 productos
top_5_expensive_products = dates_sorted.head(5)

# Imprimir o trabajar con los productos más caros
pd.DataFrame(top_5_expensive_products)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
454,Whisky Johnnie Walker Black Label 750 cc,Johnnie Walker,0.0,29.689,34.639,1,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,40,6
1771,Lomo Vetado kg,Al Vacío,0.0,18.1335,24.7335,1,carniceria,vacuno,2022-07-16 22:11:26.364649,1.5 kg,1,3,1
336,Caja 24 un. cerveza lager botella 330 cc c/u,Heineken,0.0,14.289,24.497,1,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,39,3
240,Pack 24 un. Cerveza lager 5.2° 330 cc,Stella Artois,0.0,13.739,24.189,1,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,18,1
1820,Costillar al vacío kg,Super Cerdo,0.0,18.9497,23.7567,1,carniceria,cerdo,2022-07-16 22:11:26.364649,2.3 kg,1,41,1


# ¿A cuantos productos no les queda Stock?



In [None]:
c = dates[dates['Cantidad_Stock'] < 1]
pd.DataFrame(c)


Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
14,Shampoo 400 ml + Acondicionador Regeneración E...,Dove,0.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,0,0,1
25,Pétalos desmaquilladores,Family Care,0.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,0,0,1
56,Shampoo Limpieza Renovadora 375 ml,Head & Shoulders,0.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,0,0,2
78,Desodorante barra Xtreme Tech Ultra 50 g,Speed Stick,0.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,0,0,2
93,Desodorante Original spray 150 ml,Dove,0.0,0.0,0.0,0,supermercados,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,0,0,3
...,...,...,...,...,...,...,...,...,...,...,...,...,...
4430,Milanesa de merluza apanada 500 g,Cuisine & Co,0.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,0,0,1
4439,Camarones cocidos y pelados medianos 500 g,Cuisine & Co,0.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,0,0,1
4441,Hamburguesas de Merluza 2 un. 200 g,El Golfo,0.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,0,0,1
4449,Coctelitos de Merluza congelados apanados 500 g,El Golfo,0.0,0.0,0.0,0,supermercados,pescaderia,2022-07-16 22:00:45.289537,1 un,0,0,1


# ¿Cuál es el producto más barato?



In [None]:
# Filtra las filas donde la columna 'normal_price' es mayor que 0
dates_filtered = dates[dates['Precio_sin_oferta'] > 0]

# Ordena el DataFrame por la columna 'normal_price' de manera ascendente
dates_sorted = dates_filtered.sort_values(by='Precio_sin_oferta')

# Toma los primeros 5 productos más baratos
top_5_cheapest = dates_sorted.head(5)

# Imprime los resultados
pd.DataFrame(top_5_cheapest)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
3172,"Bicarbonato Gourmet Refinado, Sobre 30 grs.",Gourmet,0.1529,0.0,0.0,0,despensa,aceites-sal-y-condimentos,2022-07-16 20:54:13.402156,1 un,1,49,2
2458,"Bicarbonato Gourmet Refinado, Sobre 30 grs.",Gourmet,0.1529,0.0,0.0,0,despensa,aceites-sal-y-condimentos,2022-07-16 20:20:00.576384,1 un,1,48,2
729,Galletas mini Conquista 35 g,Arcor,0.209,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,35,1
734,Galletas Mini Dinosaurios 35 g,Arcor,0.209,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,48,1
740,Galletas Chockiss 35 g,Arcor,0.209,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,21,1


# ¿Cuál es el producto con más Stock? ¿Se le está aplicando oferta a este producto?



In [None]:
stock_descuento = dates[dates['Precio_sin_oferta'] > 0]

stock_cantidad = stock_descuento.sort_values('Cantidad_Stock', ascending=False)

stock_cantidad.head(10)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
885,Endulzante líquido tradicional 270 ml,Daily,1.5719,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,50,5
549,Porotos granados 500 g,Frutos Del Maipo,3.2549,0.0,0.0,0,supermercados,congelados,2022-07-16 22:11:26.364649,1 un,1,50,2
1714,Cebolla morada 1 kg,Frutas Y Verduras Propias,1.749,0.0,0.0,0,frutas-y-verduras,verduras,2022-07-16 22:11:26.364649,1 un,1,50,1
4198,Crema choclo 60 g,Naturezza,0.4829,0.0,0.0,0,despensa,instantaneos-y-sopas,2022-07-16 21:25:28.860226,1 un,1,50,2
1725,Cebolla malla 3 un.,Jumbo,1.353,0.0,0.0,0,frutas-y-verduras,verduras,2022-07-16 22:11:26.364649,1 un,1,50,2
470,Cerveza Bockchocolate 5.0° 350 cc,Volcanes Del Sur,1.452,0.0,0.0,0,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,50,6
878,Galletas Gretel rellenas con chocolate 85 g,Costa,1.0549,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,50,4
869,Gomitas Frugelé 430 g,Ambrosoli,2.7929,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,50,4
863,Alimento en polvo chocolate 250 g,Cola Cao,1.5169,0.0,0.0,0,supermercados,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,50,4
424,Whiskey Finest 40° 750 cc,Ballantine'S,12.639,0.0,0.0,0,supermercados,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,50,5


# A los producos que se les aplica la oferta, ¿Cuánto dinero se está ahorrando el cliente?



In [None]:
num_pasillos = list(dates['Zona_supermecado'].unique())

lista = []
for i in dates["Zona_supermecado"]:
  if i in num_pasillos:
    lista.append(num_pasillos.index(i)+1)
dates.insert(7,"num_pasillos",lista)



In [None]:
dates

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,num_pasillos,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
0,Pasta dental Ultra Blanco 3 un. 90 g c/u,Colgate,0.0000,2.8490,3.5739,1,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
1,Pasta dental triple 3 un. 90 g,Pepsodent,0.0000,3.0690,3.2769,1,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,25,1
2,Jabón líquido Dermo Care avena doypack 750 ml,Simond'S,1.7039,0.0000,0.0000,0,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,20,1
3,Jabón líquido original 700 ml,Dove,0.0000,2.9249,3.9039,1,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,31,1
4,Pasta dental Xtra Whitening 3 un. 90 g,Pepsodent,0.0000,2.3485,3.2769,1,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,14,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4463,Camarones enteros 400 g,Cuisine & Co,6.4790,0.0000,0.0000,0,supermercados,1,pescaderia,2022-07-16 22:00:45.289537,1 un,1,10,1
4464,Carpaccio de vacuno congelado 320 g,Cuisine & Co,8.4029,0.0000,0.0000,0,supermercados,1,pescaderia,2022-07-16 22:00:45.289537,1 un,1,41,1
4465,Croqueta salmón 80 g,Aqua,0.8690,0.0000,0.0000,0,supermercados,1,pescaderia,2022-07-16 22:00:45.289537,1 un,1,34,1
4466,Camarones cocidos y pelados 500 g,Cuisine & Co,7.2160,0.0000,0.0000,0,supermercados,1,pescaderia,2022-07-16 22:00:45.289537,1 un,1,35,2


# ¿Cuál es el producto más barato por pasillos?

Ç

In [None]:
df_filtered = dates[dates['Precio_sin_oferta']> 0]

idx = df_filtered.groupby('num_pasillos')['Precio_sin_oferta'].idxmin()

cheapest_products = dates.loc[idx]

pd.DataFrame(cheapest_products)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,num_pasillos,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
729,Galletas mini Conquista 35 g,Arcor,0.209,0.0,0.0,0,supermercados,1,desayuno-y-dulces,2022-07-16 22:11:26.364649,1 un,1,35,1
1010,Yoghurt batido semidescremado vainilla 120 g,Calan,0.2299,0.0,0.0,0,lacteos,2,lacteos,2022-07-16 22:11:26.364649,1 un,1,18,2
1727,Verduras surtidas paquete 120 g,Frutas Y Verduras Propias,0.4829,0.0,0.0,0,frutas-y-verduras,3,verduras,2022-07-16 22:11:26.364649,1 un,1,4,2
1829,Albóndiga de pavo 300 g,Sopraval,2.189,0.0,0.0,0,carniceria,4,pavo,2022-07-16 22:11:26.364649,1 un,1,13,1
2458,"Bicarbonato Gourmet Refinado, Sobre 30 grs.",Gourmet,0.1529,0.0,0.0,0,despensa,5,aceites-sal-y-condimentos,2022-07-16 20:20:00.576384,1 un,1,48,2


# ¿Cuál es el producto más caro por pasillos?



In [None]:
df_filtered = dates[dates['Precio_sin_oferta']> 0]

idx = df_filtered.groupby('num_pasillos')['Precio_sin_oferta'].idxmax()

expensive_products = dates.loc[idx]

pd.DataFrame(expensive_products)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,num_pasillos,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
457,Whisky 12 años 40° 750 cc,Chivas Regal,35.739,0.0,0.0,0,supermercados,1,vinos-cervezas-y-licores,2022-07-16 22:11:26.364649,1 un,1,42,6
1349,Pack 12 un. Leche extra proteína 1 L,Loncoleche,21.7668,0.0,0.0,0,lacteos,2,lacteos,2022-07-16 22:11:26.364649,1 un,1,26,10
1769,Mix nara pote 500 g,Emporia Nuts,12.089,0.0,0.0,0,frutas-y-verduras,3,frutos-secos-y-semillas,2022-07-16 22:11:26.364649,1 un,1,28,1
1796,Filete Cat. V,Al Vacío,38.6958,0.0,0.0,0,carniceria,4,vacuno,2022-07-16 22:11:26.364649,2.2 kg,1,27,1
4320,Crema de leche 1 L,Cuisine & Co,48.4308,0.0,0.0,0,despensa,5,reposteria,2022-07-16 21:25:28.860226,1 un,1,41,3


# ¿Cuál es el producto con más Stock por pasillos?



In [None]:
df_filtered = dates[dates['Cantidad_Stock']> 0]

idx = df_filtered.groupby('num_pasillos')['Cantidad_Stock'].idxmax()

pasillo_products = dates.loc[idx]

pd.DataFrame(pasillo_products)

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,num_pasillos,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
104,Bálsamo ondas y rizos 750 ml,Ballerina,1.749,0.0,0.0,0,supermercados,1,belleza-y-cuidado-personal,2022-07-16 22:11:26.364649,1 un,1,50,3
984,Yoghurt batido multipack tradicional 12 x 115 g,Nestlé,2.8479,0.0,0.0,0,lacteos,2,lacteos,2022-07-16 22:11:26.364649,1 un,1,50,1
1714,Cebolla morada 1 kg,Frutas Y Verduras Propias,1.749,0.0,0.0,0,frutas-y-verduras,3,verduras,2022-07-16 22:11:26.364649,1 un,1,50,1
1836,Filetillo de pollo 800 g,Cuisine & Co,7.689,0.0,0.0,0,carniceria,4,pollo,2022-07-16 22:11:26.364649,1 un,1,49,1
1913,Choritos ahumados 100 g drenado,Cuisine & Co,1.6049,0.0,0.0,0,despensa,5,conservas,2022-07-16 19:41:59.974480,1 un,1,50,2


# ¿Qué ocurre con el producto "Mostaza regular doypack 1000 g"? ¿Hay algún otro producto que le ocurra lo mismo?



In [None]:
df_mostaza = dates[dates['Nombre_productos'] == 'Mostaza regular doypack 1000 g']

df_mostaza

#Se logra ver que el producto se repite por la carga repetitiva que tuvo en sistema

Unnamed: 0,Nombre_productos,Marca,Precio_sin_oferta,Precio_oferta_min,Precio_oferta_max,Oferta,Zona_supermecado,num_pasillos,Tipo_producto,Fecha,Atributo,Stock,Cantidad_Stock,Pagina
2077,Mostaza regular doypack 1000 g,JB,0.0,0.0,0.0,0,despensa,5,aderezos-y-salsas,2022-07-16 19:41:59.974480,1 un,0,0,1
2791,Mostaza regular doypack 1000 g,JB,0.0,0.0,0.0,0,despensa,5,aderezos-y-salsas,2022-07-16 20:20:00.576384,1 un,0,0,1
3505,Mostaza regular doypack 1000 g,JB,0.0,0.0,0.0,0,despensa,5,aderezos-y-salsas,2022-07-16 20:54:13.402156,1 un,0,0,1


# ¿Cuál es la marca con más productos?



In [None]:
df_filtered = dates[dates['Marca'] != None]

idx = df_filtered.groupby('Nombre_productos')['Marca'].max()

pd.DataFrame(idx)

Unnamed: 0_level_0,Marca
Nombre_productos,Unnamed: 1_level_1
Abastero Cat. V,Al Vacío
Aceite Vegetal 1 L,Miraflores
Aceite Vegetal 900 ml,Máxima MP
Aceite de Coco 350 g,Mi Tierra
Aceite de Maravilla 1 L,Miraflores
...,...
Zapallo europeo un.,Frutas Y Verduras Propias
Zapallo italiano un.,Frutas Y Verduras Propias
Ñoquis Capresse 400 g,Cuisine & Co
Ñoquis Tricolor 500 g,Cuisine & Co


# ¿Cuántos productos hay en cada pasillo?



# Cambiar los nombres de los productos a en formato mayúsculas y cambiando los espacios por "_".



# ¿Cuántas variedades de vinos venden? ¿Y cuál es el más caro?



# ¿Qué pasillo tiene más productos sin ofertas aplicadas?



# ¿Cuántos productos se venden a granel y cuántos por unidad?



# ¿Cuántos productos de los que hay en stock se les está aplicando oferta?



# ¿Qué está ocurriendo con el Producto "Aceite de Oliva extra virgen 250 ml" en temas de oferta y demanda?



# Ofrece recomendaciones específicas para mejorar la calidad de los datos y sugerir acciones futuras para la gestión del inventario.