# Proyecto del Día 7 - Analizador de Ventas

### Objetivo
Crear un programa en Python que analice un conjunto de **datos de ventas de una tienda**. El programa debe realizar varias operaciones de Data Science para proporcionar información valiosa sobre las ventas de la tienda.

### Consigna

1. **Lectura de Datos**: Crea un DataFrame que contenga los datos provistos en el archivo **Datos_Ventas_Tienda.csv** provisto en esta lección. El archivo incluirá información como *fecha de venta*, *categoría de producto*, *cantidad vendida* y *precio*.
2. **Fusión de Datos**: Crea un segundo DataFrame que contenga los datos del archivo **Datos_Ventas_Tienda2.csv** (también provisto en esta lección), y concaténalos para tener un solo dataFrame con toda la información.

3. **Tratamiento de Datos**: Utiliza Pandas para manipular estos datos. Deberás realizar tareas como limpieza de datos, filtrado y  transformaciones básicas.
4. **Análisis de Ventas**: Realiza análisis para responder preguntas como:
- ¿Cuál es el producto más vendido?
- ¿Cuál es el mes con más ventas?
5. **Datos Agrupados**: Agrupa los datos por categoría de producto y analiza las ventas por categoría.
6. **Guardar Resultados**: Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en tu ordenador.

In [506]:
import pandas as pd

In [508]:
#1. **Lectura de Datos**

In [510]:
df1 = pd.read_csv("C:/Users/nahuc/Desktop/code/Python/Udemy/Data Science y Machine Learning/Día 7/Cuadernos para Prácticas/Datos_Ventas_Tienda.csv")
df1

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/17/2023,Electrónic,7,200,1400
1,9/1/2023,Electrónic,8,200,1600
2,7/29/2023,Juguetes,3,30,90
3,10/4/2023,Alimentos,4,10,40
4,2/28/2023,Electrónic,6,200,1200
...,...,...,...,...,...
995,4/27/2023,Alimentos,2,10,20
996,6/9/2023,Ropa,10,50,500
997,8/21/2023,Alimentos,8,10,80
998,3/28/2023,Electrónic,6,200,1200


In [512]:
df2 = pd.read_csv("C:/Users/nahuc/Desktop/code/Python/Udemy/Data Science y Machine Learning/Día 7/Cuadernos para Prácticas/Datos_Ventas_Tienda2.csv")
df2

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,8/25/2023,Electrónic,5,200,1000
1,8/14/2023,Alimentos,9,10,90
2,8/30/2023,Ropa,6,50,300
3,11/9/2023,Alimentos,2,10,20
4,10/26/2023,Ropa,8,50,400
5,12/1/2023,Juguetes,2,30,60
6,5/16/2023,Electrónic,4,200,800
7,2/9/2023,Libros,1,20,20
8,1/9/2023,Electrónic,2,200,400
9,5/3/2023,Electrónic,6,200,1200


In [514]:
#2. **Fusión de Datos**

In [516]:
df = pd.concat([df1,df2])
df

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/17/2023,Electrónic,7,200,1400
1,9/1/2023,Electrónic,8,200,1600
2,7/29/2023,Juguetes,3,30,90
3,10/4/2023,Alimentos,4,10,40
4,2/28/2023,Electrónic,6,200,1200
...,...,...,...,...,...
45,9/11/2023,Juguetes,10,30,300
46,1/3/2023,Juguetes,10,30,300
47,11/7/2023,Alimentos,3,10,30
48,8/20/2023,Electrónic,6,200,1200


In [518]:
#3. **Tratamiento de Datos**

In [520]:
df.isnull()

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,False,False,False,False,False
1,False,False,False,False,False
2,False,False,False,False,False
3,False,False,False,False,False
4,False,False,False,False,False
...,...,...,...,...,...
45,False,False,False,False,False
46,False,False,False,False,False
47,False,False,False,False,False
48,False,False,False,False,False


In [522]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 1050 entries, 0 to 49
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   Fecha            1050 non-null   object
 1   Producto         1050 non-null   object
 2   Cantidad         1050 non-null   int64 
 3   Precio Unitario  1050 non-null   int64 
 4   Total Venta      1050 non-null   int64 
dtypes: int64(3), object(2)
memory usage: 49.2+ KB


In [524]:
df.describe()

Unnamed: 0,Cantidad,Precio Unitario,Total Venta
count,1050.0,1050.0,1050.0
mean,5.490476,64.428571,349.761905
std,2.882577,72.437522,473.870983
min,1.0,10.0,10.0
25%,3.0,20.0,70.0
50%,5.0,30.0,150.0
75%,8.0,50.0,400.0
max,10.0,200.0,2000.0


In [526]:
df.shape

(1050, 5)

In [528]:
#4. **Análisis de Ventas**

In [530]:
#¿Cuál es el producto más vendido?
df_group = df.groupby(by="Producto").sum()
df_producto_max_vendido_nombre = df_group["Cantidad"].idxmax()
df_producto_max_vendido_cant = df_group["Cantidad"].max()
print(f"El producto mas vendido es: {df_producto_max_vendido_nombre} y la cantidad es: {df_producto_max_vendido_cant}")

El producto mas vendido es: Alimentos y la cantidad es: 1262


In [550]:
# ¿Cuál es el mes con más ventas?
df['Fecha_convertida'] = pd.to_datetime(df['Fecha'], format='%d/%m/%Y', errors='coerce')
df_group_fecha = df.groupby(pd.Grouper(key='Fecha_convertida', freq='M')).sum()
df_mes_max_id = df_group_fecha["Total Venta"].idxmax()
df_mes_max_id = df_mes_max_id.strftime("%d/%m/%Y")
df_mes_max_total = df_group_fecha["Total Venta"].max()
print(f"El mes que mas se vendio es: {df_mes_max_id} con un total de: {df_mes_max_total}")

El mes que mas se vendio es: 31/08/2023 con un total de: 18860


In [536]:
#5. **Datos Agrupados**: Agrupa los datos por categoría de producto y analiza las ventas por categoría.

In [538]:
df_producto_max_vendido_cant = df_group["Cantidad"]
df_producto_max_vendido_cant

Producto
Alimentos     1262
Electrónic    1220
Juguetes      1113
Libros        1042
Ropa          1128
Name: Cantidad, dtype: int64

In [540]:
#6. **Guardar Resultados**: Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en tu ordenador.

In [568]:
df['Mes'] = df['Fecha_convertida'].dt.month
df.to_csv("C:/Users/nahuc/Desktop/code/Python/Udemy/Data Science y Machine Learning/Día 7/Cuadernos para Prácticas/Datos_Ventas_Tienda_Combinada.csv")