<a href="https://colab.research.google.com/github/Zeus0818/Analizador-de-Ventas--DS-Proy07/blob/main/Proyecto_del_D%C3%ADa_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Proyecto del Día 7 - Analizador de Ventas

### Objetivo
Crear un programa en Python que analice un conjunto de **datos de ventas de una tienda**. El programa debe realizar varias operaciones de Data Science para proporcionar información valiosa sobre las ventas de la tienda.

### Consigna

1. **Lectura de Datos**: Crea un DataFrame que contenga los datos provistos en el archivo **Datos_Ventas_Tienda.csv** provisto en esta lección. El archivo incluirá información como *fecha de venta*, *categoría de producto*, *cantidad vendida* y *precio*.
2. **Fusión de Datos**: Crea un segundo DataFrame que contenga los datos del archivo **Datos_Ventas_Tienda2.csv** (también provisto en esta lección), y concaténalos para tener un solo dataFrame con toda la información.

3. **Tratamiento de Datos**: Utiliza Pandas para manipular estos datos. Deberás realizar tareas como limpieza de datos, filtrado y  transformaciones básicas.
4. **Análisis de Ventas**: Realiza análisis para responder preguntas como:
- ¿Cuál es el producto más vendido?
- ¿Cuál es el mes con más ventas?
5. **Datos Agrupados**: Agrupa los datos por categoría de producto y analiza las ventas por categoría.
6. **Guardar Resultados**: Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en tu ordenador.

In [None]:
import pandas as pd

# 1- LECTURA DE DATOS

In [None]:
ruta = "/content/Datos_Ventas_Tienda.csv"
df_ventas = pd.read_csv(ruta)
df_ventas

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/17/2023,Electrónic,7,200,1400
1,9/1/2023,Electrónic,8,200,1600
2,7/29/2023,Juguetes,3,30,90
3,10/4/2023,Alimentos,4,10,40
4,2/28/2023,Electrónic,6,200,1200
...,...,...,...,...,...
995,4/27/2023,Alimentos,2,10,20
996,6/9/2023,Ropa,10,50,500
997,8/21/2023,Alimentos,8,10,80
998,3/28/2023,Electrónic,6,200,1200


In [None]:
ruta2 = "/content/Datos_Ventas_Tienda2.csv"
df_ventas2 = pd.read_csv(ruta2)
df_ventas2.head()

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,8/25/2023,Electrónic,5,200,1000
1,8/14/2023,Alimentos,9,10,90
2,8/30/2023,Ropa,6,50,300
3,11/9/2023,Alimentos,2,10,20
4,10/26/2023,Ropa,8,50,400


# 2- FUSION DE DATOS

In [None]:
df = pd.concat([df_ventas, df_ventas2], ignore_index=True)
df.tail()

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
1045,9/11/2023,Juguetes,10,30,300
1046,1/3/2023,Juguetes,10,30,300
1047,11/7/2023,Alimentos,3,10,30
1048,8/20/2023,Electrónic,6,200,1200
1049,7/21/2023,Juguetes,3,30,90


# 3- TRATAMIENTO DE DATOS

In [None]:
# Convertir la columna de fecha a tipo datetime
df["Fecha"] = pd.to_datetime(df["Fecha"], errors="coerce")
df

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,2023-01-17,Electrónic,7,200,1400
1,2023-09-01,Electrónic,8,200,1600
2,2023-07-29,Juguetes,3,30,90
3,2023-10-04,Alimentos,4,10,40
4,2023-02-28,Electrónic,6,200,1200
...,...,...,...,...,...
1045,2023-09-11,Juguetes,10,30,300
1046,2023-01-03,Juguetes,10,30,300
1047,2023-11-07,Alimentos,3,10,30
1048,2023-08-20,Electrónic,6,200,1200


In [None]:
# Eliminar filas con fecha inválida o valores nulos importantes
df = df.dropna(subset=["Fecha", "Cantidad", "Precio Unitario"])

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1050 entries, 0 to 1049
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   Fecha            1050 non-null   datetime64[ns]
 1   Producto         1050 non-null   object        
 2   Cantidad         1050 non-null   int64         
 3   Precio Unitario  1050 non-null   int64         
 4   Total Venta      1050 non-null   int64         
dtypes: datetime64[ns](1), int64(3), object(1)
memory usage: 41.1+ KB


# 4- ANALISIS DE VENTAS

In [None]:
#Producto mas vendido
producto_mas_vendido = df.groupby("Producto")["Cantidad"].sum().idxmax()
producto_mas_vendido

'Alimentos'

In [None]:
meses = []
for f in df["Fecha"]:
  meses.append(f.month)

df["Mes"] = meses
df

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta,Mes
0,2023-01-17,Electrónic,7,200,1400,1
1,2023-09-01,Electrónic,8,200,1600,9
2,2023-07-29,Juguetes,3,30,90,7
3,2023-10-04,Alimentos,4,10,40,10
4,2023-02-28,Electrónic,6,200,1200,2
...,...,...,...,...,...,...
1045,2023-09-11,Juguetes,10,30,300,9
1046,2023-01-03,Juguetes,10,30,300,1
1047,2023-11-07,Alimentos,3,10,30,11
1048,2023-08-20,Electrónic,6,200,1200,8


In [None]:
#Para saber el mes con mas ventas
ventas_por_mes = df.groupby("Mes")["Cantidad"].sum().sort_values(ascending=False)
ventas_por_mes.head(1)

Unnamed: 0_level_0,Cantidad
Mes,Unnamed: 1_level_1
8,669


# 5- DATOS AGRUPADOS POR CATEGORIAS

In [None]:
ventas_por_categoria = df.groupby("Producto")["Total Venta"].sum()
ventas_por_categoria

Unnamed: 0_level_0,Total Venta
Producto,Unnamed: 1_level_1
Alimentos,12620
Electrónic,244000
Juguetes,33390
Libros,20840
Ropa,56400


# 6- GUARDAR RESULTADOS

In [None]:
df.to_csv("Ventas_Tienda_Completo.csv", index=False)
print("\n✅ Análisis completado. Archivo 'Ventas_Tienda_Completo.csv' guardado con éxito.")


✅ Análisis completado. Archivo 'Ventas_Tienda_Completo.csv' guardado con éxito.
