# Proyecto del Día 7 - Analizador de Ventas

### Objetivo
Crear un programa en Python que analice un conjunto de **datos de ventas de una tienda**. El programa debe realizar varias operaciones de Data Science para proporcionar información valiosa sobre las ventas de la tienda.

### Consigna

1. **Lectura de Datos**: Crea un DataFrame que contenga los datos provistos en el archivo **Datos_Ventas_Tienda.csv** provisto en esta lección. El archivo incluirá información como *fecha de venta*, *categoría de producto*, *cantidad vendida* y *precio*.
2. **Fusión de Datos**: Crea un segundo DataFrame que contenga los datos del archivo **Datos_Ventas_Tienda2.csv** (también provisto en esta lección), y concaténalos para tener un solo dataFrame con toda la información.

3. **Tratamiento de Datos**: Utiliza Pandas para manipular estos datos. Deberás realizar tareas como limpieza de datos, filtrado y  transformaciones básicas.
4. **Análisis de Ventas**: Realiza análisis para responder preguntas como:
- ¿Cuál es el producto más vendido?
- ¿Cuál es el mes con más ventas?
5. **Datos Agrupados**: Agrupa los datos por categoría de producto y analiza las ventas por categoría.
6. **Guardar Resultados**: Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en tu ordenador.

In [6]:
import pandas as pd
df1 = pd.read_csv("Datos_Ventas_Tienda.csv")
df2 = pd.read_csv("Datos_Ventas_Tienda2.csv")
df1

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/17/2023,Electrónic,7,200,1400
1,9/1/2023,Electrónic,8,200,1600
2,7/29/2023,Juguetes,3,30,90
3,10/4/2023,Alimentos,4,10,40
4,2/28/2023,Electrónic,6,200,1200
...,...,...,...,...,...
995,4/27/2023,Alimentos,2,10,20
996,6/9/2023,Ropa,10,50,500
997,8/21/2023,Alimentos,8,10,80
998,3/28/2023,Electrónic,6,200,1200


In [7]:
df2

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,8/25/2023,Electrónic,5,200,1000
1,8/14/2023,Alimentos,9,10,90
2,8/30/2023,Ropa,6,50,300
3,11/9/2023,Alimentos,2,10,20
4,10/26/2023,Ropa,8,50,400
5,12/1/2023,Juguetes,2,30,60
6,5/16/2023,Electrónic,4,200,800
7,2/9/2023,Libros,1,20,20
8,1/9/2023,Electrónic,2,200,400
9,5/3/2023,Electrónic,6,200,1200


In [12]:
df = pd.concat([df1,df2])

In [14]:
#Primero arreglo las fechas a formato datetime
df["Fecha"] = pd.to_datetime(df["Fecha"],format="%m/%d/%Y")

In [17]:
# ¿Cuál es el producto más vendido?
# Segundo agrupo por tipo de producto y ordeno de forma descendente por cantidad
productos_mas_vendidos = df.sort_values(by=["Producto","Cantidad"],ascending=False)
productos_mas_vendidos

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
8,2023-03-22,Ropa,10,50,500
29,2023-05-19,Ropa,10,50,500
116,2023-07-14,Ropa,10,50,500
120,2023-01-18,Ropa,10,50,500
121,2023-01-25,Ropa,10,50,500
...,...,...,...,...,...
826,2023-04-03,Alimentos,1,10,10
839,2023-05-17,Alimentos,1,10,10
843,2023-11-26,Alimentos,1,10,10
875,2023-09-27,Alimentos,1,10,10


In [31]:
# ¿Cuál es el mes con más ventas?
# Tercero agrupo por mes y busco el que tenga mayor cantidad
df["Año"] = df["Fecha"].dt.strftime("%Y")
df["Mes"] = df["Fecha"].dt.strftime("%m")


In [82]:
mes_de_mas_venta = df.sort_values(by=["Año","Mes","Cantidad"], ascending=False).loc[["Producto","Cantidad"]]

KeyError: "None of [Index(['Producto', 'Cantidad'], dtype='object')] are in the [index]"

In [None]:
mes_de_mas_venta.head(20)

In [77]:
agrupados = df.sort_values(by="Mes")

In [78]:
agrupados

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta,Año,Mes
0,2023-01-17,Electrónic,7,200,1400,2023,01
884,2023-01-23,Ropa,7,50,350,2023,01
878,2023-01-27,Alimentos,9,10,90,2023,01
873,2023-01-27,Juguetes,3,30,90,2023,01
200,2023-01-26,Electrónic,10,200,2000,2023,01
...,...,...,...,...,...,...,...
721,2023-12-27,Electrónic,8,200,1600,2023,12
723,2023-12-18,Alimentos,9,10,90,2023,12
917,2023-12-03,Electrónic,5,200,1000,2023,12
347,2023-12-12,Alimentos,10,10,100,2023,12
