Analizador de Ventas

### Objetivo
Este programa en Python analiza un conjunto de **datos de ventas de una tienda**. El programa realiza varias operaciones de Data Science para proporcionar información sobre las ventas de la tienda.

### Detalle

1. **Lectura de Datos**: Crea un DataFrame que contenga los datos provistos en el archivo **Datos_Ventas_Tienda.csv** provisto en esta lección. El archivo incluirá información como *fecha de venta*, *categoría de producto*, *cantidad vendida* y *precio*.
2. **Fusión de Datos**: Crea un segundo DataFrame que contenga los datos del archivo **Datos_Ventas_Tienda2.csv** (también provisto en esta lección), y concaténalos para tener un solo dataFrame con toda la información.

3. **Tratamiento de Datos**: Utiliza Pandas para manipular estos datos. Deberás realizar tareas como limpieza de datos, filtrado y  transformaciones básicas.
4. **Análisis de Ventas**: Realiza análisis para responder preguntas como:
- ¿Cuál es el producto más vendido?
- ¿Cuál es el mes con más ventas?
5. **Datos Agrupados**: Agrupa los datos por categoría de producto y analiza las ventas por categoría.
6. **Guardar Resultados**: Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo .csv en tu ordenador.

In [14]:
import pandas as pd

1. Lectura de Datos

In [15]:
#Lectura de datos archivo 1
data_1 = pd.read_csv(r"C:\Users\juani\OneDrive\Escritorio\Proyectos\01.Data\01 Python\03BloquePandasParte2\AnalizadorDeVentas\Datos_Ventas_Tienda.csv")
df_1 = pd.DataFrame(data_1)
df_1

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/17/2023,Electrónic,7,200,1400
1,9/1/2023,Electrónic,8,200,1600
2,7/29/2023,Juguetes,3,30,90
3,10/4/2023,Alimentos,4,10,40
4,2/28/2023,Electrónic,6,200,1200
...,...,...,...,...,...
995,4/27/2023,Alimentos,2,10,20
996,6/9/2023,Ropa,10,50,500
997,8/21/2023,Alimentos,8,10,80
998,3/28/2023,Electrónic,6,200,1200


In [16]:
#Lectura de datos archivo 2
data_2 = pd.read_csv(r"C:\Users\juani\OneDrive\Escritorio\Proyectos\01.Data\01 Python\03BloquePandasParte2\AnalizadorDeVentas\Datos_Ventas_Tienda2.csv")
df_2 = pd.DataFrame(data_2)
df_2

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,8/25/2023,Electrónic,5,200,1000
1,8/14/2023,Alimentos,9,10,90
2,8/30/2023,Ropa,6,50,300
3,11/9/2023,Alimentos,2,10,20
4,10/26/2023,Ropa,8,50,400
5,12/1/2023,Juguetes,2,30,60
6,5/16/2023,Electrónic,4,200,800
7,2/9/2023,Libros,1,20,20
8,1/9/2023,Electrónic,2,200,400
9,5/3/2023,Electrónic,6,200,1200


2. Fusión de Datos

In [17]:
#Fusion de datos
df_combinado = pd.merge(df_1, df_2, how='outer')
df_combinado

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/1/2023,Alimentos,2,10,20
1,1/1/2023,Alimentos,3,10,30
2,1/1/2023,Libros,8,20,160
3,1/10/2023,Alimentos,2,10,20
4,1/10/2023,Electrónic,8,200,1600
...,...,...,...,...,...
1043,9/7/2023,Libros,5,20,100
1044,9/7/2023,Libros,9,20,180
1045,9/7/2023,Ropa,3,50,150
1046,9/8/2023,Alimentos,7,10,70


3. Tratamiento de Datos

In [23]:
#Limpieza de datos - eliminar filas o columnas con valores nulos
###Se eliminan valores nulos
eliminar_datos_nulos = df_combinado.dropna()
eliminar_datos_nulos

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/1/2023,Alimentos,2,10,20
1,1/1/2023,Alimentos,3,10,30
2,1/1/2023,Libros,8,20,160
3,1/10/2023,Alimentos,2,10,20
4,1/10/2023,Electrónic,8,200,1600
...,...,...,...,...,...
1043,9/7/2023,Libros,5,20,100
1044,9/7/2023,Libros,9,20,180
1045,9/7/2023,Ropa,3,50,150
1046,9/8/2023,Alimentos,7,10,70


In [26]:
#Remover datos duplicados - por columnas
eliminar_datos_duplicados = df_combinado.drop_duplicates(subset='Producto')
eliminar_datos_duplicados

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
0,1/1/2023,Alimentos,2,10,20
2,1/1/2023,Libros,8,20,160
4,1/10/2023,Electrónic,8,200,1600
5,1/10/2023,Juguetes,5,30,150
18,1/15/2023,Ropa,2,50,100


In [28]:
#Mostrar por productos mas vendidos
producto_mas_vendido = df_combinado[df_combinado['Total Venta'] > 500]
producto_mas_vendido

Unnamed: 0,Fecha,Producto,Cantidad,Precio Unitario,Total Venta
4,1/10/2023,Electrónic,8,200,1600
7,1/11/2023,Electrónic,5,200,1000
9,1/12/2023,Electrónic,4,200,800
10,1/12/2023,Electrónic,7,200,1400
11,1/12/2023,Electrónic,10,200,2000
...,...,...,...,...,...
1019,9/27/2023,Electrónic,8,200,1600
1023,9/28/2023,Electrónic,6,200,1200
1028,9/3/2023,Electrónic,7,200,1400
1029,9/30/2023,Electrónic,9,200,1800


In [36]:
#Promedio Ventas
promedio_ventas = df_combinado['Total Venta'].mean()
promedio_ventas

350.32442748091603

    4. Análisis de Ventas: Realiza análisis para responder preguntas como:

    ¿Cuál es el producto más vendido?
    ¿Cuál es el mes con más ventas?
