# Proyecto del Día - Analizador de Ventas

## Objetivo

Crear un programa en Python que analice un conjunto de datos de ventas de una tienda. El programa debe realizar varias operaciones de Data Science para proporcionar información valiosa sobre las ventas de la tienda.

# Consigna

1. **Lectura de datos:** Crea un DataFrame que contenga los datos provistos en el archivo `Datos_Ventas_Tienda.csv` provisto en esta lección. El archivo incluye información como fecha de venta, categoría de producto, cantidad vendida y precio.

2. **Fusión de datos:** Crea un segundo DataFrame que contenga los datos del archivo `Datos_Ventas_Tienda2.csv` (también provisto) y concaténalos para tener un solo DataFrame con toda la información.

3. **Tratamiento de datos:** Utiliza Pandas para manipular estos datos. Deberás realizar tareas como limpieza de datos, filtrado y transformaciones básicas.

4. **Análisis de ventas:** Realiza análisis para responder preguntas como:

    - ¿Cuál es el producto más vendido?
    - ¿Cuál es el mes con más ventas?

5. **Datos agrupados:** Agrupa los datos por categoría de producto y analiza las ventas por categoría.

6. **Guardar resultados:** Al final, guarda el DataFrame completo (incluyendo la columna de meses) en un archivo CSV en tu ordenador.

In [1]:
import pandas as pd

### Lectura de datos

In [2]:
# Cargar los datos de Datos_Ventas_Tienda.csv
datos_ventas_tienda_1_path: str = './data/Datos_Ventas_Tienda.csv'
datos_ventas_tienda_1: pd.DataFrame = pd.read_csv(datos_ventas_tienda_1_path)
print(datos_ventas_tienda_1)

         Fecha    Producto  Cantidad  Precio Unitario  Total Venta
0    1/17/2023  Electrónic         7              200         1400
1     9/1/2023  Electrónic         8              200         1600
2    7/29/2023    Juguetes         3               30           90
3    10/4/2023   Alimentos         4               10           40
4    2/28/2023  Electrónic         6              200         1200
..         ...         ...       ...              ...          ...
995  4/27/2023   Alimentos         2               10           20
996   6/9/2023        Ropa        10               50          500
997  8/21/2023   Alimentos         8               10           80
998  3/28/2023  Electrónic         6              200         1200
999   3/7/2023  Electrónic         4              200          800

[1000 rows x 5 columns]


In [4]:
# Obtener información preliminar del DataFrame
print(datos_ventas_tienda_1.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   Fecha            1000 non-null   object
 1   Producto         1000 non-null   object
 2   Cantidad         1000 non-null   int64 
 3   Precio Unitario  1000 non-null   int64 
 4   Total Venta      1000 non-null   int64 
dtypes: int64(3), object(2)
memory usage: 39.2+ KB
None


In [3]:
# Cargar los datos de Datos_Ventas_Tienda2.csv
datos_ventas_tienda_2_path: str = './data/Datos_Ventas_Tienda2.csv'
datos_ventas_tienda_2: pd.DataFrame = pd.read_csv(datos_ventas_tienda_2_path)
print(datos_ventas_tienda_2)

         Fecha    Producto  Cantidad  Precio Unitario  Total Venta
0    8/25/2023  Electrónic         5              200         1000
1    8/14/2023   Alimentos         9               10           90
2    8/30/2023        Ropa         6               50          300
3    11/9/2023   Alimentos         2               10           20
4   10/26/2023        Ropa         8               50          400
5    12/1/2023    Juguetes         2               30           60
6    5/16/2023  Electrónic         4              200          800
7     2/9/2023      Libros         1               20           20
8     1/9/2023  Electrónic         2              200          400
9     5/3/2023  Electrónic         6              200         1200
10  11/30/2023  Electrónic         5              200         1000
11  10/26/2023  Electrónic         1              200          200
12   8/22/2023    Juguetes         3               30           90
13    6/5/2023  Electrónic         1              200         

In [5]:
# Obtener información preliminar del DataFrame
print(datos_ventas_tienda_2.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 50 entries, 0 to 49
Data columns (total 5 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   Fecha            50 non-null     object
 1   Producto         50 non-null     object
 2   Cantidad         50 non-null     int64 
 3   Precio Unitario  50 non-null     int64 
 4   Total Venta      50 non-null     int64 
dtypes: int64(3), object(2)
memory usage: 2.1+ KB
None


### Fusión de datos

In [7]:
# Concatenar los dos DataFrames
concat_df: pd.DataFrame = pd.concat(
    [datos_ventas_tienda_1, datos_ventas_tienda_2],
    axis=1
)
print(concat_df)

         Fecha    Producto  Cantidad  Precio Unitario  Total Venta  \
0    1/17/2023  Electrónic         7              200         1400   
1     9/1/2023  Electrónic         8              200         1600   
2    7/29/2023    Juguetes         3               30           90   
3    10/4/2023   Alimentos         4               10           40   
4    2/28/2023  Electrónic         6              200         1200   
..         ...         ...       ...              ...          ...   
995  4/27/2023   Alimentos         2               10           20   
996   6/9/2023        Ropa        10               50          500   
997  8/21/2023   Alimentos         8               10           80   
998  3/28/2023  Electrónic         6              200         1200   
999   3/7/2023  Electrónic         4              200          800   

          Fecha    Producto  Cantidad  Precio Unitario  Total Venta  
0     8/25/2023  Electrónic       5.0            200.0       1000.0  
1     8/14/2023   A